Digital Library Framework: Installation und Konfiguration, Teil 1

Was ist das Digital Library Framework (DLF)?

Das DLF, auch bekannt als Goobi.Presentation, ist eine Software für die Darstellung der Bestände digitalisierter Sammlungen von Bibliotheken im World Wide Web und wurde von der Sächsischen Landes-und Universitätsbibliothek Dresden (SLUB) entwickelt. Es ist Teil eines größeren Softwareprojektes, das den Namen “Goobi Community Edition” trägt und das vor allem auch Software enthält, die es bei Digitalisierungsvorgängen in Bibliotheken ermöglicht, auf komfortable Weise die zu Digitalisaten gehörigen Strukturdaten und bibliographischen Daten im METS-Format zu erfassen und mit den gescannten Seiten des jeweiligen Werkes zu verknüpfen.

Der Kern des DLF ist eine Typo3-Extension. Da eine Reihe der bedeutendsten Bibliotheken auf deutschem Boden das WebCMS Typo3 als Basissystem für ihre Webauftritte einsetzen und das DLF wie auch die anderen Teile des Goobi-Projektes unter der GNU General Public License veröffentlicht wurden, ist das DLF mittlerweile in stetiger Verbreitung begriffen. Ich selber führe derzeit eine Installation und Anpassung des DLF für die Staatsbibliothek zu Berlin (SBB) durch.

Bei der Installation und Konfiguration des DLF gibt es natürlich – wie bei allen komplexen Webanwendungen, bei denen zahlreiche Komponenten zusammenwirken – einige kleine Besonderheiten zu beachten. Dieses Tutorial möge nun dazu dienen, anderen Interessenten den Einstieg etwas zu erleichtern.

Zum Download des DLF

Voraussetzungen für die Installation

Eine saubere Installation einer Typo3-Instanz auf einem gängigen Linux-System mit Apache und PHP ist natürlich Voraussetzung, ebenso die prinzipielle Kenntnis dessen, wie Typo3-Extensions installiert werden. Ich bitte um Verständnis darum, daß ich darauf hier nicht weiter eingehe. Beachtet werden muß jedoch, daß PHP mindestens die Version 5.3.0 hat und Typo3 mindestens die Version 4.3.0, ansonsten läßt sich DLF nicht installieren:

Die Versionsnummern stimmen nicht

Ich habe für das System der SBB außerdem noch die Typo3-Extensions “Typo3 Quixplorer (t3quixplorer)”, “Developer Log (devlog)” sowie das von DLF vorgeschlagene “RealURL: speaking paths for TYPO3 (realurl)” installiert.

Außerdem benötigt das DLF als Suchmaschine eine Solr-Instanz, die von dem Host aus, auf dem unsere Typo3-Instanz zu Hause ist, per http erreichbar sein muß. Das kann natürlich auch derselbe Host sein, aber wir müssen davon ausgehen, daß bei fortschreitender Massendigitalisierung unsere Datenmengen und damit auch die Größe unserer Suchindizes beträchtlich anwachsen werden. Zwar reden wir in dem Zusammenhang noch nicht von Big Data-Technologien, doch im Sinne besserer Skalierbarkeit sollten wir Solr lieber einen eigenen Host spendieren. Auch über das prinzipielle Tomcat- und Solr-Setup möchte ich an dieser Stelle keine weiteren Worte verlieren.

Konfiguration von Solr

Das DLF benötigt einen Solr mit Multicore-Setup. Der Grund dafür ist der, daß die SLUB Präsentationen anderer sächsischer Bibliotheken in einer gemeinsamen Typo3-Instanz hostet und daher mandantenfähig sein muß. Im Moment des Schreibens dieser Zeilen ist die stabile DLF-Version 1.0.4 und eine entsprechende Solr-Konfiguration noch nicht Teil davon. Deshalb steht hier eine Beispielkonfiguration zum Download bereit.

Dazu noch ein paar Hinweise. Zunächst muß der in der Beispielkonfiguration beiliegende Patch web.xml.patch ausgeführt werden. Angenommen, das Installationsverzeichnis von Tomcat sei /usr/local/tomcat und solr.war sei dementsprechend in /usr/local/tomcat/webapps installiert worden, dann bezöge sich der Patch auf /usr/local/tomcat/webapps/solr/WEB-INF/web.xml und müßte folgendermaßen angewendet werden:

cp web.xml.patch /usr/local/tomcat/webapps/solr/WEB-INF
cd /usr/local/tomcat/webapps/solr/WEB-INF
patch <web.xml.patch

Weiterhin angenommen, die Tomcat-Konfiguration, die diesen unsere Solr-Instanz finden läßt, sei dann in /usr/local/tomcat/conf/Catalina/localhost/solr.xml abgelegt und habe etwa folgenden Inhalt:

<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="/usr/local/apache-solr-1.4.1/dist/apache-solr-1.4.1.war" debug="0" crossContext="true">
        <Environment name="solr/home" type="java.lang.String" value="/storage/digital-library-framework/solr" override="true" />
</Context>

Dann müssen die in der Beispielkonfiguration beiliegende Datei solr.xml und das Verzeichnis conf nach solr/home kopiert werden:

cp solr.xml /storage/digital-library-framework/solr
cp -r conf /storage/digital-library-framework/solr

Und schließlich müssen, so der Tomcat unter dem user tomcat läuft, noch zwei roles für diesen angelegt werden:

cd /usr/local/tomcat/conf
vi tomcat-users.xml
    <role rolename="dlfSolrUpdate"/>
    <role rolename="dlfSolrAdmin"/>
    <user username="tomcat" password="password" roles="manager,tomcat,dlfSolrUpdate,dlfSolrAdmin"/>

Nach einem Tomcat-Neustart sollte jetzt unter der URL http://solrhost:8080/solr/dlfCore0/admin/ der Solr Admin zu erreichen und dabei paßwortgeschützt sein (“http://solrhost” ist natürlich nur symbolisch gemeint). Eine Abfrage an Solr sollte jetzt ebenfalls ein, wenn auch leeres, Ergebnis liefern: http://solrhost:8080/solr/dlfCore0/select?q=*:*&indent=on&wt=php.

Grundkonfiguration von DLF

Zurück ins Typo3-Backend. Nun muß dem DLF gesagt werden, wo es seinen Solr findet. Das geschieht unter “Admin Tools / Extension Manager / Frontend” und dann einem Klick auf “Goobi.Presentation”.

Im Extension Manager

In der folgenden Ansicht wird unter “Configuration: / Category” der Eintrag “SOLR (6)” ausgewählt und anschließend werden die Eingabefelder “Solr Server Host” bis “Solr Server Password” ausgefüllt. Die Werte für “Solr Server User” und “Solr Server Password” sind eben jene, die wir oben in tomcat-users.xml vergeben hatten.

Die Verbindung zu Solr steht

Sofern Solr korrekt konfiguriert wurde und auch von unserer Typo3-Instanz aus per http zu erreichen ist, bekommen wir nun den grünen Kasten mit der Aufschrift “Connection established!” zu sehen.

Weiter geht es im zweiten Teil mit der Einrichtung der Backend-Plugins des DLF, mit denen wir METS-Metadatendateien indizieren wollen, um diese für unser System verfügbar zu machen.

Add post to: Delicious Reddit Slashdot Digg Technorati Google
(already: 6) Comment post

Comments

Erika 17.04.2014 18:50
avatar

Hey just wanted to give you a quick heads up. The words in your post seem to be running off the screen in Opera.

I’m not sure if this is a formatting issue or something to do with browser compatibility but I figured I’d post to let you know. The style and design look great though! Hope you get the issue solved soon. Many thanks

Also visit my blog post … 公式 エコバッグ 品質合格

Required. 30 chars of fewer.

Required.

captcha image Please, enter symbols, which you see on the image

Comment post