Technische Dokumentation
Vorbemerkung
Die zentrale Aufgabe der Webpräsenz ist eine dauerhaft gut zugängliche und intuitiv benutzbare Oberfläche für die im Projekt erarbeiteten Transkriptionen sowie die im Zusammenhang damit gesammelten Informationen. Dabei richtet sich die Publikation einerseits natürlich an ein (interdisziplinäres) Fachpublikum, soll aber gleichzeitig auch interessierten Laien und der breiteren Öffentlichkeit einen Zugang zum Forschungsgebiet ermöglichen. Ziel ist dabei vor allem, einfache und übersichtliche Zugänge zu Handschriftbeschreibungen und Transkriptionen zu gewährleisten, sowie weiterführende Informationen zum Thema zu bieten. Die Capitularia-Webseite versteht sich damit als Arbeitsmittel für die (rechts-)historische Forschung und als Portal. Tiefergehende Informationen zur technischen Umsetzung des Projekts finden sich in der Dokumentation von Marcello Perathoner.
Hinweise
Browser
Die Webseite sollte fehlerfrei auf den jeweils aktuellen Versionen aller gängigen Browser wie Mozilla Firefox, Internet Explorer, Microsoft Edge, Google Chrome, Safari und Opera funktionieren.
Display
Wir empfehlen eine Nutzung der Seite mit einen Computer / Laptop ab einer Bildschirmgröße von 10 Zoll. Auch sollte die Bedienung über Tablets grundsätzlich möglich sein. Die Webseite ist nicht für die Darstellung und Bedienung auf sehr kleinen Displays wie z.B. Smartphones optimiert.
Es kann zu Darstellungsproblemen kommen, wenn Javascript ausgeschaltet ist. Sollten weitergehende Probleme auftauchen, lassen Sie uns dies bitte wissen.
Zitationshinweis
Wenn Sie die Capitularia-Webpräsenz bzw. Einzelseiten zitieren möchten, können Sie die folgende Zitationsform nutzen
[Titel der Datei, z.B. „Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. Blankenb. 130“], in: Capitularia. Edition der fränkischen Herrschererlasse, bearb. von Karl Ubl und Mitarb., Köln 2014 ff. URL: https://capitularia.uni-koeln.de/mss/wolfenbuettel-hab-blankenb-130 (abgerufen am: [aktuelles Datum])
Auf den Handschriftenseiten findet sich unten zusätzlich eine Zitatbox, aus der Sie die Angaben einfach herauskopieren können.
Lizenz
Die Capitularia-Webseite und alle ihre Inhalte (ausgenommen Bildrechte) steht unter folgender Creative Commons Lizenz:
Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
.
Die Bildrechte der gezeigten Handschriften liegen bei den haltenden Archiven und Bibliotheken, die diese zu unterschiedlichen Bedingungen zur Verfügung stellen. Das Copyright ist jeweils angegeben.
Die Rechte an Privataufnahmen liegen beim Projekt. Sollten Sie dazu weitere Fragen haben, zögern Sie nicht, mit uns in Kontakt zu treten (bmischke[at]uni-koeln.de).
Features
- Die Capitularia-Webpräsenz wurde als mehrsprachige Seite konzipiert. Hinsichtlich der Menüführung kann zwischen deutscher und englischer Sprache gewählt werden. Auch die Einführungstexte und Erläuterungen sind in beiden Sprachen verfügbar.
- Die Ansteuerung der einzelnen Inhalte ist neben den verschiedenen Browsingzugängen auch über eine Volltextsuche sowie einen Handschriftenfilter (Auswahl der Handschriften nach Kategorien + Freitext) möglich.
- Alle Handschriftenbeschreibungen und Transkriptionen können als XML-Dateien heruntergeladen werden. Auf der Download-Seite stehen diese gesammelt zur Verfügung, des Weiteren findet sich diese Option auch auf den einzelnen Handschriftenseiten.
- Capitularia setzt bewusst auf eine umfangreiche Vernetzung der Inhalte mit externen, frei im Internet verfügbaren Ressourcen, wie z.B. Handschriftendigitalisaten.
- Eine umfangreiche, zum großen Teil auch annotierte Projektbibliographie führt die gesamte thematisch relevante Literatur zusammen. Sofern es sich dabei um frei verfügbare Texte (z.B. dMGH) handelt, werden diese ebenfalls direkt verlinkt.
Technologien
Hinsichtlich der verwendeten Technologien sind die folgenden Bereiche zu unterscheiden:
- “Textbezogene” Technologien (XML)
- Technologien der Capitularia-Webpräsenz
- Technologien, die im Hintergund verwendet werden
“Textbezogene” Technologien
-
Textauszeichnung
Hinsichtlich der Textauszeichnung richtet sich das Projekt nach den Vorgaben der Text Encoding Initiative Proposal 5 (TEI P5), einem XML-Standard, welcher in in den digitalen Geisteswissenschaften weit verbreitet ist.
- Speziell für die Anlage der Transkriptionen wurden auf deren Basis projektspezifische Richtlinien entwickelt [Mitarbeiter Arbeitsstelle, Franz Fischer]. Detaillierte Informationen hierzu finden sich unter Arbeitsabläufe bzw. in den Transkriptionsrichtlinien selbst, die auch als Download zur Verfügung stehen.
- Die Anlage und Bearbeitung der Dateien erfolgt mithilfe des oXygen XML Editors. Pro Handschrift gibt es eine XML-Datei, welche im Kopfbereich (teiHeader) die sog. Metadaten zur Handschrift – in unserem Fall eine ausführliche Beschreibung basierend auf den Angaben aus Mordeks Bibliotheca (Mordek 1995) – enthält, und als eigentlichen Inhalt die Transkriptionen der einzelnen Kapitularien, denen weiterhin eine editorische Vorbemerkung vorgeschaltet ist. Die Arbeit an den Dateien erfolgt direkt auf dem Server. Dieser ist mittels WebDAV als Datenquelle an den Editor angebunden. Somit wird sichergestellt, dass alle Mitarbeiter jederzeit Zugriff auf die aktuellen Fassungen haben. Ältere Versionen werden in einem Archiv aufbewahrt.
-
Handschriftenbeschreibungen
Grundlage aller Handschriftenbeschreibungen aber auch der meisten Überblicksseiten ist eine mittels OCR in XML überführte Fassung von Mordeks Bibliotheca, welche dem Projekt von den MGH zur Verfügung gestellt wurde. Diese Korpusdatei wurde weiter ausgezeichnet, um so automatisiert TEI-konforme Handschriftenbeschreibungen daraus generieren zu können [Daniela Schulz].
-
Schemata
Ob bei den Transkriptionen bzw. der Überarbeitung der Handschriftenbeschreibungen die festgelegten Richtlinien eingehalten werden, wird durch ein Schema (Relax NG), welches mithilfe des Roma-Tools erstellt wurde, kontrolliert. Dieses ist spezifisch auf die Bedürfnisse des Projektes abgestimmt. Die Bibliographie wie auch die Transkriptionsdateien werden weiterhin mittels eines Schematron-Schemas überprüft [Martina Gödel].
-
Bibliographieverwaltung
Da der Aufbau und die Pflege einer Bibliographie in vielen Projekten eine wichtige Aufgabe darstellt, wurde seitens des CCeH eine projektübergreifende Lösung angestrebt. Eine Arbeitsgruppe analysierte hierfür zunächst die Bedürfnisse der einzelnen Projekte sowie bereits bestehende Ansätze, und entwickelte auf dieser Basis grundlegende Eintragstypen [Ulrike Henny, Martina Gödel, Daniela Schulz].
Die Bibliographieverwaltung selbst findet ebenfalls in TEI-XML statt. Für das Kapitularienprojekt wird grob zwischen Editionen bzw. Übersetzungen, Literatur und Bibliothekskatalogen unterschieden. Ferner werden die Eintragstypen “book” (Monographien), “bookSection” (Aufsätze in Sammelbänden, Kapitel), “journalArticle” (Zeitschriftenaufsätze) und “webPublication” (Online-Veröffentlichungen) getrennt behandelt. Der Einsatz von Schematron stellt sicher, dass Neueinträge in der Bibliographie (aktuell über 2400 Einträge, Stand Mai 2021) korrekt und vollständig sind und erleichtert damit die Arbeit für den verantwortlichen Mitarbeiter [Sören Kaschke].
Capitularia-Webpräsenz
-
Framework
Zur Verwaltung der Webpräsenz und um zusätzlich weitere Funktionen wie z.B. die Mehrsprachigkeit zu realisieren, wurde WordPress (aktuell: Version 4.3) als Content Management System gewählt. Dieses Open Source System, das zwar als Blogsoftware weite Verbreitung im World Wide Web gefunden hat, ist bisher kaum für XML-basierte Digital Humanities Projekte genutzt worden. Aufgrund der positiven Vorerfahrungen im Bibliotheca legum-Projekt, welches sich komplementär zu Capitularia vornehmlich mit der Überlieferung der leges (sog. Barbaren- oder Volksrechte), einer weiteren wichtigen Rechtsquelle für das Frühmittelalter befasst, wurde WordPress auch als Grundlage für das vorliegende Projekt gewählt.
Es ist PHP-basiert und nutzt eine MySQL-Datenbank. Positiv hervorzuheben ist, dass aufgrund der hohen Verbreitung von WordPress eine entsprechend große Community an der Weiterentwicklung und auch an der Dokumentation partizipiert. Häufig existieren somit bereits mehr oder minder fertige Lösungen für zahlreiche Probleme bzw. lassen sich aufgrund der guten Dokumentation eigene Programmteile erstellen.
-
Transformationsskripte
Zur Darstellung der Informationen, die in den XML-Dateien hinterlegt sind, müssen diese nach HTML transformiert werden. Dies geschieht mittels XSL (eXtensible Stylesheet Language). Die Skripte wurden von den Mitarbeitern der Arbeitsstelle bzw. des CCeH [Nils Geißler, Marcello Perathoner, Daniela Schulz] eigens für das Kapitularienprojekt geschrieben.
-
Anpassung und Entwicklungen
Weitergehende Funktionalitäten können bei WordPress über Erweiterungen, die sog. Plugins realisiert werden. Seitens der für die Webpräsenz verantwortlichen Mitarbeiter des CCeH [Nils Geißler, Marcello Perathoner] wurden eigene Plugins für Capitularia entwickelt. Das “Capitularia XSL Processor“-Plugin ist eine Erweiterung bzw. Weiterentwicklung eines bereits bestehenden Plugins (“XSL Processor Plugin”). Es ermöglicht die grundlegende Transformation der XML-Dateien nach HTML innerhalb des CMS. Um zu verhindern, dass der Transformationsprozess bei jedem Seitenaufruf erneut startet, was zu Verzögerungen beim Seitenaufbau führt, wird hier überprüft, ob an den zugrundeliegenden Dateien zwischenzeitlich Änderungen vorgenommen wurden. Nur dann findet eine erneute Transformation statt. Bei der Transformation wird der generierte Inhalt (in HTML) gleichzeitig in die WordPress-Seite selbst geschrieben, so dass die “normale” Volltextsuche auch im Zusammenspiel mit den XML-Dateien verwendet werden kann.
- Für die automatische Erstellung der Handschriftenseiten wurde weiterhin der “Capitularia Page Generator” entwickelt, der es den Mitarbeitern der Arbeitsstelle ermöglicht neue Seiten mit einem einzigen Klick anzulegen.
-
Design
Um die Webseite möglichst ansprechend und übersichtlich zu gestalten, wurde das Webdesign in professionelle Hände gegeben. Das Capitularia-Logo, grundlegende Layouts sowie das farblich Konzept wurden von Peter Korthals (CGN Corporate) entworfen. Die Anpassung und praktische Umsetzung wurde (und wird weiterhin) von den Mitarbeitern des CCeH [Nils Geißler, Marcello Perathoner, Jonathan Blumtritt, Christian Theisen] vorgenommen.
“Hinter den Kulissen”
-
Arbeitsumgebung
Für die Projektmitarbeiter sowie das Editorenteam gibt es einen abgeschlossenen Bereich. Die Arbeitsumgebung ermöglicht den Beteiligten einen zentralen Zugriff auf wichtige Ressourcen bzw. Dokumente. Die Blogfunktion wird beispielsweise nicht nur dazu genutzt, den Nutzern der Seite aktuelle Informationen zukommen zu lassen, sondern auch für die interne Kommunikation und Dokumentation.
-
Computergestützte Kollation
Die von den Mitarbeitern der Arbeitsstelle angefertigten Transkriptionen bilden die Grundlage der vorliegenden Webpräsenz, sind weiterhin aber auch Vorarbeiten der kritischen Edition, welche von den Editoren besorgt wird. Um in der Arbeit mit den zahlreichen Textzeugen und -fassungen mehr Transparenz und Übersichtlichkeit zu schaffen, und damit die Arbeit zu erleichtern, findet die Kollation auch unter Zuhilfenahme einer “Varianzpartitur” statt. Zur Erstellung dieser, werden zunächst den Textvergleich “störende” Informationen mittels eines Skriptes entfernt [Nils Geißler]. Die entstandenen “plain text”-Dateien werden dann einer auf CollateX basierenden Anwendung unterzogen, welche als Ergebnis ein HTML-Dokument produziert, in dem die korrepondierenden Textpassagen übersichtlich untereinander angeordnet sind, und gleichzeitig Abweichungen vom “Grundtext” (hier wird, um einen gemeinsamen Bezugspunkt zu haben, die Edition von Boretius/Krause verwendet) farblich hervorgehoben werden [Gioele Barabucci].
-
Bildserver
Die Transkriptionen werden auf Grundlage von Handschriftendigitalisaten angefertigt. Sind diese nicht frei im Internet zugänglich, werden – sofern in ausreichender Qualität vorhanden – Mikrofilme genutzt bzw. muss die Digitalisierung der Handschriften bei den haltenden Institutionen in Auftrag gegeben werden. Aus lizenzrechtlichen Gründen können diese leider nicht öffentlich verfügbar gemacht werden. Da die Digitalisate aber sowohl den Mitarbeitern der Arbeitsstelle, als auch den Editoren jederzeit zur Verfügung stehen müssen, wurde seitens des CCeH ein Bildserver eingerichtet, auf dem die Bilder zentral verwaltet werden [Peter Dängeli].
Die Benennung der Bilddateien, die möglichst als Einzelbilder im TIFF-Format (verlustfreie Kompression) vorliegen sollten, erfolgt nach festgelegten Regeln. Die Folio- bzw. Seitenangaben sind darin enhalten, so dass ein möglichst schneller Zugriff auf die benötigten Dateien ermöglicht wird. Neben diesen wird auch eine “Arbeitsfassung” im PDF-Format zur Verfügung gestellt. Eine Textdatei erhält weitergehende Informationen zur vorliegenden Zusammenstellung (Menge und Qualität der enthaltenen Bilder, Format etc.) [Anja Holtschneider, Daniela Schulz].