Dateninfrastruktur und Digital Humanities: Digitale Praktiken in den Geisteswissenschaften
Das Team INF verfolgt eigene Forschungsinteressen und begleitet die Forschung der Teilprojekte des SFB in zwei Bereichen: Dateninfrastruktur und Digital Humanities (DH).
Die Digitalisierung ist ein fortschreitender Prozess der kulturellen Transformation und beeinflusst auch und gerade unsere Arbeit als Geisteswissenschaftler*innen. Digital Humanities (DH) ist ein wachsendes Feld innerhalb der bestehenden Disziplinen, das sich einerseits mit der Anwendung digitaler Methoden in der geisteswissenschaftlichen Forschung beschäftigt und andererseits Fragen nach dem Einfluss digitaler Praktiken auf die Forschungspraktiken innerhalb der verschiedenen geisteswissenschaftlichen Disziplinen behandelt.
Wir setzen die Arbeit an zentralen Dienstleistungsaufgaben im Bereich der Infrastrukturentwicklung und des Datenmanagements für den SFB fort und stellen durch die Begleitung der Standard-konformen Datendokumentation die nachhaltige Bereitstellung und Langzeitverfügbarkeit der im gesamten SFB generierten Daten sicher. Gleichzeitig bringt INF die Methodenreflexion und die Entwicklung von Verfahren der Digital Humanities in den Teilprojekten des SFB voran.
Zu diesem Zweck entwickeln wir zwei Plattformen: 1) Dienstplattform nopaque und 2) Datenpublikationsplattform DKAN.
Beide gewährleisten den qualitätsbewussten Umgang mit den im SFB generierten und genutzten Daten – nopaque stellt einen Workflow zum Arbeiten mit digitalem Textmaterial bereit, vom Scan über OCR und NLP bis zur Corpusanalyse, während die Publikationsplattform DKAN die Ergebnisse der computergestützten in angemessenen Formaten wie Datasets und Data Stories zur Verfügung zu stellt. Beide Umgebungen werden kontinuierlich an die spezifischen Anforderungen der Teilprojekte angepasst und weiterentwickelt.
Wir wollen untersuchen, welchen Mehrwert digitale Praktiken für und in den Geisteswissenschaften haben können. Dies geschieht durch die Etablierung von Arbeitsgruppen quer zu den Teilprojekten, die der Methodenentwicklung, aber auch der Selbstreflexion der beteiligten Fächer und der Veränderung ihrer Praktiken im digitalen Zeitalter gewidmet sind. Dabei geht es namentlich um die Bereiche Text Mining und Machine Learning als Methoden in den historisch arbeitenden Geisteswissenschaften, Annotation und Datenmodellierung als Praktiken der Hypothesenbildung und Digitale Visualisierungs- und Vergleichspraktiken als Herausforderungen in den Geisteswissenschaften.
In der Webanwendung nopaque werden aufeinander abgestimmte digitale Methoden bereitgestellt. Der Funktionsumfang umfasst unter anderem Datenaufbereitungswerkzeuge in den Bereichen Optical Character Recognition (OCR) und Natrual Language Processing (NLP) sowie eine umfangreiche Korpusanalyse Software.
nopaque bietet die Möglichkeit, alle Werkzeuge einzeln oder als Workflow zu nutzen. Alle Arbeitsschritte sind so aufeinander abgestimmt, dass einzelne Services aufeinander aufbauend verwendet werden können. Die Plattform unterstützt Forschende dabei, ihre Dateien in weiterverarbeitbare Formate zu überführen, sie automatisch mit Informationen anzureichern und anschließend zu analysieren, so dass nopaque einen Großteil der geisteswissenschaftlichen Forschungsprozesse abbildet. Mit dieser Toolbox richten wir uns an geisteswissenschaftliche Forschende aller Disziplinen und Kenntnisstände. Die während der Prozesse erzeugten Daten können nach jedem Schritt heruntergeladen werden, um sie bspw. mit anderen (externen) Tools auszuwerten oder weiterzuverarbeiten.