Projekt

Variable Detection, Interlinking and Summarization (VADIS)

Ziel von VADIS ist die Verknüpfung und Kontextualisierung von Forschungsdaten, um die Reproduzierbarkeit und Wiederverwendbarkeit von Forschungsergebnissen zu verbessern, und Forschern einen verbesserten Informationszugang zu ermöglichen.

Durch die Kombination von Text-Mining und Semantic-Web-Technologien soll erreicht werden, dass die Verknüpfungen zwischen Publikationen, ihren Themen und den spezifischen Variablen, die in den Umfragen enthalten sind, identifiziert und genutzt werden können. Die semantischen Verknüpfungen in wissenschaftlichen Texten bilden die Grundlage für die Entwicklung von Anwendungen, die den Nutzern einen besseren Zugang zu wissenschaftlicher Literatur wie Abschnittssuche, Zusammenfassung und Information Retrieval ermöglichen. Die Projektergebnisse werden nahtlos in bestehende Infrastrukturen integriert. Um die Effektivität unseres Frameworks zu messen, werden mehrere Use Cases in einem Prototyp für die Suche und Exploration umgesetzt. Die Verbesserung des Zugangs wird abschließend in einer Nutzerstudie untersucht.

 

In diesem Zusammenhang wird gemeinsam mit den Partnern ein Shared Task für die „Variablenerkernnung und -verlinkung in Sozialwissenschaftlichen Publikationen“ durchgeführt, der auf dem 3nd Workshop on Scholarly Document Processing (sdproc.org) im Rahmen der https://coling2022.org/ in Korea stattfindet. Hierbei sollen verschiedene Ansätze zur Erkennung von Studienvariablen gegenübergestellt und dann auf dem gleichen Datensatz evaluiert werden. Hierzu wird ein annotierter Datensatz für mehrere Sprachen, die Annotationsrichtlinien und das Evaluationsschema erstellt.

Weitere Informationen finden sich unter VAriable Detection, Interlinking and Summarization project | vadis-project.github.io

Ziel ist die semantische Annotation wissenschaftlicher Publikationen, in denen die zugrundeliegenden Forschungsdaten und die referenzierten Studienvariablen automatisch identifiziert werden sollen.

Text Mining und Semantic Web-Verfahren bilden die Grundlage für die semantischen Verknüpfungen zwischen Publikationen, ihren Themen und den spezifischen Variablen, die in den Umfragen enthalten sind. Hierbei werden neue Anwendungen implementiert, die den Nutzern einen besseren Zugang zu wissenschaftlicher Literatur bieten und eine Abschnittssuche, Zusammenfassung und Information Retrieval ermöglichen.

Neben quantitativen Ansätzen kommen auch qualitative Ansätze wie Interviews zum Einsatz, um die Anforderungen der Sozial- und Politikwissenschaftler zu sammeln.

Das Ergebnis soll ein Verfahren zur semantischen Annotation von Publikationen mit Forschungsdaten sein, das für mehrere Sprachen einsetzbar ist.

Laufzeit

09.2021-08.2024

Auftraggeber

Deutsche Forschungsgemeinschaft DFG

Partner

Leibniz-Institut für Sozialwissenschaften, Universität Mannheim, Hochschule der Medien Stuttgart