Text- und Data-Mining

Forschende der Universität Leipzig dürfen viele der von uns lizenzierten elektronischen Ressourcen mit Methoden des Text- und Data-Mining (TDM) automatisiert auswerten. Das deutsche Urheberrechtsgesetz erlaubt TDM grundsätzlich (§ 60d). Das gilt auch unabhängig von eventuell widersprechenden Klauseln in einzelnen Lizenzverträgen, wenn die Verträge nach dem 28. Februar 2018 geschlossen wurden. Die Auswertung darf nur zu Forschungszwecken erfolgen und nicht kommerziellen Zwecken dienen.

Wenn Sie die von uns lizenzierten Zeitschriften und Datenbanken für TDM verwenden möchten, kontaktieren Sie uns bitte. Wir informieren Sie über die Rechtslage bzw. die konkrete Lizenzbestimmung für das von Ihnen ausgewählte Material. Bitte beachten Sie außerdem:

  • Viele Lizenzgeber verbieten das automatisierte, massenhafte Herunterladen von Pdf-Dateien von ihren Portalen per Crawler, Script, Bot etc. Bevor Sie einen derartigen Massendownload durchführen, nehmen Sie bitte mit uns Kontakt auf.

  • Die DOI-Registrierungsstelle Crossref sowie einige Verlage bieten besondere Schnittstellen an, wo Sie Volltexte für Ihre TDM-Vorhaben erhalten. Bitte machen Sie sich ggf. mit diesen Schnittstellen vertraut – sie könnten Ihre Arbeit erleichtern:

  • Einige Anbieter betreiben keine Schnittstellen für TDM-Zwecke, bieten allerdings die Auslieferung von Textdaten im XML-Format für die Forschung an. Diese Dienste sind kostenpflichtig. Bitte informieren Sie sich dazu auf den Webseiten der Anbieter und nehmen Sie frühzeitig Kontakt auf, wenn Sie Daten aus diesen Quellen benötigen:

Das Open Science Office berät Sie gerne zu Text- und Data-Mining.