Das AV-Portal der TIB

08.10.2019: Das AV-Portal der Technischen Informationsbibliothek (TIB) des Leibniz-Informationszentrums Technik und Naturwissenschaften ist eine offene Plattform zur Suche und Veröffentlichung von wissenschaftlichen Videos sowie Lehr- und Lernvideos. Es wurde in Kooperation mit dem Hasso-Plattner-Institut bzw. dessen Ausgründung yovisto entwickelt und ist seit Frühjahr 2014 online verfügbar. Im Interview geht Dr. Bastian Drees auf Überlegungen bei der Konzeption des Portals ein, beschreibt verschiedene Nutzungsmöglichkeiten und berichtet von Herausforderungen beim Betrieb der Plattform.

interview 2019 drees bastian das av portal der tib.mp3

Dieser Podcast ist Teil des Erfahrungsberichts „Das AV-Portal der TIB“.

Transkript

Herzlich willkommen zu einem neuen Beitrag im e-teaching.org-Podcast. Mein Name ist Markus Schmidt und ich habe heute Dr. Bastian Drees von der Technischen Informationsbibliothek des Leibniz-Informationszentrums Technik und Naturwissenschaften zu Gast. Thema heute: das AV-Portal der TIB. Dabei handelt es sich um eine Plattform, auf der vor allem wissenschaftliches Videomaterial aus dem Bereich Technik und Naturwissenschaften zur Verfügung gestellt wird. Herzlich willkommen Herr Drees.

Herr Bastian Drees: Vielen Dank. Ich freue mich hier zu sein.

Bevor wir beginnen, würde ich Sie bitten sich ganz kurz vorzustellen.

Herr Bastian Drees: Ja, mein Name ist Bastian Drees. Ich habe ursprünglich mal Physik studiert, bin nach dem Diplom an die Uni Heidelberg gewechselt, zur Promotion und habe im Bereich Biophysik promoviert. Und dann 2014, nach der Promotion, mit einem Bibliotheksreferendariat begonnen, das ich hier an der Technischen Informationsbibliothek in Hannover gemacht habe. Nach diesem zweijährigen Referendariat habe ich hier im Kompetenzzentrum für nicht-textueller Materialien als Community-Beauftragter angefangen, also an einer Schnittstelle zwischen Bibliothek und Wissenschaft. Eines unserer Kernfelder, an denen wir arbeiten oder eine der Kerndienstleistungen, die wir hier im Kompetenzzentrum anbieten, ist dieses AV-Portal, über das wir heute sprechen möchten.

Das klang jetzt in der Einleitung schon an und Sie haben es auch grad noch gesagt, dass es um das AV-Portal gehen soll, das sich mit der Bereitstellung von wissenschaftlichen Filmen aus dem Bereich Technik und Naturwissenschaften befasst. Nun kennen die meisten von uns verschiedene Videoportale, zum Beispiel von der eigenen Hochschule, also von Videos die entweder für die Hochschule oder auch übergreifend angeboten werden. Und natürlich auch Plattformen wie YouTube, die durchaus auch in der Lehre eingesetzt werden. Warum nun diese Plattform? Was hat zur Entwicklung geführt und welches Problem sollen eigentlich damit gelöst werden?

Herr Bastian Drees: Da hole ich mal ein bisschen weiter aus. Die TIB ist Teil der Leibniz-Gemeinschaft und hat 2011 im Rahmen der Evaluierung das sogenannte Kompetenzzentrum für nicht-textueller Materialien gegründet, aus Sondermitteln, die von Bund und Ländern zur Verfügung gestellt werden. Da geht es eben darum allen wissenschaftlichen Output der keine klassische Textpublikation ist, deshalb nicht-textuelle Materialien, (das heißt Forschungsdaten, Wissenschaftliche Softwares, Abbildungen, 3D-Objekte, aber eben auch Videos) archivierbar, aber auch durchsuchbar, wiederverwertbar, nachnutzbar für die Wissenschaft zu machen. So wie es für Textpublikationen an Bibliotheken seit jeher geschieht. Das ist der Kernauftrag des Kompetenzzentrums, das 2011 hier entstanden ist. Wie gesagt, da spielen AV Medien oder Audiovisuelle Medien auch eine Rolle.

Dass sie jetzt hier eine etwas größere Rolle als man zunächst vielleicht vermuten mag spielen, liegt daran, dass zeitgleich in Göttingen das ehemalige Institut für den wissenschaftlichen Film geschlossen wurde. Dieses Institut bestand seit den 50er Jahren, war auch Teil der Leibniz-Gemeinschaft und hat den Filmbestand von etwa 10.000 Filmen. Diese kamen dann hier, quasi als Nachfolger, an die TIB. Somit hatten wir direkt von Anfang an zum Großteil 10.000 Filmrollen, einen Teil davon schon digitalisiert, die zurückgehen bis zum Anfang des 20. Jahrhunderts. Der Großteil wurde in den 60er, 70er Jahren aufgenommen. Diese Filme bereitzustellen ist eben zentrale Aufgabe hier am Kompetenzzentrum. Daher war von Anfang an der Fokus auf audiovisuelle Medien, beziehungsweise Filme und Videos stärker gesetzt worden, als man vielleicht zunächst vermuten mag. Daher kam es, dass diese Plattform gebaut wurde.

Die Entwicklung fand von 2011 bis 2014 zusammen mit dem Hasso-Plattner-Institut statt, später eine Ausgründung des Hasso-Plattner-Instituts „yovisto”. Im Prinzip geht's darum ganz zentrale Aspekte, die die Bibliothek schon immer verfolgt, auch für Videos zu ermöglichen. Das heißt, die Sammlung und die Archivierung der Videos zu gewährleisten, eine gute Auffindbarkeit und Erschließung der Videos zu ermöglichen und eben die Nachnutzung und Referenzierbarkeit der Videos für die Wissenschaft zu ermöglichen.

Da haben Sie schon einige Sachen angesprochen, auch Details zu den Features. Aber nochmal die Frage, wenn man sich die Möglichkeiten der Plattform anschaut, was ist das Besondere was vielleicht gerade diese Plattform von bekannten Videoportalen, die man so kennt, unterscheidet?

Herr Bastian Drees: Ich grenze das mal in zwei Richtungen ab: Auf der einen Seite haben viele Einrichtungen, wie Sie schon gesagt haben, irgendwelche Plattformen, die eher so „mediathekartig“ sind und als Zielgruppe vor allem die eigenen Wissenschaftler oder die eigenen Lehrenden haben. Das ist bei uns anders. Im Prinzip kann bei uns jeder seine Videos veröffentlichen. Also in der Hinsicht sind wir ein bisschen wie YouTube, im Prinzip kann jeder kommen der möchte und wissenschaftliche oder Lehrvideos hat und die bei uns veröffentlichen.

Genauso steht auch die Nutzung allen Interessierten und allen Wissenschaftlern oder Lehrenden zur Verfügung. Das vom Kontext her. Auf der anderen Seite sind wir von Anfang an, bzw. ist diese Plattform von Anfang an so entwickelt worden, dass sie eine semantische Suche ermöglicht, eine zweisprachige semantische Suche. Das heißt, wenn ich nach einem englischen Begriff suche, finde ich auch die entsprechenden Synonyme oder die deutschen Übersetzungen. Wenn ich beispielsweise nach „PKW“ suche, finde ich auch das englische „car“ oder das deutsche „Auto“.

Gleichzeitig sind, wie gesagt, zusammen mit dem Hasso-Plattner-Institut zunächst und jetzt mit der Forschungsgruppe Visual Analytics, die hier bei uns in der TIB sitzt, verschiedene Videoanalysen entwickelt worden. Das heißt, es finden Spracherkennung, Texterkennung und Bilderkennung statt. Es wird ein Sprach-Transkript erstellt, es werden Transkripte der Texteinblendungen erstellt und es werden Bildkonzepte erkannt und daher danach verschlagwortet.

Außerdem wird automatisch das Video segmentiert, sodass ich, wenn ich jetzt nach einem Begriff suche, beispielsweise „Drehimpuls“, finde ich nicht nur Videos, die die diesen Begriff im Titel oder in der Beschreibung haben, sondern wo irgendwo im Video dieser Begriff genannt wird. Entweder als Einblendung oder im gesprochenen Text. Durch die Segmentierung wird auch genau dieses Segment gehighlightet, indem dieser Begriff auftaucht, sodass ich mir nicht mehr anderthalbstündige Vorlesung komplett anhören muss, sondern direkt zu der Stelle springen kann, wo dieser Begriff auftaucht. Sodass ich sehen kann: Okay, ist das für mich überhaupt relevant oder wurde das jetzt nur nebenher erwähnt. Das ist der eine Punkt: die Auffindbarkeit.

Der andere Punkt ist die Langzeitverfügbarkeit und die Nachhaltigkeit der Plattform, die man jetzt beispielsweisebei anderen kommerziellen Anbietern nicht unbedingt hat. Alle Videos im AV Portal bekommen einen sogenannten „digital object identifier“ (DOI). Das heißt mit diesem DOI, das ist sowas wie eine ISBN-Nummer für Bücher, mit dieser DOI kann ich jederzeit auf dieses Video referenzieren und ich habe, zumindest ist das die Theorie und in der Praxis funktioniert das auch sehr gut, ich habe nie so etwas wie einen toten Link, sondern ich komme immer auf die Seite, wo dieses Video ist.

Außerdem werden die Videos bei uns langzeitarchiviert und sind eben über den DOI auch in wissenschaftlichen Arbeiten zitierbar. Durch solche Sprungmarken oder „video fragment identifier“ kann ich auch einzelne Segmente oder bis runter auf eine Sekunde des Videos zitieren, so wie ich zum Beispiel bei Büchern einzelne Seiten zitieren kann. So kann ich hier sagen: Okay, ich zitiere 02:17 Minute bis 02:23 Minute in Kombination mit diesem DOI.

Das ist ja auch immer noch eine große Frage bei solchen Materialien: Gibt es in irgendeiner Form eine Qualitätssicherung oder kann da jeder einfach irgendetwas reinstellen?

Herr Bastian Drees: Grundsätzlich kann jeder etwas reinstellen und jeder kann etwas hochladen. Vor der Veröffentlichung werden alle Materialien allerdings nochmal von den Fachreferenten hier gesichtet, also den Fachreferenten in der Bibliothek. Das sind die Fachwissenschaftler, die eben auch für ihre Fächer entscheiden: Welche Bücher werden angeschafft? Welche Zeitschriften? Welche Datenbanken? Entsprechend schauen die auch nochmal drüber, welche Videos reinkommen. Natürlich schauen die sich nicht jedes Video einzeln an, aber so wie sie sich nicht jede Zeitschrift oder jedes Buch durchlesen. Es wird folgendermaßen gedacht: Wenn jetzt von einer klar wissenschaftlichen Einrichtung eine ganze Serie oder 200 Videos von einer Konferenz bzw. Konferenzaufzeichnungen reingeladen werden, dann wird nur gesagt: Diese Konferenz ist für uns relevant oder hat klaren wissenschaftlichen Content, das kommt bei uns rein. Aber wenn jetzt jemand hinkäme und seine Urlaubsvideos hochladen würde, dann würden die nicht veröffentlicht werden.

Genau, aber das ist auch schon auf jeden Fall eine Qualitätssicherung, die da vorgenommen wird. Sprachanalyse: Also finde ich ja, ein ganz spannendes Feature, das haben Sie gerade schon genannt. Jetzt kenne ich das auch von anderen Systemen, das funktioniert da mehr oder weniger gut. Wie treffsicher ist denn das? Kann man da sagen, dass der komplette Text da verstanden wird oder gibt es da Probleme mit, sagen wir mal, Dialekten?

Herr Bastian Drees: Das haben Sie schon ganz gut beschrieben, das funktioniert mehr oder weniger gut. Es ist so, dass wir derzeit in einer Übergangsphase sind. Wir haben bislang und auch immer noch einen kommerziellen Dienstleister, der die Sprachanalyse macht oder die Sprachtranskripte erstellt. Das funktioniert sehr gut. Es gibt Andere, bei denen es in Alltagssprache jedoch besser funktioniert. Bei uns ist die Besonderheit, dass es eben sowohl in Deutsch als auch in Englisch gut funktionieren muss und vor allen Dingen müssen die wissenschaftlichen Fachbegriffe erkannt werden. Das ist in unserem Fall eher die Schwierigkeit. Es ist nicht so, dass das Sprachtranskript am Ende für einen Untertitel gut verwendet werden kann. In einigen Fällen schon, aber definitiv nicht überall. Es fehlen auch so Sachen, wie Interpunktion oder sowas.

Für uns dient das Sprachtranskript in erster Linie als eine Art Steinbruch, aus dem dann in einem zweiten Schritt durch eine sogenannte „entity recognition“, also eine Schlagworterkennung, die Schlagworte erkannt werden. Deshalb ist es für uns auch wichtiger, dass die sinntragenden Fachbegriffe erkannt werden, als dass jetzt wirklich ein gut lesbarer Text am Ende entsteht. Weil es eben gerade darum geht, die Navigation im Video bzw. die Auffindbarkeit bei der Recherche nach entsprechenden Themen irgendwie zu gewährleisten.

Ja, und jeder der sich damit mal ein bisschen tiefer auseinandersetzt weiß auch, was das für eine Herausforderungen ist, natürlich. Ich hätte noch eine Frage zur Nachhaltigkeit, obwohl das auch schon eben bei Ihnen anklang. Das Projekt ist, wie ich das verstanden habe, nachhaltig finanziert. Also die üblichen Probleme, die man auch so im Projektgeschäft, auch so im Unibereich hat, so nach Ablauf des Projekts: „Seite 404 leider nicht gefunden“, das kann eigentlich nicht passieren. Oder, wie wird denn sichergestellt, dass das Projekt weiterläuft?

Herr Bastian Drees: Genau, das AV-Portal ist kein Projekt. Das gesamte Kompetenzzentrum ist aus Sondermitteln, aber aus dauerhaften Sondermitteln finanziert. Das heißt, da ist eine durchgehende Finanzierung gewährleistet. Wie gesagt, die Projektseite ist 2011 bis 2014 entwickelt worden. Wir haben jetzt gerade Anfang des Jahres [2019] den fünften Geburtstag des AV-Portals gefeiert. Es ist also schon eine Weile online. Und in Bezug zu den einzelnen Videos, so hängen da auch Systeme wie die Langzeitarchivierung dran, sodass auch da eine gewisse Nachhaltigkeit gewährleistet wird, dass man idealerweise diese Videos auch in zwanzig Jahren oder auch später noch anschaut, sodass nicht irgendwann das Dateiformat nicht mehr lesbar ist, oder solche Dinge.

Ich drehe mal ein bisschen die Perspektive. Als Anwender interessiert mich vor allem natürlich dieser Nachhaltigkeitsaspekte, wie Sie gerade sagten: Logisch, dass ich die Sachen auch nach einer Weile wieder finden möchte. Aber auch: Kann ich die Videos einfach herunterladen? Kann ich sie in meine Website später einbinden? Kann ich die selbst einfach hochladen? Wie ist das mit Lizenzen gelöst? Können Sie zu der Seite vielleicht noch etwas sagen?

Herr Bastian Drees: Fange mal an mit dem Videoproduzenten. Also wenn ich Videos produziere als Lehrender, als Wissenschaftler, dann kann ich die bei uns hochladen. Dazu meldet man sich einfach an und lädt die über ein Upload-Formular hoch, das ein bisschen komplizierter ist als bei YouTube, da wir ein paar Metadaten mehr erfragen und eben auch so etwas wie die Lizenz. Aber was für Einzelvideos auf jeden Fall überhaupt kein Problem ist. Wenn es jetzt irgendwie eine große Menge an Videos ist, dann empfiehlt es sich uns einmal zu kontaktieren, weil wir dann einfachere Zugangsmöglichkeiten haben, um gleich 100 oder 200 Videos auf einmal hochzuladen.

Die Lizenz wählt der Herausgeber, der Autor, bzw. derjenige, der hochlädt selbst. Da ist er völlig frei. Ich kann das unter den ganz normalen Bedingungen des Urhebergesetztes veröffentlichen. Aber wir versuchen schon darauf hinzuweisen oder unser Favorit wäre natürlich, dass alle Leute es unter einer Open-Access-Lizenz veröffentlichen. Und es sind auch über 90 Prozent der Videos, die online sind, unter eine Open-Access-Lizenz veröffentlicht.

Also wahrscheinlich unter irgendeiner der Creative-Commons-Lizenzen.

Herr Bastian Drees: In der Regel eben Creative Commons. Da sind es dann sehr unterschiedliche, je nachdem was die Version angeht oder ob das international ist: Österreich, Schweiz, Deutschland. Wo eben die Herausgeber sitzen.

Für den Endnutzer ist es dann so, also für den Konsumenten sozusagen: Solange das lizenzrechtlich erlaubt ist und das ist wie gesagt bei den meisten Videos der Fall, kann man die Videos bei uns herunterladen. Es gibt da einfach direkt unter dem Video so einen kleinen Download-Button, da kann ich die Videos herunterladen. Direkt darunter ist auch so ein kleiner Embed-Code angegeben, sodass ich auch die Videos auf meiner Seite einbetten kann. Da kann man auch als Nutzer nichts verkehrt machen, denn wenn dieser Download-Button da ist und dieser Embed-Code da ist, dann darf ich das auch lizenzrechtlich. Da wo ich es nicht darf, da ist er nicht angegeben.
Von den Lizenzen her sind wir eben bemüht die Herausgeber davon zu überzeugen, dass es in ihrem eigenen Interesse ist, eine möglichst freie Lizenz zu wählen. Aber am Ende ist natürlich der Herausgeber derjenige, der entscheidet.

Sie hatten gesagt, das Portal läuft eine Weile, sie hatten jetzt schon den fünften Geburtstag. Ich frage nochmal so ein bisschen nach den Erfahrungen bis jetzt. Wie wird es genutzt? Also wird es viel genutzt und was sind so die größten Herausforderungen im Betrieb und in der Weiterentwicklung, die Sie jetzt so mitbekommen haben in der Zeit?

Herr Bastian Drees: Die Nutzung ist in den letzten Jahren extrem angestiegen. Das liegt glaube ich in der Natur der Sache. Als es das erste Mal online war, da war die Nutzung noch relativ verhalten. Auch die Zahl der Videos, es ging glaube ich online mit etwa 4000 Videos. Mittlerweile haben wir über 20.000 Videos von über 200 verschiedenen Herausgebern. Wobei das schwierig ist, da Herausgeber mal Einzelpersonen sind, mal ganze Institute oder ganze Universitäten. Also das können auch ganz unterschiedliche Herausgeber sein.

Die Nutzung ist mittlerweile auch sehr stark angestiegen und steigt weiter. Also wir haben im Moment etwa eineinhalb Tausend Nutzer am Tag und wir steuern darauf zu dieses Jahr vermutlich die halbe Millionen Nutzer-Marke in diesem Jahr zu knacken, was dann eine neue Bestmarke wäre. Letztes Jahr hatten wir 400.000 Nutzer in einem Jahr. Also, die Zahlen steigen kontinuierlich eigentlich und ich hatte das eben noch nachgeschaut, wir hatten jetzt in den letzten neun Monaten etwa über zwanzig Monate Videospieldauer, die abgespielt wurde. Es wird also schon sehr intensiv genutzt, auch von anderen Institutionen, die die Videos entweder bei sich einbetten oder eben die Metadaten in ihre Suchmaschinen einbinden. Das ist dann zum Beispiel bei der Deutschen Digitalen Bibliothek oder bei der SLUB Dresden oder anderen Bibliotheken der Fall. Da werden die Metadaten verwendet.

Auch auf verschiedenen Lernplattformen, LEIFIphysik ist zum Beispiel so ein Beispiel, da werden die Videos dann direkt in die entsprechenden Artikel eingebunden und da stehen wir, mal mehr mal weniger, mit den Leuten in Kontakt um da irgendwie Hilfestellung zu geben. Auch mit wissenschaftlichen Verlagen haben wir Kooperationen, zum Beispiel mit dem Copernicus-Verlag, das ist ein Open-Access-Verlag in Göttingen, da sind wir quasi deren Videopublikations-Plattform. Also zu allen wissenschaftlichen Artikeln, bei denen audiovisuelle Medien mitgeliefert werden, die werden im Prinzip bei uns veröffentlicht.

Und Sie hatten noch nach Herausforderungen gefragt. Da ist derzeit definitiv die größte Herausforderung die, dass bislang die einzelnen Module (also die Analyse-Tools, das Frontend und das Backend und so weiter), zum Teil oder vollständig von externen Anbietern betreiben wurden. Wir sind gerade dabei, dies Schritt für Schritt quasi ins Haus zu holen und dabei auch auf Open-Source-Lösungen umzustellen. Dieser Transfer vom externen Dienstleister auf den eigenen Betrieb und die gleichzeitige Umstellung auf Open-Source-Lösungen, das ist derzeit das was bei der Entwicklung oder Weiterentwicklung die größte Herausforderung darstellt. Definitiv.

Da Sie gerade Transfer angesprochen haben und auch, mit wie vielen Partnern sie eigentlich vernetzt sind, nochmal eine Nachfrage: Ist Praxistransfer, also der inhaltliche, da es auch um viele wissenschaftliche Themen geht, ist das Thema bei Ihnen? Also, so etwas bewusst zu tun oder ergibt sich das automatisch dadurch, dass man viele Partner hat, dass Leute das einbinden. Ist das ein Thema, das bei Euch auf der Agenda ist?

Herr Bastian Drees: Da sind wir an so einer Querschnittsstelle.

Genau, das Gefühl hatte ich.

Herr Bastian Drees: Eines der Projekte bzw. eine der Aktivitäten, die wir jetzt seit gut einem Jahr stark vorantreiben, die so in diese Richtung geht und in der auch dieser Transfergedanke eine Rolle spielt, ist der Konferenz-Aufzeichnungsdienst. Wir hatten und haben von Beginn an sehr viele Aufzeichnungen wissenschaftlicher Konferenzen im Portal. In diesem Kontext hatten wir auch immer sehr viel Kontakt zu Konferenzorganisatoren gehabt und dabei gemerkt: Okay, viele Leute möchten ihre Konferenzen aufzeichnen, es ist aber nicht so eine einfache Geschichte. Am Ende stehen die Leute meistens mit irgendwelchen Videos da, die qualitativ nur mittelmäßig sind und wissen nicht genau wohin damit. Sie haben sich vielleicht auch nicht vorher Gedanken gemacht: Unter welche Lizenz stelle ich das? Haben sich bei den Vortragenden nicht die Rechte einholen lassen und solche Dinge.

Diese Probleme tauchen regelmäßig auf und da haben wir den Konferenz-Aufzeichnungsdienst ins Leben gerufen, wo wir jetzt wirklich mit ein paar Kollegen dahingehen und Konferenzen aufzeichnen. Diesen ganzen Prozess begleiten wir im Grunde von vorne bis hinten und veröffentlichen eben dann auch bei uns oder streamen gleich live. Da ist ganz bewusst auch diese Idee vorhanden: Diese geschlossene wissenschaftliche Community, die da unter sich etwas erzählt; diese Vorträge oder dieses Wissen auch der Öffentlichkeit zugänglich zu machen und nicht nur für die Teilnehmer der Konferenz geschlossen zu halten.

Und hier in der TIB selbst finden auch Tagungen oder irgendwelche Symposien, die hier gemeinsam mit der Uni auch gehalten werden, statt. Und da sind wir natürlich auch da, dass wir unsere eigenen Sachen aufzeichnen und darüber zur Verfügung stellen.

Ja, also auf jeden Fall sehr spannend. Wie ist die URL, dass man draufkommt?

Herr Bastian Drees: av.tib.eu.

Vielen Dank, ich fand das sehr spannend. Bedanke mich noch einmal ganz herzlich für das Interview und sage auf Wiedersehen.

Herr Bastian Drees: Vielen Dank, hat mich gefreut.