Sabine Rathmayer, Hans Pongratz (Hrsg.): Proceedings of DeLFI Workshops 2015 co-located with 13th e-Learning Conference of the German Computer Society (DeLFI 2015) München, Germany, September 1, 2015 10 PLuTO - Portable Lern- und Wissensplattform zum Trans- fer episodischen Wissens in Organisationen Sabrina Blümling1 und Norbert Reithinger2 Abstract: Das Projekt PLuTO unterstützt mittels multimedialer Wissensaufnahme und multimo- dalem Zugriff den Austausch von episodischem Wissen zwischen älteren und jüngeren Mitarbei- tern. Dabei wird das Wissen direkt in den Werkhallen der Unternehmen aufgenommen. Der Wis- sensabruf erfolgt über Tablets direkt in der Werkstatt. Neben Sensordaten werden auch Multimediadaten, wie Fotos oder Videos, direkt im Arbeitsprozess aufgenommen. Audiovisuelle Inhalte werden mithilfe einer domänenspezifischen Spracherkennung transkribiert und textuelle Inhalte mittels (semi-) automatischer Informationsextraktionsmethoden weiterverarbeitet. Zur Erstellung der Wissensbasis wird eine Ontologie modelliert. Das benötigte Hintergrundwissen wurde zu Projektbeginn von unserem Industriepartner zur Verfügung gestellt. Im späteren Einsatz kann die Wissensbasis dann durch die Arbeitnehmer vor Ort einfach erweitert werden und sie können über PLuTO auf das Erfahrungswissen bereits in Rente befindlicher Mitarbeiter zugreifen. Keywords: Wissensrepräsentation, Wissensmodellierung 1 Einleitung In Zeiten des demographischen Wandels wird es für Unternehmen immer wichtiger werden, das Erfahrungswissen der älteren Mitarbeiter zu sichern und aufzubereiten, um es nachfolgenden Generationen zur Verfügung zu stellen. Das Projekt PLuTO (Portable Lern- und Wissensplattform zum Transfer episodischen Wissens in Organisationen) 3 unterstützt dieses Vorhaben mittels multimedialer Wissensaufnahme und multimodalem Zugriff über Sprache oder Gesten und stellt das jeweils erforderliche Wissen allen Mit- arbeitern direkt am Arbeitsplatz zur Verfügung. Dabei wird das Wissen in verschiedensten Situationen direkt in den Werkhallen unseres Industriepartners, der Berliner Verkehrsbetriebe (BVG), aufgenommen. Als Infrastruk- turanbieter mit Anlagen, die teilweise mehr als 40 Jahre in Betrieb sind, ist die Sicherung des episodischen Wissens älterer Arbeitnehmer unumgänglich. Die BVG stellt im Rah- men des Projekts das Hintergrundwissen über den Wartungsprozess von U-Bahn- motoren bereit, welches in PLuTO benötigt wird. Der Wissensabruf erfolgt über Tablets, sodass dieser auch problemlos direkt am Arbeitsplatz in der Werkstatt erfolgen kann. 1 Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI GmbH) , Alt-Moabit 91c, 10559 Berlin, sabrina.bluemling@dfki.de 2 DFKI GmbH, Alt-Moabit 91c, 10559 Berlin, norbert.reithinger@dfki.de 3 http://www.plutoprojekt.de/ PLuTO 11 Dieser Beitrag fokussiert sich dabei auf die Modellierung und Realisierung einer struk- turoffenen Wissensbasis, in die das aufbereitete Wissen eingepflegt und somit verfügbar gemacht wird. Die zentralen Fragen hierbei sind, wie Wissen effizient repräsentiert und abgespeichert werden kann, wie Metadaten automatisch extrahiert werden können, und wie in den semistrukturierten Daten zielgerichtet Wissen gefunden und dargestellt wer- den kann? 2 Projektbeschreibung Mit dem PLuTO-Projekt wird episodisches Wissen bzw. Erfahrungswissen zwischen älteren und jüngeren Mitarbeitern in einer Werkstatt ausgetauscht. Zum einen kann das Wissen der erfahrenen Mitarbeiter multimedial im Arbeitsprozess erschlossen werden, zum anderen können die jüngeren Mitarbeiter mithilfe mobiler Geräte multimodal auf dieses Wissen zugreifen. So entsteht ein lebendiges Systems, welches kontinuierlich erweitert und angepasst werden kann. Unser Anwendungspartner ist die U-Bahnwerkstatt der BVG, speziell die Abteilung für die Wartung von U-Bahnmotoren. Das PLuTO-Projekt betrachtet dabei insbesondere die Szenarien Demontage eines Motors, Aufbereitung eines Ankers und Montage eines Motors. Abbildung 1 zeigt eine typische Situation bei der Montage eines Motors. Um nun das Erfahrungswissen der älteren Mitarbeiter aufzunehmen, werden kurze kommen- tierte Videos durch die Mitarbeiter selbst von den entsprechenden Arbeitsschritten ge- macht. Diese Videos werden dann automatisch analysiert und abgespeichert. Der Wis- sensabruf erfolgt über robuste Tablets mit der PLuTO-App, entwickelt vom Projektpartner Condat AG, die mit der Wissensbasis verbunden ist. Der Benutzer kann unterschiedliche Suchanfragen an das System stellen und die aufbereiteten Ergebnisse auf dem Tablet ansehen. Für das PLuTO-Projekt ergaben sich zu Beginn des Projektes mehrere Herausforderun- gen. Zum einen war die Dokumentation der BVG zu den einzelnen Motortypen zum Teil unvollständig bzw. über mehrere Systeme verteilt, was dadurch zu erklären ist, dass manche Komponenten teilweise über mehrere Jahrzehnte in Einsatz sind. Mit den Ver- antwortlichen der Datenbanken und Wissensmanagementsysteme der BVG wurde die aktuelle Datenlage geklärt, um die Integration der PLuTO-Wissensbasis in die bereits vorhandenen Systeme der BVG zu gewährleisten. Mit Hilfe des Vorhandwerkers, der alle zur Verfügung stehenden Materialien zusam- mengetragen, zusätzliche Bilder (inklusive Annotationen) des Motors in unterschiedli- chen Zuständen gemacht und alle unsere Anfragen ausführlich beantwortet hat, konnte dies schnell geklärt werden. Zum anderen gab es seitens des BVG Managements und des Personalrates am Anfang auch offene Fragen wegen des Datenschutzes und dem Schutz der Privatsphäre der Mit- 12 Sabrina Blümling und Norbert Reithinger arbeiter. Dies konnte jedoch gelöst werden, indem die Mitarbeiter und die Teamleitung in der Werkstatt von Anfang an ins das Projekt miteinbezogen werden und das Manage- ment und der Personalrat weiterhin regelmäßig über den Projektstand informiert wird. Bei der Prozessbeobachtung wurde außerdem festgestellt, dass die Mitarbeiter im Ar- beitsprozess keine Hände frei haben, bzw. Handschuhe tragen. Deshalb kommt eine Kamera zum Einsatz, die auf einen Helm montiert und von einem Tablet robust auch per Handschuh aus bedient wird. Das größte Problem stellt allerdings der Lärm in der Werk- halle dar. Es gibt dort viele verschiedene Arbeitsplätze an denen gleichzeitig unter- schiedliche Arbeiten durchgeführt werden. Da die aufgenommenen Videos mithilfe einer Spracherkennung analysiert werden sollen, muss die Art des Mikrofons für die Aufnah- men sorgfältig ausgewählt sein. Nach mehreren Versuchen wurde ein geeignetes Mikro- fon gefunden, welches eine unidirektionale Richtcharakteristik besitzt und somit nur wenige Nebengeräusche aufnimmt. Abb. 1: Mitarbeiter bei der Montage des Motors 3 Modellierung und Speicherung von Wissen 3.1 Erstellung einer Ontologie Im Allgemeinen ist die Aufnahme, Aufbereitung und Speicherung von Erfahrungswissen eine komplexe, nicht triviale Aufgabe aus dem Bereich des Wissensmanagements. Die größte Herausforderung bei der Teilung von Wissen, insbesondere von Erfahrungswis- sen, ist, dass implizites Wissen sich häufig nicht in Regeln gießen oder niederschreiben lässt; zumal Menschen oft nicht bereit sind, ihr Wissen aufwändig aufzuschreiben PLuTO 13 [GHR06], [CK13]. Neben Sensordaten werden deshalb auch Multimediadaten, wie Fotos oder Videos, situationsabhängig, direkt im Arbeitsprozess aufgenommen. Aus diesen Medien werden anschließend Metadaten (semi-)automatisch extrahiert, bevor die so entstandenen Wissensbausteine semantisch miteinander verknüpft werden. Damit dies effizient passieren kann, muss vorher geklärt werden, wie das Wissen bzw. die einzelnen Wissenselemente in Bezug zueinander stehen. Zunächst wurden die von der BVG zur Verfügung gestellten Daten sorgfältig analysiert und der Wartungsprozess des Motors in einer Ontologie modelliert [Gu98]. Dabei wurden acht Objektklassen (wie Bauteile oder Arbeitsschritte) identifiziert, sowie 13 Objekteigenschaften bzw. Relatio- nen (wie imageOf oder toolFor) und 14 Dateneigenschaften (wie Synonyme oder Be- schreibung). Die semantischen Relationen zwischen den einzelnen Objekten sollen die spätere Suche innerhalb der Wissensbasis vereinfachen. Abbildung 2 stellt die verwen- dete Ontologie dar, die in mehreren Iterationsschritten entstanden ist. Abb. 2: Ontologie zum Wartungsprozess von Motoren 3.2 Wissensbasis Die Speicherung von Wissen stellt besondere Anforderungen an die zu erstellende Wis- sensbasis. Notwendig ist die Möglichkeit vernetzte, divers strukturierte, multimediale 14 Sabrina Blümling und Norbert Reithinger Inhalte zu speichern und auf diese effizient zuzugreifen. Dieser Zugriff setzt unterschied- liche Arten der Abbildung bzw. Speicherung voraus, sowie unterschiedliche Zugriffsme- thoden und die Vernetzung der Inhalte. Das PLuTO-Projekt benutzt deshalb das Fedora Commons Repository (Flexible Exten- sible Digital Object Repository Architecture) 4, da es für alle Content-Typen inklusive Metadaten geeignet ist, es über die Webschnittstellen SOAP und REST zugreifbar ist und es sowohl eine RDF- wie auch Volltextsuche anbietet [La06]. Fedora Commons (FC) wird vor allem in Bereich Digital Libraries benutzt ([LA14], [MRA14]) und viele bekannte Universitäten haben ihre Systeme darauf aufgebaut 5. Obwohl es bei PLuTO nicht um den Aufbau einer digitalen Bibliothek geht, will man im PLuTO-Projekt jedoch genauso multimediale Inhalte vernetzen und abspeichern, um damit den Wartungspro- zess eines Elektromotors abzubilden. Damit die PLuTO-Plattform direkt einsatzbereit ist, bedarf es an Hintergrundwissen, welches in der Wissensbasis hinterlegt werden muss. Im späteren Einsatz von PLuTO können die Arbeitnehmer dann vor Ort einfach kommentierte Videos oder Bilder auf- nehmen und somit die Wissensbasis kontinuierlich erweitern. Momentan befinden sich insgesamt 399 Objektinstanzen in der Wissensbasis, davon sind 222 Bilder, 44 Bauteile, 37 Werkzeuge, 72 Arbeitsschritte und 15 Textdokumente. Außerdem befinden sich neun weitere Objekte in der Wissensbasis, welche das Wissensmodell repräsentieren 6. 4 Wissensaufbereitung Das Projekt konzentriert sich bei der Wissenserschließung (Aufnahme und Aufberei- tung) darauf, situationsabhängiges Wissen kontextbezogen mithilfe von Videos aufzu- nehmen. Diese audiovisuellen Inhalte werden anschließend mithilfe einer domänenspezi- fischen Spracherkennung transkribiert. Diese und andere textuelle Informationen werden mittels (semi-)automatischer Informationsextraktionsmethoden weiterverarbeitet. Die Projektpartner der Technischen Hochschule Wildau extrahieren dann aus den aufge- nommenen Bildern sogenannte Feature Deskriptoren, die dann zusammen mit dem ent- sprechenden Bild in der Wissensbasis abgespeichert werden, wodurch später eine Suche mit Bildern ermöglicht wird. Da aus unterschiedlichen Medien Metadaten extrahiert werden, müssen auch unter- schiedliche Vorverarbeitungsprozesse implementiert werden. Im PLuTO-Projekt werden Metadaten aus Textdateien, Bildern und Videos gewonnen. Alle Vorverarbeitungspro- zesse sind Offline-Prozesse. 4 http://www.fedora.info/ 5 http://www.fedora-commons.org/use-case-profiles 6 http://wiki.duraspace.org/display/DEV/Fedora+Ontologies PLuTO 15 4.1 Metadatenextraktion Im Projekt treten mehrere Arten von Textdateien auf, aus denen Fachbegriffe extrahiert werden. Zum einen sind es Dokumente der BVG (pdf, doc), wie Arbeitsanweisungen oder Instanthaltungsvorschriften, zum anderen müssen aber auch Annotationen von Bildern, Beschreibungen von Arbeitsschritten (txt) oder die Ergebnisse aus der Sprach- erkennung (xml) analysiert werden. Eine gute Übersicht über die Informationsextraktion aus Text und multimedialen Inhalten allgemein liefern [Ji12] und [Ma12]. Im PLuTO- Projekt wurde eine einfache Form der Informationsextraktion implementiert, die mithilfe eines Vollformenlexikons, welches alle morphologischen Varianten eines Fachbegriffs bzw. Keywords enthält, arbeitet. Alle Varianten werden mit dem Infinitiv, bzw. Nomina- tiv verknüpft. Damit wird verhindert, dass später unterschiedliche morphologische For- men eines Keywords im FC Repository auftauchen. Mithilfe der extrahierten Fachbegrif- fe können dann einzelne FC Objekte (wie Bilder oder Arbeitsschritte) erzeugt und in das zugrundeliegende Wissensmodell integriert werden, da sie es ermöglichen semantische Relationen zwischen Objekten herzustellen. Die Bilder, die in die Wissensbasis aufgenommen werden, müssen mit Annotationen versehen werden, die die BVG in einem Freigabeprozess hinzufügt. Ohne diese Annota- tionen können die Bilder nicht korrekt ins Wissensmodell eingefügt werden, da eine automatische Objekterkennung aller Bauteile nicht Gegenstand des Projektes ist. Aus den Annotationen werden dann wiederum die Fachbegriffe extrahiert. Abschließend werden zu den Bildern sogenannte Feature Deskriptoren berechnet und die gesamten Informationen werden im FC Repository abgespeichert. Die Feature Deskriptoren sind wichtig, um in der PLuTO-App die sogenannte Live-Suche startet zu können. Diese findet ein Referenzbild zu einem live aufgenommenen Bild und stellt damit eine Suchan- frage an die Wissensbasis. Der Mitarbeiter wird dann mit weiteren Informationen, wie abgebildete Bauteile inklusive Synonyme, identifizierte Arbeitsschritte, vorhandene Videos, usw. versorgt. Aufgenommene Videos müssen ebenfalls durch den Freigabeprozess, um in die Wis- sensbasis gespeichert zu werden. Zunächst wird die Tonspur extrahiert und mithilfe der Spracherkennung transkribiert. Das Ergebnis wird dann auf Fachbegriffe hin untersucht. Anschließend wird das Video im FC Repository abgespeichert und anhand der extrahier- ten Fachbegriffe ins Wissensmodell integriert. 4.2 Spracherkennung Um im Vorverarbeitungsprozess der Videos Sprache in Text umzuwandeln, wird im PLuTO-Projekt die Spracherkennung des European Media Laboratory (EML) 7 genutzt. Dieses System bietet den Vorteil, dass man ein eigenes Sprachmodell trainieren kann, wodurch es möglich ist, ein domänenspezifisches Vokabular zur Verfügung zu stellen, 7 http://www.eml.org/ 16 Sabrina Blümling und Norbert Reithinger ohne dass man Experte auf dem Gebiet der Spracherkennung sein muss. Das Sprachmo- dell für PLuTO wurde mit ca. 200 Textdokumenten aus dem Bereich Elektromotoren trainiert, wobei die BVG ungefähr ein Viertel der Dokumente bereitgestellt hat. Außer- dem wurden die korrigierten Transkriptionen der Sprachaufnahmen aus der Werkstatt verwendet. Mittlerweile steht ein umfassendes Vokabular mit ca. 900.000 Wortformen aus dem allgemeinen Wortschatz zur Verfügung. Dieses wurde dann um Fachvokabular wie z.B. Öleinlaufnase, Schrägstirnrad oder Labyrinthring ergänzt. Momentan werden rund 300 Fachbegriffe aus dem Bereich Wartung von Elektromotoren benutzt, welche durch die Spracherkennung auch sehr zuverlässig erkannt werden. Dabei wird das zugrundeliegende Sprachmodell kontinuierlich angepasst. In einer frühen Projektphase fand eine erste Evaluation der Spracherkennung statt. Dazu wurde die Fehlerrate der Fachbegriffe ermittelt, welche sich aus dem Quotienten der Anzahl nicht erkannter Fachbegriffe und der Anzahl der Fachbegriffe insgesamt berech- net. Demnach wurden mit dem ersten sehr einfachen Sprachmodell bereits zwei Drittel der Fachbegriffe richtig erkannt. Mittlerweile ist das Sprachmodell mehrmals adaptiert worden und es wird nun auch ein Mikrofon mit unidirektionaler Richtcharakteristik benutzt. Die Evaluation dieses neuen Sprachmodells ist für die letzten sechs Monate des Projektes angesetzt. 5 Ausblick Das PLuTO-Projekt unterstützt den Austausch episodischen Wissens zwischen älteren und jüngeren Mitarbeitern mithilfe multimedialer Wissensaufnahme und multimodalem Wissensabruf direkt im Arbeitseinsatz in der U-Bahnwerkstatt der BVG. Die zugrunde- liegende Wissensbasis ist mithilfe einer Ontologie modelliert, die den Wartungsprozess von Motoren repräsentiert. Dieses Modell kann auch auf andere Fabrikprozesse übertragen werden oder auch für andere Domänen erstellt werden. Grundsätzlich ist es möglich für jede Domäne ein ent- sprechendes Wissensmodell zu erstellen, Hintergrundwissen zu sammeln und ein Sprachmodell zu trainieren, um somit den Wissensaustausch zwischen Mitarbeitern zu ermöglichen. Andere Domänen werden andere Herausforderungen bzw. Schwierigkeiten mit sich bringen oder der Fokus wird sich verschieben. Z.B. in der Pflege wird man weniger ein Problem mit Lärm haben, aber dort wird der Schutz der Privatsphäre in den Vordergrund rücken, da es dabei sowohl um den Schutz der Pfleger, als auch um den Schutz der zu Pflegenden geht. Um ein System wie PLuTO dauerhaft in einen Produktionsprozess zu integrieren muss sowohl der finanzielle Aspekt betrachtet werden, als auch die Akzeptanz des Manage- ments und der Mitarbeiter vorhanden sein. Zunächst muss Geld investiert werden, um ein solches System zu installieren. Danach können damit aber auch Kosten eingespart PLuTO 17 werden, z.B. kann damit aufwendiges Suchen nach Informationen auf ein Minimum reduziert werden, da das ganze Wissen über den Wartungsprozess zentral und aufgear- beitet zur Verfügung steht und nicht mehr aufwendig bei Kollegen erfragt werden muss. In einer erweiterten Form könnte ein System wie PLuTO auch dabei helfen Ausbil- dungskosten zu senken. Die Akzeptanz eines neuen Systems seitens des Managements, das es bezahlen muss, und der Mitarbeiter, die es im Arbeitsalltag benutzen sollen, ist unumgänglich. Aus unserer Erfahrung mit PLuTO war dieser Aspekt sehr interessant, da am Anfang sowohl das Management als auch der Personalrat eher Bedenken hatten und sich nur drei Werkstattmitarbeiter freiwillig für PLuTO gemeldet hatten. Während der regelmäßigen Aufenthalte in den Werkhallen der BVG, in denen sich PLuTO Schritt für Schritt entwickelt hat, hat die Akzeptanz in der Belegschaft stark zugenommen. Immer mehr Mitarbeiter interessieren sich nun für das Projekt und können sich vorstellen es auch in Zukunft zu benutzen. Auch das Management und der Personalrat haben die an- fänglichen Bedenken nach den ersten Demonstrationsterminen abgelegt und können sich jetzt ebenfalls vorstellen, dass PLuTO zum Einsatz kommt. Literaturverzeichnis [CK13] Cress, U.; Kimmerle, J.: Computervermittelter Wissensaustausch als soziales Dilem- ma: Ein Überblick. Zeitschrift für Pädagogische Psychologie, 27, S. 9-26, 2013 [GHR06] Gruber, H.; Harteis, C.; Rehrl, M.: Professional Learning: Erfahrung als Grundlage von Handlungskompetenz. Bildung und Erziehung 59.2, S. 193-203, 2006 [Gu98] Guarino, N.: Formal ontology in information systems. Proceedings of FOIS’98, IOS Press, S. 3-15, 1998 [Ji12] Jiang, J.: Information Extraction from Text: Mining Text Data. Springer US, S. 11-41, 2012 [La06] Lagoze, C.; Payette, S.; Shin, E.; Wilper, C.: Fedora: an architecture for complex objects and their relationships: International Journal on Digital Libraries 2/06, S. 124- 138, 2006 [LA14] Lampi, M.; Alm, O.: Flexible data model for linked objects in digital archives: Archiv- ing Conference, Archiving 2014 Final Program and Proceedings, S. 174-178, 2014 [Ma12] Maybury, M. T.: Multimedia Information Extraction: Advances in Video, Audio, and Imagery Analysis for Search, Data Mining, Surveillance, and Authoring. John Wiley & Sons, Inc., Hoboken, NJ, USA, 2012 18 Sabrina Blümling und Norbert Reithinger [MRA14] Mayer, R.; Rauber, A.; Antunes, G.: A context model for digital preservation of pro- cesses and its application to a digital library system: Digital Libraries (JCDL), 2014 IEEE/ACM Joint Conference on, S. 459-460, 2014