=Paper=
{{Paper
|id=Vol-2397/paper3
|storemode=property
|title=Prädiktives Monitoring von Geschäftsprozessen zur Beherrschung von Risiken in weltweiten Netzen auf Basis von Process Mining und Simulation(Predictive Monitoring of Business Processes for Controlling Systemtic Risks in Global Networks)
|pdfUrl=https://ceur-ws.org/Vol-2397/paper3.pdf
|volume=Vol-2397
|authors=Peter Fettke,Peter Loos
|dblpUrl=https://dblp.org/rec/conf/wirtschaftsinformatik/FettkeL19
}}
==Prädiktives Monitoring von Geschäftsprozessen zur Beherrschung von Risiken in weltweiten Netzen auf Basis von Process Mining und Simulation(Predictive Monitoring of Business Processes for Controlling Systemtic Risks in Global Networks)==
Prädiktives Monitoring von Geschäftsprozessen zur Be- herrschung von Risiken in weltweiten Netzen auf Basis von Process Mining und Simulation Peter Fettke1,2 and Peter Loos1,2 1 Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), 66123 Saarbrücken 2 Universität des Saarlandes, Saarbrücken {peter.fettke,peter.loos}@dfki.de Abstract. Das Monitoring betrieblicher Prozesse ist eine Routineaufgabe, bei der eine Fülle von Daten über die Prozessausführung anfallen. Diese Daten können dazu genutzt werden, Abläufe von zukünftigen, noch nicht beobachtba- ren Prozessdurchläufen vorherzusagen. Auf diese Weise können eine Vielzahl verschiedener Prozessparameter wie Durchlaufzeiten, nächste Prozessschritte oder Risikofaktoren vorhergesagt werden. Diese Methoden beruhen darauf, dass eine Fülle von Daten vorliegen. Mithilfe von Simulationsansätzen können Daten künstlich erzeugt werden, wobei zwei Zwecke verfolgt werden: Erstens werden auf diese Weise Trainingsdaten für maschinelles Lernen verfügbar. Zweitens können auf diese Weise Process Mining und Simulationsansätze ver- knüpft werden, um tiefere Einsichten in reale und zukünftige Abläufe zu ge- winnen. Diese Ideen werden in dem Beitrag weiter entfaltet und anhand eines Fallbeispiels näher konkretisiert. Der Beitrag schließt mit einem Überblick über aktuelle Probleme wie der Umgang mit fehlerhaften Daten oder eine mangelnde Erklärbarkeit der Prognoseansätze. 1 Motivation der Ausgangslage Das Monitoring betrieblicher Prozesse ist ein wesentliches Instrument zur Erfolgskon- trolle, steht aber in jüngster Zeit vor erheblichen Herausforderungen: 1. Komplexität und Intransparenz: Betriebliche und überbriebliche Prozesse werden zunehmend komplexer, die tatsächlichen Abläufe sind nicht immer transparent. 2. Vielfalt der Daten: Während der Prozessbearbeitung wird eine Vielzahl von Daten erzeugt (Stichworte: Big Data, Industrie 4.0, Smart Machines), die grundsätzlich für das Monitoring eingesetzt werden können oder müssen. 3. Neue Anforderungen: An das Monitoring werden neue Anforderungen ge- tragen, wie bspw. eine frühzeitige Risikoerkennung und entsprechende As- sistenz. 23 Process Mining hat in der Vergangenheit eine beachtliche Reife erlangt, um Transpa- renz über die realen Prozessabläufe zu erhalten (de-facto Modelle). Damit wird die Modellierung von de-jure Modellen um eine wesentliche Perspektive ergänzt. Aller- dings ist die grundsätzliche Orientierung von Process Mining schwerpunktmäßig vergangenheitsorientiert. Zukünftige Entwicklungen stehen zunächst nicht im Vor- dergrund. Anders dagegen Methoden der Simulation, die nicht nur in der Wirtschaftsinformatik, sondern in vielen Wissenschaftsgebieten eine besondere Rolle im Erkenntnisgewin- nungsprozess haben. Auch können die Methoden zur Simulation betrieblicher Prozes- se vielfältig angewendet werden. Erfahrungen mit der Simulation haben dabei aller- dings nicht nur gezeigt, dass das Erstellen eines Simulationsmodells erhebliche Auf- wände erfordert. Vielmehr ist häufig die direkte und enge Verknüpfung des Simulati- onsmodells mit dem realen Zustand eines betrieblichen Systems schwer in Einklang zu bringen. Im vorliegenden Beitrag wird kein wissenschaftliches Forschungsergebnis dargestellt, sondern ein Einblick in aktuelle Forschungsarbeiten, auftretende Probleme, verfolgte Lösungsansätze und verwendete Methoden ausgewählter Arbeiten der Autoren gege- ben. Ferner werden die Ausführungen in den Kontext des geplanten Schwerpunktpro- gramms eingebettet. 2 Zielsetzung, Zuordnung zu den Arbeitsfeldern des geplanten Schwerpunktprogramms In dem geplanten Projekt sollen Methoden, Techniken und Instrumente für ein prädik- tives Monitoring betrieblicher und überbetrieblicher Prozesse geschaffen werden, die den skizzierten Herausforderungen gerecht werden. Ausgangspunkt sind die in Abbil- dung 1 skizzierten Daten der Prozessausführung wie Prozessschritte, Ausführungszei- ten, Reihenfolgen, eingesetzte Ressourcen und Sensordaten. Ausgehend von diesen Daten können Vorhersagen abgeleitet werden: 1. Prozessschritte: Wie entwickelt sich der Prozessfall voraussichtlich? 2. Zeiten bis zur Fertigstellung: Wann wird der Prozessfall abgeschlossen sein? 3. Erwartete Ergebnisse: Welches Prozessergebnis ist zu erwarten? Treten Feh- ler, Risiken oder Anomalien auf? 4. Prozessdrift: Sind signifikante Abweichungen in einem Prozessfall zu be- obachten? Wie entwickeln sich die Prozessfälle in ihrer Gesamtheit über die Zeit, welche Dynamik entsteht im Zeitablauf? 24 Antworten auf die vorherigen Fragen können aus Daten der Prozessausführung ge- wonnen werden und dienen besonders der Entscheidungsunterstützung (Arbeitsfeld „Therapie-Empfehlung“ und „Therapie-Kontrolle“). Darüber hinaus schaffen sie aber auch Transparenz im betrieblichen Geschehen („Anamnese“) und können in bestimm- ten Situationen auch zur Selbststeuerung eingesetzt werden. Um die Techniken des prädiktiven Monitorings von Geschäftsprozessen zu ermöglichen, sollen die Techni- ken des Process Mining und der Simulation eng miteinander verknüpft werden. Abbildung 1: Vorhersageaspekte bei der Ausführung betrieblicher Prozesse (vgl. Evermann et al. 2017) 3 Skizze des Neuen/Innovativen bzw. Abgrenzung zum Stand der Forschung und Technik Die Arbeiten sind in das neue Forschungsgebiet des prädikativen Prozessmanage- ments einzuordnen, das im Unterschied zu vorliegenden Arbeiten systematisch auf die zukunftsorientierte Entscheidungsunterstützung ausgerichtet ist (Di Francescomarino et al. 2016, Teinemaa et al. 2017). Damit werden in dem Vorhaben explizit systemati- sche Risiken in weltweiten Netzen adressiert, was bei den vorliegenden Arbeiten nur begrenzt der Fall ist. Ferner werden in dem Vorhaben Techniken des Deep Learning (LeCun et al. 2015) eingesetzt, die vor dem Hintergrund der Verfügbarkeit großer Datenmengen über Prozesse besonders vielversprechend sind. Erste Arbeiten der Antragsteller (Ever- mann et al. 2016, 2017a, 2017b, Mehdiyev et al. 2017) und anderer Kollegen sind äußerst vielversprechend (Nolle et al. 2016, Tax et al. 2017). Eine weitere Innovation entsteht in der Verknüpfung der Methoden des Process Mining mit Methoden der Simulation. 4 Forschungsmethode Das Vorhaben folgt einer ingenieurmäßigen Forschungsweise, bei der innovative Konzepte, Methoden und Techniken identifiziert, konzipiert, implementiert, pilotiert und evaluiert werden. Die innovativen Methoden werden durch neue technische Ent- 25 wicklungen ermöglicht („Technologiedruck“) und werden neuen betrieblichen Anfor- derungen gerecht („Bedarfssog“). Im Vorhaben spielt die geeignete Nutzung und Anpassung von Techniken des Deep Learning eine besondere Rolle. 5 Fallbeispiel Zur Demonstration und Illustration der beschriebenen Ideen, Konzepte und Methoden wird im Folgenden ein Fallbeispiel beschrieben. Das Fallbespiel baut auf den konzep- tionellen Vorüberlegungen von Fettke (2018) und den Ergebnissen der Bachelor- sowie Master-Arbeit von Bartels (2018) und Adamidis (2018) auf. Die Struktur des Fallbeispiels orientiert sich am folgenden Ablauf: 1. Auswahl und Darstellung des Anwendungsszenario, 2. Prozessmodell erstellen, 3. Simulationsparameter bestimmen, 4. Log-Daten simulieren, 5. Generierte Log-Daten manipulieren, 6. Vorhersagen auf Basis von Log-Daten vornehmen, 7. Ergebnisse interpretieren. Typische Großunternehmen unterhalten komplexe weltweite Wertschöpfungsketten mit vielfältigen Leistungsverflechtungen. Hierbei entstehen insbesondere auch im Bereich des Zolls und der Umsatzsteuer zunehmend umfassende Datenströme, die für steuerlich relevante Aufgaben, wie beispielsweise die Steuer-Compliance, eingesetzt werden können. Hierbei handelt es sich um betriebliche Massenprozesse, bei denen eine Fülle steuerlich relevanter Aufgaben im Unternehmen durchzuführen sind, viel- fältige Daten benötigt werden und an unterschiedlichen Stellen die zuvor beschriebe- nen Konzepte eingesetzt werden können. Ein mögliches Anwendungsszenario wird hier anhand der Rechnungsbearbeitung verdeutlicht und konkretisiert. Abbildung 2 zeigt exemplarisch einen derartigen betrieblichen Ablauf beginnend vom Rechnungs- eingang über die Rechnungsprüfung bis hin zur abschließenden Zahlung. Die zunehmende Digitalisierung von Steuerprozessen ermöglicht es, Techniken des Process Mining einzusetzen. Process Mining bietet Techniken zur maschinellen Ana- lyse betrieblicher Daten, um so in Echtzeit einen Überblick über sämtliche steuerrele- vante Prozesse und tatsächliche Abläufe im Unternehmen zu erhalten. Dabei lassen sich unter anderem drei Ansatzpunkte unterscheiden: • Transparenz über Abläufe in der Umsatzsteuer und im Zoll, • Verbesserung der Steuer-Compliance, • Prognose und Entscheidungsunterstützung. 26 Abbildung 2 visualisiert die Soll- und Ist-Abläufe der Rechnungsprüfung in einem Unternehmen. Wie aus der Abbildung ersichtlich ist, entfallen in einem exemplari- schen Prozessdurchlauf die Prüfschritte der formal-rechnerischen Prüfung sowie der Prüfung auf Voraussetzungen des §14 des Umsatzsteuer-Gesetzes. Hiermit sind Compliance-Verstöße eingetreten, die im Einzelfall schwerwiegende Konsequenzen haben können. Beispielsweise kann sich zu einem späteren Zeitpunkt herausstellen, dass der zu prüfende Sachverhalt eines Vorsteuerabzugs tatsächlich nicht gegeben war. Wenn dies aufgrund einer fehlenden Prüfung unerkannt geblieben ist, führt dies zum Aberkennen des möglichen Vorsteuerabzuges. Im Einzelfall können darüber hinaus weitaus schwerwiegendere Konsequenzen seitens der Betriebsprüfung einge- leitet werden. Abbildung 2: Soll- und Ist-Prozess der Rechnungsprüfung (Quelle: Bartels (2018)) In den weiteren Schritten werden ausgehend vom Soll-Modell entsprechende In- stanz-Daten mithilfe einer Simulation erzeugt. Für diesen Zweck wird die ARIS- Simulationskomponente verwendet. Die so erstellen Log-Dateien werden anschlie- ßend in zweierlei Hinsicht manipuliert: 1. Es werden zufällig mehrere Schritte in den Log-Dateien eliminiert. Auf diese Weise können ausbleibende Arbeitsschritte simuliert werden. 2. Darüber hinaus werden Aktivitäten in den Log-Dateien zufällig vertauscht. Derartige Manipulationen werden in unterschiedlichem Umfang vorgenommen. Kon- krete Schwellen sind jeweils Störungsanteile von 5, 10 und 20 Prozent. Die so synthe- tisch erzeugten Log-Dateien werden anschließend erneut zur Grundlage der Vorher- sage nächster Aktivitäten eingesetzt, wobei das von Evermann et al. (2016) beschrie- bene Verfahren genutzt wird. Dabei zeigt sich, dass die Vorhersage der nächsten Ak- 27 tivitäten weiterhin auf gutem Niveau erreicht werden kann. Mit anderen Worten: Das gezielte Einführen von Störungen in den Logdateien hat die Qualität der Vorhersage nicht signifikant in diesem Beispiel verändert. 6 Beitrag über das Projekt hinaus / Vorschläge für Arbeitskreise Es ist zu erwarten, dass über das Vorhaben hinaus die Anwendung und Nutzung von Techniken des Deep Learning im betrieblichen Umfeld im Unterschied zu bekannten Anwendungen im Bild-, Video-, Sprach-, Ton- und Sensorbereich erheblich gestärkt werden kann. Vor diesem Hintergrund wäre es von Interesse, einen Arbeitskreis zur Anwendung und Nutzung vom maschinellen Lernen / Deep Learning mit Vertretern aus der Betriebswirtschaftslehre, der (Wirtschafts-) Informatik und anderen anwen- dungsorientierten Informatikdisziplinen zu bilden. 7 Zusammenfassung und Ausblick Der Beitrag hat einen Überblick über den Einsatz von simulierten Daten im Kontext des prädiktiven Monitorings von Geschäftsprozessen gegeben. Es schließt sich eine Fülle konkreter Fragen an. Exemplarisch zu nennen ist beispielsweise: • Extraktion betrieblicher Daten aus einem ERP-System: Die bekannten An- sätze basieren im Wesentlichen auf Daten, welche typsicherweise in Work- flow-Systemen generiert werden. Dagegen sind Daten in betrieblichen An- wendungssystemen regelmäßig anders strukturiert. Zu nennen sind bei- spielsweise Daten über Buchungsbelege, kaufmännische Bücher (Grund- buch/ Journal, Haupt- und Nebenbuch), Bilanzen und Gewinn- und Verlust- rechnung. Auch wenn aus diesen kaufmännischen Daten zeitliche Zusam- menhänge gewonnen werden können, sind diese nicht unmittelbar offen- sichtlich, sondern sind geeignet zu rekonstruieren, was im Einzelfall über ei- nen typischen Datenextraktions- und Transformationsvorgang hinaus geht. • Synthetische Generierung von Modellen: In dem zuvor beschriebenen Fall- beispiel wurde exemplarisch synthetische Daten generiert. Hier sind weitere Ansätze denkbar. • Erklärbarkeit von Deep-Learning-Modellen: Auch wenn inzwischen ver- schiedene Ideen zur Erklärbarkeit von Prozessprognosen bekannt sind, bleibt ein breiter Raum für die weitere Forschung. • Vorhersage nächster Schritte im Unterschied zur Empfehlung optimaler Handlungen: Mithilfe der Vorhersage des nächsten Schrittes ist noch nicht klar, welcher Schritt tatsächlich gegangen werden soll. Auch sind hier weite- re Arbeiten zur Konkretisierung der relevanten Optimierungsfunktion not- wendig. 28 • Echtzeit-Feedback bei der Durchführung: Das Erkennen von Verhaltensän- derungen während der Ausführung beziehungsweise das Geben von Rück- meldungen bereits während der Ausführung als Grundlage für eines neues Training erscheint erfolgsversprechend, ist aber noch nicht realisiert. • Abtrainieren und Verlernen falsch Erlernten Verhaltens: Insofern Daten über falsches oder unerwünschtes Verhalten fälschlicherweise als Trainingsgrund- lage für richtiges Verhalten verwendet wurde, ist noch unklar, wie das Er- lernte wieder rückgängig zu machen ist. Das vollständige Neutrainieren des Verhaltens ist zwar in diesem Fall möglich, erscheint jedoch bei hohen Trai- ningsaufwänden nicht sinnvoll. Literatur 1. Philipp Adamidis: Entwicklung einer Methode für das Benchmarking von Process-Mining- Ansätzen auf Basis synthetischer Daten. Master-Arbeit, Universität des Saarlandes, 2018. 2. Felix Bartels: Analyse von Anwendungspotenzialen des Financial Process Minings zur Überwachung und Optimierung von umsatzsteuerrelevanten Prozessen im Rahmen eines Corporate Tax Compliance Frameworks. Bachelor-Arbeit, Universität des Saarlandes, 2018. 3. Joerg Evermann, Jana-Rebecca Rehse, Peter Fettke: A Deep Learning Approach for Pre- dicting Process Behaviour at Runtime. Business Process Management Workshops 2016: 327-338 4. Joerg Evermann, Jana-Rebecca Rehse, Peter Fettke: Predicting process behaviour using deep learning. Decision Support Systems 100: 129-140 (2017a). 5. Joerg Evermann, Jana-Rebecca Rehse and Peter Fettke: XES Tensorflow - Process Predic- tion using the Tensorflow Deep-Learning Framework. Conference on Advanced Infor- mation Systems Engineering (CAiSE) Forum, Essen, Germany, June 12-16, 2017b. 6. Peter Fettke: Umsatzsteuer, Zoll und Künstliche Intelligenz – Eine Einführung. MwStR 2018, S. 463- 471 7. Chiara Di Francescomarino, Marlon Dumas, Marco Federici, Chiara Ghidini, Fabrizio Maria Maggi, Williams Rizzi: Predictive Business Process Monitoring Framework with Hyperparameter Optimization. CAiSE 2016: 361-376. 8. Yann LeCun, Yoshua Bengio, Geoffrey Hinton, Deep learning, Nature 521 (2015) 436–444. 9. Irene Teinemaa, Marlon Dumas, Marcello La Rosa, Fabrizio Maria Maggi: Outcome- Oriented Predictive Process Monitoring: Review and Benchmark. CoRR abs/1707.06766 (2017) 10. Nijat Mehdiyev, Joerg Evermann, Peter Fettke: A Multi-Stage Deep Learning Approach for Business Process Event Prediction. IEEE CBI 2017. 11. Niek Tax, Ilya Verenich, Marcello La Rosa, Marlon Dumas: Predictive Business Process Monitoring with LSTM Neural Networks. CAiSE 2017: 477-492 12. Timo Nolle, Alexander Seeliger, Max Mühlhäuser: Unsupervised Anomaly Detection in Noisy Business Process Event Logs Using Denoising Autoencoders. DS 2016: 442-456 29