=Paper=
{{Paper
|id=Vol-2397/paper3
|storemode=property
|title=Prädiktives Monitoring von Geschäftsprozessen zur Beherrschung von Risiken in weltweiten Netzen auf Basis von Process Mining und Simulation(Predictive Monitoring of Business Processes for Controlling Systemtic Risks in Global Networks)
|pdfUrl=https://ceur-ws.org/Vol-2397/paper3.pdf
|volume=Vol-2397
|authors=Peter Fettke,Peter Loos
|dblpUrl=https://dblp.org/rec/conf/wirtschaftsinformatik/FettkeL19
}}
==Prädiktives Monitoring von Geschäftsprozessen zur Beherrschung von Risiken in weltweiten Netzen auf Basis von Process Mining und Simulation(Predictive Monitoring of Business Processes for Controlling Systemtic Risks in Global Networks)==
<pdf width="1500px">https://ceur-ws.org/Vol-2397/paper3.pdf</pdf>
<pre>
    Prädiktives Monitoring von Geschäftsprozessen zur Be-
    herrschung von Risiken in weltweiten Netzen auf Basis
              von Process Mining und Simulation
                                Peter Fettke1,2 and Peter Loos1,2
     1
         Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), 66123 Saarbrücken
                            2
                              Universität des Saarlandes, Saarbrücken
                         {peter.fettke,peter.loos}@dfki.de


          Abstract. Das Monitoring betrieblicher Prozesse ist eine Routineaufgabe, bei
          der eine Fülle von Daten über die Prozessausführung anfallen. Diese Daten
          können dazu genutzt werden, Abläufe von zukünftigen, noch nicht beobachtba-
          ren Prozessdurchläufen vorherzusagen. Auf diese Weise können eine Vielzahl
          verschiedener Prozessparameter wie Durchlaufzeiten, nächste Prozessschritte
          oder Risikofaktoren vorhergesagt werden. Diese Methoden beruhen darauf,
          dass eine Fülle von Daten vorliegen. Mithilfe von Simulationsansätzen können
          Daten künstlich erzeugt werden, wobei zwei Zwecke verfolgt werden: Erstens
          werden auf diese Weise Trainingsdaten für maschinelles Lernen verfügbar.
          Zweitens können auf diese Weise Process Mining und Simulationsansätze ver-
          knüpft werden, um tiefere Einsichten in reale und zukünftige Abläufe zu ge-
          winnen. Diese Ideen werden in dem Beitrag weiter entfaltet und anhand eines
          Fallbeispiels näher konkretisiert. Der Beitrag schließt mit einem Überblick über
          aktuelle Probleme wie der Umgang mit fehlerhaften Daten oder eine mangelnde
          Erklärbarkeit der Prognoseansätze.


1         Motivation der Ausgangslage

Das Monitoring betrieblicher Prozesse ist ein wesentliches Instrument zur Erfolgskon-
trolle, steht aber in jüngster Zeit vor erheblichen Herausforderungen:

     1.     Komplexität und Intransparenz: Betriebliche und überbriebliche Prozesse
            werden zunehmend komplexer, die tatsächlichen Abläufe sind nicht immer
            transparent.

     2.     Vielfalt der Daten: Während der Prozessbearbeitung wird eine Vielzahl von
            Daten erzeugt (Stichworte: Big Data, Industrie 4.0, Smart Machines), die
            grundsätzlich für das Monitoring eingesetzt werden können oder müssen.

     3.     Neue Anforderungen: An das Monitoring werden neue Anforderungen ge-
            tragen, wie bspw. eine frühzeitige Risikoerkennung und entsprechende As-
            sistenz.


                                                23
Process Mining hat in der Vergangenheit eine beachtliche Reife erlangt, um Transpa-
renz über die realen Prozessabläufe zu erhalten (de-facto Modelle). Damit wird die
Modellierung von de-jure Modellen um eine wesentliche Perspektive ergänzt. Aller-
dings ist die grundsätzliche Orientierung von Process Mining schwerpunktmäßig
vergangenheitsorientiert. Zukünftige Entwicklungen stehen zunächst nicht im Vor-
dergrund.

Anders dagegen Methoden der Simulation, die nicht nur in der Wirtschaftsinformatik,
sondern in vielen Wissenschaftsgebieten eine besondere Rolle im Erkenntnisgewin-
nungsprozess haben. Auch können die Methoden zur Simulation betrieblicher Prozes-
se vielfältig angewendet werden. Erfahrungen mit der Simulation haben dabei aller-
dings nicht nur gezeigt, dass das Erstellen eines Simulationsmodells erhebliche Auf-
wände erfordert. Vielmehr ist häufig die direkte und enge Verknüpfung des Simulati-
onsmodells mit dem realen Zustand eines betrieblichen Systems schwer in Einklang
zu bringen.

Im vorliegenden Beitrag wird kein wissenschaftliches Forschungsergebnis dargestellt,
sondern ein Einblick in aktuelle Forschungsarbeiten, auftretende Probleme, verfolgte
Lösungsansätze und verwendete Methoden ausgewählter Arbeiten der Autoren gege-
ben. Ferner werden die Ausführungen in den Kontext des geplanten Schwerpunktpro-
gramms eingebettet.


2        Zielsetzung, Zuordnung zu den Arbeitsfeldern des geplanten
         Schwerpunktprogramms

In dem geplanten Projekt sollen Methoden, Techniken und Instrumente für ein prädik-
tives Monitoring betrieblicher und überbetrieblicher Prozesse geschaffen werden, die
den skizzierten Herausforderungen gerecht werden. Ausgangspunkt sind die in Abbil-
dung 1 skizzierten Daten der Prozessausführung wie Prozessschritte, Ausführungszei-
ten, Reihenfolgen, eingesetzte Ressourcen und Sensordaten.

Ausgehend von diesen Daten können Vorhersagen abgeleitet werden:

    1.    Prozessschritte: Wie entwickelt sich der Prozessfall voraussichtlich?

    2.    Zeiten bis zur Fertigstellung: Wann wird der Prozessfall abgeschlossen sein?

    3.    Erwartete Ergebnisse: Welches Prozessergebnis ist zu erwarten? Treten Feh-
          ler, Risiken oder Anomalien auf?

    4.    Prozessdrift: Sind signifikante Abweichungen in einem Prozessfall zu be-
          obachten? Wie entwickeln sich die Prozessfälle in ihrer Gesamtheit über die
          Zeit, welche Dynamik entsteht im Zeitablauf?


                                           24
Antworten auf die vorherigen Fragen können aus Daten der Prozessausführung ge-
wonnen werden und dienen besonders der Entscheidungsunterstützung (Arbeitsfeld
„Therapie-Empfehlung“ und „Therapie-Kontrolle“). Darüber hinaus schaffen sie aber
auch Transparenz im betrieblichen Geschehen („Anamnese“) und können in bestimm-
ten Situationen auch zur Selbststeuerung eingesetzt werden. Um die Techniken des
prädiktiven Monitorings von Geschäftsprozessen zu ermöglichen, sollen die Techni-
ken des Process Mining und der Simulation eng miteinander verknüpft werden.


    Abbildung 1: Vorhersageaspekte     bei    der   Ausführung   betrieblicher   Prozesse
    (vgl. Evermann et al. 2017)


3      Skizze des Neuen/Innovativen bzw. Abgrenzung zum Stand
       der Forschung und Technik

Die Arbeiten sind in das neue Forschungsgebiet des prädikativen Prozessmanage-
ments einzuordnen, das im Unterschied zu vorliegenden Arbeiten systematisch auf die
zukunftsorientierte Entscheidungsunterstützung ausgerichtet ist (Di Francescomarino
et al. 2016, Teinemaa et al. 2017). Damit werden in dem Vorhaben explizit systemati-
sche Risiken in weltweiten Netzen adressiert, was bei den vorliegenden Arbeiten nur
begrenzt der Fall ist.

Ferner werden in dem Vorhaben Techniken des Deep Learning (LeCun et al. 2015)
eingesetzt, die vor dem Hintergrund der Verfügbarkeit großer Datenmengen über
Prozesse besonders vielversprechend sind. Erste Arbeiten der Antragsteller (Ever-
mann et al. 2016, 2017a, 2017b, Mehdiyev et al. 2017) und anderer Kollegen sind
äußerst vielversprechend (Nolle et al. 2016, Tax et al. 2017). Eine weitere Innovation
entsteht in der Verknüpfung der Methoden des Process Mining mit Methoden der
Simulation.


4      Forschungsmethode

Das Vorhaben folgt einer ingenieurmäßigen Forschungsweise, bei der innovative
Konzepte, Methoden und Techniken identifiziert, konzipiert, implementiert, pilotiert
und evaluiert werden. Die innovativen Methoden werden durch neue technische Ent-


                                         25
wicklungen ermöglicht („Technologiedruck“) und werden neuen betrieblichen Anfor-
derungen gerecht („Bedarfssog“). Im Vorhaben spielt die geeignete Nutzung und
Anpassung von Techniken des Deep Learning eine besondere Rolle.


5        Fallbeispiel

Zur Demonstration und Illustration der beschriebenen Ideen, Konzepte und Methoden
wird im Folgenden ein Fallbeispiel beschrieben. Das Fallbespiel baut auf den konzep-
tionellen Vorüberlegungen von Fettke (2018) und den Ergebnissen der Bachelor-
sowie Master-Arbeit von Bartels (2018) und Adamidis (2018) auf. Die Struktur des
Fallbeispiels orientiert sich am folgenden Ablauf:

    1.    Auswahl und Darstellung des Anwendungsszenario,
    2.    Prozessmodell erstellen,
    3.    Simulationsparameter bestimmen,
    4.    Log-Daten simulieren,
    5.    Generierte Log-Daten manipulieren,
    6.    Vorhersagen auf Basis von Log-Daten vornehmen,
    7.    Ergebnisse interpretieren.

Typische Großunternehmen unterhalten komplexe weltweite Wertschöpfungsketten
mit vielfältigen Leistungsverflechtungen. Hierbei entstehen insbesondere auch im
Bereich des Zolls und der Umsatzsteuer zunehmend umfassende Datenströme, die für
steuerlich relevante Aufgaben, wie beispielsweise die Steuer-Compliance, eingesetzt
werden können. Hierbei handelt es sich um betriebliche Massenprozesse, bei denen
eine Fülle steuerlich relevanter Aufgaben im Unternehmen durchzuführen sind, viel-
fältige Daten benötigt werden und an unterschiedlichen Stellen die zuvor beschriebe-
nen Konzepte eingesetzt werden können. Ein mögliches Anwendungsszenario wird
hier anhand der Rechnungsbearbeitung verdeutlicht und konkretisiert. Abbildung 2
zeigt exemplarisch einen derartigen betrieblichen Ablauf beginnend vom Rechnungs-
eingang über die Rechnungsprüfung bis hin zur abschließenden Zahlung.

Die zunehmende Digitalisierung von Steuerprozessen ermöglicht es, Techniken des
Process Mining einzusetzen. Process Mining bietet Techniken zur maschinellen Ana-
lyse betrieblicher Daten, um so in Echtzeit einen Überblick über sämtliche steuerrele-
vante Prozesse und tatsächliche Abläufe im Unternehmen zu erhalten. Dabei lassen
sich unter anderem drei Ansatzpunkte unterscheiden:

    •     Transparenz über Abläufe in der Umsatzsteuer und im Zoll,
    •     Verbesserung der Steuer-Compliance,
    •     Prognose und Entscheidungsunterstützung.


                                         26
Abbildung 2 visualisiert die Soll- und Ist-Abläufe der Rechnungsprüfung in einem
Unternehmen. Wie aus der Abbildung ersichtlich ist, entfallen in einem exemplari-
schen Prozessdurchlauf die Prüfschritte der formal-rechnerischen Prüfung sowie der
Prüfung auf Voraussetzungen des §14 des Umsatzsteuer-Gesetzes. Hiermit sind
Compliance-Verstöße eingetreten, die im Einzelfall schwerwiegende Konsequenzen
haben können. Beispielsweise kann sich zu einem späteren Zeitpunkt herausstellen,
dass der zu prüfende Sachverhalt eines Vorsteuerabzugs tatsächlich nicht gegeben
war. Wenn dies aufgrund einer fehlenden Prüfung unerkannt geblieben ist, führt dies
zum Aberkennen des möglichen Vorsteuerabzuges. Im Einzelfall können darüber
hinaus weitaus schwerwiegendere Konsequenzen seitens der Betriebsprüfung einge-
leitet werden.


  Abbildung 2: Soll- und Ist-Prozess der Rechnungsprüfung (Quelle: Bartels (2018))

   In den weiteren Schritten werden ausgehend vom Soll-Modell entsprechende In-
stanz-Daten mithilfe einer Simulation erzeugt. Für diesen Zweck wird die ARIS-
Simulationskomponente verwendet. Die so erstellen Log-Dateien werden anschlie-
ßend in zweierlei Hinsicht manipuliert:

  1.   Es werden zufällig mehrere Schritte in den Log-Dateien eliminiert. Auf diese
       Weise können ausbleibende Arbeitsschritte simuliert werden.

  2.   Darüber hinaus werden Aktivitäten in den Log-Dateien zufällig vertauscht.

Derartige Manipulationen werden in unterschiedlichem Umfang vorgenommen. Kon-
krete Schwellen sind jeweils Störungsanteile von 5, 10 und 20 Prozent. Die so synthe-
tisch erzeugten Log-Dateien werden anschließend erneut zur Grundlage der Vorher-
sage nächster Aktivitäten eingesetzt, wobei das von Evermann et al. (2016) beschrie-
bene Verfahren genutzt wird. Dabei zeigt sich, dass die Vorhersage der nächsten Ak-


                                           27
tivitäten weiterhin auf gutem Niveau erreicht werden kann. Mit anderen Worten: Das
gezielte Einführen von Störungen in den Logdateien hat die Qualität der Vorhersage
nicht signifikant in diesem Beispiel verändert.


6       Beitrag über das Projekt hinaus / Vorschläge für
        Arbeitskreise

Es ist zu erwarten, dass über das Vorhaben hinaus die Anwendung und Nutzung von
Techniken des Deep Learning im betrieblichen Umfeld im Unterschied zu bekannten
Anwendungen im Bild-, Video-, Sprach-, Ton- und Sensorbereich erheblich gestärkt
werden kann. Vor diesem Hintergrund wäre es von Interesse, einen Arbeitskreis zur
Anwendung und Nutzung vom maschinellen Lernen / Deep Learning mit Vertretern
aus der Betriebswirtschaftslehre, der (Wirtschafts-) Informatik und anderen anwen-
dungsorientierten Informatikdisziplinen zu bilden.


7       Zusammenfassung und Ausblick

Der Beitrag hat einen Überblick über den Einsatz von simulierten Daten im Kontext
des prädiktiven Monitorings von Geschäftsprozessen gegeben. Es schließt sich eine
Fülle konkreter Fragen an. Exemplarisch zu nennen ist beispielsweise:

    •    Extraktion betrieblicher Daten aus einem ERP-System: Die bekannten An-
         sätze basieren im Wesentlichen auf Daten, welche typsicherweise in Work-
         flow-Systemen generiert werden. Dagegen sind Daten in betrieblichen An-
         wendungssystemen regelmäßig anders strukturiert. Zu nennen sind bei-
         spielsweise Daten über Buchungsbelege, kaufmännische Bücher (Grund-
         buch/ Journal, Haupt- und Nebenbuch), Bilanzen und Gewinn- und Verlust-
         rechnung. Auch wenn aus diesen kaufmännischen Daten zeitliche Zusam-
         menhänge gewonnen werden können, sind diese nicht unmittelbar offen-
         sichtlich, sondern sind geeignet zu rekonstruieren, was im Einzelfall über ei-
         nen typischen Datenextraktions- und Transformationsvorgang hinaus geht.
    •    Synthetische Generierung von Modellen: In dem zuvor beschriebenen Fall-
         beispiel wurde exemplarisch synthetische Daten generiert. Hier sind weitere
         Ansätze denkbar.
    •    Erklärbarkeit von Deep-Learning-Modellen: Auch wenn inzwischen ver-
         schiedene Ideen zur Erklärbarkeit von Prozessprognosen bekannt sind, bleibt
         ein breiter Raum für die weitere Forschung.
    •    Vorhersage nächster Schritte im Unterschied zur Empfehlung optimaler
         Handlungen: Mithilfe der Vorhersage des nächsten Schrittes ist noch nicht
         klar, welcher Schritt tatsächlich gegangen werden soll. Auch sind hier weite-
         re Arbeiten zur Konkretisierung der relevanten Optimierungsfunktion not-
         wendig.


                                          28
    •    Echtzeit-Feedback bei der Durchführung: Das Erkennen von Verhaltensän-
         derungen während der Ausführung beziehungsweise das Geben von Rück-
         meldungen bereits während der Ausführung als Grundlage für eines neues
         Training erscheint erfolgsversprechend, ist aber noch nicht realisiert.
    •    Abtrainieren und Verlernen falsch Erlernten Verhaltens: Insofern Daten über
         falsches oder unerwünschtes Verhalten fälschlicherweise als Trainingsgrund-
         lage für richtiges Verhalten verwendet wurde, ist noch unklar, wie das Er-
         lernte wieder rückgängig zu machen ist. Das vollständige Neutrainieren des
         Verhaltens ist zwar in diesem Fall möglich, erscheint jedoch bei hohen Trai-
         ningsaufwänden nicht sinnvoll.


Literatur
 1. Philipp Adamidis: Entwicklung einer Methode für das Benchmarking von Process-Mining-
    Ansätzen auf Basis synthetischer Daten. Master-Arbeit, Universität des Saarlandes, 2018.
 2. Felix Bartels: Analyse von Anwendungspotenzialen des Financial Process Minings zur
    Überwachung und Optimierung von umsatzsteuerrelevanten Prozessen im Rahmen eines
    Corporate Tax Compliance Frameworks. Bachelor-Arbeit, Universität des Saarlandes,
    2018.
 3. Joerg Evermann, Jana-Rebecca Rehse, Peter Fettke: A Deep Learning Approach for Pre-
    dicting Process Behaviour at Runtime. Business Process Management Workshops 2016:
    327-338
 4. Joerg Evermann, Jana-Rebecca Rehse, Peter Fettke: Predicting process behaviour using
    deep learning. Decision Support Systems 100: 129-140 (2017a).
 5. Joerg Evermann, Jana-Rebecca Rehse and Peter Fettke: XES Tensorflow - Process Predic-
    tion using the Tensorflow Deep-Learning Framework. Conference on Advanced Infor-
    mation Systems Engineering (CAiSE) Forum, Essen, Germany, June 12-16, 2017b.
 6. Peter Fettke: Umsatzsteuer, Zoll und Künstliche Intelligenz – Eine Einführung. MwStR
    2018, S. 463- 471
 7. Chiara Di Francescomarino, Marlon Dumas, Marco Federici, Chiara Ghidini, Fabrizio Maria
    Maggi, Williams Rizzi: Predictive Business Process Monitoring Framework with
    Hyperparameter Optimization. CAiSE 2016: 361-376.
 8. Yann LeCun, Yoshua Bengio, Geoffrey Hinton, Deep learning, Nature 521 (2015) 436–444.
 9. Irene Teinemaa, Marlon Dumas, Marcello La Rosa, Fabrizio Maria Maggi: Outcome-
    Oriented Predictive Process Monitoring: Review and Benchmark. CoRR abs/1707.06766
    (2017)
10. Nijat Mehdiyev, Joerg Evermann, Peter Fettke: A Multi-Stage Deep Learning Approach
    for Business Process Event Prediction. IEEE CBI 2017.
11. Niek Tax, Ilya Verenich, Marcello La Rosa, Marlon Dumas: Predictive Business Process
    Monitoring with LSTM Neural Networks. CAiSE 2017: 477-492
12. Timo Nolle, Alexander Seeliger, Max Mühlhäuser: Unsupervised Anomaly Detection in
    Noisy Business Process Event Logs Using Denoising Autoencoders. DS 2016: 442-456


                                            29

</pre>