<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <journal-title-group>
        <journal-title>Journal of Computer and Sys</journal-title>
      </journal-title-group>
      <issn pub-type="ppub">1613-0073</issn>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.1016/j.procir.2021</article-id>
      <title-group>
        <article-title>mit AutoML</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Julius Voggesberger</string-name>
          <email>julius.voggesberger@ipvs.uni-stuttgart.de</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
          <xref ref-type="aff" rid="aff3">3</xref>
          <xref ref-type="aff" rid="aff4">4</xref>
          <xref ref-type="aff" rid="aff5">5</xref>
          <xref ref-type="aff" rid="aff6">6</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>A1: Genaue Klassifikatoren : Eine Steigerung der</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>A3: Genaue Entscheidungsfusion: Damit während</institution>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Generalisierbarkeit möglich ist. Diversität kann hierbei</institution>
        </aff>
        <aff id="aff3">
          <label>3</label>
          <institution>Institut für Parallele und Verteilte Systeme, Universität Stuttgart</institution>
          ,
          <addr-line>Universitätsstr. 38, Stuttgart</addr-line>
          ,
          <country country="DE">Deutschland</country>
        </aff>
        <aff id="aff4">
          <label>4</label>
          <institution>Maschinelles Lernen</institution>
          ,
          <addr-line>Klassifikator-Ensembles, Klassifikatordiversität, Entscheidungsfusion</addr-line>
        </aff>
        <aff id="aff5">
          <label>5</label>
          <institution>Vorhersagen übernommen werden. Damit ein Ensemble</institution>
        </aff>
        <aff id="aff6">
          <label>6</label>
          <institution>ermöglicht die Fusion der korrekten Vorhersagen</institution>
          ,
          <addr-line>wo-</addr-line>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2021</year>
      </pub-date>
      <volume>28</volume>
      <fpage>278</fpage>
      <lpage>283</lpage>
      <abstract>
        <p>Data for classification problems often exhibit complex characteristics that lead to inaccurate predictions of classifiers trained on the data. For example, training a classifier on a small amount of data can lead to overfitting. To solve such problems, multiple classifiers can be combined into an ensemble. For this purpose, multiple classifiers have to be trained that are as accurate and divers as possible. In this case, diversity stands for classifiers that make correct predictions on diferent data instances. Furhtermore, a suitable method for fusing the individual classifier predictions has to be selected In this paper, we present an approach using AutoML to automatically create and optimize ensembles. The approach is evaluated on two real-world datasets with complex data characteristics. The results of the evaluation show an improvement of the predictive accuracy by the automatically created ensembles.</p>
      </abstract>
      <kwd-group>
        <kwd>den Entscheidungsfusion können so primär die korrekten</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Zusammenfassung</title>
      <p>Daten für Klassifikationsprobleme weisen oft komplexe Charakteristika auf, die zu ungenauen Vorhersagen der mit den
Daten trainierten Klassifikatoren führen. Beispielsweise kann eine geringe Menge an Daten zu einer Überanpassung der
Klassifikatoren führen. Um derartige Probleme zu lösen, können mehrere Klassifikatoren zu einem Ensemble kombiniert
werden. Hierfür müssen mehrere Klassifikatoren trainiert werden, die möglichst genau, aber auch divers sind. Diversität
bedeutet in diesem Fall, dass die Klassifikatoren auf unterschiedlichen Dateninstanzen korrekte Vorhersagen trefen. Weiterhin
muss eine geeignete Methode für die Fusion der einzelnen Klassifikatorvorhersagen ausgewählt werden. In dieser Arbeit
stellen wir einen AutoML-Ansatz vor, mit dem die Erstellung und Optimierung eines Ensembles automatisiert möglich ist. Der
Ansatz wird anhand zweier Echtweltdatensätze mit komplexen Datencharakteristika evaluiert. Die Ergebnisse der Evaluation
zeigen hierbei eine Verbesserung der Vorhersagegenauigkeit durch die automatisch erstellten Ensembles.</p>
      <sec id="sec-1-1">
        <title>1. Einführung</title>
        <p>
          Um Erkenntnisse aus Daten zu gewinnen sowie
Vorhersagen und Entscheidungen zu trefen, werden oft
Klassifikationsalgorithmen verwendet. Diese finden in vielen
unterschiedlichen Bereichen, wie z. B. dem Medizinwesen,
wendung [
          <xref ref-type="bibr" rid="ref1">1</xref>
          ]. Jedoch kann ein Klassifikationsalgorithmus
nicht in jedem Fall einen Klassifikator mit einer hohen
Vorhersagegenauigkeit erstellen. So kann ein
Klassifikator durch das Training auf kleinen Datensätzen
überangepasst werden oder komplexe Datencharakteristika nicht
vollständig erfassen [
          <xref ref-type="bibr" rid="ref2 ref3 ref4 ref5 ref6">2, 3, 4, 5, 6</xref>
          ].
        </p>
        <p>
          Um diese Probleme zu lösen, können mehrere
Klassifikatoren in einem Ensemble kombiniert werden, sodass
eine höhere Vorhersagegenauigkeit und
Generalisierbarkeit erreicht werden kann [
          <xref ref-type="bibr" rid="ref3">3</xref>
          ]. Dabei trefen die
Klassifikatoren diverse Vorhersagen, welche in einem
Fusionsschritt zu einer gemeinsamen Vorhersage kombiniert
werden. Diversität bedeutet hierbei, dass die
Klassifikatoren fehlerhafte und korrekte Vorhersagen auf
unterschiedlichen Dateninstanzen trefen. Bei der
anschließennEvelop-O
34th GI-Workshop on Foundations of Databases (Grundlagen von
Daimplizit oder explizit erzeugt werden [
          <xref ref-type="bibr" rid="ref8">8</xref>
          ]. Implizite
Methoden manipulieren den Trainingsprozess der
Klassifikatoren durch die Verwendung von Zufall, wohingegen
explizite Methoden die Diversität direkt durch z. B.
Dider Fusion die korrekten Vorhersagen der Klassifikatoren
bevorzugt werden, muss ein geeigneter
EntscheidungsfuCEUR
        </p>
        <p>
          ceur-ws.org
© 2023 Copyright for this paper by its authors. Use permitted under Creative Commons License sionsalgorithmus ausgewählt werden [
          <xref ref-type="bibr" rid="ref3">3</xref>
          ]. Jedoch
existie
        </p>
      </sec>
    </sec>
    <sec id="sec-2">
      <title>Tabelle 1</title>
      <p>Vergleich von Ansätzen aus der Literatur. 3 = vollständig erfüllt, (3) = teilweise erfüllt, 7 = nicht erfüllt.</p>
    </sec>
    <sec id="sec-3">
      <title>Ensemble</title>
    </sec>
    <sec id="sec-4">
      <title>Algorithmen</title>
    </sec>
    <sec id="sec-5">
      <title>Automated</title>
    </sec>
    <sec id="sec-6">
      <title>Machine</title>
    </sec>
    <sec id="sec-7">
      <title>Learning</title>
    </sec>
    <sec id="sec-8">
      <title>Methoden</title>
      <sec id="sec-8-1">
        <title>Bagging [11], Boosting [12] Ungleichverteilte Daten [13], MEG [14]</title>
      </sec>
      <sec id="sec-8-2">
        <title>PUSION [9]</title>
        <p>
          ren viele unterschiedliche Fusionsalgorithmen, die ver- 2.1. Ensemble-Algorithmen
schiedene Strategien zur Fusion der Vorhersagen
verwenden und bei denen zusätzlich Hyper-Parameter optimiert Es existiert bereits eine Vielfalt an Algorithmen für die
Erwerden müssen [
          <xref ref-type="bibr" rid="ref10 ref9">9, 10</xref>
          ]. stellung von Ensembles. Die bekanntesten Verfahren sind
        </p>
        <p>In dieser Arbeit wird ein Überblick über unterschiedli- Boosting [12] und Bagging [11]. Beispiele für
Algorithchen Lösungsansätze für die Erstellung eines Ensembles, men dieser Verfahren sind AdaBoost [20] und Random
das diese Anforderungen erfüllt, gegeben. Die Ansätze Forests [21]. AdaBoost erzeugt Diversität explizit, indem
beziehen sich neben den Klassifikations- und Entschei- in einem iterativen Verfahren Klassifikatoren mit Fokus
dungsfusionsalgorithmen zu einem großen Teil auch auf auf die Fehler der vorhergehenden Klassifikatoren
traidie Betrachtung der Daten und ihrer Charakteristiken so- niert werden. Eine implizite Erzeugung der Diversität
wie auf Aspekte der Datenvorbereitung, die ebenso einen erfolgt jedoch nicht. Ebenso werden die Hyperparameter
wesentlichen Einfluss auf die Diversität und Genauigkeit der Klassifikatoren und die Entscheidungsfusion nicht
eines Ensembles haben können. Zusätzlich werden ers- optimiert. Random Forests teilen diese Defizite, jedoch
erte Ergebnisse anhand eines implementierten Ansatzes zeugt der Algorithmus die Diversität implizit statt explizit.
vorgestellt. Für die Automatisierung der Auswahl von Hierfür werden die Klassifikatoren auf unterschiedlichen,
Klassifikations- und Entscheidungsfusionsalgorithmen zufällig ausgewählten Teilmengen der Trainingsdaten
und der Optimierung ihrer Hyper-Parameter wird Auto- trainiert.
mated Machine Learning (AutoML) verwendet. Abschlie- Neuere Veröfentlichung fokussieren sich hingegen
ßend werden die Ergebnisse der Evaluation des Ansatzes auf die Verwendung von multikriterieller Optimierung.
anhand zweier Datensätze diskutiert. So wird z. B. in ”Multi-objective Ensemble Generation”</p>
        <p>
          Die restliche Arbeit ist wie folgt gegliedert: Anhand (MEG) [14] ein Ensemble sowohl anhand der Diversität
verwandter Arbeiten wird in Abschnitt 2 die Forschungs- als auch der Vorhersagegenauigkeit optimiert. Die
belücke aufgezeigt und anschließend in Abschnitt 3 Ansätze trachtete Menge an Klassifikatoren und
Entscheidungsfür deren Lösung präsentiert. Ein erstes auf diesen Ansät- fusionsalgorithmen ist hierbei jedoch gering und
Diverzen basierendes Konzept wird in Abschnitt 4 vorgestellt, sität wird nur explizit erzeugt. Ein weiterer Algorithmus
sowie anhand zweier Datensätze evaluiert. Abschließend betrachtet Ensembles für ungleich verteilte Daten [13].
werden in Abschnitt 5 die Arbeit zusammengefasst sowie Hierfür werden die Gewichte eines Mehrheitsvotums
mögliche Ansatzpunkte für zukünftige Arbeiten genannt. Ansatzes sowohl anhand von Precision als auch Recall
optimiert. Jedoch werden die Klassifikatoren selbst nicht
optimiert, sondern nur aus einer Menge an 15
Algorith2. Verwandte Arbeiten men eine Untermenge für das Ensemble ausgewählt.
Einen anderen Ansatz bietet das PUSION
FrameIn diesem Abschnitt werden bestehende Ansätze betrach- work [
          <xref ref-type="bibr" rid="ref9">9</xref>
          ]. Dieses nimmt die diverse
Klassifikatormentet, die die Erstellung von Ensembles behandeln. Hierbei ge als gegeben an und optimiert ausschließlich den zu
wird zusätzlich der Fokus auf AutoML Ansätze gelegt, da verwendeten Entscheidungsfusionsalgorithmus. Jedoch
dieser Ansatz im weiteren Verlauf dieser Arbeit verfolgt wird hierbei nicht die Hyper-Parameteroptimierung der
wird. Eine Übersicht über die vorgestellte Literatur an- Entscheidungsfusionsalgorithmen mitbetrachtet.
hand der Anforderungen A1-A3 ist in Tabelle 1 gegeben.
        </p>
      </sec>
    </sec>
    <sec id="sec-9">
      <title>Datenaspekt (A1, A2)</title>
      <p>Impl. Diversität,
Vorverarbeitung</p>
    </sec>
    <sec id="sec-10">
      <title>Klassifikatoraspekt (A1, A2)</title>
      <sec id="sec-10-1">
        <title>Auswahl und Optimierung der Algorithmen, expl. Diversität</title>
      </sec>
    </sec>
    <sec id="sec-11">
      <title>Fusionsaspekt (A3)</title>
      <sec id="sec-11-1">
        <title>Auswahl und Optimierung der Fusionsalgorithmen</title>
        <p />
      </sec>
      <sec id="sec-11-2">
        <title>Klassifikator</title>
      </sec>
      <sec id="sec-11-3">
        <title>Menge</title>
        <p>Entscheidungsfusion

 1
 2

⋮</p>
      </sec>
      <sec id="sec-11-4">
        <title>Ensemble</title>
      </sec>
    </sec>
    <sec id="sec-12">
      <title>Domänenspezifische Datencharakteristika (A1, A2, A3)</title>
      <p>Komplexe Datencharakteristika, Domänenwissen, expl. Diversität
Abbildung 1: Schematische Darstellung eines Ensembles. Die Eingabe  ist ein Datensatz,   sind die Vorhersagen der
einzelnen Klassifikatoren und  ist die fusionierte Ausgabe des Ensembles. Blau hinterlegt sind die möglichen Aspekte zur</p>
      <sec id="sec-12-1">
        <title>Lösung der Anforderungen A1-A3.</title>
        <p>2.2. AutoML für Ensembles
Automated Machine Learning (AutoML) bezeichnet die
automatisierte Erstellung eines maschinellen
Lernmodells für gegebene Daten innerhalb eines bestimmten
Budgets [16]. Im AutoML-Bereich existieren bereits
viele verschiedene Frameworks, jedoch unterstützen nur
einige wenige die Erstellung und Optimierung von
Ensembles. So erlauben dies z. B. Auto-sklearn [16],
H2O [15], ESMBO [17], Bayesian Optimization for
Ensembles (BOE) [18] und AutoGluon-Tabular [19]. Jedoch
nehmen diese an, dass die Verwendung von
unterschiedlichen Algorithmen und Hyper-Parametrisierungen eine
ausreichend diverse Menge an Klassifikatoren erzeugt.
Zusätzlich dazu wird bei der Mehrheit der Frameworks
der Entscheidungsfusionsalgorithmus nicht optimiert,
sondern ein spezifischer Algorithmus vorgegeben. Eine
Ausnahme bildet H2O, welches eine begrenzte
Optimierung der Fusion erlaubt, indem verschiedene
Algorithmen für die Stacked Generalization verwendet werden
können.</p>
        <sec id="sec-12-1-1">
          <title>3. Lösungsansätze</title>
          <p>Methoden und den Einsatz impliziter
Diversitätsmethoden in der Datenvorbereitung ein. Über die
Manipulation der Daten kann die Genauigkeit und Diversität
der trainierten Klassifikator-Menge beeinflusst werden
(Anforderungen A1 und A2). Vorverarbeitungs- und
Feature-Engineering-Methoden beeinflussen
insbesondere die Vorhersagegenauigkeit der einzelnen
Klassifikatoren (A1). Diese Methoden bereiten die Daten auf, sodass
diese von Klassifikationsalgorithmen besser verarbeitet
werden können. Hierfür können z. B. kategorische Daten
numerisch kodiert oder die Dimensionalität der Daten
reduziert werden. Um mit Hilfe der Vorverarbeitungs- und
Feature-Engineering-Methoden zusätzlich die Diversität
zu erhöhen (A2), können je Klassifikator
unterschiedliche Methoden auf die Daten angewendet werden. Damit
wird jeder Klassifikator auf unterschiedlich vorbereiteten
Daten trainiert und angepasst, sodass die gesamte Menge
an Klassifikatoren insgesamt diverser wird.</p>
          <p>Alternativ</p>
          <p>werden innerhalb gängiger
EnsembleAlgorithmen, wie z. B. Random Forests, implizite
Diversitätsmethoden verwendet, um die Diversität zwischen den
einzelnen Klassifikatoren zu erhöhen (vgl. Abschnitt 2.1).</p>
          <p>Hierbei werden die Trainingsdaten für jeden Klassifikator
zufällig ausgewählt, z. B. über die Auswahl von
DatenIn diesem Abschnitt werden vier verschiedene Aspek- instanzen mit Bootstrapping [11] oder einer
Attributte vorgestellt, mit denen die Anforderungen A1-A3 zur
Erstellung eines Klassifikator-Ensembles gelöst werden
können (siehe Abbildung 1). Im Folgenden werden diese
Aspekte definiert, sowie deren Ansatzpunkte zur Lösung
der Anforderungen präsentiert.</p>
          <p>Teilmenge mit der Random-Subspace-Methode [22].</p>
          <p>Klassifikatoraspekt:</p>
          <p>Unter diesem Aspekt wird die
Auswahl und Optimierung der Klassifikatoren des
Ensembles anhand der Vorhersagegenauigkeit und
Diversität betrachtet (A1+A2). Diversität kann hierbei explizit</p>
          <p>Datenaspekt: Der Datenaspekt schließt die Verwen- über die Verwendung von Diversitätsmetriken optimiert
dung von Vorverarbeitungs- und
Feature-Engineeringwerden [23]. Mit Hilfe dieser Metriken, wie z. B. der
DopOverproduce:
Klassifikatoroptimierung
(A1)</p>
          <p>Select:</p>
        </sec>
      </sec>
      <sec id="sec-12-2">
        <title>Untermenge</title>
        <p>auswählen
hinsichtlich</p>
      </sec>
      <sec id="sec-12-3">
        <title>Diversität (A2)</title>
      </sec>
      <sec id="sec-12-4">
        <title>Entscheidungsfusionsoptimierung (A3)</title>
      </sec>
      <sec id="sec-12-5">
        <title>Auswahl der</title>
        <p>genausten</p>
      </sec>
      <sec id="sec-12-6">
        <title>Entscheidungsfusion</title>
        <p>Abbildung 2: Darstellung des gewählten Ansatzes für das AutoML-Frameworks für Ensembles. COGS = Optimierungsproblem.
pelfehlerrate oder Q-Statistik, kann die Diversität eines
werden, um so explizit anhand der Datencharakteristika
Ensembles gemessen und so eine Aussage über sie ge- Diversität zu erzeugen.
schreibt die Auswahl und Optimierung des Fusionsalgo- 4.1. AutoML-Ansatz für Ensembles
Daten sowie zeitliche Änderungen der statistischen Da- figurationen ausgewählt werden kann. Dies erlaubt es,
trofen werden. Jedoch ist aktuell der Zusammenhang
zwischen der mit diesen Metriken gemessenen
Diversität und der Genauigkeit des Ensembles aus
Klassifikatoren nicht ausreichend untersucht. Für die Optimierung
kann z. B. AutoML und Meta-Learning verwendet
werden. Meta-Learning bezeichnet das Lernen aus
vorherigen Erfahrungen, um schneller ein Modell mit hoher
Vorhersagegenauigkeit für einen neuen Datensatz zu
finden [24]. Als Erfahrungen werden hierbei Metadaten
bezeichnet, die vorherige Datensätze und darauf evaluierte
Machine-Learning-Algorithmen beschreiben [25, 26].</p>
        <p>Entscheidungsfusionsaspekt: Der Fusionsaspekt
berithmus. Die Optimierung erfolgt im Gegensatz zu den
Klassifikatoren lediglich anhand der
Vorhersagegenauigkeit (A3). Jedoch kann hier ebenfalls AutoML und
MetaLearning für die Optimierung verwendet werden.</p>
        <p>Domänenspezifische Datencharakteristika:</p>
        <p>
          Die
Ausnutzung domänenspezifischer Datencharakteristika
ermöglicht es, Wissen über die Daten und die
Datendomäne zu verwenden. Dies schließt komplexe,
domänenspezifische Datencharakteristika wie z. B. ungleiche
Klassenverteilungen, verschiedene Arten von Bias in den
tenverteilungen mit ein [27, 28, 29, 30, 31]. Beispielsweise
stellen Hirsch et al. [
          <xref ref-type="bibr" rid="ref4">4</xref>
          ] einen Ansatz vor, der
domänenspezifische Datencharakteristika sowie Domänenwissen
explizit innerhalb einer Vorbereitung der Daten ausnutzt,
um die Eingabedaten  in mehrere Teilmengen
aufzuteilen. Durch diese Datenpartitionierung können auf den
Teilmengen spezialisierte Klassifikatoren trainiert
werden, die für die jeweilige Datenteilmenge genauere
Vorhersagen trift als ein auf der gesamten Datenmenge 
trainierter Klassifikator (A1). Da jeder dieser
Klassifikatoren auf einer anderen Teilmenge der Daten trainiert
wurde, wird die gesamte Menge an Klassifikatoren divers
und kann für ein Ensemble genutzt werden (A2).
Analog kann Wissen über die Problemdomäne verwendet
werden, um geeignete Klassifikatoren und
Fusionsalgorithmen auszuwählen sowie die Größe des Ensembles zu
bestimmen (A3). Insbesondere kann dieses Wissen für die
Erstellung einer diversen Klassifikatormenge verwendet
        </p>
        <sec id="sec-12-6-1">
          <title>4. Erste Ergebnisse</title>
          <p>Die Diskussion bestehender Arbeiten in Abschnitt 2 zeigt,
dass aktuell kein Framework die Anforderungen A1-A3
erfüllt. Um dieses Problem zu lösen, haben wir [32] einen
Ansatz entwickelt, der auf die in Abschnitt 3
vorgestellten Lösungsansätze eingeht. Im Folgenden werden der
Ansatz und seine prototypische Implementierung
vorgestellt sowie erste Evaluationsergebnisse präsentiert.
Der hier vorgestellte Ansatz setzt die in Abschnitt 3
vorgestellten Klassifikations- und Fusionsaspekte mithilfe
von AutoML um (siehe Abb. 2). Für die Erstellung der
Klassifikator-Menge wird ein sogenannter „Overproduce
and Select“-Ansatz verfolgt: In einem Overproduce-Schritt
werden mehrere Klassifikatorkonfigurationen anhand
ihrer Vorhersagegenauigkeit durch AutoML optimiert und
evaluiert. Jede Konfiguration und ihre Evaluation
werden abgespeichert, sodass nach der Optimierung in einem
Select-Schritt eine Untermenge aus allen evaluierten
Koneine Menge an Klassifikatoren anhand ihrer Diversität
und Genauigkeit auszuwählen und somit die
Anforderungen A1 und A2 zu erfüllen.</p>
          <p>Für die Optimierung der Entscheidungsfusion wird
hingegen ausschließlich AutoML verwendet. Die
Optimierung und Auswahl des besten
Entscheidungsfusionsalgorithmus erfolgt somit anhand der
Vorhersagegenauigkeit, um die Anforderung A3 zu erfüllen.</p>
          <p>Durch dieses Vorgehen wird ein Ensemble erstellt,
dass die Anforderungen A1-A3 erfüllt. Weiterhin ist
die Komplexität des Suchraums und der Optimierung
niedrig, da die Klassifikator-Menge und die
Entscheidungsfusion getrennt voneinander optimiert werden [32].
Dies ermöglicht eine kürzere Laufzeit und erhöht die
Wahrscheinlichkeit eine genaue und generalisierende
Ensemble-Konfiguration zu finden.</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-13">
      <title>Tabelle 2</title>
      <p>Vorhersagegenauigkeit der Baseline, statischen Fusion und des optimierten Ensembles. Für die Baseline bezeichnet der
Entscheidungsfusionsalgorithmus den Klassifikationsalgorithmus. SVM=Support Vector Machine, AVG=„Simple Averaging“,
WV=Gewichtetes Mehrheitsvotum, RF=Random Forest, NN=Neurales Netzwerk.</p>
      <sec id="sec-13-1">
        <title>Datensatz Typ</title>
      </sec>
      <sec id="sec-13-2">
        <title>Kropt</title>
      </sec>
      <sec id="sec-13-3">
        <title>Ldpa</title>
        <p>Baseline
Statische Fusion
Optimiertes Ensemble
Baseline
Statische Fusion
Optimiertes Ensemble
SVM
AVG
WV
RF
AVG
NN</p>
      </sec>
      <sec id="sec-13-4">
        <title>Entscheidungsfusion</title>
      </sec>
      <sec id="sec-13-5">
        <title>Ensemblegröße</title>
      </sec>
      <sec id="sec-13-6">
        <title>Accuracy (%)</title>
      </sec>
      <sec id="sec-13-7">
        <title>Ausgewogene</title>
        <p>Accuracy (%)</p>
        <p>
          Makro F1 (%)
4.2. Implementierung letzteren beiden besser für Mehrklassenprobleme
geeignet sind. Um eine geeignete Größe für die
KlassifikatorDie Implementierung des Prototyps erfolgte in der Pro- Menge zu finden, werden alle Größen zwischen 2 und 30
grammiersprache Python. Für die Bereitstellung von Klas- getestet. Abschließend wird das Ensemble mit der
höchssifikationsalgorithmen wird die Bibliothek scikit-learn ten Vorhersagegenauigkeit gewählt. Für die Optimierung
1.0.2 [33] verwendet und Entscheidungsfusionsalgorith- der Klassifikatoren wird ein Limit von einer Stunde und
men sind aus dem PUSION-Framework 1.3.5 [
          <xref ref-type="bibr" rid="ref9">9</xref>
          ] adaptiert. für die Fusionsoptimierung von zehn Minuten festgelegt.
Als AutoML-Optimierung wird eine Zufallssuche [34] Vergleich von Baseline und optimiertem
Ensemverwendet, während für die Auswahl der Klassifikator- ble: Im Vergleich zwischen der Baseline und unserem
opMenge ein Clustering-Ansatz zum Einsatz kommt [35, 25]. timierten Ensemble erreicht Letzteres für beide
DatensätDurch den Clustering-Ansatz werden Klassifikatoren mit ze die höhere Vorhersagegenauigkeit. Die Verbesserung
einer niedrigen Diversität zueinander in ein Cluster grup- des Ensembles beträgt für den Kropt-Datensatz +2,
00%piert, und pro Cluster der Klassifikator mit der höchsten Punkte Accuracy, +2, 05%-Punkte ausgewogene
AccuVorhersagegenauigkeit ausgewählt. Weitere Software- racy und +2, 13%-Punkte Makro F1 und für den
LdpaBibliotheken, die für die Implementierung verwendet Datensatz +0, 93%-Punkte Accuracy, +8, 88%-Punkte
auswerden, sind NumPy 1.22.2, Pandas 1.4.0 und Scipy 1.8.0. gewogene Accuracy und +8, 39%-Punkte Makro F1. Bei
Der Prototyp wurde auf einem Cluster mit 16 virtuellen letzterem Datensatz fällt die Diferenz von Makro F1 und
CPU-Kernen und 32 GB RAM ausgeführt. gewichteter Accuracy Metrik mit mehr als +8%-Punkte
bedeutend größer aus als für die Accuracy. Dies ist darauf
4.3. Experimentelle Evaluation zurückzuführen, dass beide Metriken die Klassen in ihren
Der vorgestellte Ansatz wird anhand zweier Echtwelt- Berechnungen gleich gewichten, unabhängig von deren
datensätze evaluiert, die ungleiche Klassenverteilungen tatsächlichen Häufigkeit in den Daten.
aufweisen. Hierfür wurde der Schach-Datensatz Kropt1 Vergleich von statischer Fusion und
optimiermit 18 und der Bewegungs-Datensatz Ldpa2 mit 11 Klas- tem Ensemble: Bei der Betrachtung der
Fusionsoptisen ausgewählt. Als Baseline der Evaluation wird der mierung zeigt sich sogar eine Verschlechterung zur
Baseeinzelne Klassifikator gewählt, der während der AutoML- line, falls die Entscheidungsfusion nicht optimiert wird,
Optimierung die höchste Vorhersagegenauigkeit erzielt. sondern eine statische Fusion verwendet wird. So
verUm die Optimierung der Entscheidungsfusion separat zu ringert sich die Vorhersagegenauigkeit des Ensembles
beurteilen, wird zusätzlich das vom Prototyp optimierte ohne Optimierung um −4, 87%-Punkte Accuracy, −3,
86%Ensemble mit einem Ensemble ohne Fusionsoptimierung Punkte ausgewogene Accuracy und −2, 02%-Punkte
Maverglichen. Für dieses wird als statisch gewählte Ent- kro F1 für den Kropt-Datensatz und um −0, 49%-Punkte
scheidungsfusion das „Simple Averaging“ (AVG) [
          <xref ref-type="bibr" rid="ref3">3, 23</xref>
          ] Accuracy, −9, 88%-Punkte ausgewogene Accuracy und
auf die Klassifikator-Menge des optimierten Ensembles −11, 56%-Punkte Makro F1 für den Ldpa-Datensatz. Im
angewendet. Vergleich zu den optimierten Ensembles fällt die
Verbes
        </p>
        <p>Die Ergebnisse der Evaluation sind in Tabelle 2 auf- serung durch die Fusionsoptimierung im Vergleich zur
gelistet. Der Vergleich erfolgt anhand der Metriken Ac- statischen Fusion folglich nochmals höher aus. So
becuracy, Ausgewogener Accuracy und Makro F1, wobei trägt die Verbesserung für den Kropt-Datensatz +6,
87%Punkte Accuracy, +5, 90%-Punkte ausgewogene
Accuracy und +4, 15%-Punkte Makro F1 sowie +1, 42%-Punkte</p>
        <sec id="sec-13-7-1">
          <title>Acknowledgments</title>
          <p>Accuracy, +18, 76%-Punkte ausgewogene Accuracy und
+19, 95%-Punkte Makro F1 für den Ldpa-Datensatz.</p>
          <p>Diskussion: Durch die Evaluation konnte gezeigt wer- Der Autor bedankt sich bei Bernhard Mitschang und
den, dass die durch unseren Ansatz optimierten Ensem- Peter Reimann für ihr Feedback zur Verbesserung des
bles für beide Datensätze die Vorhersagen mit der höchs- Papers.
ten Genauigkeit erzielen. Insbesondere mit Bezug auf
ungleichverteilte Mehrklassenprobleme zeigt sich eine gro- Literatur
ße Verbesserung der Vorhersagegenauigkeit, wie anhand
der Makro F1 und ausgewogenen Accuracy-Metriken
gesehen werden kann. Zusätzlich zeigt sich diese
Verbesserung vor allem in Bezug auf die Optimierung der
Entscheidungsfusionsmethode. Wird diese nicht optimiert,
so kann sich die Vorhersage des Ensembles im Vergleich
zu einzelnen Klassifikatoren verschlechtern. Diese
Verbesserung lässt sich dadurch erklären, dass eine statisch
gewählte Entscheidungsfusionsmethode nicht auf die
gewählte Menge an Klassifikatoren sowie die verwendeten
Daten angepasst ist. Aus diesem Grund führt die hier
verwendete Optimierung der Entscheidungsfusion zu einer
höheren Vorhersagegenauigkeit.</p>
        </sec>
        <sec id="sec-13-7-2">
          <title>5. Zusammenfassung und nächste</title>
        </sec>
        <sec id="sec-13-7-3">
          <title>Schritte</title>
          <p>In dieser Arbeit haben wir einen AutoML-Ansatz
vorgestellt, der die automatische Optimierung eines Ensembles
ermöglicht. Hierbei wird die Klassifikator-Menge
hinsichtlich Diversität und Genauigkeit sowie die
Entscheidungsfusion hinsichtlich ihrer Genauigkeit optimiert.
Somit werden aktuell der Klassifikator- und
Entscheidungsfusionsaspekt behandelt. Der Ansatz wurde an zwei
Datensätzen mit unausgewogenen Klassenverteilungen
evaluiert. Anhand der Evaluation ist zu sehen, dass die
Erstellung eines optimierten Ensembles und die
Fusionsoptimierung eine Verbesserung der Vorhersagegenauigkeit
erzielen.</p>
          <p>In zukünftigen Arbeiten planen wir, den vorgestellten
Prototypen hinsichtlich des Datenaspektes zu erweitern.
So können Methoden für die implizite Diversität und
Vorverarbeitung integriert werden. Zusätzlich ist eine
ausführlichere Evaluation anhand weiterer Datensätze
wie z. B. MNIST3 und Covertype4 geplant. Hierbei sollen
weitere Aspekte wie der Einfluss der Diversität auf die
Optimierung des Ensembles mit betrachtet werden.</p>
          <p>Weiterhin kann Meta-Learning für die Auswahl von
Klassifikatoren und Entscheidungsfusionsmethoden
betrachtet werden. Zuletzt bietet die Betrachtung
domänenspezifischer Datencharakteristika neue Ansätze, um
z. B. Klassifikatoren und Entscheidungsfusionsmethoden
auszuwählen und zu optimieren.
3https://www.openml.org/d/554
4https://www.openml.org/d/180</p>
        </sec>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <given-names>I. H.</given-names>
            <surname>Sarker</surname>
          </string-name>
          ,
          <article-title>Machine learning: Algorithms, realworld applications and research directions</article-title>
          ,
          <source>SN computer science 2</source>
          (
          <year>2021</year>
          )
          <fpage>160</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>T. G.</given-names>
            <surname>Dietterich</surname>
          </string-name>
          ,
          <article-title>Ensemble Methods in Machine Learning</article-title>
          , in: G. Goos,
          <string-name>
            <given-names>J.</given-names>
            <surname>Hartmanis</surname>
          </string-name>
          , J. van Leeuwen (Eds.),
          <source>Multiple Classifier Systems</source>
          , volume
          <year>1857</year>
          ,
          <year>2000</year>
          , pp.
          <fpage>1</fpage>
          -
          <lpage>15</lpage>
          . doi:
          <volume>10</volume>
          .1007/3- 540- 45014-
          <issue>9</issue>
          _
          <fpage>1</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>R.</given-names>
            <surname>Polikar</surname>
          </string-name>
          ,
          <source>Ensemble Based Systems in Decision Making, IEEE Circuits and Systems Magazine</source>
          <volume>6</volume>
          (
          <year>2006</year>
          )
          <fpage>21</fpage>
          -
          <lpage>45</lpage>
          . doi:
          <volume>10</volume>
          .1109/
          <string-name>
            <surname>MCAS</surname>
          </string-name>
          .
          <year>2006</year>
          .
          <volume>1688199</volume>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [4]
          <string-name>
            <given-names>V.</given-names>
            <surname>Hirsch</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Reimann</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D.</given-names>
            <surname>Treder-Tschechlov</surname>
          </string-name>
          ,
          <string-name>
            <given-names>H.</given-names>
            <surname>Schwarz</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Mitschang</surname>
          </string-name>
          ,
          <article-title>Exploiting Domain Knowledge to Address Class Imbalance and a Heterogeneous Feature Space in Multi-Class Classiifcation</article-title>
          ,
          <source>The VLDB Journal</source>
          (
          <year>2023</year>
          ).
          <source>doi: 10.1007/ s00778- 023- 00780- 6.</source>
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [5]
          <string-name>
            <given-names>V.</given-names>
            <surname>Hirsch</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Reimann</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Mitschang</surname>
          </string-name>
          ,
          <article-title>Data-Driven Fault Diagnosis in End-of-Line Testing of Complex Products</article-title>
          ,
          <source>in: Proc. of the 6th IEEE International Conference on Data Science and Advanced Analytics (DSAA)</source>
          ,
          <year>2019</year>
          , pp.
          <fpage>492</fpage>
          -
          <lpage>503</lpage>
          . doi:
          <volume>10</volume>
          .1109/DSAA.
          <year>2019</year>
          .
          <volume>00064</volume>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [6]
          <string-name>
            <given-names>Y.</given-names>
            <surname>Wilhelm</surname>
          </string-name>
          , U. Schreier,
          <string-name>
            <given-names>P.</given-names>
            <surname>Reimann</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Mitschang</surname>
          </string-name>
          ,
          <string-name>
            <given-names>H.</given-names>
            <surname>Ziekow</surname>
          </string-name>
          ,
          <article-title>Data Science Approaches to Quality Control in Manufacturing: A Review of Problems, Challenges and Architecture</article-title>
          ,
          <source>in: Proc. of the 14th Symposium on Service-Oriented Computing (SummerSOC)</source>
          ,
          <source>Communications in Computer and Information Science (CCIS)</source>
          ,
          <year>2020</year>
          , pp.
          <fpage>45</fpage>
          -
          <lpage>65</lpage>
          . doi:
          <volume>10</volume>
          .1007/978- 3-
          <fpage>030</fpage>
          - 64846-
          <issue>6</issue>
          _
          <fpage>4</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [7]
          <string-name>
            <given-names>L.</given-names>
            <surname>Hansen</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Salamon</surname>
          </string-name>
          , Neural Network Ensembles,
          <source>IEEE Trans. on Pattern Analysis and Machine Intelligence</source>
          <volume>12</volume>
          (Oct./
          <year>1990</year>
          )
          <fpage>993</fpage>
          -
          <lpage>1001</lpage>
          . doi:
          <volume>10</volume>
          .1109/34. 58871.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [8]
          <string-name>
            <given-names>G.</given-names>
            <surname>Brown</surname>
          </string-name>
          , J. Wyatt,
          <string-name>
            <given-names>R.</given-names>
            <surname>Harris</surname>
          </string-name>
          ,
          <string-name>
            <given-names>X.</given-names>
            <surname>Yao</surname>
          </string-name>
          ,
          <article-title>Diversity Creation Methods: A Survey and Categorisation</article-title>
          ,
          <source>Information Fusion 6</source>
          (
          <year>2005</year>
          )
          <fpage>5</fpage>
          -
          <lpage>20</lpage>
          . doi:
          <volume>10</volume>
          .1016/j. inffus.
          <year>2004</year>
          .
          <volume>04</volume>
          .004.
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [9]
          <string-name>
            <given-names>Y.</given-names>
            <surname>Wilhelm</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Reimann</surname>
          </string-name>
          ,
          <string-name>
            <given-names>W.</given-names>
            <surname>Gauchel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Klein</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Mitschang</surname>
          </string-name>
          , PUSION
          <article-title>- A Generic and Automated Framework for Decision Fusion</article-title>
          ,
          <source>in: Proc. of the 39th International Conference on Data Engineering (ICDE)</source>
          ,
          <year>2023</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [10]
          <string-name>
            <given-names>Y.</given-names>
            <surname>Wilhelm</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Reimann</surname>
          </string-name>
          ,
          <string-name>
            <given-names>W.</given-names>
            <surname>Gauchel</surname>
          </string-name>
          ,
          <string-name>
            <surname>B. Mitschang,</surname>
          </string-name>
          <article-title>Overview on Hybrid Approaches to Fault Detection and Diagnosis: Combining Data-driven</article-title>
          , Physics-
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>