=Paper=
{{Paper
|id=Vol-1366/paper9.pdf
|storemode=property
|title=Ansätze zur Erkennung von Kommunikationsmodi in Online-Diskussionen
|pdfUrl=https://ceur-ws.org/Vol-1366/paper9.pdf
|volume=Vol-1366
|dblpUrl=https://dblp.org/rec/conf/gvd/Liebeck15
}}
==Ansätze zur Erkennung von Kommunikationsmodi in Online-Diskussionen==
Ansätze zur Erkennung von Kommunikationsmodi in Online-Diskussionen Matthias Liebeck Heinrich-Heine-Universität Düsseldorf Institut für Informatik Universitätsstr. 1 D-40225 Düsseldorf, Deutschland liebeck@cs.uni-duesseldorf.de Zusammenfassung se Textbeiträge können automatisiert analysiert werden, um Bei der automatisierten Analyse von Textbeiträgen aus Meinungsbilder über individuelle Themen zu erstellen. Online-Plattformen erfolgt oft eine Einteilung in positive 1.1 Analyse von Online-Diskussionen und negative Aussagen. Bei der Analyse von Textbeiträ- gen eines kommunalen Online-Partizipationsverfahrens ist Von besonderem Interesse ist die automatisierte Analy- eine Aufteilung der geäußerten Meinungen in Kommuni- se von Online-Partizipationsverfahren, bei denen Bürger die kationsmodi sinnvoll, um eine Filterung nach Argumenten Möglichkeit nutzen, ihre Meinung zu lokalkommunalen The- und Emotionsäußerungen für nachfolgende Verarbeitungs- men zu äußern. Bei einer oft erwünschten, hohen Teilneh- schritte zu ermöglichen. In dieser Arbeit werden zwei An- merzahl an Bürgern kann schnell das Problem auftreten, sätze zur Erkennung von Kommunikationsmodi vorgestellt. dass die beteiligten Bürger viele Textbeiträge erstellen und Das erste Verfahren unterscheidet verschiedene Kommuni- dadurch ein hoher Aufwand für eine manuelle Auswertung kationsmodi anhand von Wortlisten. Die zweite Methode entsteht. Dieser nicht unerhebliche Arbeitsaufwand kann für berücksichtigt Wortarten und extrahiert weitere sprachli- Kommunen mit geringem Budget zu dem Problem führen, che Eigenschaften. Zur Evaluation der Ansätze wird ein Da- dass für die Analyse nicht genügend personelle Ressourcen tensatz aus Schlagzeilen von Nachrichtenartikeln der Inter- zu Verfügung stehen und eine Analyse durch einen externen netseite ZEIT ONLINE und der Satire-Website Postillon er- Dienstleister finanziell ebenfalls nicht möglich ist. stellt. Die Ansätze werden zur Erkennung des Kommunika- Eine weitere Schwierigkeit entsteht, wenn in einer Kom- tionsmodus Satire eingesetzt. Das beste Ergebnis mit einem mune erstmalig ein Online-Beteiligungsverfahren eingesetzt durchschnittlichen F1 von 75,5 % wird durch den zweiten wird und die beteiligten Bürger vermehrt Inhalte äußern, Ansatz mit einer Support Vector Machine erreicht. die nicht zu dessen Thema passen. Werden in einem Verfah- ren beispielsweise gemeinsam Sparmaßnahmen diskutiert, so sind Beiträge, in denen Bürger kostenintensive Baumaßnah- Kategorien men an der städtischen Infrastruktur vorschlagen, nicht kon- I.2.7 [Natural Language Processing]: Text Analysis; struktiv und sollten herausgefiltert werden können. H.3.1 [Information stogare and retrieval]: Text Mining Um diese Probleme zu reduzieren, sind mehrere auto- matisierte Schritte denkbar, die zu einer Arbeitsreduk- Schlüsselwörter tion bei einer qualitativen Analyse führen. Durch diese Arbeitsreduktion kann eine Verwaltung umfassender mit Natural Language Processing, Text Mining, Text Analysis, den beteiligten Bürgern über eingereichte Verbesserungs- Sentiment Analysis, Opinion Mining, Emotion Recognition, vorschläge diskutieren. Zu diesen automatisierten Schrit- Satire Detection, Postillon ten gehören die thematische Gruppierung von Textbeiträ- gen und die themenspezifische Bestimmung einer Tonalität 1. EINLEITUNG t ∈ {positiv, negativ, neutral}, um ein Stimmungsbild ab- Im Internet gibt es viele verschiedene Plattformen, auf de- schätzen zu können. Dadurch kann beispielsweise ermittelt nen Meinungen, z. B. über Produkte, Filme oder politische werden, dass sich viele Bürger über eine Parkplatzsituati- Themen, als Textbeiträge geäußert werden können. Die Be- on in einem Stadtteil beschweren und Anpflanzungen neuer nutzer können untereinander Diskussionen führen, in denen Bäume in einem Park befürworten. sie idealerweise argumentativ ihre Meinungen darlegen. Die- Ein üblicher Ansatz zur Bestimmung von Tonalitäten ist der Einsatz eines Tonalitätslexikons, in dem für einzelne Wörter jeweils ein numerischer Tonalitätswert angegeben ist. In [10] wurde gezeigt, dass für das deutsche Tonali- tätslexikon SentiWS [14] nur eine geringe Abdeckung für die untersuchten Kommentare aus einem kleineren Online- Partizipationsverfahren und einem Nachrichtenportal er- reicht wurde und daher weitergehende Ansätze zur Bestim- mung von positiven und negativen Aussagen nötig sind. In 27th GI-Workshop on Foundations of Databases (Grundlagen von Daten- banken), 26.05.2015 - 29.05.2015, Magdeburg, Germany. dieser Publikation werden daher zwei Ansätze vorgestellt, Copyright is held by the author/owner(s). die eine differenziertere Analyse von Meinungsäußerungen 42 ermöglichen sollen, indem genauer auf Kommunikationsmo- ordnet wird, hat sich für die Analyse von Zeitungsartikeln di und geäußerte Emotionen eingegangen wird. im Rahmen einer Medienresonanzanalyse [16] bewährt. Die Erkennung von Emotionen in Texten ist bereits mehr- 1.2 Kommunikationsmodi fach [1, 8, 17] untersucht worden. Das Ziel von [1] ist die In Online-Diskussionen verwenden die Teilnehmer ver- Erkennung von Emotionen in Märchentexten. Die Autoren schiedene Kommunikationsmodi. Die einzelnen Beteiligten fokussieren sich dabei auf die binäre Klassifikation von eng- können beispielsweise Aussagen tätigen (1), Argumente für lischsprachigen Sätzen und untersuchen, ob in einem Satz oder gegen einen Standpunkt formulieren (2) oder Emoti- Emotionen auftreten. Dafür annotieren sie einen Datensatz onsäußerungen zum Ausdruck bringen (3). von 1580 Sätzen aus 22 Geschichten der Gebrüder Grimm, (1) Ich bin für den Bau eines Schwimmbads. auf dem ein linearer Klassifikator trainiert und evaluiert (2) Es sollte kein Geld für die Oper ausgegeben werden, wird. Zur vektoriellen Repräsentation der einzelnen Sätze da unsere Schulen das Geld dringender benötigen. verwendet [1] mehrere sprachliche Eigenschaften wie die Ver- (3) Die steigende Kriminalitätsrate macht mir Angst. teilung von POS-Tags, Satzlängen, Interpunktionszeichen Die Emotionsäußerungen können wiederum in ver- und mehrere Listen von Wörtern, die auf Emotionen hin- schiedene Emotionen differenziert werden. Bei der deuten. Untersuchung von Textbeiträgen aus Online-Par- Eine automatisierte Erkennung von sechs verschiedenen tizipationsverfahren sind zunächst die Emotionen Emotionen erfolgt in [17]. Die Autoren untersuchen meh- E := {Freude, Hoffnung, Empörung, Enttäuschung, Angst} rere Techniken auf einem Datensatz aus 1000 Schlagzeilen für ein Stimmungsbild der Bürgermeinungen interessant. von Nachrichtenartikeln. Für ein Baseline-Verfahren erstel- Eine fundiertere Einteilung wird in zukünftigen Arbeiten len die Autoren sechs Wortlisten aus WordNet-Affect [18], durch Experten erfolgen. Die folgenden Beispiele aus einem einer um Emotionen annotierte Erweiterung von WordNet fiktiven Online-Partizipationsverfahren veranschaulichen [11]. In dem Baseline-Verfahren erfolgt die Klassifikation ei- die unterschiedenen Emotionen. nes Satzes s zu Emotionen durch das Auftreten der einzelnen (4) Freude: Das wäre wirklich schön. Wörter aus s in den Wortlisten. In einem fortgeschrittenen (5) Hoffnung: Ich hoffe, dass an der Hauptstraße neue Verfahren, das aus einer Kombination aus Latent Semantic Bäume gepflanzt werden können. Analysis [9] und Synonymen aus WordNet und WordNet- (6) Empörung: Das gehört doch verboten! Affect besteht, erreicht [17] einen durchschnittlichen F1 Wert (7) Enttäuschung: Die zur letzten Wahlperiode verspro- von 17,57 % als bestes Ergebnis für die Erkennung der sechs chene Änderung konnte meine Erwartungen nicht er- Emotionen. füllen. In [3] wird ebenfalls das binäre Klassifikationsproblem der (8) Angst: Ich befürchte, dass meine Buslinie durch diese Satire-Erkennung in Zeitungsartikeln behandelt. Dabei be- Änderung eingestellt wird. rücksichtigen die Autoren zusätzlich den Inhalt der Nach- Bei der automatisierten Erkennung von Emotionen vari- richtenartikel. Als Datensatz untersucht [3] dabei insgesamt iert die Einteilung der Emotionen je nach Textmaterial. [17] 4000 englischsprachige Zeitungsartikel, von denen 233 Satire unterscheidet in die sechs Emotionen anger, disgust, fear, beinhalten. Als Basismodell wählen die Autoren ein Bag- joy, sadness und surprise, wohingegen [8] nur die vier Emo- of-Words-Modell mit binärer Gewichtung. Eine deutliche tionen anger, fear, joy und sadness betrachtet. Steigerung der Ergebnisse kann mit Bi-Normal Separation Der Grund für die Untersuchung von Kommunikations- (BNS) [6] als Gewichtung, dem Nachschlagen von Wörtern modi ist die Arbeitshypothese, dass durch eine automatische in einem Lexikon und einer Google-Suche nach auftreten- Erkennung der Emotionen E ein detaillierteres, themenspe- den Personen und Organisationsnamen erreicht werden. Zur zifisches Stimmungsbild angegeben werden kann, als es ein Klassifikation setzt [3] eine lineare Support Vector Machine Mittelwert über numerische Tonalitätsangaben ermöglicht. ein. Dazu muss ein Klassifikator K erstellt werden, der jedem Satz eines Textbeitrags individuell eine Emotion oder die 3. ANSÄTZE Klasse neutral zuordnet. Erschwerend bei der Klassifikation Im Folgenden werden zwei Ansätze vorgestellt, die für die ist die subjektive und kontextabhängige Wahrnehmung von Erkennung von Kommunikationsmodi in Textbeiträgen aus Emotionen. Online-Partizipationsverfahren naheliegend sind. Beide An- Der Rest dieser Arbeit ist wie folgt aufgebaut: Im nächs- sätze versuchen, die menschliche Erkennung von Emotionen ten Kapitel werden verwandte Arbeiten vorgestellt. Nach- nachzuahmen, indem sie auf die in den Textbeiträgen vor- dem in Kapitel 3 zwei Ansätze zur Erkennung von Kommu- handenen Wörter, in Form von Signalwörtern und bestimm- nikationsmodi präsentiert werden, erfolgt in Kapitel 4 eine ten sprachlichen Konstruktionen, achten. Evaluation beider Ansätze am Beispiel des Kommunikati- Dazu müssen die zu untersuchenden Texte satzweise ana- onsmodus Satire. Anschließend wird in Kapitel 5 ein Fazit lysiert werden. Die Eingabetexte werden zunächst durch ei- gezogen und Ideen für zukünftige Arbeiten angegeben. ne Natural Language Processing Pipeline aufbereitet. Die Anzahl an Verarbeitungsschritten der Pipeline ist von der 2. VERWANDTE ARBEITEN konkreten Aufgabenstellung abhängig. Für die vorgestellten Der Bereich Sentiment Analysis beschäftigt sich mit der Ansätze werden insgesamt vier Schritte in der NLP-Pipeline automatisierten Bestimmung von Tonalitäten in Textdoku- durchgeführt: Mittels eines Tokenizers wird ein Eingabetext menten. Übliche Anwendungsgebiete sind die Analyse von in einzelne Wörter zerlegt. Durch einen Sentence Splitter Produktrezensionen [7] und Filmrezensionen [12], die in po- werden die Wörter in Sätze gruppiert. Anschließend werden sitive und negative Äußerungen kategorisiert werden. Die für jedes Wort ein Part-of-Speech Tag (POS-Tag) bzw. eine automatisierte Extraktion von Tonalitäten, bei der einer Wortart bestimmt und eine Lemmatisierung durchgeführt, Aussage eine Tonalität t ∈ {positiv, negativ, neutral} zuge- durch die für jedes Wort zusätzlich eine Grundform (z. B. 43 Schwimmbäder → Schwimmbad) angegeben wird. werden. Der erste Ansatz untersucht, inwiefern bestimmte Schlüs- In einer Modifikation dieses Ansatzes werden nicht die selwörter auf einzelne Kommunikationsmodi oder Emotio- Wörter, sondern deren, durch eine Lemmatisierung be- nen hinweisen. Der zweite Ansatz arbeitet unter der Hy- stimmte, Grundformen in Wortlisten geführt bzw. nachge- pothese, dass eine Korrelation bestimmter sprachlicher Ei- schlagen. genschaften zu einzelnen Kommunikationsmodi auftritt. Da- bei werden die verwendeten Wortarten untersucht. Motiviert 3.2 Sprachliche Eigenschaften wird dieser Ansatz dadurch, dass eine positive Emotion bei- Der zweite Ansatz basiert auf der Hypothese, dass die ver- spielsweise mit einer überdurchschnittlichen Anzahl an Ad- schiedenen Kommunikationsmodi bzw. Emotionen im Text jektiven korrelieren könnte. charakteristische sprachliche Merkmale besitzen. Um die- In beiden Ansätzen wird jedem Satz mittels eines Klassi- se Vermutung auf einem Datensatz zu überprüfen, ist ei- fikators ein Kommunikationsmodus bzw. eine Emotion oder ne Methode M notwendig, die sprachliche Eigenschaften ei- die Klasse neutral zugeordnet. Um beide Ansätze evaluieren nes Satzes in eine vektorielle Darstellung überführt. Dazu zu können, muss ein annotierter Datensatz bzw. ein Korpus werden aus allen Sätzen einer Trainingsmenge sprachliche als Trainingsmenge verwendet werden, in dem auf Satzebe- Eigenschaften durch M extrahiert. Für einen zu klassifizie- ne alle Sätze mit entsprechenden Kommunikationsmodi an- renden Satz einer Testmenge werden ebenfalls sprachliche notiert sind. Der Korpus wird in eine Trainings- und eine Eigenschaften mittels M extrahiert, die anschließend mit ei- Testmenge aufgeteilt, anhand derer ein Klassifikator trai- nem Klassifikationsverfahren und einer Distanzfunktion zu niert bzw. bewertet werden kann. einem Kommunikationsmodus zugeordnet werden können. Eine einfache Annahme ist, dass bestimmte Kommunika- 3.1 Wortlisten tionsmodi bzw. Emotionen mit einer bestimmten Verteilung Der erste Ansatz basiert auf der Annahme, dass das Auf- von POS-Tags korrelieren. Als erste vektorielle Modellierung treten bestimmter Wörter mit einem Kommunikationsmo- eines Satzes s wird daher für jeden POS-Tag p eines Tagsets dus bzw. einer Emotion korreliert. Das Ziel des Ansatzes ist die Häufigkeit von p in s angegeben. die Verwendung von Wortlisten, die eine Klassifikation eines Diese vektorielle Darstellung kann um weitere sprachliche Satzes, basierend auf den in ihm enthaltenen Wörtern, er- Eigenschaften ergänzt werden, die eventuell charakteristisch möglichen. Für den nachfolgenden Satz können die Wörter für eine Emotion sein können, beispielsweise welche Wort- Angst und verliere auf die Emotion Angst hinweisen: art am Satzanfang und am Satzende steht oder welches In- (9) Ich habe Angst, dass ich verliere. terpunktionszeichen (Punkt, Fragezeichen oder Ausrufezei- Um diese Erkennung zu automatisieren, können für jede chen) einen Satz beendet. Ferner kann das Auftreten von Emotion charakteristische Wörter aus einer Trainingsmen- Negationen oder von verschachtelten Nebensätzen berück- ge extrahiert werden. Dazu werden in der Trainingsmenge sichtigt werden. auftretende Wörter untersucht und in disjunkte Wortlisten eingeteilt. Bei der Konstruktion dieser Wortlisten könnten für Beispiel (9) die Wörter Angst und verliere als charakte- 4. KOMMUNIKATIONSMODUS SATIRE ristisch identifiziert werden, falls sie auch in anderen Sätzen Da zum aktuellen Zeitpunkt noch keine ausreichende Da- der Trainingsmenge auftreten, die ebenfalls mit der Emoti- tenmenge an Diskussionensbeiträgen aus Online-Partizipati- on Angst annotiert sind. Die größte Schwierigkeit bei diesem onsverfahren vorliegt, werden die in Kapitel 3 beschriebenen Ansatz ist die passende Auswahl der Wörter für die Wortlis- Ansätze zur Erkennung von Kommunikationsmodi konkret ten. So muss darauf geachtet werden, keine Wörter zu ver- auf den Kommunikationsmodus Satire angewendet, indem wenden, die in allen Klassen häufig vorkommen. Daher bie- die Erkennung von Satire in Nachrichtenartikeln evaluiert tet es sich an, nur Wörter zu betrachten, die überwiegend in wird. In zukünftigen Arbeiten werden diese Techniken eben- einer Klasse (relative Häufigkeit größer als ein Schwellwert falls für die Erkennung von Emotionsäußerungen in Online- τ ) und damit nur selten in anderen Klassen vorkommen. Partizipationsverfahren erprobt und evaluiert. Wird allein auf den Schwellwert τ geachtet, so entsteht das Zur Evaluation wird ein Datensatz aus Nachrichtenar- Problem, dass auch Wörter in die Wortlisten aufgenommen tikeln zusammengestellt. Basierend auf den Überschriften werden, die insgesamt nur selten auftreten. Tritt beispiels- der Nachrichtenartikel soll das binäre Klassifikationsproblem weise das Wort Glück nur einmal in der Trainingsmenge gelöst werden, ob ein Nachrichtenartikel von der Satire- auf, und zwar in einem mit der Emotion Empörung anno- Webseite Postillon 1 stammt oder auf ZEIT ONLINE2 ver- tierten Satz, so würde das Wort Glück in die Wortliste für öffentlicht wurde. die Emotion Empörung aufgenommen werden, anstatt in die Wortliste der Emotion Freude. Um diese Problematik zu ver- 4.1 Datensatz meiden, bietet sich ein Parameter supp an, der angibt, wie Der zur Satire-Erkennung verwendete Datensatz setzt sich häufig ein Wort insgesamt in der Trainingsmenge auftreten aus den beiden Nachrichtenquellen Postillon und ZEIT ON- muss, bevor es in eine Wortliste eingefügt werden darf. LINE zusammen. Die Schlagzeilen der Artikel beider Web- Durch diese beiden Parameter werden häufig in allen Emo- seiten wurden jeweils über einen JSON-Webservice herun- tionen auftretende Wörter, wie Artikel und Pronomen, her- tergeladen. Für den Postillon werden 3650 Artikel aus dem ausgefiltert. Die konkrete Wahl der beiden Parameter kann Zeitraum Oktober 2008 bis März 2015 betrachtet. Die beiden durch ein Experiment geschätzt werden. nachfolgenden Schlagzeilen sind Beispiele für Satire-Artikel Um einen neuen Satz einer Emotion zuzuordnen, kann aus dem Postillon: jedes Wort w des Satzes in den Wortlisten nachgeschlagen 1 werden. Dem Satz wird diejenige Emotion zugeordnet, für http://www.der-postillon.com 2 die am meisten Wörter in der jeweiligen Wortliste gefunden http://www.zeit.de 44 (10) Sensation! Autobahn-Fahrer entdeckt weitere Fahr- bahn rechts neben der Mittelspur Tabelle 1: Satire-Erkennung mit Wortlisten (11) Kölner Dom von Unbekannten über Nacht um 360 Wort Lemma τ Grad gedreht + Default + Default Eine genauere Betrachtung der Satire-Artikel hat ergeben, 0,55 59,24 % 56,84 % 62,88 % 60,21 % dass bestimmte Artikelformate in regelmäßigen Abständen 0,6 61,51 % 57,74 % 64,21 % 60,38 % vorkommen, wie z. B. Sonntagsfragen oder Newsticker. Diese 0,65 59,23 % 55,73 % 57,59 % 54,03 % wurden für die weitere Betrachtung entfernt, um das Klassi- 0,7 58,87 % 52,11 % 53,75 % 47,70 % fikationsproblem zu erschweren. Da einige Artikel mehrfach 0,75 52,36 % 46,11 % 50,90 % 45,24 % veröffentlicht wurden, wird von allen Artikeln mit demselben 0,8 49,02 % 41,52 % 48,13 % 40,97 % Namen jeweils nur die chronologisch erste Veröffentlichung 0,85 43,41 % 33,58 % 43,81 % 33,58 % verwendet. Durch diese Filterungsschritte reduziert sich die 0,9 42,42 % 30,76 % 42,96 % 30,06 % Anzahl der zur Verfügung stehenden Postillon-Artikel auf 0,95 41,39 % 28,77 % 42,04 % 29,30 % 2260. 1 41,39 % 28,77 % 42,04 % 29,30 % Die zweite Klasse des Datensatzes setzt sich aus klas- sischen Zeitungsartikeln zusammen, die auf ZEIT ONLI- NE veröffentlicht wurden. Aus den Kategorien Wirtschaft, Wörter die durch die Lemmatisierung bestimmten Lemmata Gesellschaft, Sport, Wissen und Digital wurden jeweils die der Wörter untersucht. 2000 aktuellsten Artikel vor dem Stichtag 1.4.2015 mittels Da bisher noch keine Erfahrungswerte für die Parame- ZeitOnlineAPISharp 3 heruntergeladen. Für die weitere Ver- terwahl vorliegen, werden die Auswirkungen verschiedener arbeitung wurden aus diesen 10000 Artikeln insgesamt 2260 Parameter experimentell bestimmt, indem eine Gittersuche Artikel zufällig ausgewählt, um einen balancierten Daten- mit τ ∈ {0.55, 0.6, . . . , 1} und supp ∈ {3, 4, . . . , 10} durchge- satz betrachten zu können. Die beiden folgenden Schlagzei- führt wird. len stammen aus Artikeln von ZEIT ONLINE: Die Ergebnisse der Satire-Erkennung durch Wortlisten (12) Lehrerverband warnt vor Risiken für Bildung sind in Tabelle 1 als durchschnittlicher F1 Wert über bei- (13) Energiekonzern verzichtet auf Atomenergie, Kohle de Klassen angegeben, wobei für jeden Wert von τ das je- und Gas weils beste Ergebnis angegeben ist, welches durchgehend mit Zur nachfolgenden Evaluation werden die Artikel in eine supp = 3 erreicht wird. Bei dem Mehrheitsentscheid des An- Trainings- und eine Testmenge aufgeteilt. Zum Training wer- satzes ist es möglich, dass ein Unentschieden vorliegt. Dies den pro Klasse 1000 Artikel zufällig ausgewählt, sodass das bedeutet, dass keines der Wörter einer zu klassifizierenden Training auf insgesamt 2000 Artikeln stattfindet. Die Eva- Schlagzeile in WP oder WZ auftritt oder dass ein Gleich- luation erfolgt auf der Grundlage der verbleibenden 2520 stand vorliegt. Für jede Parameterbelegung von τ und supp Artikel. werden zwei Evaluationen mit einem unterschiedlichen Stan- dardwert d ∈ {Postillon, ZEIT ONLINE} zur Auflösung ei- 4.2 Evaluation nes Gleichstands durchgeführt, von denen in Tabelle 1 je- Der zusammengestellte Datensatz wird zunächst durch ei- weils das schlechtere der beiden Ergebnisse aufgeführt ist. ne NLP-Pipeline aufbereitet: Für jede Schlagzeile erfolgt Um die Auswirkungen eines Standardwerts beurteilen zu durch OpenNLP4 eine Zerlegung in einzelne Wörter, eine können, sind in Tabelle 1 ebenfalls die Ergebnisse einer Klas- Trennung in Sätze und eine Bestimmung von Wortarten für sifikation aufgeführt, bei der ein Unentschieden bei einem jedes einzelne Wort. Die ermittelten Wortarten stammen aus Mehrheitsentscheid als falsche Klassifikation behandelt wird. dem Stuttgart-Tübingen-Tagset (STTS) [15], welches aus 54 Für die Satire-Erkennung erreicht der erste Ansatz mit verschiedenen Wortarten besteht. Die Lemmatisierung von den auftretenden Wörtern als Datengrundlage als bestes Er- Wörtern erfolgt durch Mate Tools [2]. gebnis den Wert 61,51 % für τ = 0, 6 und supp = 3. Durch eine Lemmatisierung kann das Ergebnis auf 64,21 % gestei- 4.2.1 Wortlisten gert werden. Bei einem fixierten Wert für τ und einem stei- Für die Satire-Erkennung über Wortlisten müssen zwei genden Wert für supp werden die Klassifikationsergebnisse disjunkte Wortlisten WP und WZ erstellt werden, in de- schlechter, da die Größen der Wortlisten entsprechend ab- nen jeweils Wörter vertreten sind, die überwiegend nur in nehmen. Für den untersuchten Datensatz verschlechtern sich den Schlagzeilen des Postillons bzw. in den Schlagzeilen von die Ergebnisse bei einem steigenden τ aus demselben Grund. ZEIT ONLINE auftreten. Zur Erstellung dieser Wortlisten werden zunächst die einzelnen Wörter als Datengrundlage 4.2.2 Sprachliche Features verwendet. Im Postillon treten 4025 (3583 Lemmata) und In einem ersten vektoriellen Modell wird jede Schlagzei- in ZEIT ONLINE 3050 (2696 Lemmata) verschiedene Wör- le durch die absoluten Häufigkeiten der auftretenden POS- ter auf. Für die Erstellung der Wortlisten wird zunächst pro Tags aus dem STTS-Tagset repräsentiert. Zum Vergleich Wort bestimmt, wie häufig es in der Trainingsmenge auf- wird ein zweites Modell untersucht, in dem die Auswir- tritt. Wörter, die weniger als supp mal auftreten, werden kungen einer Reduktion der 54 POS-Tags auf die 12 POS- ignoriert. Anschließend wird für jedes Wort w berechnet, Tags des UTS-Tagsets [13] beobachtet werden. Beide Mo- wie groß die relative Häufigkeit p von w in den Schlagzeilen delle werden mit den drei Klassifikationsverfahren k-Nearest des Postillons bzw. in den Schlagzeilen aus ZEIT ONLINE Neighbors (kNN), Support Vector Machine (SVM) und out- ist. Falls p ≥ τ ist, so wird w in die entsprechende Wortlis- of-place measure [4] evaluiert. te eingefügt. In einer zweiten Variante werden anstelle der Als SVM-Implementierung wird LIBSVM [5] verwendet. 3 https://github.com/Liebeck/ZeitOnlineAPISharp Eingesetzt wird eine soft-margin SVM mit einem RBF- 4 https://opennlp.apache.org/ Kernel K(x, y) = exp(−γ||x − y||2 ). Die für das Training der 45 Tabelle 2: Satire-Erkennung mit sprachlichen Eigenschaften kNN Modell SVM Out-of-place + Default STTS 73,65 % 71,77 % 71,04 % 67,13 % STTS, Variante B 75,50 % 73,13 % 72,94 % — UTS 71,51 % 74,75 % 74,48 % 60,74 % UTS, Variante B 73,55 % 75,25 % 75,05 % — SVM benötigten Werte für den Strafterm C und für γ wer- 5. FAZIT UND AUSBLICK den pro Modell jeweils über eine Gittersuche mittels einer In dieser Arbeit wurden zwei Ansätze zur Erkennung Kreuzvalidierung über die Trainingsmenge bestimmt. Als von Kommunikationsmodi präsentiert. Für die nahe Zukunft Konvergenzkriterium der SVM wird = 10−3 gesetzt. ist geplant, beide Ansätze auf Textbeiträge eines Online- Für den kNN-Algorithmus werden verschiedene Werte für Partizipationsverfahrens anzuwenden. Dazu wird ein Code- k ∈ {1, . . . , 12} erprobt. Bei der Bestimmung der nächs- buch entwickelt werden, mit dem der Datensatz in Bezug auf ten Nachbarn werden jeweils die k nächsten Nachbarn per Kommunikationsmodi annotiert wird. Beide Ansätze werden euklidischer Distanz ermittelt. Sollten mehrere Kandidaten dann auf das Multiklassenproblem der Erkennung von Emo- für die Auswahl des k-nächsten Nachbarn p vorhanden sein, tionsäußerungen transferiert und evaluiert. so wird die Liste der nächsten Nachbarn um alle Nachbarn Bei der Untersuchung des Kommunikationsmodus Satire erweitert, die zum Anfrageobjekt o denselben Abstand ha- wurde gezeigt, dass die beiden Ansätze gute Ergebnisse von ben wie o zu p. Die Klassenzugehörigkeit erfolgt über einen bereits 75,5 % erreicht haben. Bei der Evaluation ist auf- Mehrheitsentscheid der Klassen aller gefundenen nächsten gefallen, dass das Festlegen eines Standardwerts bei einem Nachbarn. Tritt dabei ein Gleichstand auf, so wird ebenfalls Gleichstand für den mit Wortlisten arbeitenden Ansatz eine ein Standardwert verwendet. größere Auswirkung auf die Klassifikationsergebnisse hat, als Das out-of-place measure wird gewöhnlich für die Sprach- beim kNN-Algorithmus für die sprachlichen Eigenschaften. erkennung durch N-Gramme eingesetzt. Für die Evaluation Für das binäre Klassifikationsproblem der Satire-Erkennung wird es für den Vergleich von Verteilungen von POS-Tags sind ein Reihe von weitergehenden Untersuchen möglich. verwendet, indem für beide Nachrichtenquellen sogenann- Es könnte untersucht werden, welche Auswirkungen durch te Kategorienprofile bestimmt werden. Ein Kategorienprofil die Filterung von Stoppwörtern, durch den Vergleich un- besteht dabei jeweils aus einer nach absoluten Häufigkei- terschiedlicher Distanzfunktionen für den kNN-Algorithmus ten absteigend sortierten Liste von POS-Tags der jeweiligen und durch die Verwendung weiterer sprachlicher Eigenschaf- Trainingsmenge. Zur Klassifikation einer Schlagzeile wird ein ten entstehen können und ob dadurch die Ergebnisse gegen- Anfrageprofil mittels derselben Methode berechnet. Die In- über Variante B noch gesteigert werden können. dexpositionen des Anfrageprofils werden mit den Indexpo- Die größte Schwierigkeit des ersten Ansatzes ist die Aus- sitionen der Kategorienprofile verglichen. Einer Schlagzeile wahl charakteristischer Wörter. Bei einem Transfer des An- wird dann diejenige Nachrichtenquelle zugeordnet, zu deren satzes auf andere Datenquellen werden die Auswirkungen Kategorienprofil der kleinste Abstand zum Anfrageprofil be- von manuell vorgegebenen Wortlisten untersucht. Insbeson- steht. dere ist geplant, die Auswirkungen einer Erweiterung der Die Modellierung wird in einer Variante B ergänzt, in der Listen durch Synonyme aus einem Thesaurus zu beobachten. weitere sprachliche Eigenschaften als binäre Dimension hin- Bei der Generierung der Wortlisten konnten die Ergebnisse zugefügt werden. Dabei wird berücksichtigt, ob in der Über- durch eine Lemmatisierung verbessert werden. In zukünfti- schrift das erste Wort ein Nomen ist, ob das erste Wort ein gen Arbeiten wird untersucht werden, inwiefern Wiktionary5 Verb ist, ob das letzte Wort ein Verb ist, ob in der Über- zur Grundformreduktion eingesetzt werden kann. Außerdem schrift ein Anführungszeichen vorhanden ist und ob ein Fra- wird der Ansatz für den Umgang mit Negationen erweitert gezeichen, ein Ausrufezeichen oder ein Komma (jeweils bi- werden. när) auftritt. Für den zweiten Ansatz sind weitere sprachliche Eigen- Die Ergebnisse der drei Klassifikationsverfahren sind in schaften in einer vektoriellen Darstellung vorstellbar, wie Tabelle 2 mit durchschnittlichen F1 Werten über bei- beispielsweise das Auftreten von POS-Tag-Bigrammen. Um de Klassen dargestellt. Das insgesamt beste Ergebnis von bei einer Klassifikation gute Ergebnisse erzielen zu können, 75,5 % erreicht eine SVM mit STTS POS-Tags und Vari- ist eine Filterung nach sprachlichen Eigenschaften notwen- ante B. Das beste Ergebnis des kNN-Algorithmus ist mini- dig, die besonders gut mit den einzelnen Klassen korrelie- mal schlechter mit 75,25 %. Die Klassenzugehörigkeit beim ren. Darüber hinaus wird in zukünftigen Arbeiten unter- kNN-Algorithmus kann in fast allen Fällen per Mehrheits- sucht werden, inwiefern beide Ansätze kombinierbar sind. entscheid bestimmt werden. Interessant zu beobachten sind Anstelle eines Mehrheitsentscheids des ersten Ansatzes kann die Auswirkungen der Reduktion des STTS-Tagsets auf die vektorielle Darstellung für jeden Eintrag einer Wortliste das UTS-Tagset, die je nach Klassifikationsverfahren unter- um binäre Dimensionen erweitert werden, die jeweils ange- schiedlich sind. Für den kNN-Algorithmus konnte eine Ver- ben, ob in dem zu klassifizierenden Satz das entsprechen- besserung der Ergebnisse erzielt werden. Bei den anderen de Wort einer Wortliste auftritt. In nachfolgenden Arbeiten Verfahren verschlechtert sich das Ergebnis im Vergleich zu wird untersucht werden, welchen Einfluss eine Verkleinerung den STTS-Tags. des STTS-Tagsets auf das UTS-Tagset auf anderen Daten- sätzen hat. 5 https://de.wiktionary.org/ 46 6. LITERATUR International Conference on Language Resources and [1] C. O. Alm, D. Roth, and R. Sproat. Emotions from Evaluation (LREC’12). European Language Resources Text: Machine Learning for Text-based Emotion Association, 2012. Prediction. In Proceedings of the Conference on [14] R. Remus, U. Quasthoff, and G. Heyer. SentiWS – a Human Language Technology and Empirical Methods Publicly Available German-language Resource for in Natural Language Processing, HLT ’05, pages Sentiment Analysis. In Proceedings of the 7th 579–586. Association for Computational Linguistics, International Language Resources and Evaluation 2005. (LREC’10), pages 1168–1171, 2010. [2] A. Björkelund, B. Bohnet, L. Hafdell, and P. Nugues. [15] A. Schiller, S. Teufel, C. Stöckert, and C. Thielen. A High-Performance Syntactic and Semantic Guidelines für das Tagging deutscher Textcorpora mit Dependency Parser. In Proceedings of the 23rd STTS (kleines und großes Tagset). Technical report, International Conference on Computational Universität Stuttgart, Universität Tübingen, 1999. Linguistics: Demonstrations, COLING ’10, pages [16] T. Scholz and S. Conrad. Opinion Mining in 33–36. Association for Computational Linguistics, Newspaper Articles by Entropy-Based Word 2010. Connections. In Proceedings of the 2013 Conference on [3] C. Burfoot and T. Baldwin. Automatic Satire Empirical Methods in Natural Language Processing, Detection: Are You Having a Laugh? In Proceedings of pages 1828–1839. Association for Computational the ACL-IJCNLP 2009 Conference Short Papers, Linguistics, 2013. ACLShort ’09, pages 161–164. Association for [17] C. Strapparava and R. Mihalcea. Learning to Identify Computational Linguistics, 2009. Emotions in Text. In Proceedings of the 2008 ACM [4] W. B. Cavnar and J. M. Trenkle. N-Gram-Based Text Symposium on Applied Computing, SAC ’08, pages Categorization. In Proceedings of SDAIR-94, 3rd 1556–1560. ACM, 2008. Annual Symposium on Document Analysis and [18] C. Strapparava and A. Valitutti. WordNet-Affect: An Information Retrieval, pages 161–175, 1994. affective extension of WordNet. In Proceedings of the [5] C.-C. Chang and C.-J. Lin. LIBSVM: A library for 4th International Conference on Language Resources support vector machines. ACM Transactions on and Evaluation, pages 1083–1086. European Language Intelligent Systems and Technology, 2:27:1–27:27, Resources Association, 2004. 2011. [6] G. Forman. BNS Feature Scaling: An Improved Representation over TF-IDF for SVM Text Classification. In Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM ’08, pages 263–270. ACM, 2008. [7] M. Hu and B. Liu. Mining and Summarizing Customer Reviews. In Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD ’04, pages 168–177. ACM, 2004. [8] S. M. Kim, A. Valitutti, and R. A. Calvo. Evaluation of Unsupervised Emotion Models to Textual Affect Recognition. In Proceedings of the NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, CAAGET ’10, pages 62–70. Association for Computational Linguistics, 2010. [9] T. Landauer, P. Foltz, and D. Laham. An introduction to latent semantic analysis. Discourse processes, 25:259–284, 1998. [10] M. Liebeck. Aspekte einer automatischen Meinungsbildungsanalyse von Online-Diskussionen. In Proceedings BTW 2015 - Workshops und Studierendenprogramm, pages 203–212, 2015. [11] G. A. Miller. WordNet: A Lexical Database for English. Communications of the ACM, 38(11):39–41, 1995. [12] B. Pang, L. Lee, and S. Vaithyanathan. Thumbs Up?: Sentiment Classification Using Machine Learning Techniques. In Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing - Volume 10, EMNLP ’02, pages 79–86. Association for Computational Linguistics, 2002. [13] S. Petrov, D. Das, and R. McDonald. A Universal Part-of-Speech Tagset. In Proceedings of the Eight 47