Sentiment Analysis: applicazione in un dominio psico-forense Francesca Guglielmi1 and Pierpaolo Basile2 and Antonietta Curci1 and Giovanni Semeraro2 1 Dipartimento di Scienze della Formazione, Psicologia, Comunicazione, Università di Bari Aldo Moro 2 Dipartimento di Informatica, Università di Bari Aldo Moro 1 {francesca.guglielmi,antonietta.curci}@uniba.it 2 {pierpaolo.basile,giovanni.semeraro}@uniba.it Abstract affettivo neutro sia per gli offender psico- patici sia per gli offender non psicopati- English. This study aims to apply the sen- ci, tuttavia è possibile individuare peculia- timent analysis to a psycho-forensic con- rità emotive significative che diversificano text through the analysis of narrative trans- i resoconti narrativi. criptions related to the crimes committed by violent detainees. We investigate the presence of psychopathy through the Psy- 1 Introduzione chopathic Personality Inventory-Revised (PPI-R). Psychopathy is a personality di- La psicopatia è un disturbo di personalità caratte- sorder that is characterized by emotional rizzato da deficit emotivi, stile di vita antisocia- detachment, the lack of empathy and it is le, mancanza di senso di colpa ed empatia. Negli often found in the prison population for psicopatici la coloritura affettiva che generalmen- the brutality of committed crimes. Our te serve a differenziare gli eventi emotivi da quel- study explores possible associations bet- li neutri non esiste nella stessa misura degli altri ween psychopathy and emotional content individui (Cleckley, 1941). present in the narratives. Results show a Gli psicopatici hanno un’attenuata risposta neutral polarity for both psychopathic and emotiva agli eventi di cui fanno esperienza e nei not psychopaths offenders, however it is confronti delle persone con cui interagiscono. I possible to identify significant emotional tratti caratterizzanti la psicopatia, si riscontrano in characteristics that diversify the narrative alcuni offender detenuti (Serin, 1996), proprio per transcriptions. le peculiarità relative alla violenza degli atti espe- riti da queste persone (Yang et al., 2010). Inol- Italiano. Il presente studio ha l’obiettivo tre, la callosità emotiva, tratto caratterizzante il di applicare la sentiment analysis ad un disturbo, pare possa essere associata ad una per- contesto psico-forense attraverso l’anali- cezione minimizzata dell’esperienza emotiva (po- si di resoconti narrativi relativi ai crimini sitiva o negativa) dell’evento vissuto, relativa sia commessi da detenuti, autori di reati vio- al momento in cui si è verificato sia al richiamo lenti. Attraverso lo strumento Psycopathic dell’evento stesso (Osumi and Ohira, 2010). Personality Inventory-Revised (PPI-R), è L’incapacità nell’elaborare e nel fare esperienza stata indagata la presenza di psicopatia, del contenuto affettivo degli stimoli e degli even- disturbo di personalità che si caratterizza ti può avere delle conseguenze sulle capacità di per il distacco emotivo, l’assenza di empa- memoria e quindi sulla possibilità di elaborare e tia e lo stile di vita antisociale riscontra- di recuperare l’informazione emotiva relativa al- bile nella popolazione carceraria per l’ef- l’evento esperito. Evidenze empiriche (Burrow et feratezza dei crimini commessi, al fine di al., 2014) sostengono che le persone psicopatiche esplorare eventuali associazioni tra il di- soffrono di un deficit emotivo che può avere un sturbo e i contenuti emotivi presenti nelle impatto sul loro modo di percepire il ricordo de- narrazioni. Dai risultati emerge un tono gli eventi. Alcuni clinici e ricercatori sostengono che gli psicopatici generalmente non sono in gra- nati. Le narrazioni sono state trascritte dagli do di apprendere il significato emotivo degli even- sperimentatori in simultanea; ti; pertanto si ipotizza che i racconti degli offen- 2. rilevazione della presenza/assenza di psico- der psicopatici siano scarni di dettagli emotivi ri- patia misurata attraverso il PPI-R (Lilienfeld spetto alle narrazioni degli offender non psicopati- and Widows, 2005) che valuta i tratti di per- ci (Glass and Newman, 2006; Wilson et al., 2008; sonalità del soggetto attraverso l’indagine di Christianson et al., 1996) quei comportamenti e peculiarità cognitive, La ricerca in questi ambiti necessita di essere emotive e percettive che costituiscono i tratti implementata, infatti negli ultimi anni la ricerca di tipici della psicopatia. Il test è composto da base in psicologia cognitiva si è ampliata median- 154 item, da cui si ricavano 8 scale di con- te l’adattamento delle procedure, delle variabili e tenuto, aggregate in 3 fattori sovraordinati: il coinvolgimento di altri domini scientifici, tra cui Dominanza priva di paura, Impulsività au- la psicolinguistica. Tali adattamenti consentono to centrata e Freddezza emotiva. Ogni item di allargare le conoscenze sulle caratteristiche di prevede 4 alternative di risposta (vero, abba- personalità e le loro influenze sui comportamenti stanza vero, abbastanza falso, falso). Le som- in contesti diversificati, come quello penitenziario, ministrazioni si sono tenute previa autorizza- per rendere fruibile la messa in atto di programmi zione del P.R.A.P. della Regione Puglia e pre- di intervento mirati e adatti a supportare persone via autorizzazione individuale all’uso dei da- con tali disturbi. Il presente studio è il risultato di ti personali nei limiti stabiliti dalla legge. Le queste integrazioni di domini concettuali e di ri- somministrazioni si sono svolte in una cella cerca, nella fattispecie si applica la sentiment ana- protetta, alla presenza di due somministratori lysis, una metodologia per l’elaborazione automa- e una guardia penitenziaria; tica del testo al fine di estrarre informazioni sog- 3. elaborazione dei resoconti narrativi, co- gettive in un contesto psico-forense. A 48 offen- me descritto nel paragrafo 2.1, per l’estra- der detenuti, autori di reati violenti, è stato chie- zione automatica di attributi emotivi e di sto, attraverso un compito di free-recall, di narrare sentimento; il ricordo autobiografico relativo all’evento crimi- 4. analisi dei risultati per l’individuazione di noso commesso per il quale sono stati condannati, una correlazione tra i punteggi del PPI-R e tale ricordo è stato trascritto dagli sperimentato- gli attributi estratti dall’analisi automatica del ri simultaneamente alla narrazione. Inoltre, a cia- testo; scun partecipante è stato somministrato il Psycho- 5. analisi degli attributi estratti dall’elaborazio- patic Personality Inventory-Revised (PPI-R) (Li- ne del testo con tecniche di apprendimento lienfeld and Widows, 2005) per analizzare la pre- automatico. senza di psicopatia. Ciascun resoconto narrativo è La metodologia proposta ha l’obiettivo di veri- stato successivamente analizzato con la metodolo- ficare se l’analisi automatica del testo può rilevare gia della sentiment analysis attraverso un algorit- alcune caratteristiche emozionali o di sentimento mo descritto in dettaglio nel paragrafo 2. I risultati associabili alla psicopatia nei detenuti che hanno di questa analisi sono riportati nel paragrafo 3. commesso crimini particolarmente violenti. 2 Metodologia 2.1 Elaborazione del testo La metodologia da noi proposta si compone di Ogni trascrizione è stata processata da una pipe- cinque distinte fasi: line di strumenti per l’analisi automatica del lin- 1. reperimento dei resoconti narrativi. Ad un guaggio per la lingua italiana. In particolare, ogni campione composto da 48 uomini (Metà = trascrizione è sottoposta alle seguenti operazioni: 38, 69; Ds = 8, 5) autori di reati violenti, 1. Tokenizzazione e PoS-tagging: il testo è detenuti presso l’Istituto penitenziario di Turi suddiviso in token (parole) e ad ogni to- (BA) e la Casa circondariale di Trani (BA) è ken è associato un tag che identifica la par- stato chiesto di narrare, attraverso un compito te del discorso (sostantivo, aggettivo, verbo, di free-recall, il ricordo autobiografico relati- avverbio, preposizione, articolo, ...). Queste vo al crimine per il quale sono stati condan- operazioni sono realizzate attraverso il tool open-source Apache OpenNLP1 ; un problema di apprendimento di tipo binario in 2. Lemmatizzazione: sfruttando le informa- cui ogni racconto è classificato come psicopatico zioni sul PoS-tag, riconduce ogni parola al o non psicopatico in base ai risultati del PPI-R. suo lemma. Questa operazione è necessa- Ogni racconto è descritto da una serie di attributi: ria per poter accedere a dizionari elettroni- polarità media, score massimo di polarità positi- ci, ad esempio quelli utilizzati nelle opera- va, score massimo di polarità negativa, differenza zioni successive per l’analisi del sentiment. tra gli score massimi di polarità e, per ogni clas- L’operazione è stata realizzata attraverso l’u- se emotiva prevista da WordNet-Affect, numero di tilizzo della risorsa linguistica Morph-it!2 parole che ricadono in tale classe. (Zanchetta and Baroni, 2005); Lo scopo di questa analisi non è quello di mi- 3. Analisi del sentiment: l’analisi del senti- surare la bontà predittiva degli attributi estratti dal ment prevede l’associazione di uno score di testo, ma di capire il potere discriminante di ogni polarità ad ogni parola presente nella trascri- attributo. Per questo motivo si è scelto l’algoritmo zione, ed il calcolo di uno score di sentiment C4.5 (Quinlan, 1993) basato sugli alberi di deci- sull’intera trascrizione. Lo score di sentiment sione. In particolare l’algoritmo genera un albe- sull’intera trascrizione è calcolato seguendo ro di decisione basandosi sul concetto di entropia due differenti approcci: 1) come media degli dell’informazione. score di sentiment associati ad ogni parola; Ad ogni nodo dell’albero, l’algoritmo C4.5 sce- 2) come differenza tra gli score massimi di glie l’attributo che divide più efficacemente i dati polarità positiva e negativa. Questo processo in una o nell’altra classe. Il criterio di suddivisio- è realizzato utilizzando la risorsa linguistica ne è il guadagno d’informazione (differenza di en- Sentix (Basile and Nissim, 2013). Inoltre, la tropia). L’attributo con il più alto guadagno d’in- polarità dei termini è invertita se compaiono formazione viene scelto per prendere la decisione. in un contesto di negazione. Il contesto di L’algoritmo C4.5 viene applicato in maniera ricor- negazione è individuato dalla parola “non” e siva ai nuovi sottoinsiemi di dati che si vengano a si estende fino all’individuazione di uno dei creare ad ogni passo. seguenti caratteri {. :; !?}; L’idea è che l’albero di decisione possa dar- 4. Analisi delle emozioni: ad ogni parola so- ci un’indicazione di quali siano gli attributi più no associate delle etichette emotive utiliz- discriminanti per l’individuazione dei racconti zando la risorsa linguistica WordNet-Affect appartenenti a soggetti affetti da psicopatia. (Strapparava and Valitutti, 2004). L’analisi del sentiment e quella delle emozio- 3 Analisi sperimentale ni necessitano di maggiori dettagli implementati- vi. Poiché le risorse linguistiche utilizzate sono Il punteggio totale di psicopatia, che ha consentito dei dizionari basati sul significato si rende neces- la discriminazione dei due gruppi: offender psico- saria una strategia per poter accedere a questi di- patici (n. 20) e offender non psicopatici (n. 28), zionari attraverso il lemma. Un lemma può ave- è stato calcolato attraverso moduli di autoscoring re più significati; nel caso di lemma polisemico si sommando, per ciascun soggetto, i punteggi otte- è scelto il significato più frequente. La frequen- nuti nei tre fattori (Dominanza priva di paura, Im- za dei significati per la lingua italiana è calcola- pulsività auto centrata e Freddezza emotiva). Ta- ta utilizzando la risorsa MultiSemCor (Bentivogli le punteggio grezzo è stato poi convertito in punti and Pianta, 2005). Lo stesso procedimento viene t, quindi standardizzato. Attraverso il t-test, te- applicato a WordNet-Affect in presenza di lemmi st statistico parametrico che permette di verificare polisemici. se il valore medio di una distribuzione si disco- sta significativamente da un certo valore di rife- 2.2 Analisi con approcci di apprendimento rimento ad un livello di significatività inferiore a automatico 0,05, emerge che sia i punteggi totali di Psicopatia Al fine di analizzare l’associazione tra gli attribu- (t(46) = −9, 86), sia dei tre fattori: Dominan- ti linguistici e la psicopatia, abbiamo formalizzato za priva di paura (t(46) = −8, 24); Impulsitvità 1 autocentrata (t(46) = −9, 86) e Freddezza emo- https://opennlp.apache.org/ 2 http://sslmitdev-online.sslmit.unibo. tiva (t(46) − 8, 24) hanno delle differenze signifi- it/linguistics/morph-it.php cative con valori di p < 0,05. Questo risultato la- Tabella 1: Correlazione di Pearson tra gli indicatori della Sentiment Analysis e i fattori del PPI-R nel gruppo di offender psicopatici (n = 20). (*) p < 0.05 Sentiment Psicopatia: PPI-R Analysis Impulsività Dominanza Freddezza Psicopatia Polarità autocentrata priva di paura emotiva totale Mpol -0,260 0,103 0,097 -0,095 M axpos -0,006 0,507* 0,335 0,305 M axneg -0,116 0,104 -0,121 -0,054 M axpos − M axneg 0,069 0,291 0.311 0,249 scia ragionevolmente supporre che i due gruppi si affetti da psicopatia. Ancora più interessante è differenziano per i tratti caratterizzanti la psicopa- il valore per il quale avviene la suddivisione del tia relativi allo stile di vita antisociale, la callosita campione. In particolare, se la differenza di pola- emotiva e le caratteristiche legate alla mancanza di rità è maggiore di -0,125, l’individuo viene classi- paura, gestione dello stress e influenza sociale. ficato come affetto da psicopatia. Questo risultato Successivamente, i resoconti narrativi sono sta- è molto rilevante in quanto la differenza di pola- ti analizzati mediante tecniche di elaborazione rità nel campione assume valori nell’intervallo [- del linguaggio naturale al fine di estrarre attribu- 0,625; 0,25]. Questo significa che le narrazioni ti emotivi e di polarità del sentimento (positiva, neutre, che hanno una differenza vicina allo zero, negativa e neutra). Gli attributi cosı̀ estratti sono risultano scritte da soggetti affetti da psicopatia, in stati utilizzati per impostare il problema di appren- linea con l’ipotesi che gli psicopatici abbiano un dimento automatico descritto nel paragrafo 2.2. ricordo povero di dettagli emotivi che lascia ra- Per realizzare ciò è stata utilizzata l’implemen- gionevolmente presupporre un’attenuata risposta tazione J48 dell’algoritmo C4.5 presente nel tool emozionale agli eventi. open-source Weka3 (Hall et al., 2009). È anche importante sottolineare come la pola- rità sia sbilanciata verso la negatività. Ciò sug- 3.1 Risultati gerisce che, in assenza di psicopatia, il tipo di ri- Per analizzare l’associazione tra psicopatia e pun- cordo associato all’evento criminoso risulta essere teggi ottenuti negli score della Sentiment Analysis negativo. Continuando ad analizzare l’albero di abbiamo utilizzato analisi correlazionali attraver- decisione si scopre che i nodi successivi si basano so le quali è emersa una correlazione significativa sugli attributi di polarità massima positiva e nega- tra M axpos e il fattore Dominanza priva di pau- tiva, e solo uno dei nodi fa riferimento all’etichetta ra del PPI (Tabella 1) nel gruppo composto da of- “piacere” di WordNetAffect. fender psicopatici. Questo risultato sembra soste- nere l’ipotesi che la freddezza emotiva dello psi- 4 Conclusioni copatico predisponga ad una ricerca attiva di tut- In questo lavoro abbiamo cercato di capire se i ri- te quelle situazioni e sensazioni forti ed eccitanti sultati prodotti da un algoritmo di sentiment analy- che possano in qualche modo indurre uno stato di sis possano in qualche modo essere associati alla eccitazione in loro (Hervé et al., 2007), come il psicopatia. In particolare, abbiamo analizzato la commettere i crimini violenti di cui si sono resi presenza di psicopatia, in un campione di offen- protagonisti e la loro la tendenza a correre rischi der detenuti poichè i tratti caratterizzanti di tale (Ellis, 1987). Al contrario nel gruppo composto disturbo, distacco emotivo, mancanza di senso di da offender non psicopatici non è emersa alcuna colpa, stile di vita antisociale, è possibile riscon- correlazione significativa. trarli negli offender detenuti per le peculiarità re- Per quanto riguarda l’output fornitoci dall’albe- lative alla violenza degli atti esperiti e allo stile di ro di decisione, si evince che la differenza di po- vita condotto. larità è l’attributo più discriminante, in grado di I risultati ottenuti dalla sentiment analysis so- riconoscere da solo quasi il 50% degli individui no stati confrontati con quelli ottenuti attraverso il 3 http://www.cs.waikato.ac.nz/ml/weka/ test PPI-R che valuta i tratti di personalità del sog- getto attraverso l’indagine di quei comportamen- Lee Ellis. 1987. Relationships of criminality and psy- ti e peculiarità cognitive, emotive e percettive che chopathy with eight other apparent behavioral ma- nifestations of sub-optimal arousal. Personality and costituiscono i tratti tipici della psicopatia. Individual Differences, 8(6):905–925. I risultati ottenuti attraverso l’utilizzo di un ap- proccio basato sull’induzione di alberi di decisio- Samantha J Glass and Joseph P Newman. 2006. Re- ne dimostrano una dipendenza tra la presenza di cognition of facial affect in psychopathic offenders. Journal of abnormal psychology, 115(4):815. psicopatia e la differenza tra la massima polarità positiva e quella negativa individuate nella nar- Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard razione del detenuto. Inoltre, è stata riscontrata Pfahringer, Peter Reutemann, and Ian H Witten. 2009. The WEKA data mining software: an una correlazione tra lo score massimo di polarità update. ACM SIGKDD explorations newsletter, e il fattore Dominanza priva di paura attraverso 11(1):10–18. l’utilizzo di test statistici. I risultati ottenuti sono incoraggianti e dimo- Hugues Hervé, Barry S Cooper, and JOHN C Yuille. 2007. Memory formation in offenders: Perspecti- strano l’efficacia di ampliare la ricerca di base in ves from a biopsychosocial model of eyewitness me- psicologia cognitiva con strumenti innovativi co- mory. Offenders’ memories of violent crimes, pages me quello della sentiment analysis e in genere del- 38–74. l’analisi automatica del testo. Lo studio qui ripor- Scott O Lilienfeld and Michelle R Widows. 2005. tato, seppur rilevante, è comunque da considerarsi PPI-R: Psychopathic personality inventory revised: preliminare per due ragioni: la ridotta dimensione Professional Manual. Psychological Assessment del campione e l’utilizzo di tecniche abbastanza Resources, Incorporated. semplici per l’analisi del sentiment. Takahiro Osumi and Hideki Ohira. 2010. The positive side of psychopathy: Emotional detach- Acknowledgement ment in psychopathy and rational decision-making in the ultimatum game. Personality and individual Questo lavoro è parzialmente supportato dal differences, 49(5):451–456. progetto “Multilingual Entity Liking” finanzia- to dalla Regione Puglia con il programma J Ross Quinlan. 1993. C4. 5: programs for machine learning. Morgan Kaufmann Publishers. FutureInResearch. Ralph C Serin. 1996. Violent recidivism in criminal psychopaths. Law and Human Behavior, 20(2):207. References Carlo Strapparava and Alessandro Valitutti. 2004. Valerio Basile and Malvina Nissim. 2013. Sentiment WordNet Affect: an Affective Extension of analysis on Italian tweets. In Proceedings of the 4th WordNet. In LREC, volume 4, pages 1083–1086. Workshop on Computational Approaches to Subjec- tivity, Sentiment and Social Media Analysis, pages Kevin Wilson, Sabrina Demetrioff, and Stephen Por- 100–107, Atlanta. ter. 2008. A pawn by any other name? so- cial information processing as a function of psy- Luisa Bentivogli and Emanuele Pianta. 2005. Ex- chopathic traits. Journal of research in personality, ploiting parallel texts in the creation of multilin- 42(6):1651–1656. gual semantically annotated resources: the Multi- SemCor Corpus. Natural Language Engineering, Yaling Yang, Adrian Raine, Patrick Colletti, Arthur W 11(03):247–261. Toga, and Katherine L Narr. 2010. Morphological Ashley N Burrow, Nichole Currence, Diana Lemus, alterations in the prefrontal cortex and the amygdala Amber E DeBono, Matthew T Crawford, and W Ri- in unsuccessful psychopaths. Journal of abnormal chard Walker. 2014. Psychopaths view autobiogra- psychology, 119(3):546. phical memories as less memorable, important, and Eros Zanchetta and Marco Baroni. 2005. Morph-it! emotional than normal individuals. International A free corpus-based morphological resource for the Journal of Humanities and Social Science, 4:1–9. Italian language. Corpus Linguistics 2005, 1(1). Sven-Åke Christianson, Adelle E Forth, Robert D Ha- re, Catherine Strachan, Lars Lidberg, and Lars- Håkan Thorell. 1996. Remembering details of emotional events: A comparison between psycho- pathic and nonpsychopathic offenders. Personality and Individual Differences, 20(4):437–443. H Cleckley. 1941. The mask of sanity. st. louis. MO: Mosby.