=Paper= {{Paper |id=Vol-1749/paper29 |storemode=property |title=Sentiment Analysis: Applicazione in un Dominio Psico–Forense |pdfUrl=https://ceur-ws.org/Vol-1749/paper29.pdf |volume=Vol-1749 |authors=Francesca Guglielmi,Pierpaolo Basile,Antonietta Curci,Giovanni Semeraro |dblpUrl=https://dblp.org/rec/conf/clic-it/GuglielmiBCS16 }} ==Sentiment Analysis: Applicazione in un Dominio Psico–Forense== https://ceur-ws.org/Vol-1749/paper29.pdf
            Sentiment Analysis: applicazione in un dominio psico-forense


  Francesca Guglielmi1 and Pierpaolo Basile2 and Antonietta Curci1 and Giovanni Semeraro2
1
  Dipartimento di Scienze della Formazione, Psicologia, Comunicazione, Università di Bari Aldo Moro
                      2
                        Dipartimento di Informatica, Università di Bari Aldo Moro
                1
                  {francesca.guglielmi,antonietta.curci}@uniba.it
                  2
                    {pierpaolo.basile,giovanni.semeraro}@uniba.it




                        Abstract                           affettivo neutro sia per gli offender psico-
                                                           patici sia per gli offender non psicopati-
       English. This study aims to apply the sen-          ci, tuttavia è possibile individuare peculia-
       timent analysis to a psycho-forensic con-           rità emotive significative che diversificano
       text through the analysis of narrative trans-       i resoconti narrativi.
       criptions related to the crimes committed
       by violent detainees. We investigate the
       presence of psychopathy through the Psy-        1   Introduzione
       chopathic Personality Inventory-Revised
       (PPI-R). Psychopathy is a personality di-       La psicopatia è un disturbo di personalità caratte-
       sorder that is characterized by emotional       rizzato da deficit emotivi, stile di vita antisocia-
       detachment, the lack of empathy and it is       le, mancanza di senso di colpa ed empatia. Negli
       often found in the prison population for        psicopatici la coloritura affettiva che generalmen-
       the brutality of committed crimes. Our          te serve a differenziare gli eventi emotivi da quel-
       study explores possible associations bet-       li neutri non esiste nella stessa misura degli altri
       ween psychopathy and emotional content          individui (Cleckley, 1941).
       present in the narratives. Results show a          Gli psicopatici hanno un’attenuata risposta
       neutral polarity for both psychopathic and      emotiva agli eventi di cui fanno esperienza e nei
       not psychopaths offenders, however it is        confronti delle persone con cui interagiscono. I
       possible to identify significant emotional      tratti caratterizzanti la psicopatia, si riscontrano in
       characteristics that diversify the narrative    alcuni offender detenuti (Serin, 1996), proprio per
       transcriptions.                                 le peculiarità relative alla violenza degli atti espe-
                                                       riti da queste persone (Yang et al., 2010). Inol-
       Italiano. Il presente studio ha l’obiettivo     tre, la callosità emotiva, tratto caratterizzante il
       di applicare la sentiment analysis ad un        disturbo, pare possa essere associata ad una per-
       contesto psico-forense attraverso l’anali-      cezione minimizzata dell’esperienza emotiva (po-
       si di resoconti narrativi relativi ai crimini   sitiva o negativa) dell’evento vissuto, relativa sia
       commessi da detenuti, autori di reati vio-      al momento in cui si è verificato sia al richiamo
       lenti. Attraverso lo strumento Psycopathic      dell’evento stesso (Osumi and Ohira, 2010).
       Personality Inventory-Revised (PPI-R), è          L’incapacità nell’elaborare e nel fare esperienza
       stata indagata la presenza di psicopatia,       del contenuto affettivo degli stimoli e degli even-
       disturbo di personalità che si caratterizza    ti può avere delle conseguenze sulle capacità di
       per il distacco emotivo, l’assenza di empa-     memoria e quindi sulla possibilità di elaborare e
       tia e lo stile di vita antisociale riscontra-   di recuperare l’informazione emotiva relativa al-
       bile nella popolazione carceraria per l’ef-     l’evento esperito. Evidenze empiriche (Burrow et
       feratezza dei crimini commessi, al fine di      al., 2014) sostengono che le persone psicopatiche
       esplorare eventuali associazioni tra il di-     soffrono di un deficit emotivo che può avere un
       sturbo e i contenuti emotivi presenti nelle     impatto sul loro modo di percepire il ricordo de-
       narrazioni. Dai risultati emerge un tono        gli eventi. Alcuni clinici e ricercatori sostengono
che gli psicopatici generalmente non sono in gra-               nati. Le narrazioni sono state trascritte dagli
do di apprendere il significato emotivo degli even-             sperimentatori in simultanea;
ti; pertanto si ipotizza che i racconti degli offen-         2. rilevazione della presenza/assenza di psico-
der psicopatici siano scarni di dettagli emotivi ri-            patia misurata attraverso il PPI-R (Lilienfeld
spetto alle narrazioni degli offender non psicopati-            and Widows, 2005) che valuta i tratti di per-
ci (Glass and Newman, 2006; Wilson et al., 2008;                sonalità del soggetto attraverso l’indagine di
Christianson et al., 1996)                                      quei comportamenti e peculiarità cognitive,
    La ricerca in questi ambiti necessita di essere             emotive e percettive che costituiscono i tratti
implementata, infatti negli ultimi anni la ricerca di           tipici della psicopatia. Il test è composto da
base in psicologia cognitiva si è ampliata median-             154 item, da cui si ricavano 8 scale di con-
te l’adattamento delle procedure, delle variabili e             tenuto, aggregate in 3 fattori sovraordinati:
il coinvolgimento di altri domini scientifici, tra cui          Dominanza priva di paura, Impulsività au-
la psicolinguistica. Tali adattamenti consentono                to centrata e Freddezza emotiva. Ogni item
di allargare le conoscenze sulle caratteristiche di             prevede 4 alternative di risposta (vero, abba-
personalità e le loro influenze sui comportamenti              stanza vero, abbastanza falso, falso). Le som-
in contesti diversificati, come quello penitenziario,           ministrazioni si sono tenute previa autorizza-
per rendere fruibile la messa in atto di programmi              zione del P.R.A.P. della Regione Puglia e pre-
di intervento mirati e adatti a supportare persone              via autorizzazione individuale all’uso dei da-
con tali disturbi. Il presente studio è il risultato di        ti personali nei limiti stabiliti dalla legge. Le
queste integrazioni di domini concettuali e di ri-              somministrazioni si sono svolte in una cella
cerca, nella fattispecie si applica la sentiment ana-           protetta, alla presenza di due somministratori
lysis, una metodologia per l’elaborazione automa-               e una guardia penitenziaria;
tica del testo al fine di estrarre informazioni sog-         3. elaborazione dei resoconti narrativi, co-
gettive in un contesto psico-forense. A 48 offen-               me descritto nel paragrafo 2.1, per l’estra-
der detenuti, autori di reati violenti, è stato chie-          zione automatica di attributi emotivi e di
sto, attraverso un compito di free-recall, di narrare           sentimento;
il ricordo autobiografico relativo all’evento crimi-         4. analisi dei risultati per l’individuazione di
noso commesso per il quale sono stati condannati,               una correlazione tra i punteggi del PPI-R e
tale ricordo è stato trascritto dagli sperimentato-            gli attributi estratti dall’analisi automatica del
ri simultaneamente alla narrazione. Inoltre, a cia-             testo;
scun partecipante è stato somministrato il Psycho-          5. analisi degli attributi estratti dall’elaborazio-
patic Personality Inventory-Revised (PPI-R) (Li-                ne del testo con tecniche di apprendimento
lienfeld and Widows, 2005) per analizzare la pre-               automatico.
senza di psicopatia. Ciascun resoconto narrativo è           La metodologia proposta ha l’obiettivo di veri-
stato successivamente analizzato con la metodolo-          ficare se l’analisi automatica del testo può rilevare
gia della sentiment analysis attraverso un algorit-        alcune caratteristiche emozionali o di sentimento
mo descritto in dettaglio nel paragrafo 2. I risultati     associabili alla psicopatia nei detenuti che hanno
di questa analisi sono riportati nel paragrafo 3.          commesso crimini particolarmente violenti.

2   Metodologia                                            2.1   Elaborazione del testo

La metodologia da noi proposta si compone di               Ogni trascrizione è stata processata da una pipe-
cinque distinte fasi:                                      line di strumenti per l’analisi automatica del lin-
  1. reperimento dei resoconti narrativi. Ad un            guaggio per la lingua italiana. In particolare, ogni
     campione composto da 48 uomini (Metà =               trascrizione è sottoposta alle seguenti operazioni:
     38, 69; Ds = 8, 5) autori di reati violenti,            1. Tokenizzazione e PoS-tagging: il testo è
     detenuti presso l’Istituto penitenziario di Turi           suddiviso in token (parole) e ad ogni to-
     (BA) e la Casa circondariale di Trani (BA) è              ken è associato un tag che identifica la par-
     stato chiesto di narrare, attraverso un compito            te del discorso (sostantivo, aggettivo, verbo,
     di free-recall, il ricordo autobiografico relati-          avverbio, preposizione, articolo, ...). Queste
     vo al crimine per il quale sono stati condan-              operazioni sono realizzate attraverso il tool
      open-source Apache OpenNLP1 ;                      un problema di apprendimento di tipo binario in
   2. Lemmatizzazione: sfruttando le informa-            cui ogni racconto è classificato come psicopatico
      zioni sul PoS-tag, riconduce ogni parola al        o non psicopatico in base ai risultati del PPI-R.
      suo lemma. Questa operazione è necessa-           Ogni racconto è descritto da una serie di attributi:
      ria per poter accedere a dizionari elettroni-      polarità media, score massimo di polarità positi-
      ci, ad esempio quelli utilizzati nelle opera-      va, score massimo di polarità negativa, differenza
      zioni successive per l’analisi del sentiment.      tra gli score massimi di polarità e, per ogni clas-
      L’operazione è stata realizzata attraverso l’u-   se emotiva prevista da WordNet-Affect, numero di
      tilizzo della risorsa linguistica Morph-it!2       parole che ricadono in tale classe.
      (Zanchetta and Baroni, 2005);                         Lo scopo di questa analisi non è quello di mi-
   3. Analisi del sentiment: l’analisi del senti-        surare la bontà predittiva degli attributi estratti dal
      ment prevede l’associazione di uno score di        testo, ma di capire il potere discriminante di ogni
      polarità ad ogni parola presente nella trascri-   attributo. Per questo motivo si è scelto l’algoritmo
      zione, ed il calcolo di uno score di sentiment     C4.5 (Quinlan, 1993) basato sugli alberi di deci-
      sull’intera trascrizione. Lo score di sentiment    sione. In particolare l’algoritmo genera un albe-
      sull’intera trascrizione è calcolato seguendo     ro di decisione basandosi sul concetto di entropia
      due differenti approcci: 1) come media degli       dell’informazione.
      score di sentiment associati ad ogni parola;          Ad ogni nodo dell’albero, l’algoritmo C4.5 sce-
      2) come differenza tra gli score massimi di        glie l’attributo che divide più efficacemente i dati
      polarità positiva e negativa. Questo processo     in una o nell’altra classe. Il criterio di suddivisio-
      è realizzato utilizzando la risorsa linguistica   ne è il guadagno d’informazione (differenza di en-
      Sentix (Basile and Nissim, 2013). Inoltre, la      tropia). L’attributo con il più alto guadagno d’in-
      polarità dei termini è invertita se compaiono    formazione viene scelto per prendere la decisione.
      in un contesto di negazione. Il contesto di        L’algoritmo C4.5 viene applicato in maniera ricor-
      negazione è individuato dalla parola “non” e      siva ai nuovi sottoinsiemi di dati che si vengano a
      si estende fino all’individuazione di uno dei      creare ad ogni passo.
      seguenti caratteri {. :; !?};                         L’idea è che l’albero di decisione possa dar-
   4. Analisi delle emozioni: ad ogni parola so-         ci un’indicazione di quali siano gli attributi più
      no associate delle etichette emotive utiliz-       discriminanti per l’individuazione dei racconti
      zando la risorsa linguistica WordNet-Affect        appartenenti a soggetti affetti da psicopatia.
      (Strapparava and Valitutti, 2004).
    L’analisi del sentiment e quella delle emozio-       3   Analisi sperimentale
ni necessitano di maggiori dettagli implementati-
vi. Poiché le risorse linguistiche utilizzate sono      Il punteggio totale di psicopatia, che ha consentito
dei dizionari basati sul significato si rende neces-     la discriminazione dei due gruppi: offender psico-
saria una strategia per poter accedere a questi di-      patici (n. 20) e offender non psicopatici (n. 28),
zionari attraverso il lemma. Un lemma può ave-          è stato calcolato attraverso moduli di autoscoring
re più significati; nel caso di lemma polisemico si     sommando, per ciascun soggetto, i punteggi otte-
è scelto il significato più frequente. La frequen-     nuti nei tre fattori (Dominanza priva di paura, Im-
za dei significati per la lingua italiana è calcola-    pulsività auto centrata e Freddezza emotiva). Ta-
ta utilizzando la risorsa MultiSemCor (Bentivogli        le punteggio grezzo è stato poi convertito in punti
and Pianta, 2005). Lo stesso procedimento viene          t, quindi standardizzato. Attraverso il t-test, te-
applicato a WordNet-Affect in presenza di lemmi          st statistico parametrico che permette di verificare
polisemici.                                              se il valore medio di una distribuzione si disco-
                                                         sta significativamente da un certo valore di rife-
2.2    Analisi con approcci di apprendimento             rimento ad un livello di significatività inferiore a
       automatico                                        0,05, emerge che sia i punteggi totali di Psicopatia
Al fine di analizzare l’associazione tra gli attribu-    (t(46) = −9, 86), sia dei tre fattori: Dominan-
ti linguistici e la psicopatia, abbiamo formalizzato     za priva di paura (t(46) = −8, 24); Impulsitvità
   1                                                     autocentrata (t(46) = −9, 86) e Freddezza emo-
   https://opennlp.apache.org/
   2
   http://sslmitdev-online.sslmit.unibo.                 tiva (t(46) − 8, 24) hanno delle differenze signifi-
it/linguistics/morph-it.php                              cative con valori di p < 0,05. Questo risultato la-
Tabella 1: Correlazione di Pearson tra gli indicatori della Sentiment Analysis e i fattori del PPI-R nel
gruppo di offender psicopatici (n = 20). (*) p < 0.05
                 Sentiment
                                                      Psicopatia: PPI-R
                  Analysis
                                     Impulsività    Dominanza     Freddezza Psicopatia
                   Polarità
                                    autocentrata priva di paura     emotiva        totale
             Mpol                      -0,260           0,103        0,097      -0,095
             M axpos                   -0,006          0,507*        0,335      0,305
             M axneg                   -0,116           0,104        -0,121     -0,054
             M axpos − M axneg          0,069          0,291         0.311      0,249


scia ragionevolmente supporre che i due gruppi si           affetti da psicopatia. Ancora più interessante è
differenziano per i tratti caratterizzanti la psicopa-      il valore per il quale avviene la suddivisione del
tia relativi allo stile di vita antisociale, la callosita   campione. In particolare, se la differenza di pola-
emotiva e le caratteristiche legate alla mancanza di        rità è maggiore di -0,125, l’individuo viene classi-
paura, gestione dello stress e influenza sociale.           ficato come affetto da psicopatia. Questo risultato
   Successivamente, i resoconti narrativi sono sta-         è molto rilevante in quanto la differenza di pola-
ti analizzati mediante tecniche di elaborazione             rità nel campione assume valori nell’intervallo [-
del linguaggio naturale al fine di estrarre attribu-        0,625; 0,25]. Questo significa che le narrazioni
ti emotivi e di polarità del sentimento (positiva,         neutre, che hanno una differenza vicina allo zero,
negativa e neutra). Gli attributi cosı̀ estratti sono       risultano scritte da soggetti affetti da psicopatia, in
stati utilizzati per impostare il problema di appren-       linea con l’ipotesi che gli psicopatici abbiano un
dimento automatico descritto nel paragrafo 2.2.             ricordo povero di dettagli emotivi che lascia ra-
Per realizzare ciò è stata utilizzata l’implemen-         gionevolmente presupporre un’attenuata risposta
tazione J48 dell’algoritmo C4.5 presente nel tool           emozionale agli eventi.
open-source Weka3 (Hall et al., 2009).                          È anche importante sottolineare come la pola-
                                                            rità sia sbilanciata verso la negatività. Ciò sug-
3.1     Risultati                                           gerisce che, in assenza di psicopatia, il tipo di ri-
Per analizzare l’associazione tra psicopatia e pun-         cordo associato all’evento criminoso risulta essere
teggi ottenuti negli score della Sentiment Analysis         negativo. Continuando ad analizzare l’albero di
abbiamo utilizzato analisi correlazionali attraver-         decisione si scopre che i nodi successivi si basano
so le quali è emersa una correlazione significativa        sugli attributi di polarità massima positiva e nega-
tra M axpos e il fattore Dominanza priva di pau-            tiva, e solo uno dei nodi fa riferimento all’etichetta
ra del PPI (Tabella 1) nel gruppo composto da of-           “piacere” di WordNetAffect.
fender psicopatici. Questo risultato sembra soste-
nere l’ipotesi che la freddezza emotiva dello psi-          4   Conclusioni
copatico predisponga ad una ricerca attiva di tut-
                                                            In questo lavoro abbiamo cercato di capire se i ri-
te quelle situazioni e sensazioni forti ed eccitanti
                                                            sultati prodotti da un algoritmo di sentiment analy-
che possano in qualche modo indurre uno stato di
                                                            sis possano in qualche modo essere associati alla
eccitazione in loro (Hervé et al., 2007), come il
                                                            psicopatia. In particolare, abbiamo analizzato la
commettere i crimini violenti di cui si sono resi
                                                            presenza di psicopatia, in un campione di offen-
protagonisti e la loro la tendenza a correre rischi
                                                            der detenuti poichè i tratti caratterizzanti di tale
(Ellis, 1987). Al contrario nel gruppo composto
                                                            disturbo, distacco emotivo, mancanza di senso di
da offender non psicopatici non è emersa alcuna
                                                            colpa, stile di vita antisociale, è possibile riscon-
correlazione significativa.
                                                            trarli negli offender detenuti per le peculiarità re-
   Per quanto riguarda l’output fornitoci dall’albe-
                                                            lative alla violenza degli atti esperiti e allo stile di
ro di decisione, si evince che la differenza di po-
                                                            vita condotto.
larità è l’attributo più discriminante, in grado di
                                                               I risultati ottenuti dalla sentiment analysis so-
riconoscere da solo quasi il 50% degli individui
                                                            no stati confrontati con quelli ottenuti attraverso il
   3
       http://www.cs.waikato.ac.nz/ml/weka/                 test PPI-R che valuta i tratti di personalità del sog-
getto attraverso l’indagine di quei comportamen-          Lee Ellis. 1987. Relationships of criminality and psy-
ti e peculiarità cognitive, emotive e percettive che       chopathy with eight other apparent behavioral ma-
                                                            nifestations of sub-optimal arousal. Personality and
costituiscono i tratti tipici della psicopatia.
                                                            Individual Differences, 8(6):905–925.
   I risultati ottenuti attraverso l’utilizzo di un ap-
proccio basato sull’induzione di alberi di decisio-       Samantha J Glass and Joseph P Newman. 2006. Re-
ne dimostrano una dipendenza tra la presenza di             cognition of facial affect in psychopathic offenders.
                                                            Journal of abnormal psychology, 115(4):815.
psicopatia e la differenza tra la massima polarità
positiva e quella negativa individuate nella nar-         Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard
razione del detenuto. Inoltre, è stata riscontrata        Pfahringer, Peter Reutemann, and Ian H Witten.
                                                           2009. The WEKA data mining software: an
una correlazione tra lo score massimo di polarità
                                                           update. ACM SIGKDD explorations newsletter,
e il fattore Dominanza priva di paura attraverso           11(1):10–18.
l’utilizzo di test statistici.
   I risultati ottenuti sono incoraggianti e dimo-        Hugues Hervé, Barry S Cooper, and JOHN C Yuille.
                                                            2007. Memory formation in offenders: Perspecti-
strano l’efficacia di ampliare la ricerca di base in        ves from a biopsychosocial model of eyewitness me-
psicologia cognitiva con strumenti innovativi co-           mory. Offenders’ memories of violent crimes, pages
me quello della sentiment analysis e in genere del-         38–74.
l’analisi automatica del testo. Lo studio qui ripor-      Scott O Lilienfeld and Michelle R Widows. 2005.
tato, seppur rilevante, è comunque da considerarsi         PPI-R: Psychopathic personality inventory revised:
preliminare per due ragioni: la ridotta dimensione          Professional Manual. Psychological Assessment
del campione e l’utilizzo di tecniche abbastanza            Resources, Incorporated.
semplici per l’analisi del sentiment.                     Takahiro Osumi and Hideki Ohira. 2010. The
                                                            positive side of psychopathy: Emotional detach-
Acknowledgement                                             ment in psychopathy and rational decision-making
                                                            in the ultimatum game. Personality and individual
Questo lavoro è parzialmente supportato dal                differences, 49(5):451–456.
progetto “Multilingual Entity Liking” finanzia-
to dalla Regione Puglia con il programma                  J Ross Quinlan. 1993. C4. 5: programs for machine
                                                             learning. Morgan Kaufmann Publishers.
FutureInResearch.
                                                          Ralph C Serin. 1996. Violent recidivism in criminal
                                                            psychopaths. Law and Human Behavior, 20(2):207.
References
                                                          Carlo Strapparava and Alessandro Valitutti. 2004.
Valerio Basile and Malvina Nissim. 2013. Sentiment          WordNet Affect: an Affective Extension of
  analysis on Italian tweets. In Proceedings of the 4th     WordNet. In LREC, volume 4, pages 1083–1086.
  Workshop on Computational Approaches to Subjec-
  tivity, Sentiment and Social Media Analysis, pages      Kevin Wilson, Sabrina Demetrioff, and Stephen Por-
  100–107, Atlanta.                                         ter. 2008. A pawn by any other name? so-
                                                            cial information processing as a function of psy-
Luisa Bentivogli and Emanuele Pianta. 2005. Ex-
                                                            chopathic traits. Journal of research in personality,
  ploiting parallel texts in the creation of multilin-
                                                            42(6):1651–1656.
  gual semantically annotated resources: the Multi-
  SemCor Corpus. Natural Language Engineering,            Yaling Yang, Adrian Raine, Patrick Colletti, Arthur W
  11(03):247–261.                                           Toga, and Katherine L Narr. 2010. Morphological
Ashley N Burrow, Nichole Currence, Diana Lemus,             alterations in the prefrontal cortex and the amygdala
  Amber E DeBono, Matthew T Crawford, and W Ri-             in unsuccessful psychopaths. Journal of abnormal
  chard Walker. 2014. Psychopaths view autobiogra-          psychology, 119(3):546.
  phical memories as less memorable, important, and
                                                          Eros Zanchetta and Marco Baroni. 2005. Morph-it!
  emotional than normal individuals. International
                                                            A free corpus-based morphological resource for the
  Journal of Humanities and Social Science, 4:1–9.
                                                            Italian language. Corpus Linguistics 2005, 1(1).
Sven-Åke Christianson, Adelle E Forth, Robert D Ha-
  re, Catherine Strachan, Lars Lidberg, and Lars-
  Håkan Thorell. 1996. Remembering details of
  emotional events: A comparison between psycho-
  pathic and nonpsychopathic offenders. Personality
  and Individual Differences, 20(4):437–443.
H Cleckley. 1941. The mask of sanity. st. louis. MO:
  Mosby.