=Paper= {{Paper |id=Vol-1714/paper05 |storemode=property |title=Comportamento das hashtags durante grandes eventos |pdfUrl=https://ceur-ws.org/Vol-1714/paper05.pdf |volume=Vol-1714 |authors=Pedro Pinto,Ingrhid Theodoro,Jonice Oliveira |dblpUrl=https://dblp.org/rec/conf/ihc/PintoTO16 }} ==Comportamento das hashtags durante grandes eventos== https://ceur-ws.org/Vol-1714/paper05.pdf
     Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


  Comportamento das Hashtags Durante Grandes Eventos
           Pedro Pinto                                        Ingrhid Theodoro                            Jonice Oliveira
  Universidade Federal do Rio de                        Universidade Federal do Rio de             Universidade Federal do Rio de
             Janeiro                                               Janeiro                                    Janeiro
       pedropinto@ufrj.br                                   indytheodoro@ufrj.br                        jonice@dcc.ufrj.br
ABSTRACT                                                                        hashtags são usadas para:
Hashtags are words or terms which are used to categorize
publications in social media, indexing the content and                                 Indexação de conteúdo - Hashtags são compostas
making it available for retrieval. The hashtags creation is                             por termos antecedidos pelo símbolo de tralha (#),
free process, i.e, there are no rules or restrictions to create                         tornando-se      hiperlinks   indexáveis     pelos
them. Otherwise, there is a convergence of the terms used                               mecanismos de busca. Os usuários podem busca-
to explain and semantically enrich the content. This work                               las, acessar todos os conteúdos associados a elas e
aims to study the use of hashtags for the crowd to describe                             as hashtags mais usadas no Twitter ficam
major events. The rise and acceptance of hashtags in major                              agrupadas no menu Trending Topics.
events related to politics, disasters, sports and entertainment                        Sumarização de ideias – As mídias sociais são
were analyzed. Although the broad diversity, we identify                                plataformas naturais para se disseminar ideias e as
some language patterns in the use of hashtags created by                                hashtags têm sido utilizadas para representá-las,
the population. Moreover, peculiarities were analyzed in                                permitindo o estudo de como as ideias são
each studied event.                                                                     disseminadas e propagadas [4; 7]
RESUMO
                                                                                       Expressão de sentimentos e opiniões – Hashtags
As hashtags são palavras ou termos que servem para
                                                                                        podem estar associadas direta ou indiretamente a
categorizar publicações em mídias sociais, indexando o
                                                                                        sentimentos como alegria, raiva, alívio, susto,
conteúdo e tornando-o apto para a busca. As hashtags são                                medo, dentre outras, auxiliando também no
de livre criação, ou seja, não há regras ou restrições para                             entendimento do evento que gerou tal sentimento
criá-las. Mesmo diante desta liberdade, nota-se uma                                     (Davidov, 2010). Opiniões (e suas polaridades)
convergência dos termos usados para explicar e trazer                                   também são expressas por hashtags [6].
significado para conteúdos. Este trabalho visa estudar o uso
das hashtags pela multidão para descrever grandes eventos.                             Contextualização – As hashtags podem estar
O surgimento e adesão das hashtags em grandes eventos                                   associadas a locais, eventos, sentimentos, ações,
relacionados à política, desastres, esporte e entretenimento                            datas especiais e pessoas envolvidas, tornando-se
foram analisados. Apesar da ampla diversidade, percebeu-                                um mecanismo de contextualização das
se um padrão de linguagem característico no uso das                                     mensagens.
hashtags criadas pela população. Além disso, também
foram analisadas peculiaridades de cada um dos eventos                                 Definição de sarcasmo – A identificação da
estudados.                                                                              veracidade da informação é um grande desafio.
                                                                                        Neste contexto, encontramos o sarcasmo. Algumas
Author Keywords                                                                         hashtags são utilizadas para especificar a
Social Network Analysis, Zipf Law, Hashtag, Twitter.                                    veracidade ou grau de sarcasmo de seu conteúdo
                                                                                        (i.e, #sqn)
INTRODUÇÃO                                                                      Neste sentido, as hashtags são um importante mecanismo
O Twitter é um site de microblogging onde os usuários                           para as interações textuais, permitindo enriquecer
podem publicar mensagens curtas chamadas tweets. Além                           semanticamente textos usualmente curtos e coloquiais.
de uma das mais utilizadas mídias sociais, foi o precursor
do uso de hashtags, recurso que depois foi incorporado em                       Atualmente, tornou-se comum publicar tweets sobre
outras mídias sociais.                                                          acontecimentos e eventos quase em tempo real [3], pois
                                                                                com a utilização das hashtags nos tweets tornou-se possível
Mas afinal, o que são hashtags? São termos ou expressões                        resumir o assunto sobre o qual pretendia-se comentar,
que tentam resumir uma mensagem. Em interações sociais                          facilitando a transmissão de informações, cultura e contato
baseadas principalmente em textos, as hastags tornaram-se                       com a sociedade. Percebe-se que as hashtags surgem pela
– apesar de sua simplicidade - um poderoso recurso nas                          livre espontânea vontade de cada indivíduo, e mesmo assim
tecnologias de informação e comunicação online. As                              algumas são escolhidas pela multidão para descrever o
                                                                                evento. Como se ao longo do tempo, surgisse um
WAIHCWS’16 was held as part of IHC’16, organized by the Brazilian               vocabulário coletivo, descrito e representado pelas
Computing Society (SBC). October 04, 2016, São Paulo/SP, Brazil.
Copyright 2016 © for this paper by its authors. Permission to make
digital or hard copies of all or part of this work for personal or classroom
use is granted for private and academic purposes.




                                                                               35
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


hashtags. A partir desta observação, tentamos analisar o
comportamento do uso das hashtags em grandes eventos.                                                           Período
                                                                                                                        Quantidade
Para efetuar este estudo, foi feita uma análise sobre o uso de        Bases            Strings de busca           de
                                                                                                                         de Tweets
hashtags nos tweets, verificando se existem padrões de                                                          Coleta
comportamento ou forma de utilização que possa ser                                 #rockinrio OR
reproduzido para qualquer tipo de evento. Como as                                                      01/09/13
                                                                 Rock in Rio    #rockinrio2013 OR
hashtags são usadas? Quão grande é a adesão da multidão                                                    a                   73.605
                                                                    2013     #multishownorockinrio OR
(participantes ou comentaristas de grandes eventos), neste                                             29/09/13
                                                                             #multishownorockinrio2013
tipo de mídia? Existe um padrão na utilização de hashtags?
Estas são as questões de pesquisa (QP) que analisaremos                        eduardo campos OR marina
neste trabalho.                                                                  OR aecio OR dilma OR
                                                                               pastor everaldo OR Luciana
Analisamos a interação entre usuários em eventos nacionais         Eleições                               20/08/14
                                                                               Genro OR Levy Fidelix OR
e internacionais. Para analisar tais cenários, fez-se o uso da   Presidenciais                                a                746.794
                                                                               Mauro Iasi OR Eymael OR
Lei de Zipf [9], uma distribuição de probabilidade que               2014                                 03/11/14
                                                                                  Everaldo Pereira OR
descreve boa parte das formas de comunicação escritas ou                         Eduardo Jorge OR Jose
sonoras. Além disso, também foram analisadas                                       Maria OR Rui Costa
peculiaridades de cada um dos eventos em estudo, como
notícias e taxas de surgimento e adesão relacionadas à            Morte do
                                                                                                                06/08/14
utilização de hashtags. Os resultados obtidos mostram que         candidato
                                                                   Eduardo           “Eduardo Campos”               a          12.921
existe um padrão de linguagem característico na utilização                                                      20/08/14
hashtags pelos usuários do Twitter.                                Campos
                                                                  Game Of
                                                                                                                12/05/14
                                                                   Thrones
                                                                                             #got                   a           6.652
                                                                   (Quarta
METODOLOGIA                                                                                                     08/08/14
                                                                 temporada)
A metodologia consiste em três etapas: i) coleta dos dados
do Twitter e criação de uma base de dados brutos; ii)                         Tabela 1. Lista de eventos e strings de busca.
aplicação de filtros sobre a base de dados brutos; e iii) a
análise sobre a base de dados já tratada.
                                                                  Tratamento dos Dados
Foram escolhidos quatro eventos para serem observados             A base de dados brutos, formada com os dados obtidos no
por causarem comoção e levantarem discussões nas redes            formato JSON, contém campos de dados (como id, data de
sociais: Rock in Rio 2013, Eleições presidenciais 2014,           publicação, hashtags, tweet, etc.). No passo seguinte foi
Morte do candidato Eduardo Campos e a Estreia da quarta           realizado um processamento de todo o conteúdo dessa base.
temporada de Game of Thrones. Tais eventos foram                  Um código em JavaScript com as funções de MapReduce,
selecionados pela representativa e repercussão na época,          aplicado à base contida no MongoDB, foi utilizado para
bem como pela grande quantidade de mensagens trocadas             criar combinações entre campos para que fosse possível
                                                                  contabilizar a utilização dessas chaves. A aplicação desses
Coleta de Dados
                                                                  filtros resultou em novas bases contendo apenas os dados
Os dados coletados se deram por meio do uso de um                 que interessavam para as análises realizadas. Para efetuar as
crawler, que obtém os tweets acessando a API                      diferentes análises foram usadas a linguagem de
(ApplicationProgramming Interface) oficial de busca do            programação Python e ferramentas de manipulação de
Twitter1 utilizando palavras pré-definidas. Foram                 planilhas, como tabela dinâmica.
escolhidos quatro eventos para serem abordados e foi criada
uma base de dados para cada um.
                                                                  ANÁLISES DOS RESULTADOS
                                                                  Com os dados devidamente organizados, foi possível fazer
                                                                  as seguintes análises:
                                                                             Taxa de Surgimento - quantidade de novas
                                                                              hashtags que são criadas em cada dia;
                                                                             Taxa de adesão - quantidade de vezes que uma
                                                                              determinada hashtag foi usada em cada dia;
1
    https://dev.twitter.com/docs/api/1.1,    acessado     em                 Análise de notícias - relacionadas aos eventos em
07/04/2014.                                                                   dias de picos de uso de hashtags sobre o assunto.




                                                                 36
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


                                                                Observa-se uma coleta prévia a data do acidente, sendo
QP1: Como as hashtags se comportam?                             possível identificar o exato momento da explosão de
Esta observação foi feita com base nas análises das notícias    hashtags, representado 72% de todas as hashtags referentes
sobre os eventos. Serão utilizadas a Taxa de Surgimento e o     à coleta sobre a morte de Eduardo Campos surgiram entre
Total de Hashtags do evento para entender os picos de           os dias 12 e 15 de agosto. Tal fato deve-se a morte do
hashtags nos acontecimentos, que justificam o                   candidato, ocorrida no dia 13 de agosto, por um desastre
comportamento da população em relação aos eventos. A            aéreo. Também houve uma leve subida no gráfico no dia 17
seguir, nas Figuras 1 e 2, é possível observar tal              de agosto, data de seu sepultamento.
comportamento em dois eventos: sobre entretenimento e no        No pico do dia 13 de agosto mais de 2000 Hashtags
cenário político brasileiro. Além desses, também serão          relativas ao evento foram criadas. Isso é um indício de que
descritos os outros dois eventos analisados que possuem o       a população acompanhou e se chocou com o ocorrido.
mesmo tema.
As imagens abaixo apresentam os gráficos das taxas de
surgimento do evento Rock in Rio 2013 e Morte do
candidato Eduardo Campos.
Percebe-se que 57% de todas as hashtags referentes ao
Rock in Rio 2013 surgiram na semana do dia 11 ao dia 17
de setembro, semana que precedeu ao show da cantora
norte-americana Beyoncé, que foi dia 14 de setembro.
Outros dois dias significativos foram os shows da banda
Metallica e do cantor Bon Jovi que se apresentaram no
palco principal do evento. Estes artistas foram mencionados
entre as dez principais hashtags utilizadas do evento,
representando aproximadamente 2% das de todas as
hashtags publicadas pelos usuários durante todo o evento e
aparecem entre as dez principais do evento, como iremos
ver mais a frente detalhadamente análise da taxa de adesão.
Esta análise é interessante para que se possa observar quais
foram os dias o evento mais acompanhados e comentados
pelos fãs nas mídias sociais.


                                                                Figura 2. Análise de padrões entre Taxa de Surgimento e
                                                                   Total de Hashtags da morte de Eduardo Campos.
                                                                Pode-se notar, comparando os gráficos das taxas de
                                                                surgimento e total de hashtags de um mesmo evento, que
                                                                eles seguem padrões semelhantes. Esse fenômeno ocorreu
                                                                em todos os eventos observados. É interessante perceber
                                                                que existe uma relação forte entre o total de hashtags
                                                                usadas sobre determinado evento e o surgimento de novas
                                                                hashtags.




Figura 1. Análise de padrões entre Taxa de Surgimento e
        Total de Hashtags do Rock in Rio 2013.




                                                               37
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


                                                                Os picos do dia 27 de agosto se referem ao debate
                                                                presidencial ocorrido em uma emissora de televisão, bem
                                                                como os dias 3 e 14 de outubro. É possível verificar,
                                                                observando apenas as dez primeiras hashtags utilizadas, em
                                                                qual emissora foi o debate e qual era a opinião do público
                                                                em relação aos candidatos.




Figura 3. Análise de padrões entre Taxa de Surgimento e
        Total de Hashtags de Game of Thrones.
Na figura 3 observa-se que na quarta temporada de Game of
Thrones há duas ocorrências de picos de publicações, bem
como de surgimento de novas hashtags. Elas ocorretam nos
dias seguintes aos últimos episódios da temporada. A
grande comoção na rede social foi devido à morte de um          Figura 4. Análise de padrões entre Taxa de Surgimento e
personagem, entre as principais hashtags utilizadas             Total de Hashtags das Eleições Presidenciais Brasileiras
continham o nome do personagem e a insatisfação das                                     de 2014.
pessoas. 39% de todas as hashtags relacionadas a Game of        Nos dias 5 e 26 de outubro, dias de votação, também houve
Thrones surgiram entre o dia primeiro e o dia cinco de          grande participação popular. Entretanto, é possível verificar
junho.                                                          que há significativa participação nas mídias sociais em
A seguir, observa-se o gráfico de outro cenário, este           torno deste assunto um dia antes e um dia depois do pico.
relacionado a política brasileira. Os dados sobre a opinião
dos usuários sobre as Eleições Presidenciais Brasileiras de     QP2: Quão grande é a adesão da multidão?
2014. Apesar de todos os gráficos seguirem um padrão de         Taxa de adesão é a quantidade de vezes que cada hashtag é
surgimento similar ao de utilização de modo geral das           utilizada em cada dia. Mostra o quanto os usuários aderiram
hashtags, este possui algumas observações simples sobre         aquela hashtag.
determinados períodos.                                          Na imagem a seguir, figura 5, está a distribuição da taxa de
Observa-se, neste acompanhamento em longo prazo, alguns         adesão das dez hashtags mais populares do evento Rock in
picos na figura abaixo. Analisando o intervalo entre os dias    Rio 2013. Para a análise das top 10, foi necessário ocultar
20 e 28 de agosto percebe-se a diferença entre os dois          do gráfico a hashtag “#rockinrio”, devido sua frequência
gráficos, pois no segundo caso há picos, enquanto no            ser aproximadamente dez vezes mais do que a segunda
primeiro o desenvolvimento do gráfico está normal. Dado         hashtag mais utilizada no evento, o que dificultaria a
que, o dia 21 de agosto foi o início do horário eleitoral,      visualização deste comparativo.
houve pouca publicação, entretanto a variedade de hashtags
criadas fez com que o gráfico da taxa de surgimento se
destacasse.




                                                               38
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)




Figura 5. Taxa de adesão de hashtags sobre o Rock in Rio
                         2013.                                     Figura 7. Taxa de adesão de hashtags sobre a morte de
                                                                                     Eduardo Campos.
Esta análise permite observar quais atrações foram as mais
comentadas do evento e os dias em que elas ficaram em          É possível perceber através das hashtags utilizadas no
evidência, em geral, foram no dia do evento e no dia           evento das eleições 2014 que a população acompanhou e
seguinte ao show dos artistas mais aguardados pelo público.    participou, através das mídias sociais, dos debates pelas
                                                               principais emissoras de televisão aberta, que são citadas
Além disso, as hashtags sugeridas pelos meios de               entre as principais hashtags do evento.
comunicação, que transmitiram o evento ao vivo, também
surgiram entre as mais citadas no evento.
A Figura 6 apresenta taxa de adesão das hashtags
relacionadas à quarta temporada de Game of Thrones.
Nota-se que a hashtag “themontaindandtheviper” se destaca
no dia 2 de junho. Ela mostra a expectativa do público em
relação a um evento prestes a acontecer na série durante
aquela semana.




                                                                   Figura 8. Taxa de adesão de hashtags sobre as Eleições
                                                                                   Presidenciais de 2014.
                                                               Percebe-se que Dilma Rousseff e Marina Silva foram as
  Figura 6. Taxa de adesão de hashtags sobre Game of           únicas candidatas que apareceram no top 10 deste evento.
                       Thrones.                                Entretanto, a disputa no dia das votações não seguiu esta
                                                               tendência, que teve como principais concorrentes a
Na Figura 7 Nota-se que a maioria das hashtags foi muito
                                                               candidata, e futuramente eleita, Dilma Rousseff seguida
utilizada no dia 13 de agosto – data do falecimento do
                                                               pelo candidato Aécio Neves, que seguiram para votações
candidato - e decresceu ao longo do período analisado. Esse
                                                               em segundo turno.
comportamento é típico de um acontecimento inesperado
que choca a população e coloca o tema em foco
                                                               QP3: Existe algum padrão na utilização de hashtags?
instantaneamente.
                                                               Para verificar se existem padrões na comunicação através
                                                               de hashtags neste trabalho será utilizada a Lei de Zipf, que
                                                               estuda a relação entre o posicionamento de uma palavra no
                                                               ranking de frequência em um texto suficientemente grande




                                                              39
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


e a quantidade de vezes que ela aparece. A relação é dada
pela lei de potência:
                          f(k)=C/kª
Sendo ‘k’ a posição da palavra no ranking, ‘c’ a quantidade
de vezes que a primeira palavra do ranking aparece e ‘a’
uma constante positiva. A análise abaixo mostra
graficamente a distribuição das hashtags dos diferentes
eventos.
Uma maneira visual de reconhecer a distribuição de Zipf é
notar que os dados ordenados colocados na escala Log x Log
se aproximam de uma reta cuja inclinação é igual ‘-a’.
O objetivo desta análise é verificar se a comunicação via
hashtags segue o mesmo padrão dos textos escritos em
português e em muitas outras línguas.
A seguir, observa-se a tabela que representa o cálculo, com
base na Lei de Zipf, dos eventos analisados e suas respectivas
leis de distribuição de hashtags fixando a mais citada de cada
um dos temas e a constate positiva. Com base em dados
parciais sobre uma tendência linear.

            Evento               Distribuição aproximada
       Rock in Rio 2013             f(k)=879.590/k^1,03
 Quarta temporada de Game                                             Figura 9. Análises da Lei de Zipf sobre o Rock in Rio
                                    f(k)=371.426/k^1,12
         of Thrones
                                                                                              2013.
 Eleições Presidenciais 2014        f(k)=316.085/k^1,33
                                                                  O ajuste da reta, representado em vermelho nos gráficos, foi
  Morte de Eduardo Campos             f(k)=3.554/k^1,21           calculado através de dados parciais de uma equação linear.
                                                                  Onde o primeiro elemento é dado a partir dos resultados do
   Tabela 2. Eventos e suas leis de distribuição de hashtags.     Log da Posição e a constante ‘-a’ e o segundo é o resultado
                                                                  da subtração do erro dados pelo ajuste linear e o primeiro
Abaixo, na figura 9, observa-se o resultado da análise            elemento.
referente ao evento Rock in Rio 2013. Pode-se perceber que
a primeira hashtag se distancia das demais, pois a segunda
hashtag com maior adesão representa apenas 10% da
frequência da primeira mais utilizada “#rockinrio”, definida
pelo próprio evento e utilizada por usuários, artistas e
emissoras de Rádio/TV.




                                                                 40
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


                                                                  segunda maior frequência de ocorrência, ordem de série 2 e,
                                                                  assim, sucessivamente.

                                                                  CONSIDERAÇÕES FINAIS
                                                                  Este estudo analisou o comportamento das hashtags criadas
                                                                  em 5 grandes eventos. Neste estudo, analisamos se as
                                                                  hashtags possuíam comportamentos linguísticos como o
                                                                  surgimento de novos termos mediante novos eventos (taxa
                                                                  de surgimento), além da fixação e popularidade de termos
                                                                  (taxa de adesão). A partir da análise destes dois critérios,
                                                                  percebemos o comportamento de inovação linguística, que
                                                                  pode ser descrito como qualquer mudança em um sistema
                                                                  linguístico existente [8].
                                                                  Outro comportamento linguístico analisado foi a obediência
                                                                  ao padrão de Zipf. A lei de Zipf é uma teoria com base na
                                                                  matemática e linguística que analisa e quantifica como as
                                                                  palavras são distribuídas dentro de um determinado texto.
                                                                  Zipf analisou a comunicação escrita em vários textos em
                                                                  inglês e verificou que as palavras seguem uma lei de
                                                                  potência. Tal estudo foi replicado por vários estudiosos, em
                                                                  diferentes línguas, em textos de diferentes conotações
                                                                  (músicas, textos científicos, poesias e romances) e chegou-
                                                                  se à mesma conclusão: a comunicação humana segue o
                                                                  princípio de Zipf. Maia [10] realizou uma das primeiras
                                                                  análises para o português-brasileiro. Por este motivo,
   Figura 10. Análises da Lei de Zipf sobre a Morte de            escolhemos a Lei de Zipf para verificar se hashtags
                   Eduardo Campos.                                poderiam se comportar como um vocabulário, o que foi
A figura 10 mostra a análise das Hashtags sobre a morte de        mostrado que sim.
Eduardo Campos. Percebe-se que as hashtags localizadas            Até a presente data, não ocorreram estudos que analisassem
nas primeiras posições do ranking destoam um pouco do             o comportamento linguístico das hashtags em grandes
ajuste linear no gráfico LogxLog. Essa diferença já é             eventos. Este artigo conduziu e descreveu um estudo
conhecida no experimento de Zipf. Espera-se que as                inédito para verificar se, mesmo sendo criadas
primeiras e últimas palavras analisadas fujam do padrão.          individualmente, o conjunto de hashtags usadas em grandes
Entretanto, a partir de um determinado ponto a lei de             eventos teriam comportamentos linguísticos, seguindo um
formação é seguida a risca.                                       padrão semelhante ao dos idiomas humanos.
TRABALHOS RELACIONADOS                                            Este é um estudo preliminar. Como trabalhos futuros,
As leis de potência são encontradas em áreas bem diversas:        pretendemos analisar uma quantidade maior de eventos e
economia e finanças, educação, demografia, geologia,              modelar o comportamento de surgimento, uso e
história, climatologia, bibliometria e informetria, terrorismo    desatualização das hashtags.
e guerras, corrupção, turismo, esportes, artes, agronomia,
ecologia, biologia, linguística, ciência da computação,           AGRADECIMENTOS
ciências cognitivas, ciências sociais, astronomia, mecânica       Agradecimento ao CNPQ, FAPERJ, Fabrício Firmino,
dos sólidos, física e química [1]. A lei de potência usada        Fabio Rangel que contribuíram para a evolução deste
nas linguagens escritas e sonoras é conhecida como Lei de         trabalho.
Zipf, que foi usada neste trabalho para analisar as tags
relacionadas a eventos populares.                                 REFERÊNCIAS BIBLIOGRÁFICAS
                                                                  1. Bortolossi, H. J., Queiroz, J. J. D. B., & da Silva, M. M.,
Na lei de Zipf observa-se que, num texto suficientemente             (2012), A Lei de Zipf e Outras Leis de Potência em
longo, existe uma relação entre a frequência que uma dada            Dados Empíricos.
palavra ocorria e sua posição na lista de palavras ordenadas
segundo sua frequência de ocorrência [2]. Uma lista é             2. Guedes, V. L. and Borschiver, S. (2013), Bibliometria:
confeccionada, levando-se em conta a frequência                      Uma Ferramenta Estatística Para a Gestão da
decrescente de ocorrências. À posição nesta lista dá-se o            Informação e do Conhecimento, Em Sistemas De
nome de ordem de série (rank) como foi utilizado para as             Informação, de Comunicação e de Avaliação Científica
análises deste trabalho. Assim, a palavra de maior                   e Tecnológica
frequência de ocorrência tem ordem de série 1, a de




                                                                 41
    Anais do 7º Workshop sobre Aspectos da Interação Humano-Computador para a Web Social (WAIHCWS’16)


3. Naaman, C.-H. L. Mor., and Boase, J. (2010), “Is it all      7.Wang, Yazhe, and Baihua Zheng (2014). "On macro and
   About Me? User Content in Social Awareness Streams”,           micro exploration of hashtag diffusion in Twitter."
   ACM Conference on Computer Supported Cooperative               Advances in Social Networks Analysis and Mining
   Work, 2010.                                                    (ASONAM), 2014 IEEE/ACM International Conference
4. Tsur, Oren, and Ari Rappoport (2012). "What's in a             on. IEEE.
   hashtag?: content based prediction of the spread of ideas    8.Breivik, L.E., and Jahr, E.H. (Eds.) 1989. Language
   in microblogging communities." Proceedings of the fifth        change: Contributions to the study of its causes.
   ACM international conference on Web search and data            Berlin/New York: Mouton de Gruyter.
   mining. ACM.                                                 9.Zipf, George Kingsley. Human behavior and the principle
5.Davidov, Dmitry, Oren Tsur, and Ari Rappoport (2010).           of least effort: An introduction to human ecology.
  "Enhanced sentiment learning using twitter hashtags and         Ravenio Books, 2016 (reprinted).
  smileys." Proceedings of the 23rd international               10.MAIA, E. de L. Q S. Comportamento bibliométrico da
  conference on computational linguistics: posters.              língua portuguesa como veículo de representação da
  Association for Computational Linguistics, 2010.               informação. Ciência da Informação, Rio de Janeiro,
6.Barbosa, Glívia AR, et al. (2013)"Caracterização do uso        2(2):99-138, 1973. (Dissertação de Mestrado de 1973).
  de hashtags do Twitter para mensurar o sentimento da
  população online: Um estudo de caso nas Eleições
  Presidenciais dos EUA em 2012." Simpósio Brasileiro de
  Banco de Dados: Recife.




                                                               42