<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Comportamento das Hashtags Durante Grandes Eventos</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Pedro Pinto</string-name>
          <email>pedropinto@ufrj.br</email>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Ingrhid Theodoro</string-name>
          <email>indytheodoro@ufrj.br</email>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Jonice Oliveira</string-name>
          <email>jonice@dcc.ufrj.br</email>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Author Keywords</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Social Network Analysis</institution>
          ,
          <addr-line>Zipf Law, Hashtag, Twitter.</addr-line>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Universidade Federal do Rio de</institution>
          ,
          <addr-line>Janeiro</addr-line>
        </aff>
      </contrib-group>
      <fpage>35</fpage>
      <lpage>42</lpage>
      <abstract>
        <p>Hashtags are words or terms which are used to categorize publications in social media, indexing the content and making it available for retrieval. The hashtags creation is free process, i.e, there are no rules or restrictions to create them. Otherwise, there is a convergence of the terms used to explain and semantically enrich the content. This work aims to study the use of hashtags for the crowd to describe major events. The rise and acceptance of hashtags in major events related to politics, disasters, sports and entertainment were analyzed. Although the broad diversity, we identify some language patterns in the use of hashtags created by the population. Moreover, peculiarities were analyzed in each studied event.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>INTRODUÇÃO</title>
      <p>O Twitter é um site de microblogging onde os usuários
podem publicar mensagens curtas chamadas tweets. Além
de uma das mais utilizadas mídias sociais, foi o precursor
do uso de hashtags, recurso que depois foi incorporado em
outras mídias sociais.</p>
      <p>Mas afinal, o que são hashtags? São termos ou expressões
que tentam resumir uma mensagem. Em interações sociais
baseadas principalmente em textos, as hastags tornaram-se
– apesar de sua simplicidade - um poderoso recurso nas
tecnologias de informação e comunicação online. As
WAIHCWS’16 was held as part of IHC’16, organized by the Brazilian
Computing Society (SBC). October 04, 2016, São Paulo/SP, Brazil.
Copyright 2016 © for this paper by its authors. Permission to make
digital or hard copies of all or part of this work for personal or classroom
use is granted for private and academic purposes.
hashtags são usadas para:</p>
      <p>Indexação de conteúdo - Hashtags são compostas
por termos antecedidos pelo símbolo de tralha (#),
tornando-se hiperlinks indexáveis pelos
mecanismos de busca. Os usuários podem
buscalas, acessar todos os conteúdos associados a elas e
as hashtags mais usadas no Twitter ficam
agrupadas no menu Trending Topics.</p>
      <p>
        Sumarização de ideias – As mídias sociais são
plataformas naturais para se disseminar ideias e as
hashtags têm sido utilizadas para representá-las,
permitindo o estudo de como as ideias são
disseminadas e propagadas [4; 7]
Expressão de sentimentos e opiniões – Hashtags
podem estar associadas direta ou indiretamente a
sentimentos como alegria, raiva, alívio, susto,
medo, dentre outras, auxiliando também no
entendimento do evento que gerou tal sentimento
(Davidov, 2010). Opiniões (e suas polaridades)
também são expressas por hashtags [
        <xref ref-type="bibr" rid="ref5">6</xref>
        ].
      </p>
      <p>Contextualização – As hashtags podem estar
associadas a locais, eventos, sentimentos, ações,
datas especiais e pessoas envolvidas, tornando-se
um mecanismo de contextualização das
mensagens.</p>
      <p>
        Definição de sarcasmo – A identificação da
veracidade da informação é um grande desafio.
Neste contexto, encontramos o sarcasmo. Algumas
hashtags são utilizadas para especificar a
veracidade ou grau de sarcasmo de seu conteúdo
(i.e, #sqn)
Neste sentido, as hashtags são um importante mecanismo
para as interações textuais, permitindo enriquecer
semanticamente textos usualmente curtos e coloquiais.
Atualmente, tornou-se comum publicar tweets sobre
acontecimentos e eventos quase em tempo real [
        <xref ref-type="bibr" rid="ref2">3</xref>
        ], pois
com a utilização das hashtags nos tweets tornou-se possível
resumir o assunto sobre o qual pretendia-se comentar,
facilitando a transmissão de informações, cultura e contato
com a sociedade. Percebe-se que as hashtags surgem pela
livre espontânea vontade de cada indivíduo, e mesmo assim
algumas são escolhidas pela multidão para descrever o
evento. Como se ao longo do tempo, surgisse um
vocabulário coletivo, descrito e representado pelas
hashtags. A partir desta observação, tentamos analisar o
comportamento do uso das hashtags em grandes eventos.
Para efetuar este estudo, foi feita uma análise sobre o uso de
hashtags nos tweets, verificando se existem padrões de
comportamento ou forma de utilização que possa ser
reproduzido para qualquer tipo de evento. Como as
hashtags são usadas? Quão grande é a adesão da multidão
(participantes ou comentaristas de grandes eventos), neste
tipo de mídia? Existe um padrão na utilização de hashtags?
Estas são as questões de pesquisa (QP) que analisaremos
neste trabalho.
      </p>
      <p>
        Analisamos a interação entre usuários em eventos nacionais
e internacionais. Para analisar tais cenários, fez-se o uso da
Lei de Zipf [
        <xref ref-type="bibr" rid="ref8">9</xref>
        ], uma distribuição de probabilidade que
descreve boa parte das formas de comunicação escritas ou
sonoras. Além disso, também foram analisadas
peculiaridades de cada um dos eventos em estudo, como
notícias e taxas de surgimento e adesão relacionadas à
utilização de hashtags. Os resultados obtidos mostram que
existe um padrão de linguagem característico na utilização
hashtags pelos usuários do Twitter.
      </p>
    </sec>
    <sec id="sec-2">
      <title>METODOLOGIA</title>
      <p>A metodologia consiste em três etapas: i) coleta dos dados
do Twitter e criação de uma base de dados brutos; ii)
aplicação de filtros sobre a base de dados brutos; e iii) a
análise sobre a base de dados já tratada.</p>
      <p>Foram escolhidos quatro eventos para serem observados
por causarem comoção e levantarem discussões nas redes
sociais: Rock in Rio 2013, Eleições presidenciais 2014,
Morte do candidato Eduardo Campos e a Estreia da quarta
temporada de Game of Thrones. Tais eventos foram
selecionados pela representativa e repercussão na época,
bem como pela grande quantidade de mensagens trocadas</p>
    </sec>
    <sec id="sec-3">
      <title>Coleta de Dados</title>
      <p>Os dados coletados se deram por meio do uso de um
crawler, que obtém os tweets acessando a API
(ApplicationProgramming Interface) oficial de busca do
Twitter1 utilizando palavras pré-definidas. Foram
escolhidos quatro eventos para serem abordados e foi criada
uma base de dados para cada um.
1 https://dev.twitter.com/docs/api/1.1,
07/04/2014.
acessado
em</p>
      <sec id="sec-3-1">
        <title>Bases</title>
        <p>Strings de busca</p>
        <sec id="sec-3-1-1">
          <title>Rock in Rio 2013</title>
          <p>##mmuul#lttriiso#shchrokoowicwnknrniionoorrr2oioo0cc1kkO3iinRnOrriioRo2O01R3 0219//00a99//1133
eduardo campos OR marina</p>
          <p>OR aecio OR dilma OR
PreEsliedieçnõceisais pGMaesantuorroroeOIvaResriaLOledvRoyOEFyRimdLealueixcliOOanRRa 20/0a8/14
2014 Everaldo Pereira OR 03/11/14
Eduardo Jorge OR Jose</p>
          <p>Maria OR Rui Costa</p>
        </sec>
        <sec id="sec-3-1-2">
          <title>Morte do candidato Eduardo Campos</title>
        </sec>
        <sec id="sec-3-1-3">
          <title>Game Of</title>
          <p>Thrones
(Quarta
temporada)
“Eduardo Campos”
#got</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Tratamento dos Dados</title>
      <p>A base de dados brutos, formada com os dados obtidos no
formato JSON, contém campos de dados (como id, data de
publicação, hashtags, tweet, etc.). No passo seguinte foi
realizado um processamento de todo o conteúdo dessa base.
Um código em JavaScript com as funções de MapReduce,
aplicado à base contida no MongoDB, foi utilizado para
criar combinações entre campos para que fosse possível
contabilizar a utilização dessas chaves. A aplicação desses
filtros resultou em novas bases contendo apenas os dados
que interessavam para as análises realizadas. Para efetuar as
diferentes análises foram usadas a linguagem de
programação Python e ferramentas de manipulação de
planilhas, como tabela dinâmica.</p>
    </sec>
    <sec id="sec-5">
      <title>ANÁLISES DOS RESULTADOS</title>
      <p>Com os dados devidamente organizados, foi possível fazer
as seguintes análises:


</p>
      <p>Taxa de Surgimento - quantidade de novas
hashtags que são criadas em cada dia;
Taxa de adesão - quantidade de vezes que uma
determinada hashtag foi usada em cada dia;
Análise de notícias - relacionadas aos eventos em
dias de picos de uso de hashtags sobre o assunto.</p>
    </sec>
    <sec id="sec-6">
      <title>QP1: Como as hashtags se comportam?</title>
      <p>Esta observação foi feita com base nas análises das notícias
sobre os eventos. Serão utilizadas a Taxa de Surgimento e o
Total de Hashtags do evento para entender os picos de
hashtags nos acontecimentos, que justificam o
comportamento da população em relação aos eventos. A
seguir, nas Figuras 1 e 2, é possível observar tal
comportamento em dois eventos: sobre entretenimento e no
cenário político brasileiro. Além desses, também serão
descritos os outros dois eventos analisados que possuem o
mesmo tema.</p>
      <p>As imagens abaixo apresentam os gráficos das taxas de
surgimento do evento Rock in Rio 2013 e Morte do
candidato Eduardo Campos.</p>
      <p>Percebe-se que 57% de todas as hashtags referentes ao
Rock in Rio 2013 surgiram na semana do dia 11 ao dia 17
de setembro, semana que precedeu ao show da cantora
norte-americana Beyoncé, que foi dia 14 de setembro.
Outros dois dias significativos foram os shows da banda
Metallica e do cantor Bon Jovi que se apresentaram no
palco principal do evento. Estes artistas foram mencionados
entre as dez principais hashtags utilizadas do evento,
representando aproximadamente 2% das de todas as
hashtags publicadas pelos usuários durante todo o evento e
aparecem entre as dez principais do evento, como iremos
ver mais a frente detalhadamente análise da taxa de adesão.
Esta análise é interessante para que se possa observar quais
foram os dias o evento mais acompanhados e comentados
pelos fãs nas mídias sociais.</p>
      <sec id="sec-6-1">
        <title>Figura 1. Análise de padrões entre Taxa de Surgimento e</title>
      </sec>
      <sec id="sec-6-2">
        <title>Total de Hashtags do Rock in Rio 2013.</title>
        <p>Observa-se uma coleta prévia a data do acidente, sendo
possível identificar o exato momento da explosão de
hashtags, representado 72% de todas as hashtags referentes
à coleta sobre a morte de Eduardo Campos surgiram entre
os dias 12 e 15 de agosto. Tal fato deve-se a morte do
candidato, ocorrida no dia 13 de agosto, por um desastre
aéreo. Também houve uma leve subida no gráfico no dia 17
de agosto, data de seu sepultamento.</p>
        <p>No pico do dia 13 de agosto mais de 2000 Hashtags
relativas ao evento foram criadas. Isso é um indício de que
a população acompanhou e se chocou com o ocorrido.</p>
      </sec>
      <sec id="sec-6-3">
        <title>Figura 2. Análise de padrões entre Taxa de Surgimento e</title>
      </sec>
      <sec id="sec-6-4">
        <title>Total de Hashtags da morte de Eduardo Campos.</title>
        <p>Pode-se notar, comparando os gráficos das taxas de
surgimento e total de hashtags de um mesmo evento, que
eles seguem padrões semelhantes. Esse fenômeno ocorreu
em todos os eventos observados. É interessante perceber
que existe uma relação forte entre o total de hashtags
usadas sobre determinado evento e o surgimento de novas
hashtags.
Os picos do dia 27 de agosto se referem ao debate
presidencial ocorrido em uma emissora de televisão, bem
como os dias 3 e 14 de outubro. É possível verificar,
observando apenas as dez primeiras hashtags utilizadas, em
qual emissora foi o debate e qual era a opinião do público
em relação aos candidatos.</p>
      </sec>
      <sec id="sec-6-5">
        <title>Figura 3. Análise de padrões entre Taxa de Surgimento e</title>
      </sec>
      <sec id="sec-6-6">
        <title>Total de Hashtags de Game of Thrones.</title>
        <p>Na figura 3 observa-se que na quarta temporada de Game of
Thrones há duas ocorrências de picos de publicações, bem
como de surgimento de novas hashtags. Elas ocorretam nos
dias seguintes aos últimos episódios da temporada. A
grande comoção na rede social foi devido à morte de um
personagem, entre as principais hashtags utilizadas
continham o nome do personagem e a insatisfação das
pessoas. 39% de todas as hashtags relacionadas a Game of
Thrones surgiram entre o dia primeiro e o dia cinco de
junho.</p>
        <p>A seguir, observa-se o gráfico de outro cenário, este
relacionado a política brasileira. Os dados sobre a opinião
dos usuários sobre as Eleições Presidenciais Brasileiras de
2014. Apesar de todos os gráficos seguirem um padrão de
surgimento similar ao de utilização de modo geral das
hashtags, este possui algumas observações simples sobre
determinados períodos.</p>
        <p>Observa-se, neste acompanhamento em longo prazo, alguns
picos na figura abaixo. Analisando o intervalo entre os dias
20 e 28 de agosto percebe-se a diferença entre os dois
gráficos, pois no segundo caso há picos, enquanto no
primeiro o desenvolvimento do gráfico está normal. Dado
que, o dia 21 de agosto foi o início do horário eleitoral,
houve pouca publicação, entretanto a variedade de hashtags
criadas fez com que o gráfico da taxa de surgimento se
destacasse.</p>
      </sec>
      <sec id="sec-6-7">
        <title>Figura 4. Análise de padrões entre Taxa de Surgimento e</title>
      </sec>
      <sec id="sec-6-8">
        <title>Total de Hashtags das Eleições Presidenciais Brasileiras de 2014.</title>
        <p>Nos dias 5 e 26 de outubro, dias de votação, também houve
grande participação popular. Entretanto, é possível verificar
que há significativa participação nas mídias sociais em
torno deste assunto um dia antes e um dia depois do pico.</p>
      </sec>
    </sec>
    <sec id="sec-7">
      <title>QP2: Quão grande é a adesão da multidão?</title>
      <p>Taxa de adesão é a quantidade de vezes que cada hashtag é
utilizada em cada dia. Mostra o quanto os usuários aderiram
aquela hashtag.</p>
      <p>Na imagem a seguir, figura 5, está a distribuição da taxa de
adesão das dez hashtags mais populares do evento Rock in
Rio 2013. Para a análise das top 10, foi necessário ocultar
do gráfico a hashtag “#rockinrio”, devido sua frequência
ser aproximadamente dez vezes mais do que a segunda
hashtag mais utilizada no evento, o que dificultaria a
visualização deste comparativo.</p>
      <sec id="sec-7-1">
        <title>Figura 5. Taxa de adesão de hashtags sobre o Rock in Rio 2013.</title>
        <p>Esta análise permite observar quais atrações foram as mais
comentadas do evento e os dias em que elas ficaram em
evidência, em geral, foram no dia do evento e no dia
seguinte ao show dos artistas mais aguardados pelo público.
Além disso, as hashtags sugeridas pelos meios de
comunicação, que transmitiram o evento ao vivo, também
surgiram entre as mais citadas no evento.</p>
        <p>A Figura 6 apresenta taxa de adesão das hashtags
relacionadas à quarta temporada de Game of Thrones.
Nota-se que a hashtag “themontaindandtheviper” se destaca
no dia 2 de junho. Ela mostra a expectativa do público em
relação a um evento prestes a acontecer na série durante
aquela semana.</p>
      </sec>
      <sec id="sec-7-2">
        <title>Figura 6. Taxa de adesão de hashtags sobre Game of</title>
      </sec>
      <sec id="sec-7-3">
        <title>Thrones.</title>
        <p>Na Figura 7 Nota-se que a maioria das hashtags foi muito
utilizada no dia 13 de agosto – data do falecimento do
candidato - e decresceu ao longo do período analisado. Esse
comportamento é típico de um acontecimento inesperado
que choca a população e coloca o tema em foco
instantaneamente.</p>
      </sec>
      <sec id="sec-7-4">
        <title>Figura 7. Taxa de adesão de hashtags sobre a morte de</title>
      </sec>
      <sec id="sec-7-5">
        <title>Eduardo Campos.</title>
        <p>É possível perceber através das hashtags utilizadas no
evento das eleições 2014 que a população acompanhou e
participou, através das mídias sociais, dos debates pelas
principais emissoras de televisão aberta, que são citadas
entre as principais hashtags do evento.</p>
      </sec>
      <sec id="sec-7-6">
        <title>Figura 8. Taxa de adesão de hashtags sobre as Eleições</title>
      </sec>
      <sec id="sec-7-7">
        <title>Presidenciais de 2014.</title>
        <p>Percebe-se que Dilma Rousseff e Marina Silva foram as
únicas candidatas que apareceram no top 10 deste evento.
Entretanto, a disputa no dia das votações não seguiu esta
tendência, que teve como principais concorrentes a
candidata, e futuramente eleita, Dilma Rousseff seguida
pelo candidato Aécio Neves, que seguiram para votações
em segundo turno.</p>
      </sec>
    </sec>
    <sec id="sec-8">
      <title>QP3: Existe algum padrão na utilização de hashtags?</title>
      <p>Para verificar se existem padrões na comunicação através
de hashtags neste trabalho será utilizada a Lei de Zipf, que
estuda a relação entre o posicionamento de uma palavra no
ranking de frequência em um texto suficientemente grande
e a quantidade de vezes que ela aparece. A relação é dada
pela lei de potência:</p>
      <p>f(k)=C/kª
Sendo ‘k’ a posição da palavra no ranking, ‘c’ a quantidade
de vezes que a primeira palavra do ranking aparece e ‘a’
uma constante positiva. A análise abaixo mostra
graficamente a distribuição das hashtags dos diferentes
eventos.</p>
      <p>Uma maneira visual de reconhecer a distribuição de Zipf é
notar que os dados ordenados colocados na escala Log x Log
se aproximam de uma reta cuja inclinação é igual ‘-a’.
O objetivo desta análise é verificar se a comunicação via
hashtags segue o mesmo padrão dos textos escritos em
português e em muitas outras línguas.</p>
      <p>A seguir, observa-se a tabela que representa o cálculo, com
base na Lei de Zipf, dos eventos analisados e suas respectivas
leis de distribuição de hashtags fixando a mais citada de cada
um dos temas e a constate positiva. Com base em dados
parciais sobre uma tendência linear.</p>
      <sec id="sec-8-1">
        <title>Evento</title>
        <sec id="sec-8-1-1">
          <title>Rock in Rio 2013</title>
        </sec>
        <sec id="sec-8-1-2">
          <title>Quarta temporada de Game of Thrones</title>
        </sec>
      </sec>
      <sec id="sec-8-2">
        <title>Distribuição aproximada</title>
        <p>f(k)=879.590/k^1,03
f(k)=371.426/k^1,12
f(k)=316.085/k^1,33</p>
        <sec id="sec-8-2-1">
          <title>Morte de Eduardo Campos f(k)=3.554/k^1,21</title>
        </sec>
      </sec>
      <sec id="sec-8-3">
        <title>Tabela 2. Eventos e suas leis de distribuição de hashtags.</title>
        <p>Abaixo, na figura 9, observa-se o resultado da análise
referente ao evento Rock in Rio 2013. Pode-se perceber que
a primeira hashtag se distancia das demais, pois a segunda
hashtag com maior adesão representa apenas 10% da
frequência da primeira mais utilizada “#rockinrio”, definida
pelo próprio evento e utilizada por usuários, artistas e
emissoras de Rádio/TV.</p>
      </sec>
      <sec id="sec-8-4">
        <title>Figura 9. Análises da Lei de Zipf sobre o Rock in Rio 2013.</title>
        <p>O ajuste da reta, representado em vermelho nos gráficos, foi
calculado através de dados parciais de uma equação linear.
Onde o primeiro elemento é dado a partir dos resultados do
Log da Posição e a constante ‘-a’ e o segundo é o resultado
da subtração do erro dados pelo ajuste linear e o primeiro
elemento.</p>
      </sec>
      <sec id="sec-8-5">
        <title>Figura 10. Análises da Lei de Zipf sobre a Morte de</title>
      </sec>
      <sec id="sec-8-6">
        <title>Eduardo Campos.</title>
        <p>A figura 10 mostra a análise das Hashtags sobre a morte de
Eduardo Campos. Percebe-se que as hashtags localizadas
nas primeiras posições do ranking destoam um pouco do
ajuste linear no gráfico LogxLog. Essa diferença já é
conhecida no experimento de Zipf. Espera-se que as
primeiras e últimas palavras analisadas fujam do padrão.
Entretanto, a partir de um determinado ponto a lei de
formação é seguida a risca.</p>
      </sec>
    </sec>
    <sec id="sec-9">
      <title>TRABALHOS RELACIONADOS</title>
      <p>As leis de potência são encontradas em áreas bem diversas:
economia e finanças, educação, demografia, geologia,
história, climatologia, bibliometria e informetria, terrorismo
e guerras, corrupção, turismo, esportes, artes, agronomia,
ecologia, biologia, linguística, ciência da computação,
ciências cognitivas, ciências sociais, astronomia, mecânica
dos sólidos, física e química [1]. A lei de potência usada
nas linguagens escritas e sonoras é conhecida como Lei de
Zipf, que foi usada neste trabalho para analisar as tags
relacionadas a eventos populares.</p>
      <p>
        Na lei de Zipf observa-se que, num texto suficientemente
longo, existe uma relação entre a frequência que uma dada
palavra ocorria e sua posição na lista de palavras ordenadas
segundo sua frequência de ocorrência [
        <xref ref-type="bibr" rid="ref1">2</xref>
        ]. Uma lista é
confeccionada, levando-se em conta a frequência
decrescente de ocorrências. À posição nesta lista dá-se o
nome de ordem de série (rank) como foi utilizado para as
análises deste trabalho. Assim, a palavra de maior
frequência de ocorrência tem ordem de série 1, a de
segunda maior frequência de ocorrência, ordem de série 2 e,
assim, sucessivamente.
      </p>
    </sec>
    <sec id="sec-10">
      <title>CONSIDERAÇÕES FINAIS</title>
      <p>
        Este estudo analisou o comportamento das hashtags criadas
em 5 grandes eventos. Neste estudo, analisamos se as
hashtags possuíam comportamentos linguísticos como o
surgimento de novos termos mediante novos eventos (taxa
de surgimento), além da fixação e popularidade de termos
(taxa de adesão). A partir da análise destes dois critérios,
percebemos o comportamento de inovação linguística, que
pode ser descrito como qualquer mudança em um sistema
linguístico existente [
        <xref ref-type="bibr" rid="ref7">8</xref>
        ].
      </p>
      <p>
        Outro comportamento linguístico analisado foi a obediência
ao padrão de Zipf. A lei de Zipf é uma teoria com base na
matemática e linguística que analisa e quantifica como as
palavras são distribuídas dentro de um determinado texto.
Zipf analisou a comunicação escrita em vários textos em
inglês e verificou que as palavras seguem uma lei de
potência. Tal estudo foi replicado por vários estudiosos, em
diferentes línguas, em textos de diferentes conotações
(músicas, textos científicos, poesias e romances) e
chegouse à mesma conclusão: a comunicação humana segue o
princípio de Zipf. Maia [
        <xref ref-type="bibr" rid="ref9">10</xref>
        ] realizou uma das primeiras
análises para o português-brasileiro. Por este motivo,
escolhemos a Lei de Zipf para verificar se hashtags
poderiam se comportar como um vocabulário, o que foi
mostrado que sim.
      </p>
      <p>Até a presente data, não ocorreram estudos que analisassem
o comportamento linguístico das hashtags em grandes
eventos. Este artigo conduziu e descreveu um estudo
inédito para verificar se, mesmo sendo criadas
individualmente, o conjunto de hashtags usadas em grandes
eventos teriam comportamentos linguísticos, seguindo um
padrão semelhante ao dos idiomas humanos.</p>
      <p>Este é um estudo preliminar. Como trabalhos futuros,
pretendemos analisar uma quantidade maior de eventos e
modelar o comportamento de surgimento, uso e
desatualização das hashtags.</p>
    </sec>
    <sec id="sec-11">
      <title>AGRADECIMENTOS</title>
      <p>Agradecimento ao CNPQ, FAPERJ, Fabrício Firmino,
Fabio Rangel que contribuíram para a evolução deste
trabalho.</p>
    </sec>
    <sec id="sec-12">
      <title>REFERÊNCIAS BIBLIOGRÁFICAS</title>
      <p>1. Bortolossi, H. J., Queiroz, J. J. D. B., &amp; da Silva, M. M.,
(2012), A Lei de Zipf e Outras Leis de Potência em
Dados Empíricos.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          2.
          <string-name>
            <surname>Guedes</surname>
            ,
            <given-names>V. L.</given-names>
          </string-name>
          and
          <string-name>
            <surname>Borschiver</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          (
          <year>2013</year>
          ),
          <article-title>Bibliometria: Uma Ferramenta Estatística Para a Gestão da Informação e do Conhecimento</article-title>
          , Em Sistemas De Informação, de Comunicação e de Avaliação Científica e Tecnológica
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          3.
          <string-name>
            <surname>Naaman</surname>
            ,
            <given-names>C.-H. L.</given-names>
          </string-name>
          <string-name>
            <surname>Mor</surname>
          </string-name>
          ., and
          <string-name>
            <surname>Boase</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          (
          <year>2010</year>
          ), “
          <article-title>Is it all About Me? User Content in Social Awareness Streams”</article-title>
          , ACM Conference on Computer Supported Cooperative Work,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          4.
          <string-name>
            <surname>Tsur</surname>
            , Oren, and
            <given-names>Ari</given-names>
          </string-name>
          <string-name>
            <surname>Rappoport</surname>
          </string-name>
          (
          <year>2012</year>
          ).
          <article-title>"What's in a hashtag?: content based prediction of the spread of ideas in microblogging communities." Proceedings of the fifth ACM international conference on Web search and data mining</article-title>
          . ACM.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          5.
          <string-name>
            <surname>Davidov</surname>
            , Dmitry,
            <given-names>Oren</given-names>
          </string-name>
          <string-name>
            <surname>Tsur</surname>
          </string-name>
          , and
          <string-name>
            <surname>Ari Rappoport</surname>
          </string-name>
          (
          <year>2010</year>
          ).
          <article-title>"Enhanced sentiment learning using twitter hashtags and smileys</article-title>
          .
          <source>" Proceedings of the 23rd international conference on computational linguistics: posters. Association for Computational Linguistics</source>
          ,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          6.
          <string-name>
            <surname>Barbosa</surname>
          </string-name>
          ,
          <string-name>
            <surname>Glívia</surname>
            <given-names>AR</given-names>
          </string-name>
          , et al. (
          <year>2013</year>
          )
          <article-title>"Caracterização do uso de hashtags do Twitter para mensurar o sentimento da população online: Um estudo de caso nas Eleições Presidenciais dos</article-title>
          EUA em
          <year>2012</year>
          .
          <article-title>"</article-title>
          Simpósio Brasileiro de Banco de Dados: Recife.
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          7.
          <string-name>
            <surname>Wang</surname>
          </string-name>
          , Yazhe, and Baihua Zheng (
          <year>2014</year>
          ).
          <article-title>"On macro and micro exploration of hashtag diffusion in Twitter." Advances in Social Networks Analysis</article-title>
          and
          <source>Mining (ASONAM)</source>
          ,
          <year>2014</year>
          IEEE/ACM International Conference on. IEEE.
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          8.
          <string-name>
            <surname>Breivik</surname>
            ,
            <given-names>L.E.</given-names>
          </string-name>
          , and
          <string-name>
            <surname>Jahr</surname>
          </string-name>
          , E.H. (Eds.)
          <year>1989</year>
          .
          <article-title>Language change: Contributions to the study of its causes</article-title>
          . Berlin/New York: Mouton de Gruyter.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          9.
          <string-name>
            <surname>Zipf</surname>
            ,
            <given-names>George</given-names>
          </string-name>
          <string-name>
            <surname>Kingsley</surname>
          </string-name>
          .
          <article-title>Human behavior and the principle of least effort: An introduction to human ecology</article-title>
          .
          <source>Ravenio Books</source>
          ,
          <year>2016</year>
          (reprinted).
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          10.
          <string-name>
            <surname>MAIA</surname>
          </string-name>
          ,
          <string-name>
            <surname>E. de L. Q S.</surname>
          </string-name>
          <article-title>Comportamento bibliométrico da língua portuguesa como veículo de representação da informação</article-title>
          .
          <source>Ciência da Informação</source>
          , Rio de Janeiro,
          <volume>2</volume>
          (
          <issue>2</issue>
          ):
          <fpage>99</fpage>
          -
          <lpage>138</lpage>
          ,
          <year>1973</year>
          . (Dissertação de Mestrado de
          <year>1973</year>
          ).
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>