Title:
|
CRIAÇÃO DE UM MODELO DE CLASSIFICAÇÃO DE
TWEETS EM PORTUGUÊS DO BRASIL RELACIONADOS
A CRIMES UTILIZANDO MÁQUINA DE VETORES DE
SUPORTE |
Author(s):
|
Isa Cristina C. de Andrade, Áurea Milene Teixeira B. dos Santos, Jonatã P. da Costa
e Roberto C. Limão de Oliveira |
ISBN:
|
978-989-8704-25-2 |
Editors:
|
Paula Miranda, Cristiano Costa, Pedro Isaías e Flávia Maria Santoro |
Year:
|
2020 |
Edition:
|
Single |
Keywords:
|
Twitter, SVM, Classificação, Crime |
Type:
|
Full |
First Page:
|
109 |
Last Page:
|
116 |
Cover:
|
|
Full Contents:
|
click to dowload
|
Paper Abstract:
|
O Twitter se tornou uma grande fonte de dados de pesquisa para descoberta de conhecimento, sendo uma rede social que
divulga o compartilhamento de opiniões e informações sobre eventos em geral, além de informações pessoais.
Considerando isso, o presente estudo tem como objetivo desenvolver um classificador com o propósito de classificar
tweets de notícias relacionadas a crime ou não escritos em português do Brasil, utilizando o método de reconhecimento
de padrões SVM (Support Vector Machine - Máquina de Vetores de Suporte). O ambiente de desenvolvimento utilizado
foi o Jupyter Notebook, onde a partir de várias bibliotecas auxiliares foram implementadas técnicas de pré-processamento
nos tweets para eliminar informações indesejáveis. O dataset utilizado no experimento é composto por tweets de contas
jornalísticas da cidade de Belém, Pará, Brasil. Os tweets são submetidos a um classificador SVM (Linear e RBF) onde o
Linear obteve uma taxa de acerto de 97%. |
|
|
|
|