Este repositório contém o dataset proposto no trabalho "A Sentiment Classification Approach for Books Reviews in Brazilian Portuguese Using Different Feature Extraction Methods" publicado no XVII Encontro Nacional de Inteligência Artificial e Computacional.
O dataset proposto contém 2000 comentários sobre livros feitos no idioma português brasileiro por usuários da Amazon Brasil. Os dados disponibilizados são os documetos brutos, sem qualquer tipo de processamento, dando ao pesquisador a liberdade para executar as etapas de pré-processamento desejadas.
O dataset está organizado nos seguintes arquivos, onde cada linha equivale a um comentário.
books_pt_neg - mil comentários de livros classificados como negativos pelos usuários (abaixo de 3 estrelas).
books_pt_pos - mil comentários de livros classificados como positivos pelos usuários (acima de 3 estrelas).
Se utilizar esse corpus por favor cite:
@inproceedings{books,
author = {Larissa Britto and Luciano Pacífico},
title = {A Sentiment Classification Approach for Books Reviews in Brazilian Portuguese Using Different Feature Extraction Methods},
booktitle = {Anais do XVII Encontro Nacional de Inteligência Artificial e Computacional},
year = {2020},
publisher = {SBC},
address = {Porto Alegre, RS, Brasil},
}
}