Skip to content

Latest commit

 

History

History
35 lines (19 loc) · 1.47 KB

README.md

File metadata and controls

35 lines (19 loc) · 1.47 KB

sentiment_analysis

Цель проекта

Нужно построить модель, которая будет определять тональность текста.

Про данные

В качестве данных был взят корпус русскоязычных твитов RuTweetCorp.

Описание данных:

positive.csv, negative.csv

id — уникальный номер сообщения в системе twitter.

tdate — дата публикации твита.

ttext — текст твита.

ttype — тональность твита (положительная, отрицательная).

trtw — количество ретвитов данного сообщения.

trep — количество реплаев к данному сообщению.

tfav — сколько других людей добавили это сообщение в избранное.

tstcount — число всех сообщений пользователя в сети twitter.

tfol — количество подписчиков у автора сообщения.

tfrien — количество друзей автора сообщения (те люди, которых читает пользователь).

listcount — количество листов-подписок в которые добавлен твиттер-пользователь.