Skip to content

Прогнозирование тональности текста.

Notifications You must be signed in to change notification settings

Doppler-67/sentiment_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 

Repository files navigation

sentiment_analysis

Цель проекта

Нужно построить модель, которая будет определять тональность текста.

Про данные

В качестве данных был взят корпус русскоязычных твитов RuTweetCorp.

Описание данных:

positive.csv, negative.csv

id — уникальный номер сообщения в системе twitter.

tdate — дата публикации твита.

ttext — текст твита.

ttype — тональность твита (положительная, отрицательная).

trtw — количество ретвитов данного сообщения.

trep — количество реплаев к данному сообщению.

tfav — сколько других людей добавили это сообщение в избранное.

tstcount — число всех сообщений пользователя в сети twitter.

tfol — количество подписчиков у автора сообщения.

tfrien — количество друзей автора сообщения (те люди, которых читает пользователь).

listcount — количество листов-подписок в которые добавлен твиттер-пользователь.