Нужно построить модель, которая будет определять тональность текста.
В качестве данных был взят корпус русскоязычных твитов RuTweetCorp.
id — уникальный номер сообщения в системе twitter.
tdate — дата публикации твита.
ttext — текст твита.
ttype — тональность твита (положительная, отрицательная).
trtw — количество ретвитов данного сообщения.
trep — количество реплаев к данному сообщению.
tfav — сколько других людей добавили это сообщение в избранное.
tstcount — число всех сообщений пользователя в сети twitter.
tfol — количество подписчиков у автора сообщения.
tfrien — количество друзей автора сообщения (те люди, которых читает пользователь).
listcount — количество листов-подписок в которые добавлен твиттер-пользователь.