Skip to content

dobribobri/txtclf

Repository files navigation

txtclf

TF-IDF * Word2Vec for russian

Тексты новостей взяты с портала Яндекс.Новости: https://yandex.ru/news/export

Вектора слов word2vec (word embeddings / keyed vectors) необходимо загрузить в папку проекта отдельно с сайта Russian Distributional Thesaurus: https://nlpub.mipt.ru/Russian_Distributional_Thesaurus

Модель all.norm-sz500-w10-cb0-it3-min5.w2v - http://panchenko.me/data/dsl-backup/w2v-ru/all.norm-sz500-w10-cb0-it3-min5.w2v

Модель all.norm-sz100-w10-cb0-it1-min100.w2v - http://panchenko.me/data/dsl-backup/w2v-ru/all.norm-sz100-w10-cb0-it1-min100.w2v

About

TF-IDF * Word2vec for russian

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages