خوشهبندی به فرآیند تبدیل حجم عظیمی از دادهها به گروههای دادهای مشابه گفته میشود. به همین صورت خوشهبندی متون عبارت است از تبدیل حجم عظیمی از اسناد متنی به گروههایی از متنهای مشابه؛ که به هر کدام از این گروهها یک خوشه گفته میشود. پس مسئله خوشهبندی اسناد متنی را میتوان به صورت سادهتر، مسئله پیدا کردن اسناد مشابه و قرار دادن آنها کنار هم تعریف کرد.
برای خوشهبندی اسناد متنی روشهای متنوعی وجود دارد که در این پژوهش انتظار میرود روشهای متداول برای خوشهبندی معرفی شده و یکی از آنها برای خوشهبندی متون فارسی پیادهسازی شود.
- Ebbesson, Magnus, and Christopher Issal. "Document Clustering." (2010).
- Berry, Michael W., ed. Survey of Text Mining I: Clustering, Classification, and Retrieval. Vol. 1. Springer, 2004.
- م.ایمانی، خوشهبندی متون فارسی، پایاننامه کارشناسی، داشگاه علم و صنعت ایران، ۱۳۹۱