Skip to content

Latest commit

 

History

History
36 lines (23 loc) · 3.77 KB

dependency-parser.md

File metadata and controls

36 lines (23 loc) · 3.77 KB

یکی از پیش‌نیازهای اصلی برای حل بسیاری از مسائل موجود در حوزه پردازش زبان طبیعی، وجود تحلیل نحوی از جملات زبان است. برای رسیدن به این هدف دو رویکرد متفاوت وجود دارد:

  • دستور زایشی: ابتدا جمله را به دو بخش نهاد و گزاره تقسیم می‌شود و در ادامه به صورت بازگشتی کار تقسیم را تا رسیدن به واژه‌های جمله ادامه می‌دهد.

درخت تجزیه زایشی

  • دستور وابستگی: وظیفه تجزیه جمله را از فعل اصلی جمله آغاز می کند و در گام اول وابسته‌های مستقیم فعل و در ادامه به صورت بازگشتی وابسته‌های سطح بعدی را تا تحلیل کامل جمله ادامه می‌دهد.

درخت تجزیه وابستگی

تجزیه وابستگی برای تحلیل زبان‌هایی مثل فارسی که ترتیب واژگان در آن‌ها ثابت نیستند بهتر است. یکی از الگوریتم‌های تجزیه وابستگی که بر روی زبان فارسی دقت بالایی دارد و در عین حال پیاده‌سازی آن ساده است الگوریتم کاوینگتون است. تلاش‌هایی برای بهبود این الگوریتم نیز صورت گرفته است مثل + و +.

در این پژوهش از شما خواسته شده است که الگوریتم کاوینگتون را پیاده‌سازی کرده و تلاش کنید دقت آن را بر روی زبان فارسی بهبود بخشید.

مقدمه

کارهای مرتبط

آزمایش‌ها

کارهای آینده

مراجع

پیوندهای مفید