معمولا در برنامههای وب مثل سامانههای آموزش دانشگاهها یا سامانههای اینترنت بانک برای جلوگیری از کارهای خرابکارانه توسط رباتها، از کپچا استفاده میشود.
یکی از معمولترین شکل کپچا به صورت تصویر است. در این نوع کپچا معمولا حروف و اعدادی انگلیسی به شکلی کنار هم قرار میگیرند و از کاربر پرسیده میشود که بگوید که این حروف و اعداد چیست. معمولا مسئولین این سایتها فکر میکنند که رباتها یا برنامههای کامپیوتری نمیتوانند پاسخ این سؤالات را بدهند.
مواقع زیادی هم رخ میدهد که این کپچاها به غیر از اعصاب خوردی چیزی برای ما ندارد.
در این پروژه ما میخواهیم که یک افزونه برای مروگر بنویسیم که یک کپچا را بکشند و به صورت خودکار آن را حل نماید.
برای مثال سادهتر میتوانید از کپچای سامانه آموزش دانشگاه شریف استفاده کنید.
مراحل یک سیستم برای اینکار میتواند بدین صورت باشد:
- جمع آوری یک پایگاه داده از کپچاها و تهیه پاسخ هر کدام از آنها به صورت دستی
- جداسازی هر حرف یا عدد از هم. (یعنی یک عکس را بگیرد و چند عکس کوچکتر دیگر درست بکند که هر کدام شامل یک حرف است).
- استفاده از OCR یا آموزش یک دستهبند ساده که هر حرف را تشخصی بدهد. برای دسته بند هم میتوان از شبکههای عصبی یا از SVM استفاده کرد.