BinaryVision

Tag: תיכנות

OCR בעזרת רשת עצבית בJavaScript

by on ינו.08, 2009, under כללי

כן כן, שמעתם טוב…
מכירים את האתר Megaupload?
זה כמו Rapidshare, אבל עם CAPTCHA הרבה יותר פשוטה של 3 אותיות.
מי שלא מכיר את הCAPTCHA, הנה לינק לדוגמה להורדה: http://www.megaupload.com/?d=X03HFLP1
(מצד ימין יש 3 אותיות)
כולם יודעים שCAPTCHA נועדה למנוע רובוטים שינסו להוריד את הקובץ בצורה אוטומטית,
וחלק אפילו יודעים שיש אפשרות לנסות לעשות זיהוי Optical Character Recognition או בקצרה OCR.
אבל אני לא חושב שמישהו פה ראה סקריפט Javascript שמממש את זה,
ואפשר להשתמש בו Live מול האתר בעזרת Add-on לFirefox שקוראים לו Greasemonkey.
התוסף מאפשר הרצת סקריפטים מסויימים עבור אתר כשנכנסים אליו.
הלינק הקודם שהבאתי, (http://www.megaupload.com/?d=X03HFLP1)
מכיל הורדה של התוסף, וגם של הסקריפט שעושה זיהוי אוטמטי עם הCAPTCHA של Megaupload.
מי שלא מעניין אותו השלמה אוטמטית של הCAPTCHA לפחות יעניין אותו איך בנוי הסקריפט.
הסקריפט מממש רשת עצבית מלאכותית ומגיע עם המשקלים המתאימים כדי לזהות את הCAPTCHA.
מי שמעניין אותו לקרוא על Artificial Neural Networks מוזמן ללמוד על זה מ:
http://en.wikipedia.org/wiki/Artificial_neural_network

הנה חלק מהסקריפט עם כמה מהמשקלים:

function create_net()
  {
    //pre-calculated weights
var h_weights = [[-0.126359597761, [-0.58837191446576764, 0.036755965405260743
, 0.51854514831840781, -0.43431581850621709, 1.0754289255168701
, -0.64799960752449348, 1.1940698464323356, -0.86824098689125395
, 0.29366831980315877, -0.89830849234532661, -0.43654295013922195
1 Comment :, more...

מחפש משהו?

תשתמש בטופס למטה כדי לחפש באתר: