סטודנטים לתואר ראשון במחלקה למדעי המחשב ב-HIT פיתחו עבור המחלקה לזיהוי פלילי במשטרת ישראל תוכנה המסוגלת להבין כתב יד אנושי בעברית ולתרגם אותו לטקסט מוקלד.

הפרויקט נכתב בשפת פייתון ובוצע על ידי הסטודנטים תומר פריאל ושרון שרטילוב, בהנחייתו של ד"ר יהונתן שלר, ראש המחלקה למדעי מחשב ב-HIT.
עד היום, כדי להזין מסמכים למחשבי מעבדת המסמכים של המחלקה לזיהוי פלילי, שוטרים היו נדרשים להזין את תוכן המסמך על גבי מקלדת באופן ידני. כעת ובזכות הפיתוח של HIT, מלאכת הזנת המסמכים תיהפך ותיעשה בצורה אוטומטית.
האלגוריתם שפותח יודע לזהות שורות ולחלקן למילים ולאותיות וכמו כן לזהות את כתב היד, כאשר בעתיד יוכל לזהות את כתב ידו של הכותב על גבי מספר מסמכים שונים.
הסטודנטים מיפו תבניות של אותיות, מילים ומשפטים בעברית באמצעות ספריית מידע רלוונטית שסופקה על ידי מעבדת המסמכים של המחלקה לזיהוי פלילי במשטרה ו"לימדו" את המחשב באמצעות למידת מכונה ובינה מלאכותית. לאחר שלב למידת המכונה הם ניסו את האלגוריתם על מסמכים ועשו את ההתאמות הנדרשות על מנת שהאלגוריתם יוכל להתממשק ולעבוד עם מערכת מעבדת המסמכים של המחלקה לזיהוי פלילי (מז"פ).

פורסם: 16/12/2021