מעבדות

NLP - עיבוד שפה טבעית (דיבור וטקסט) בעזרת מחשב

Natural Language Processing using Computer

מעבדת עיבוד שפה טבעית - דיבור וטקסט

המעבדה הוקמה במטרה לקיים קורס הכשרה על שיטות וכלים עדכניים המשמשים לעיבוד שפה ונתרגל עיבוד והקמת בסיסי נתונים, מודלי שפה ופתרון בעיות עמימות.

שם הקורס NLP בעזרת מחשבים - 65339
מרצים ד"ר נאווה שקד, מר יורי יורצינקו
אופן הוראה שיעור ומעבדה
שעות שבועיות 4 (2 הרצאה + 2 תרגול-מעבדה)
מיקום מרכז מעבדות מחשוב – בניין 8, קומה 1, חדר 100
כמות הסטודנטים בקורס עד 22 סטודנטים
סילבוס עברית | אנגלית
למי מיועד הקורס
הקורס מיועד לסטודנטים הפקולטה למדעי המחשב.

הקורס נועד להציג בפני הסטודנטים את המורכבות במידול שפות אנוש, וכן להקנות ידע מעשי שיסייע להם לפתור משימות בתחום עיבוד שפות טבעיות, החל מכלי מיון וכלה בתרגום אוטומטי. הקורס יעסוק בהיבטים אלגוריתמיים, בנושאים לשוניים ובהדגמת כלים המבצעים ניתוחים על נתוני שפה טבעית. הקורס בונה קשר ישיר בין התיאוריות ליישומים ומקשר מחקר ליישומי תעשייה תוך הבאת מקרים ודוגמאות לפרויקטים בחזית תעשיית ההיי-טק והמחקר.

עיבוד שפות טבעיות הוא תחום הבינה המלאכותית (AI) מעניק למחשבים את היכולת לנתח - להבין, לקרוא, ולפרש את השפה האנושית הטבעית, שפה כתובה או מדוברת (text or speech) בצורה הדומה למוח האנושי.

בקורס יחשפו הסטודנטים לתיאוריות המדעיות והאסכולות השונות בתחום בתקופות השונות האלגוריתימים החישוביים המובילים כגון: מודלי מרקוב, רשתות ניויורנים, אלגוריתמים סטאטיסטיים וסטוקסטיים כמו גם מכונות מצבים.
מטרות הקורס

מטרות הקורס להקנות ידע ויכולת ניתוח של אותות דיבור, הבנה של תהליכים אקוסטיים ומיצוי תכונות מאות הדיבור, לאחר השללב התיאורטי נלמד איך לשלב את יכולות העיבוד לתוך יישומים כגון: זיהוי דיבור, סינטחזת קול, זיהוי ביומטרי קולי, זיהוי רגשות, זיהוי שפה ועוד.

הסטודנטים יחשפו לפרויקטים אמיתיים בתעשייה.

במהלך הקורס הסטודנטים ישלימו פרויקטים הדורשים אלגוריתמים ופיתוח תוכנה עם שימוש בשפת התכנות Python, עבודה עם API וקוד פתוח.

הכלים עליהם הקורס מבוסס

תוכנה - כלי עיבוד ועיצוב: PRAAT, AUDACITY, MATLAB.

יישומים עם ערכות לפיתוח מוצרי דיבור, כגון:

  • ממשק API בענן של Google:
    TTS, Natural Language. STT, DialogFlow (API.AI)
  • IBM Watson (NLP technologies)
  • AWS: Amazon Polly, Amazon Transcribe, Amazon Comprehend

למעבדות נוספות במרכז מעבדות המחשוב: