סילבוסים תואר שני

שיטות לאחזור ודליית מידע Methods in Data Retrieval

אופן ההוראה: שו"ת
ש"ס: 3
נ"ז: 3

מטרות הקורס: שיטות לאחזור ודלית מידע הפכו בשנים האחרונות לנושאים רבי חשיבות עבור ארגונים המחפשים דרכים ליעל את פעילותם ולרכוש יתרון אסטרטגי על פני מתחריהם.
מטרת הקורס היא להקנות לסטודנט כלים בתחומים אלו תוך ביסוס הידע באלגוריתמים ומודלים הלקוחים מתחום האינטליגנציה המלאכותית, כרית המידע והסטטיסטיקה. המושגים שילמדו יתורגלו בעזרת כלי תוכנה לכריית נתונים. הקורס מתנהל במעבדת המחשבים ומספר הסטודנטים, לכן, מוגבל.

תכני הקורס:
- מהי דלית מידע, חשיבותה באירגונים מודרניים, מושגים בסיסים, הבדלי גישות בין דלית מידע למערכות מומחה, כלים ועזרים לפיתוח, דוגמאות לישומים.
- גישת למידת מכונה, מתודולגיות של כרית מידע, גישת מחזור החיים, סוגי מודלים עיקריים, הגדרת ומדידת שגיאות, שיטות ולידציה, דרוג מודלים.
-הכרות עם תוכנת WEKA, סקירת סוגי מודלים בתוכנה, תרגול המתודולגיה בעזרת WEKA על נתוני אמת.
- מודלי כרית מידע מבוססי אנטרופיה. תרגול עם WEKA.
- מודלי כרית מידע מבוססי רשתות עצביות. תרגול עם WEKA.
- מודלים מבוססי כללים - תרגול עם WEKA.
- מודלים אורדינליים - תרגול עם WEKA.
- Support Vector Machines - תרגול עם WEKA
- סיכום: ישומים, מתי להשתמש במערכות מומחה ומתי בלמידת מכונה, מודלים היברידיים.

חובות הסטודנטים: הקורס הינו אינטגרטיבי, והוא דורש גם לימוד עצמי מהמשתתפים. ציון הקורס יקבע לפי איכות פרוייקט שיבצע ויגיש כל סטודנט. הפרוייקט ישווה בין ביצועי שני מודלים שנלמדו בקורס עם מודל נוסף אחד לפחות שהסטודנט ילמד בעצמו. את סדרת הנתונים עליה תתבצע העבודה ישיג כל סטודנט בכוחות עצמו, רצוי בתחום עיסוקו או בתחום ענין שלו. ניתן לקבל הפניה לנתונים כאלו גם מהמרצה. כל סטודנט חייב להציג ולהגן על עבודתו, וכן לחגיש דוח מסכם בכתב. חובה להצטרף לרשימת התפוצה של WEKA על מנת לקבל תמיכה טכנית. כל סטודנט יציג בפרויקט שאילתה אחת לפחות שפרסם באתר של WEKA.

ביבליוגרפיה: 

 

I. Witten & E. Frank, Data Mining, Morgan Kaufmann, (2nd Ed.) 2005
E. Alpaydin, Introduction to Machine Learning, MIT Press, 2004.
T. Mitchell, Machine Learning, McGraw-Hill, 1997.
U. Fayyad et. al. (Editors): Advances in Knowledge Discovery and Data Mining, MIT Press, 1996