נקודות זכות באוניברסיטה העברית:
2
תואר:
מוסמך
היחידה האקדמית שאחראית על הקורס:
מדעי המחשב
סמסטר:
סמסטר ב'
שפת ההוראה:
עברית
קמפוס:
קרית א"י ספרא
מורה אחראי על הקורס (רכז):
oron sabag
שעות קבלה של רכז הקורס:
מורי הקורס:
ד"ר אורון סבג
תאור כללי של הקורס:
הקורס מציג את יסודות תורת הבקרה ובצורה יותר כללית תהליכי החלטה מרקוביים (מודל עבור למידה חיזוקית). החלק הראשון של הקורס כולל מידול ופתרונות עבור מודלים לינאריים בבקרה ו בחלק השני נציג עקרונות פתרון לתהליכי החלטה מרקוביים ונלמד אלגורימים לפתרון.
מטרות הקורס:
תוצרי למידה : בסיומו של קורס זה, סטודנטים יהיו מסוגלים:
- להסביר עקרונות מידול של בעיות בקרה ושערוך כמשוואות מצב.
- לפתור בעיות בקרה ושערוך לינאריות עם אינדקס ביצועים ריבועי.
- למדל בעיות כמודל תהליך החלטה מרקובי.
- לממש אלגוריתמים עבור פתרון תהליכי החלטה מרקוביים.
דרישות נוכחות (%):
שיטת ההוראה בקורס:
רשימת נושאים / תכנית הלימודים בקורס:
מבוא לבקרה: מערכות עם משוב, מוטיבציה (חוג פתוח / חוג סגור), דוגמאות פיזיקליות ומודל משוואות המצב עם תכונותיו.
-מודלים לינאריים בבקרה ושערוך עבור מודלים וקטוריים: מודל אינפורמציה מלאה(LQR) או עם רעש גאוסי(LQG), קלמן פילטר: פתרונות ע"י עקרונות תכנון דינמי ומשוואה ריבועית מטריציונית (משוואת ריקאטי).
- תהליכי החלטה מרקוביים: מודל, דוגמאות, קבלת החלטות, ופונקציות המטרה (מסלול קצר/אינדקס מופחת/אינדקס ממוצע וכו').
- פונקציית התגמול ((value function, אופרטור הבלמן, משוואת בלמן.
- אלגוריתמים לפתרון תהליכי החלטה מרקוביים עם מודל ידוע.
אלגוריתמים ללמידה חיזוקית (תהליכי החלטה מרקוביים ללא ידיעת המודל).
חומר חובה לקריאה:
-
חומר לקריאה נוספת:
- D.P. Bertsekas, Dynamic Programming and Optimal Control, vol. 1, Athena Scientific, 4th edition, 2017
- K. J. Åström. Introduction to Stochastic Control Theory. Academic Press, 1970.
- Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
הערכת הקורס - הרכב הציון הסופי :
מבחן מסכם בכתב/בחינה בעל פה 0 %
הרצאה0 %
השתתפות 0 %
הגשת עבודה 0 %
הגשת תרגילים 10 %
הגשת דו"חות 10 %
פרויקט מחקר 80 %
בחנים 0 %
אחר 0 %
מידע נוסף / הערות:
|