נקודות זכות באוניברסיטה העברית:
3
תואר:
בוגר
היחידה האקדמית שאחראית על הקורס:
סטטיסטיקה
סמסטר:
סמסטר ב'
שפת ההוראה:
עברית
קמפוס:
הר הצופים
מורה אחראי על הקורס (רכז):
אור צוק
שעות קבלה של רכז הקורס:
ד 16:15-17:15
מורי הקורס:
ד"ר אור צוק
תאור כללי של הקורס:
נלמד שיטות לטיפול ולניתוח מסדי נתונים גדולים.
מטרות הקורס:
רכישת כלים תכנותיים וסטטיסטיים הדרושים לביצוע סטטיסטיקות על נתוני ענק.
תוצרי למידה : בסיומו של קורס זה, סטודנטים יהיו מסוגלים:
לנתח מסדי נתונים המכילים מליוני רשומות ואלפי משתנים. להשתמש בצורה יעילה בתוכנות המסוגלות לבצע חישוב מקבילי/בענן. להוציא ולנתח נתונים המרוכזים ברשתות.
דרישות נוכחות (%):
0
שיטת ההוראה בקורס:
הרצאה, הדגמה תוך שימוש במחשב.
רשימת נושאים / תכנית הלימודים בקורס:
עבודה מרחוק בסביבת unix ובמחשוב ענן, SQL, אחזור מידע מהרשת.
מציאת דמיון: מציאת שכנים, פונקציות האש
חישוב מבוזר בסביבת ענן
ניתוח רשתות: זיהוי קהילה, דגימה בגרפים גדולים.
זרם נתונים: אלגוריתמי און-ליין, קבלת החלטות און-ליין (מבחניA/B)
חומר חובה לקריאה:
אין
חומר לקריאה נוספת:
Leskovec, Rajaraman&Ullman (2014). Mining of massive datasets, Cambridge University Press
Tan, Steinbach, Karpatne and Kumar (2005). Introduction to Data Mining. Pearson Addison Wesley
Liu (2011). Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (Data-Centric Systems and Applications). Springer
White (2015). Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. O'Reilly Media
הערכת הקורס - הרכב הציון הסופי :
מבחן מסכם בכתב/בחינה בעל פה 0 %
הרצאה0 %
השתתפות 0 %
הגשת עבודה 75 %
הגשת תרגילים 25 %
הגשת דו"חות 0 %
פרויקט מחקר 0 %
בחנים 0 %
אחר 0 %
מידע נוסף / הערות:
תינתן במהלך הסמסטר עבודת ביניים שתהווה 25% מציון הקורס.
לאחר סוף הסמסטר תהיה עבודת בית שתהווה 75% מציון הקורס.
כמו כן יינתנו מספר תרגילי רשות
|