למידה מפוקחת היא סוגי למידת מכונה שבהן מכונות מאומנות באמצעות נתוני אימון 'מתויגים' היטב, ועל בסיס הנתונים הללו, מכונות חוזות את התפוקה. הנתונים המסומנים פירושם שחלק מנתוני הקלט כבר מתויגים עם הפלט הנכון.
בלמידה מפוקחת, נתוני ההדרכה המסופקים למכונות פועלים כמפקח שמלמד את המכונות לחזות את הפלט בצורה נכונה. היא מיישמת את אותה תפיסה כפי שתלמיד לומד בהשגחת המורה.
למידה מפוקחת היא תהליך של אספקת נתוני קלט כמו גם נתוני פלט נכונים למודל למידת מכונה. המטרה של אלגוריתם למידה בפיקוח היא מצא פונקציית מיפוי כדי למפות את משתנה הקלט (x) עם משתנה הפלט (y) .
בעולם האמיתי, ניתן להשתמש בלמידה בפיקוח הערכת סיכונים, סיווג תמונות, זיהוי הונאה, סינון דואר זבל , וכו.
איך עובדת למידה מפוקחת?
בלמידה מפוקחת, מודלים מאומנים באמצעות נתונים מסומנים, כאשר המודל לומד על כל סוג של נתונים. לאחר השלמת תהליך האימון, המודל נבדק על בסיס נתוני מבחן (תת-קבוצה של מערך ההדרכה), ולאחר מכן הוא מנבא את התפוקה.
ניתן להבין בקלות את פעולת הלמידה בפיקוח על ידי הדוגמה והדיאגרמה שלהלן:
נניח שיש לנו מערך נתונים של סוגים שונים של צורות הכולל ריבוע, מלבן, משולש ומצולע. עכשיו השלב הראשון הוא שאנחנו צריכים לאמן את הדגם לכל צורה.
- אם לצורה הנתונה יש ארבע צלעות, וכל הצלעות שוות, היא תסומן כ-a כיכר .
- אם לצורה הנתונה יש שלושה צדדים, היא תסומן כ-a משולש .
- אם לצורה הנתונה יש שש צלעות שוות, היא תסומן כ מְשׁוּשֶׁה .
כעת, לאחר האימון, אנו בודקים את המודל שלנו באמצעות ערכת הבדיקות, ומשימתו של המודל היא לזהות את הצורה.
המכונה כבר מאומנת על כל סוגי הצורות, וכאשר היא מוצאת צורה חדשה היא מסווגת את הצורה על בסיסים של מספר צדדים, ומנבאת את התפוקה.
שלבים המעורבים בלמידה מפוקחת:
- ראשית קבע את סוג מערך ההדרכה
- אסוף/אסף את נתוני האימון המסומנים.
- חלק את מערך ההדרכה לאימון מערך נתונים, מערך נתונים לבדיקה ומערך אימות .
- קבע את תכונות הקלט של מערך ההדרכה, שאמור להיות בעל מספיק ידע כדי שהמודל יוכל לחזות במדויק את הפלט.
- קבע את האלגוריתם המתאים למודל, כגון מכונת תמיכה וקטורית, עץ החלטות וכו'.
- בצע את האלגוריתם על מערך ההדרכה. לפעמים אנחנו צריכים ערכות אימות כפרמטרי הבקרה, שהם קבוצת המשנה של מערכי אימון.
- הערך את הדיוק של המודל על ידי אספקת ערכת הבדיקה. אם המודל חוזה את הפלט הנכון, כלומר המודל שלנו מדויק.
סוגי אלגוריתמים של למידת מכונה בפיקוח:
ניתן לחלק למידה מפוקחת לשני סוגים של בעיות:
1. רגרסיה
משתמשים באלגוריתמי רגרסיה אם יש קשר בין משתנה הקלט למשתנה הפלט. הוא משמש לחיזוי של משתנים רציפים, כגון חיזוי מזג אוויר, מגמות שוק וכו'. להלן כמה אלגוריתמי רגרסיה פופולריים הנמצאים בלמידה מפוקחת:
- רגרסיה לינארית
- עצי רגרסיה
- רגרסיה לא לינארית
- רגרסיה לינארית בייסיאנית
- רגרסיה פולינומית
2. סיווג
אלגוריתמי סיווג משמשים כאשר משתנה הפלט הוא קטגורי, כלומר ישנן שתי מחלקות כגון כן-לא, זכר-נקבה, נכון-שקר וכו'.
סינון דואר זבל,
- יער אקראי
- עצי החלטה
- רגרסיה לוגיסטית
- תמיכה במכונות וקטוריות
הערה: נדון באלגוריתמים אלה בפירוט בפרקים מאוחרים יותר.
יתרונות של למידה מפוקחת:
- בעזרת למידה מפוקחת, המודל יכול לחזות את התפוקה על בסיס התנסויות קודמות.
- בלמידה מפוקחת, נוכל לקבל מושג מדויק לגבי כיתות החפצים.
- מודל למידה מפוקח עוזר לנו לפתור בעיות שונות בעולם האמיתי כגון איתור הונאה, סינון דואר זבל , וכו.
חסרונות של למידה בפיקוח:
- מודלים של למידה מפוקחת אינם מתאימים לטיפול במשימות המורכבות.
- למידה מפוקחת לא יכולה לחזות את הפלט הנכון אם נתוני הבדיקה שונים ממערך הנתונים של ההדרכה.
- האימון דרש הרבה זמני חישוב.
- בלמידה מפוקחת, אנו זקוקים לידע מספיק על מחלקות האובייקט.