logo

למידת מכונה ללא פיקוח

בנושא הקודם, למדנו למידת מכונה מפוקחת שבה מודלים מאומנים באמצעות נתונים מסומנים תחת פיקוח של נתוני אימון. אבל ייתכנו מקרים רבים שבהם אין לנו נתונים מסומנים וצריך למצוא את הדפוסים הנסתרים ממערך הנתונים הנתון. לכן, כדי לפתור סוגים כאלה של מקרים בלמידת מכונה, אנו זקוקים לטכניקות למידה ללא פיקוח.

מהי למידה ללא פיקוח?

כפי שהשם מרמז, למידה ללא פיקוח היא טכניקת למידת מכונה שבה מודלים אינם מפוקחים באמצעות מערך נתונים אימון. במקום זאת, המודלים עצמם מוצאים את הדפוסים והתובנות הנסתרות מהנתונים הנתונים. אפשר להשוות את זה ללמידה שמתרחשת במוח האנושי תוך כדי לימוד דברים חדשים. ניתן להגדיר זאת כ:

פיתון f-string
למידה לא מפוקחת היא סוג של למידת מכונה שבה מודלים מאומנים באמצעות מערך נתונים ללא תווית ומורשים לפעול על פי הנתונים הללו ללא כל פיקוח.

לא ניתן ליישם למידה לא מפוקחת ישירות על בעיית רגרסיה או סיווג מכיוון שבניגוד ללמידה מפוקחת, יש לנו את נתוני הקלט אבל אין נתוני פלט תואמים. המטרה של למידה ללא פיקוח היא למצוא את המבנה הבסיסי של מערך הנתונים, לקבץ את הנתונים לפי קווי דמיון, ולייצג את מערך הנתונים בפורמט דחוס .

דוגמא: נניח שאלגוריתם הלמידה ללא פיקוח מקבל מערך נתונים המכיל תמונות של סוגים שונים של חתולים וכלבים. האלגוריתם לעולם אינו מאומן על בסיס הנתונים הנתון, מה שאומר שאין לו מושג לגבי התכונות של מערך הנתונים. המשימה של אלגוריתם הלמידה הבלתי מפוקחת היא לזהות את תכונות התמונה בעצמן. אלגוריתם למידה ללא פיקוח יבצע משימה זו על ידי קיבוץ מערך התמונות לקבוצות לפי קווי דמיון בין תמונות.

למידת מכונה מפוקחת

למה להשתמש בלמידה ללא פיקוח?

להלן כמה סיבות עיקריות המתארות את החשיבות של למידה ללא פיקוח:

  • למידה ללא פיקוח מועילה למציאת תובנות שימושיות מהנתונים.
  • למידה ללא פיקוח דומה במידה רבה לכך שאדם לומד לחשוב על פי החוויות שלו, מה שהופך אותו קרוב יותר ל-AI האמיתי.
  • למידה לא מפוקחת עובדת על נתונים לא מסווגים ולא מסווגים שהופכים למידה ללא פיקוח חשובה יותר.
  • בעולם האמיתי, לא תמיד יש לנו נתוני קלט עם הפלט המתאים ולכן כדי לפתור מקרים כאלה, אנו זקוקים ללמידה ללא פיקוח.

עבודה של למידה ללא פיקוח

ניתן להבין את העבודה של למידה ללא פיקוח על ידי התרשים שלהלן:

למידת מכונה מפוקחת

כאן לקחנו נתוני קלט ללא תווית, מה שאומר שהוא לא מסווג וגם פלטים תואמים לא ניתנים. כעת, נתוני קלט ללא תווית אלה מוזנים למודל למידת מכונה על מנת לאמן אותם. ראשית, הוא יפרש את הנתונים הגולמיים כדי למצוא את הדפוסים הנסתרים מהנתונים ולאחר מכן יחיל אלגוריתמים מתאימים כגון clustering k-means, עץ החלטות וכו'.

פרוס מערך java

ברגע שהוא מיישם את האלגוריתם המתאים, האלגוריתם מחלק את אובייקטי הנתונים לקבוצות לפי קווי הדמיון וההבדלים בין האובייקטים.

סוגי אלגוריתם למידה ללא פיקוח:

ניתן לסווג עוד יותר את אלגוריתם הלמידה הבלתי מפוקחת לשני סוגים של בעיות:

למידת מכונה מפוקחת
    מקבץ: Clustering היא שיטה של ​​קיבוץ האובייקטים לאשכולות כך שאובייקטים בעלי מרבית הדמיון נשארים בקבוצה ויש להם פחות או ללא דמיון עם אובייקטים של קבוצה אחרת. ניתוח אשכולות מוצא את המשותף בין אובייקטי הנתונים ומסווג אותם לפי נוכחותם והעדרם של אותם משותפים.אִרגוּן: כלל שיוך הוא שיטת למידה ללא פיקוח המשמשת למציאת הקשרים בין משתנים במסד הנתונים הגדול. הוא קובע את קבוצת הפריטים שמתרחשת יחד במערך הנתונים. כלל האסוציאציה הופך את האסטרטגיה השיווקית ליעילה יותר. כמו אנשים שקונים פריט X (נניח לחם) נוטים גם לרכוש פריט Y (חמאה/ריבה). דוגמה טיפוסית לכלל ההתאגדות היא ניתוח סל השוק.

הערה: נלמד את האלגוריתמים הללו בפרקים מאוחרים יותר.

אלגוריתמי למידה ללא פיקוח:

להלן רשימה של כמה אלגוריתמים פופולריים של למידה ללא פיקוח:

    K-פירושו התקבצות KNN (השכנים הקרובים ביותר) מקבץ היררכי זיהוי אנומליות רשתות עצביות ניתוח רכיבים עקרוניים ניתוח רכיבים עצמאיים אלגוריתם אפריורי פירוק ערך יחיד

היתרונות של למידה ללא פיקוח

  • למידה ללא פיקוח משמשת למשימות מורכבות יותר בהשוואה ללמידה בפיקוח מכיוון שבלמידה ללא פיקוח, אין לנו נתוני קלט מתויגים.
  • למידה ללא פיקוח עדיפה מכיוון שקל להשיג נתונים ללא תווית בהשוואה לנתונים מסומנים.

חסרונות של למידה ללא פיקוח

  • למידה לא מפוקחת היא מטבעה קשה יותר מלמידה מפוקחת מכיוון שאין לה תפוקה מתאימה.
  • התוצאה של אלגוריתם הלמידה ללא פיקוח עשויה להיות פחות מדויקת מכיוון שנתוני קלט אינם מסומנים, ואלגוריתמים אינם יודעים את הפלט המדויק מראש.