למידת מכונה היא תת-קבוצה של AI, המאפשרת למכונה ללמוד באופן אוטומטי מנתונים, לשפר ביצועים מחוויות קודמות ולבצע תחזיות . למידת מכונה מכילה קבוצה של אלגוריתמים שעובדים על כמות עצומה של נתונים. נתונים מוזנים לאלגוריתמים אלה כדי לאמן אותם, ועל בסיס האימון הם בונים את המודל ומבצעים משימה ספציפית.
אלגוריתמי ML אלו עוזרים לפתור בעיות עסקיות שונות כמו רגרסיה, סיווג, חיזוי, אשכולות, אסוציאציות וכו'.
בהתבסס על השיטות ודרך הלמידה, למידת מכונה מחולקת לארבעה סוגים בעיקר, שהם:
- למידת מכונה מפוקחת
- למידת מכונה ללא פיקוח
- למידת מכונה בפיקוח למחצה
- לימוד עם חיזוקים
בנושא זה, נספק תיאור מפורט של סוגי למידת מכונה יחד עם האלגוריתמים המתאימים להם:
1. למידת מכונה מפוקחת
כפי שהשם שלו מרמז, למידת מכונה מפוקחת מבוסס על פיקוח. זה אומר שבטכניקת הלמידה המפוקחת, אנו מאמנים את המכונות באמצעות מערך הנתונים ה'מתויג', ובהתבסס על ההדרכה, המכונה חוזה את הפלט. כאן, הנתונים המסומנים מציינים שחלק מהקלטים כבר ממופים לפלט. יותר יקר, אנחנו יכולים לומר; ראשית, אנו מאמנים את המכונה עם הקלט והפלט המתאים, ולאחר מכן אנו מבקשים מהמכונה לחזות את הפלט באמצעות מערך הנתונים של הבדיקה.
בואו נבין למידה מפוקחת עם דוגמה. נניח שיש לנו מערך נתונים של חתולים וכלבים. אז, ראשית, נספק את ההדרכה למכונה כדי להבין את התמונות, כגון צורה וגודל הזנב של חתול וכלב, צורת עיניים, צבע, גובה (כלבים גבוהים יותר, חתולים קטנים יותר) וכו'. לאחר השלמת האימון, אנו מזינים את תמונת החתול ומבקשים מהמכונה לזהות את האובייקט ולחזות את הפלט. כעת, המכונה מאומנת היטב, ולכן היא תבדוק את כל התכונות של האובייקט, כגון גובה, צורה, צבע, עיניים, אוזניים, זנב וכו', ותגלה שמדובר בחתול. אז זה יכניס אותו לקטגוריית החתול. זהו התהליך של האופן שבו המכונה מזהה את האובייקטים בלמידה מפוקחת.
המטרה העיקרית של טכניקת הלמידה המפוקחת היא למפות את משתנה הקלט (x) עם משתנה הפלט (y). כמה יישומים בעולם האמיתי של למידה בפיקוח הם הערכת סיכונים, זיהוי הונאה, סינון דואר זבל, וכו '
קטגוריות של למידת מכונה מפוקחת
ניתן לסווג למידת מכונה מפוקחת לשני סוגים של בעיות, המפורטות להלן:
א) סיווג
אלגוריתמי סיווג משמשים לפתרון בעיות הסיווג שבהן משתנה הפלט הוא קטגורי, כגון ' כן או לא, זכר או נקבה, אדום או כחול וכו' . אלגוריתמי הסיווג מנבאים את הקטגוריות הקיימות במערך הנתונים. כמה דוגמאות מהעולם האמיתי של אלגוריתמי סיווג הן איתור דואר זבל, סינון דואר אלקטרוני וכו'.
בינארי ל-bcd
כמה אלגוריתמי סיווג פופולריים מובאים להלן:
ב) רגרסיה
אלגוריתמי רגרסיה משמשים לפתרון בעיות רגרסיה שבהן יש קשר ליניארי בין משתני קלט ופלט. אלה משמשים לניבוי משתני תפוקה מתמשכים, כגון מגמות שוק, חיזוי מזג אוויר וכו'.
כמה אלגוריתמי רגרסיה פופולריים מובאים להלן:
יתרונות וחסרונות של למידה מפוקחת
יתרונות:
- מאז למידה בפיקוח, עבדו עם מערך הנתונים המסומן כך שנוכל לקבל מושג מדויק לגבי מחלקות האובייקטים.
- אלגוריתמים אלה מועילים בחיזוי הפלט על בסיס ניסיון קודם.
חסרונות:
- אלגוריתמים אלו אינם מסוגלים לפתור משימות מורכבות.
- זה עשוי לחזות את הפלט השגוי אם נתוני הבדיקה שונים מנתוני האימון.
- זה דורש הרבה זמן חישוב כדי לאמן את האלגוריתם.
יישומים של למידה מפוקחת
להלן כמה יישומים נפוצים של למידה מפוקחת:
ליבת תקלת פילוח הושלכה
בפילוח תמונות משתמשים באלגוריתמים של למידה מפוקחת. בתהליך זה מבוצע סיווג תמונה על נתוני תמונה שונים עם תוויות מוגדרות מראש.
אלגוריתמים מפוקחים משמשים גם בתחום הרפואי למטרות אבחון. זה נעשה על ידי שימוש בתמונות רפואיות ובנתונים שסומנו בעבר עם תוויות למצבי מחלה. עם תהליך כזה, המכונה יכולה לזהות מחלה עבור החולים החדשים.
2. למידת מכונה ללא פיקוח
למידה ללא פיקוח g שונה מטכניקת הלמידה בפיקוח; כפי שמעיד שמו, אין צורך בפיקוח. פירוש הדבר, בלמידת מכונה ללא פיקוח, המכונה מאומנת באמצעות מערך הנתונים ללא תווית, והמכונה חוזה את הפלט ללא כל פיקוח.
בלמידה לא מפוקחת, המודלים מאומנים עם הנתונים שאינם מסווגים ואינם מסווגים, והמודל פועל על פי הנתונים הללו ללא כל פיקוח.
המטרה העיקרית של אלגוריתם הלמידה הבלתי מפוקחת היא לקבץ או לקטגור את מערך הנתונים הלא ממוינים לפי קווי הדמיון, הדפוסים וההבדלים. מכונות מקבלים הוראה למצוא את הדפוסים הנסתרים ממערך הנתונים של הקלט.
בואו ניקח דוגמה כדי להבין אותה ביתר שאת; נניח שיש סל של תמונות פירות, ואנחנו מכניסים אותה למודל למידת מכונה. התמונות אינן ידועות לחלוטין לדגם, ומשימתה של המכונה היא למצוא את הדפוסים והקטגוריות של האובייקטים.
אז, כעת המכונה תגלה את הדפוסים וההבדלים שלה, כגון הבדל צבע, הבדל צורה, ותחזה את הפלט כאשר היא תיבדק עם מערך הבדיקה.
קטגוריות של למידת מכונה ללא פיקוח
ניתן לסווג למידה ללא פיקוח לשני סוגים, המובאים להלן:
1) אשכולות
טכניקת האשכולות משמשת כאשר אנו רוצים למצוא את הקבוצות המובנות מהנתונים. זוהי דרך לקבץ את האובייקטים לאשכול כך שהאובייקטים בעלי הדמיון הרב ביותר יישארו בקבוצה אחת ויש להם פחות או ללא דמיון עם האובייקטים של קבוצות אחרות. דוגמה לאלגוריתם האשכולות היא קיבוץ הלקוחות לפי התנהגות הרכישה שלהם.
כמה מאלגוריתמי האשכולות הפופולריים מובאים להלן:
2) עמותה
למידת כללים של אסוציאציות היא טכניקת למידה ללא פיקוח, המוצאת קשרים מעניינים בין משתנים בתוך מערך נתונים גדול. המטרה העיקרית של אלגוריתם למידה זה היא למצוא את התלות של פריט נתונים אחד בפריט נתונים אחר ולמפות אותם משתנים בהתאם כך שיוכל לייצר רווח מקסימלי. אלגוריתם זה מיושם בעיקר ב ניתוח סל שוק, כריית שימוש באינטרנט, ייצור רציף , וכו.
כמה אלגוריתמים פופולריים של לימוד כללי אסוציאציה הם אלגוריתם Apriori, Eclat, אלגוריתם FP-growth.
יתרונות וחסרונות של אלגוריתם למידה ללא פיקוח
יתרונות:
- ניתן להשתמש באלגוריתמים אלה למשימות מסובכות בהשוואה למשימות המפוקחות מכיוון שהאלגוריתמים הללו עובדים על מערך הנתונים ללא תווית.
- אלגוריתמים לא מפוקחים עדיפים למשימות שונות, מכיוון שקל יותר להשיג את מערך הנתונים ללא תווית בהשוואה למערך הנתונים המסומן.
חסרונות:
- הפלט של אלגוריתם לא מפוקח יכול להיות פחות מדויק מכיוון שמערך הנתונים אינו מסומן, ואלגוריתמים אינם מאומנים עם הפלט המדויק בקודם.
- עבודה עם למידה ללא פיקוח קשה יותר מכיוון שהיא עובדת עם מערך הנתונים ללא תווית שאינו ממפה עם הפלט.
יישומים של למידה ללא פיקוח
3. למידה בפיקוח למחצה
למידה מפוקחת למחצה היא סוג של אלגוריתם למידת מכונה שנמצא בין למידת מכונה מפוקחת ובלתי מפוקחת . הוא מייצג את נקודת הביניים בין אלגוריתמים מפוקחים (עם נתוני אימון מסומנים) ולמידה ללא פיקוח (ללא נתוני הדרכה מסומנים) ומשתמש בשילוב של מערכי נתונים מסומנים ובלתי מסומנים במהלך תקופת ההכשרה.
א למרות שלמידה מפוקחת למחצה היא דרך הביניים בין למידה מפוקחת ללא פיקוח ופועלת על הנתונים המורכבים מכמה תוויות, היא מורכבת לרוב מנתונים לא מסומנים. מכיוון שתוויות הן יקרות, אך למטרות ארגוניות, עשויות להיות להן מעט תוויות. זה שונה לחלוטין מלמידה מפוקחת ולא מפוקחת שכן הם מבוססים על נוכחות והיעדר תוויות.
כדי להתגבר על החסרונות של למידה מפוקחת ואלגוריתמי למידה ללא פיקוח, מוצג הרעיון של למידה מפוקחת למחצה . המטרה העיקרית של למידה מפוקחת למחצה היא להשתמש ביעילות בכל הנתונים הזמינים, ולא רק בנתונים מסומנים כמו בלמידה מפוקחת. בתחילה, נתונים דומים מקובצים יחד עם אלגוריתם למידה לא מפוקח, ובנוסף, זה עוזר לתייג את הנתונים הלא מסומנים לנתונים מסומנים. הסיבה לכך היא שנתונים מסומנים הם רכישה יקרה יותר יחסית לנתונים ללא תווית.
אנו יכולים לדמיין את האלגוריתמים האלה עם דוגמה. למידה מפוקחת היא המקום שבו סטודנט נמצא בפיקוח של מדריך בבית ובמכללה. יתר על כן, אם אותו תלמיד מנתח בעצמו את אותו מושג ללא כל עזרה מהמדריך, הוא מגיע ללמידה ללא פיקוח. במסגרת למידה בפיקוח למחצה, הסטודנט צריך לשנות את עצמו לאחר ניתוח אותו מושג בהנחיית מדריך במכללה.
יתרונות וחסרונות של למידה בפיקוח למחצה
יתרונות:
- קל ופשוט להבין את האלגוריתם.
- זה מאוד יעיל.
- הוא משמש לפתרון חסרונות של אלגוריתמי למידה מפוקחים ובלתי מפוקחים.
חסרונות:
- ייתכן שתוצאות האיטרציות לא יהיו יציבות.
- איננו יכולים ליישם אלגוריתמים אלה על נתונים ברמת הרשת.
- הדיוק נמוך.
4. למידת חיזוק
למידת חיזוק עובדת על תהליך המבוסס על משוב, שבו סוכן בינה מלאכותית (רכיב תוכנה) חוקר אוטומטית את סביבתו על ידי לחיצה ועקיבה, נקיטת פעולה, למידה מחוויות ושיפור הביצועים שלו. הסוכן מקבל פרס על כל פעולה טובה ונענש על כל פעולה גרועה; מכאן שהמטרה של סוכן למידת חיזוק היא למקסם את התגמולים.
בלמידה תגבורת, אין נתונים מתויגים כמו למידה מפוקחת, וסוכנים לומדים מהניסיון שלהם בלבד.
תהליך למידת החיזוק דומה לבן אדם; למשל, ילד לומד דברים שונים על ידי התנסויות בחיי היום יום שלו. דוגמה ללמידת חיזוק היא לשחק משחק, שבו המשחק הוא הסביבה, מהלכים של סוכן בכל שלב מגדירים מצבים, והמטרה של הסוכן היא לקבל ציון גבוה. הסוכן מקבל משוב במונחים של עונשים ותגמולים.
בשל אופן עבודתו, למידת תגבור מועסקת בתחומים שונים כגון תורת המשחקים, חקר המבצעים, תורת המידע, מערכות ריבוי סוכנים.
ניתן לעצב בעיית למידה חיזוק באמצעות תהליך ההחלטה של מרקוב (MDP). ב-MDP, הסוכן מקיים כל הזמן אינטראקציה עם הסביבה ומבצע פעולות; בכל פעולה, הסביבה מגיבה ויוצרת מצב חדש.
קטגוריות של למידת חיזוק
למידת חיזוק מסווגת בעיקר לשני סוגים של שיטות/אלגוריתמים:
מקרי שימוש בעולם האמיתי של למידת חיזוק
אלגוריתמי RL פופולריים מאוד ביישומי משחקים. הוא משמש כדי להשיג ביצועים על-אנושיים. כמה משחקים פופולריים המשתמשים באלגוריתמים של RL הם AlphaGO ו AlphaGO Zero .
המאמר 'ניהול משאבים עם למידת חיזוק עמוק' הראה כיצד להשתמש ב-RL במחשב כדי ללמוד באופן אוטומטי ולתזמן משאבים לחכות לעבודות שונות על מנת למזער את ההאטה הממוצעת בעבודה.
RL נמצא בשימוש נרחב ביישומי רובוטיקה. רובוטים משמשים בתחום התעשייה והייצור, ורובוטים אלה נעשים חזקים יותר עם למידת חיזוק. יש תעשיות שונות שיש להן את החזון שלהן לבנות רובוטים חכמים באמצעות טכנולוגיית AI ו- Machine learning.
כריית טקסט, אחד מהיישומים הגדולים של NLP, מיושמת כעת בעזרת Reinforcement Learning של חברת Salesforce.
יתרונות וחסרונות של למידת חיזוק
יתרונות
זוג java
- זה עוזר בפתרון בעיות מורכבות בעולם האמיתי שקשה לפתור בטכניקות כלליות.
- מודל הלמידה של RL דומה ללמידה של בני אדם; לפיכך ניתן למצוא את התוצאות המדויקות ביותר.
- מסייע בהשגת תוצאות לטווח ארוך.
חִסָרוֹן
- אלגוריתמי RL אינם מועדפים לבעיות פשוטות.
- אלגוריתמי RL דורשים נתונים וחישובים עצומים.
- יותר מדי למידת חיזוק עלולה להוביל לעומס יתר של מצבים שעלולים להחליש את התוצאות.
קללת הממדיות מגבילה למידת חיזוק עבור מערכות פיזיות אמיתיות.