logo

מודלים של למידת מכונה

מודל למידת מכונה מוגדר כייצוג מתמטי של התפוקה של תהליך האימון. למידת מכונה היא חקר אלגוריתמים שונים שיכולים להשתפר באופן אוטומטי באמצעות ניסיון ונתונים ישנים ולבנות את המודל. מודל למידת מכונה דומה לתוכנת מחשב המיועדת לזהות דפוסים או התנהגויות על סמך ניסיון או נתונים קודמים. אלגוריתם הלמידה מגלה דפוסים בתוך נתוני האימון, והוא מוציא מודל ML אשר לוכד דפוסים אלו ומבצע תחזיות על נתונים חדשים.

מודלים של למידת מכונה

בואו נבין דוגמה למודל ML שבו אנו יוצרים אפליקציה לזיהוי רגשות המשתמש על סמך הבעות פנים. לכן, יצירת אפליקציה כזו אפשרית על ידי מודלים של למידת מכונה שבה נאמן מודל על ידי הזנת תמונות של פרצופים עם רגשות שונים המסומנים עליהם. בכל פעם שהאפליקציה הזו משמשת כדי לקבוע את מצב הרוח של המשתמש, היא קוראת את כל הנתונים המוזנים ואז קובעת את מצב הרוח של כל משתמש.

לפיכך, במילים פשוטות, אנו יכולים לומר כי א מודל למידת מכונה הוא ייצוג פשוט של משהו או תהליך. בנושא זה, נדון במודלים שונים של למידת מכונה, הטכניקות והאלגוריתמים שלהם .

מהו מודל למידת מכונה?

ניתן להבין מודלים של Machine Learning כתוכנית שהוכשרה למצוא דפוסים בתוך נתונים חדשים ולבצע תחזיות. מודלים אלה מיוצגים כפונקציה מתמטית המקבלת בקשות בצורה של נתוני קלט, מבצעת תחזיות על נתוני קלט, ולאחר מכן מספקת פלט בתגובה. ראשית, מודלים אלה מאומנים על קבוצת נתונים, ולאחר מכן הם מקבלים אלגוריתם לנמק על נתונים, לחלץ את הדפוס מנתוני הזנה וללמוד מהנתונים הללו. ברגע שהמודלים האלה מתאמנים, ניתן להשתמש בהם כדי לחזות את מערך הנתונים הבלתי נראה.

ישנם סוגים שונים של מודלים של למידת מכונה זמינים בהתבסס על יעדים עסקיים ומערכות נתונים שונים.

סיווג מודלים של למידת מכונה:

בהתבסס על יעדים עסקיים ומערכות נתונים שונים, ישנם שלושה מודלים ללמידה לאלגוריתם. כל אלגוריתם למידת מכונה מתמקם באחד משלושת הדגמים:

  • למידה מפוקחת
  • למידה ללא פיקוח
  • לימוד עם חיזוקים
מודלים של למידת מכונה

למידה מפוקחת מחולקת לשתי קטגוריות:

  • מִיוּן
  • נְסִיגָה

למידה ללא פיקוח מחולקת גם לקטגוריות הבאות:

  • מקבץ
  • כלל ההתאחדות
  • צמצום מימדיות

1. מודלים של למידת מכונה בפיקוח

למידה מפוקחת היא מודל למידת המכונה הפשוטה ביותר להבנה שבה נתוני קלט נקראים נתוני אימון ויש להם תווית או תוצאה ידועה כפלט. אז זה עובד על העיקרון של זוגות קלט-פלט. זה דורש יצירת פונקציה שניתן לאמן באמצעות ערכת נתוני אימון, ולאחר מכן היא מיושמת על נתונים לא ידועים ועושה ביצועים חזויים. למידה מפוקחת מבוססת על משימות ונבדקת על קבוצות נתונים מסומנות.

אנו יכולים ליישם מודל למידה מפוקח על בעיות פשוטות מהחיים האמיתיים. לדוגמה, יש לנו מערך נתונים המורכב מגיל וגובה; לאחר מכן, נוכל לבנות מודל למידה בפיקוח כדי לחזות את גובהו של האדם על סמך גילו.

מודלים של למידה מפוקחת מסווגים לשתי קטגוריות:

נְסִיגָה

בבעיות רגרסיה, הפלט הוא משתנה רציף. כמה מודלים נפוצים של רגרסיה הם כדלקמן:

א) רגרסיה לינארית

רגרסיה לינארית היא מודל למידת המכונה הפשוטה ביותר בו אנו מנסים לחזות משתנה פלט אחד באמצעות משתנה קלט אחד או יותר. הייצוג של רגרסיה לינארית הוא משוואה ליניארית, המשלבת קבוצה של ערכי קלט (x) ופלט חזוי (y) עבור קבוצת ערכי הקלט הללו. הוא מיוצג בצורה של קו:

Y = bx + c.

מודלים של למידת מכונה

המטרה העיקרית של מודל הרגרסיה הליניארית היא למצוא את קו ההתאמה הטוב ביותר המתאים ביותר לנקודות הנתונים.

רגרסיה לינארית מורחבת לרגרסיה לינארית מרובה (מצא מישור בהתאמה הטובה ביותר) ורגרסיה פולינומית (מצא את עקומת ההתאמה הטובה ביותר).

ב) עץ החלטות

r בשפת c

עצי החלטה הם המודלים הפופולריים של למידת מכונה שיכולים לשמש הן לבעיות רגרסיה והן לבעיות סיווג.

עץ החלטות משתמש במבנה דמוי עץ של החלטות יחד עם ההשלכות והתוצאות האפשריות שלהן. בכך, כל צומת פנימי משמש לייצוג מבחן על תכונה; כל ענף משמש לייצוג תוצאת הבדיקה. ככל שיש לעץ החלטות יותר צמתים, כך התוצאה תהיה מדויקת יותר.

היתרון של עצי החלטה הוא שהם אינטואיטיביים וקלים ליישום, אך הם חסרי דיוק.

עצי החלטה נמצאים בשימוש נרחב ב חקר תפעול, במיוחד בניתוח החלטות, תכנון אסטרטגי , ובעיקר בלמידת מכונה.

ג) יער אקראי

יער אקראי היא שיטת הלמידה האנסמבלית, המורכבת ממספר רב של עצי החלטה. כל עץ החלטה ביער אקראי מנבא תוצאה, והתחזית עם רוב הקולות נחשבת כתוצאה.

מודל יער אקראי יכול לשמש הן לבעיות רגרסיה והן לבעיות סיווג.

עבור משימת הסיווג, התוצאה של היער האקראי נלקחת מרוב הקולות. בעוד שבמטלת הרגרסיה, התוצאה נלקחת מהממוצע או הממוצע של התחזיות שנוצרו על ידי כל עץ.

ד) רשתות עצביות

רשתות עצביות הן תת-הקבוצה של למידת מכונה והן ידועות גם כרשתות עצביות מלאכותיות. רשתות עצביות מורכבות מתאי עצב מלאכותיים ומעוצבות באופן שדומה למבנה המוח האנושי ולעבודתו. כל נוירון מלאכותי מתחבר עם נוירונים רבים אחרים ברשת עצבית, ומיליוני נוירונים מחוברים כאלה יוצרים מבנה קוגניטיבי מתוחכם.

מודלים של למידת מכונה

רשתות עצביות מורכבות ממבנה רב שכבתי, המכיל שכבת קלט אחת, שכבה נסתרת אחת או יותר ושכבת פלט אחת. מכיוון שכל נוירון מחובר לנוירון אחר, הוא מעביר נתונים משכבה אחת לנוירון השני של השכבות הבאות. לבסוף, הנתונים מגיעים לשכבה או לשכבת הפלט האחרונה של הרשת העצבית ומייצרים פלט.

רשתות עצביות תלויות בנתוני אימון כדי ללמוד ולשפר את הדיוק שלהם. עם זאת, רשת עצבית מאומנת ומדויקת יכולה לאסוף נתונים במהירות ולהפוך לכלי למידת מכונה ובינה מלאכותית רבת עוצמה. אחת הרשתות העצביות הידועות ביותר היא אלגוריתם החיפוש של גוגל.

מִיוּן

מודלים לסיווג הם הסוג השני של טכניקות למידה מפוקחת, המשמשות להפקת מסקנות מערכים נצפים בצורה הקטגורית. לדוגמה, מודל הסיווג יכול לזהות אם האימייל הוא דואר זבל או לא; קונה ירכוש את המוצר או לא, וכו'. אלגוריתמי סיווג משמשים לניבוי שתי מחלקות ולסווג את הפלט לקבוצות שונות.

בסיווג, מתוכנן מודל מסווג שמסווג את מערך הנתונים לקטגוריות שונות, ולכל קטגוריה מוקצית תווית.

ישנם שני סוגים של סיווגים בלמידת מכונה:

    סיווג בינארי: אם לבעיה יש רק שתי מחלקות אפשריות, הנקראות מסווג בינארי. לדוגמה, חתול או כלב, כן או לא,סיווג רב כיתתי: אם לבעיה יש יותר משתי מחלקות אפשריות, מדובר במסווג מרובה מחלקות.

כמה אלגוריתמי סיווג פופולריים הם כדלקמן:

א) רגרסיה לוגיסטית

רגרסיה לוגיסטית משמשת לפתרון בעיות הסיווג בלמידת מכונה. הם דומים לרגרסיה ליניארית אך משמשים לניבוי המשתנים הקטגוריים. הוא יכול לחזות את הפלט ב-כן או לא, 0 או 1, נכון או לא נכון וכו'. עם זאת, במקום לתת את הערכים המדויקים, הוא מספק את הערכים ההסתברותיים בין 0 ל-1.

ב) תמיכה במכונת וקטור

תמיכה במכונה וקטורית או SVM הוא אלגוריתם למידת מכונה הפופולרי, שנמצא בשימוש נרחב למשימות סיווג ורגרסיה. עם זאת, באופן ספציפי, הוא משמש לפתרון בעיות סיווג. המטרה העיקרית של SVM היא למצוא את גבולות ההחלטה הטובים ביותר במרחב N-ממדי, שיכול להפריד נקודות נתונים למחלקות, וגבול ההחלטה הטוב ביותר ידוע בשם Hyperplane. SVM בוחר את הווקטור הקיצוני כדי למצוא את מישור ההיפר, והווקטורים הללו ידועים בתור וקטורי תמיכה.

מודלים של למידת מכונה

ג) בייס נאיבי

Naive Bayes הוא אלגוריתם סיווג פופולרי נוסף המשמש למידת מכונה. זה נקרא כך מכיוון שהוא מבוסס על משפט בייס ועוקב אחר ההנחה הנאיבית (הבלתי תלויה) בין התכונות הניתנת כ:

מודלים של למידת מכונה

כל מסווג Bayes נאיבי מניח שהערך של משתנה ספציפי אינו תלוי בכל משתנה/תכונה אחרת. לדוגמה, אם יש לסווג פרי לפי צבע, צורה וטעם. אז צהוב, סגלגל ומתוק יוכר כמנגו. כאן כל תכונה אינה תלויה בתכונות אחרות.

2. מודלים של למידת מכונה ללא פיקוח

מודלים של למידת מכונה ללא פיקוח מיישמים את תהליך הלמידה המנוגד ללמידה מפוקחת, כלומר היא מאפשרת למודל ללמוד ממערך ההדרכה ללא תווית. בהתבסס על מערך הנתונים ללא תווית, המודל חוזה את הפלט. באמצעות למידה ללא פיקוח, המודל לומד תבניות נסתרות ממערך הנתונים בעצמו ללא כל פיקוח.

מודלים של למידה ללא פיקוח משמשים בעיקר לביצוע שלוש משימות, שהן כדלקמן:

    מקבץ
    Clustering היא טכניקת למידה ללא פיקוח הכוללת קיבוץ או גישוש של נקודות הנתונים לאשכולות שונים בהתבסס על קווי דמיון והבדלים. העצמים בעלי הדמיון הרב ביותר נשארים באותה קבוצה, ואין להם או מעט מאוד קווי דמיון מקבוצות אחרות.
    ניתן להשתמש באלגוריתמי אשכולות באופן נרחב במשימות שונות כגון פילוח תמונה, ניתוח נתונים סטטיסטי, פילוח שוק , וכו.
    כמה אלגוריתמים נפוצים של Clustering הם K-משמעו Clustering, Clustering היררכי, DBSCAN , וכו.
    מודלים של למידת מכונה לימוד כללים של האגודה
    למידת כללים של אסוציאציות היא טכניקת למידה ללא פיקוח, המוצאת קשרים מעניינים בין משתנים בתוך מערך נתונים גדול. המטרה העיקרית של אלגוריתם למידה זה היא למצוא את התלות של פריט נתונים אחד בפריט נתונים אחר ולמפות אותם משתנים בהתאם כך שיוכל לייצר רווח מקסימלי. אלגוריתם זה מיושם בעיקר ב ניתוח סל שוק, כריית שימוש באינטרנט, ייצור רציף , וכו.
    כמה אלגוריתמים פופולריים של לימוד כללי אסוציאציה הם אלגוריתם Apriori, Eclat, אלגוריתם FP-growth. צמצום מימדיות
    מספר התכונות/המשתנים הקיימים במערך נתונים ידוע בתור הממדיות של מערך הנתונים, והטכניקה המשמשת להפחתת הממדיות ידועה בשם טכניקת הפחתת הממדיות.
    למרות שיותר נתונים מספקים תוצאות מדויקות יותר, זה יכול גם להשפיע על הביצועים של המודל/אלגוריתם, כגון בעיות התאמת יתר. במקרים כאלה, נעשה שימוש בטכניקות הפחתת מימד.
    ' זהו תהליך של המרת מערך הנתונים של מימדים גבוהים יותר למערך נתונים של מימדים קטנים יותר, המבטיח שהוא מספק מידע דומה .'
    שיטות שונות להפחתת מימדים כגון כמו PCA (ניתוח רכיבים עיקריים), פירוק ערך יחיד וכו'.

לימוד עם חיזוקים

בלימוד חיזוק, האלגוריתם לומד פעולות עבור קבוצה נתונה של מצבים המובילות למצב מטרה. זהו מודל למידה מבוסס משוב שלוקח אותות משוב לאחר כל מצב או פעולה על ידי אינטראקציה עם הסביבה. משוב זה פועל כפרס (חיובי עבור כל פעולה טובה ושלילי עבור כל פעולה גרועה), ומטרתו של הסוכן היא למקסם את התגמולים החיוביים כדי לשפר את ביצועיו.

התנהגות המודל בלימוד חיזוק דומה ללמידה אנושית, שכן בני אדם לומדים דברים על ידי התנסויות כמשוב ואינטראקציה עם הסביבה.

להלן כמה אלגוריתמים פופולריים שמגיעים ללימוד חיזוק:

    Q-learning:Q-learning הוא אחד האלגוריתמים הפופולריים ללא מודלים של למידת חיזוק, המבוסס על משוואת בלמן.

המטרה היא ללמוד את המדיניות שיכולה לעזור לסוכן הבינה המלאכותית לנקוט בפעולה הטובה ביותר כדי למקסם את התגמול בנסיבות ספציפיות. הוא משלב ערכי Q עבור כל זוג מצב-פעולה המציינים את התגמול לביצוע נתיב מצב נתון, והוא מנסה למקסם את ערך ה-Q.

    State-Action-Reward-State-Action (SARSA):SARSA הוא אלגוריתם על מדיניות המבוסס על תהליך ההחלטה של ​​מרקוב. הוא משתמש בפעולה המתבצעת על ידי המדיניות הנוכחית כדי ללמוד את ערך ה-Q. אלגוריתם SARSA עומד עבור State Action Reward State Action, המסמל את ה-tuple (s, a, r, s', a'). Deep Q Network:DQN או Deep Q Neural Network היא Q-learning בתוך הרשת העצבית. הוא משמש בעצם בסביבת חלל מדינה גדולה שבה הגדרת Q-table תהיה משימה מורכבת. אז, במקרה כזה, במקום להשתמש Q-table, הרשת העצבית משתמשת בערכי Q עבור כל פעולה על סמך המצב.

אימון מודלים של למידת מכונה

לאחר בניית מודל למידת המכונה, הוא עובר הכשרה על מנת להשיג את התוצאות המתאימות. כדי להכשיר מודל למידת מכונה, צריך כמות עצומה של נתונים מעובדים מראש. כאן נתונים מעובדים מראש פירושם נתונים בצורה מובנית עם ערכי null מופחתים וכו'. אם לא נספק נתונים מעובדים מראש, אז יש סיכוי עצום שהמודל שלנו עשוי לבצע ביצועים נוראיים.

איך בוחרים את הדגם הטוב ביותר?

בסעיף לעיל, דנו במודלים ואלגוריתמים שונים של למידת מכונה. אבל שאלה אחת הכי מבלבלת שעלולה לעלות לכל מתחיל ש'באיזה דגם כדאי לי לבחור?'. אז התשובה היא שזה תלוי בעיקר בדרישה העסקית או בדרישת הפרויקט. מלבד זאת, זה תלוי גם בתכונות המשויכות, נפח מערך הנתונים הזמין, מספר התכונות, מורכבות וכו'. עם זאת, בפועל, מומלץ תמיד להתחיל עם המודל הפשוט ביותר שניתן ליישם על הפרט המסוים. בעיה ולאחר מכן לשפר את המורכבות בהדרגה ולבדוק את הדיוק בעזרת כוונון פרמטרים ואימות צולב.

ההבדל בין מודל למידת מכונה ואלגוריתמים

אחת השאלות המבלבלות ביותר בקרב מתחילים היא האם הם מודלים של למידת מכונה, והאלגוריתמים זהים? מכיוון שבמקרים שונים בלמידת מכונה ובמדעי הנתונים, שני המונחים הללו משמשים לסירוגין.

התשובה לשאלה זו היא לא, ומודל למידת המכונה אינו זהה לאלגוריתם. בצורה פשוטה, א אלגוריתם ML הוא כמו הליך או שיטה הפועלים על נתונים כדי לגלות דפוסים מהם ולייצר את המודל. במקביל, א מודל למידת מכונה הוא כמו תוכנת מחשב שמפיקה פלט או עושה תחזיות . ליתר דיוק, כאשר אנו מאמנים אלגוריתם עם נתונים, הוא הופך למודל.

 Machine Learning Model = Model Data + Prediction Algorithm