אלגוריתמי רגרסיה וסיווג הם אלגוריתמים של למידה מפוקחת. שני האלגוריתמים משמשים לחיזוי בלמידת מכונה ועובדים עם מערכי הנתונים המסומנים. אבל ההבדל בין שניהם הוא איך הם משמשים לבעיות למידת מכונה שונות.
ההבדל העיקרי בין אלגוריתמי רגרסיה לסיווג שאלגוריתמי רגרסיה רגילים אליהם לחזות את הרציף ערכים כגון מחיר, משכורת, גיל וכו' ואלגוריתמי סיווג משמשים לחזות/לסווג את הערכים הבדידים כגון זכר או נקבה, נכון או לא נכון, ספאם או לא ספאם וכו'.
שקול את התרשים שלהלן:
מִיוּן:
סיווג הוא תהליך של מציאת פונקציה המסייעת בחלוקת מערך הנתונים למחלקות על סמך פרמטרים שונים. בסיווג, תוכנית מחשב מאומנת על מערך ההדרכה ועל סמך ההכשרה היא מסווגת את הנתונים לכיתות שונות.
המשימה של אלגוריתם הסיווג היא למצוא את פונקציית המיפוי למיפוי הקלט (x) לפלט (y) הבדיד.
דוגמא: הדוגמה הטובה ביותר להבנת בעיית הסיווג היא איתור דואר זבל. המודל מאומן על בסיס מיליוני מיילים בפרמטרים שונים, ובכל פעם שהוא מקבל מייל חדש הוא מזהה אם המייל הוא ספאם או לא. אם האימייל הוא ספאם, הוא מועבר לתיקיית הספאם.
סוגי אלגוריתמי סיווג ML:
ניתן לחלק את אלגוריתמי הסיווג לסוגים הבאים:
- רגרסיה לוגיסטית
- K-השכנים הקרובים ביותר
- תמיכה במכונות וקטור
- ליבה SVM
- נאווה בייס
- סיווג עץ ההחלטה
- סיווג יער אקראי
נְסִיגָה:
רגרסיה היא תהליך של מציאת המתאמים בין משתנים תלויים ובלתי תלויים. זה עוזר בניבוי המשתנים המתמשכים כמו חיזוי של טרנדים בשוק , חיזוי מחירי בתים וכו'.
המשימה של אלגוריתם הרגרסיה היא למצוא את פונקציית המיפוי למיפוי משתנה הקלט (x) למשתנה הפלט הרציף (y).
דוגמא: נניח שאנו רוצים לבצע חיזוי מזג אוויר, אז לשם כך, נשתמש באלגוריתם הרגרסיה. בחיזוי מזג האוויר, המודל מאומן על נתוני העבר, ולאחר השלמת האימון, הוא יכול לחזות בקלות את מזג האוויר לימים הבאים.
סוגי אלגוריתם רגרסיה:
- רגרסיה ליניארית פשוטה
- רגרסיה לינארית מרובה
- רגרסיה פולינומית
- תמיכה ברגרסיה וקטורית
- רגרסיית עץ ההחלטה
- רגרסיה אקראית של יער
ההבדל בין רגרסיה לסיווג
אלגוריתם רגרסיה | אלגוריתם סיווג |
---|---|
ברגרסיה, משתנה הפלט חייב להיות בעל אופי רציף או ערך אמיתי. | בסיווג, משתנה הפלט חייב להיות ערך בדיד. |
המשימה של אלגוריתם הרגרסיה היא למפות את ערך הקלט (x) עם משתנה הפלט הרציף (y). | המשימה של אלגוריתם הסיווג היא למפות את ערך הקלט (x) עם משתנה הפלט הבדיד (y). |
אלגוריתמי רגרסיה משמשים עם נתונים רציפים. | אלגוריתמי סיווג משמשים עם נתונים בדידים. |
ברגרסיה, אנו מנסים למצוא את קו ההתאמה הטוב ביותר, שיכול לחזות את הפלט בצורה מדויקת יותר. | בסיווג, אנו מנסים למצוא את גבול ההחלטה, שיכול לחלק את מערך הנתונים למחלקות שונות. |
ניתן להשתמש באלגוריתמי רגרסיה כדי לפתור את בעיות הרגרסיה כמו חיזוי מזג אוויר, חיזוי מחירי דירות וכו'. | ניתן להשתמש באלגוריתמי סיווג כדי לפתור בעיות סיווג כגון זיהוי הודעות דואר זבל, זיהוי דיבור, זיהוי תאים סרטניים וכו'. |
ניתן לחלק את אלגוריתם הרגרסיה עוד יותר לרגרסיה לינארית ולא לינארית. | ניתן לחלק את אלגוריתמי הסיווג למסווג בינארי ומסווג רב-מעמדי. |