רגרסיה לינארית ורגרסיה לוגיסטית הם שני האלגוריתמים המפורסמים של למידת מכונה הנמצאים תחת טכניקת למידה מפוקחת. מכיוון ששני האלגוריתמים הם בעלי אופי מפוקח, לכן אלגוריתמים אלה משתמשים במערך נתונים מסומן כדי לבצע את התחזיות. אבל ההבדל העיקרי ביניהם הוא אופן השימוש בהם. הרגרסיה הליניארית משמשת לפתרון בעיות רגרסיה ואילו רגרסיה לוגיסטית משמשת לפתרון בעיות הסיווג. התיאור של שני האלגוריתמים ניתן להלן יחד עם טבלת הבדלים.
רגרסיה לינארית:
- רגרסיה לינארית הוא אחד מאלגוריתמים הפשוטים ביותר של למידה חישובית שנמצאים תחת טכניקת למידה מפוקחת ומשמש לפתרון בעיות רגרסיה.
- הוא משמש לניבוי המשתנה התלוי הרציף בעזרת משתנים בלתי תלויים.
- המטרה של הרגרסיה הליניארית היא למצוא את קו ההתאמה הטוב ביותר שיכול לחזות במדויק את הפלט עבור המשתנה התלוי הרציף.
- אם נעשה שימוש במשתנה בלתי תלוי בודד לחיזוי אז הוא נקרא Simple Linear Regression ואם יש יותר משני משתנים בלתי תלויים אז רגרסיה כזו נקראת Multiple Linear Regression.
- על ידי מציאת קו ההתאמה הטוב ביותר, האלגוריתם קובע את הקשר בין המשתנה התלוי למשתנה הבלתי תלוי. והקשר צריך להיות בעל אופי ליניארי.
- הפלט עבור רגרסיה לינארית צריך להיות רק הערכים הרציפים כגון מחיר, גיל, משכורת וכו'. ניתן להציג את הקשר בין המשתנה התלוי למשתנה הבלתי תלוי בתמונה למטה:
בתמונה למעלה המשתנה התלוי נמצא על ציר Y (שכר) והמשתנה הבלתי תלוי נמצא על ציר x (ניסיון). ניתן לכתוב את קו הרגרסיה כך:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
היכן ש0וכן א1הם המקדמים ו-ε הוא מונח השגיאה.
רגרסיה לוגיסטית:
- רגרסיה לוגיסטית היא אחד מאלגוריתמים הפופולריים ביותר של למידת מכונה שמגיעים תחת טכניקות למידה מפוקחת.
- זה יכול לשמש עבור סיווג כמו גם עבור בעיות רגרסיה, אך משמש בעיקר עבור בעיות סיווג.
- רגרסיה לוגיסטית משמשת לניבוי המשתנה התלוי הקטגורי בעזרת משתנים בלתי תלויים.
- הפלט של בעיית רגרסיה לוגיסטית יכול להיות רק בין 0 ל-1.
- ניתן להשתמש ברגרסיה לוגיסטית כאשר ההסתברויות בין שני מחלקות נדרשות. כמו אם יירד גשם היום או לא, או 0 או 1, נכון או לא נכון וכו'.
- רגרסיה לוגיסטית מבוססת על הרעיון של הערכת סבירות מקסימלית. לפי הערכה זו, הנתונים הנצפים צריכים להיות סבירים ביותר.
- ברגרסיה לוגיסטית, אנו מעבירים את הסכום המשוקלל של התשומות דרך פונקציית הפעלה שיכולה למפות ערכים בין 0 ל-1. פונקציית הפעלה כזו ידועה בשם פונקציה סיגמואידית והעקומה המתקבלת נקראת כ- sigmoid curve או S-curve. שקול את התמונה הבאה:
- המשוואה לרגרסיה לוגיסטית היא:
ההבדל בין רגרסיה לינארית ורגרסיה לוגיסטית:
רגרסיה לינארית | רגרסיה לוגיסטית |
---|---|
רגרסיה לינארית משמשת לניבוי המשתנה התלוי הרציף באמצעות קבוצה נתונה של משתנים בלתי תלויים. | רגרסיה לוגיסטית משמשת לניבוי המשתנה התלוי הקטגורי באמצעות קבוצה נתונה של משתנים בלתי תלויים. |
רגרסיה לינארית משמשת לפתרון בעיית רגרסיה. | רגרסיה לוגיסטית משמשת לפתרון בעיות סיווג. |
ברגרסיה לינארית, אנו חוזים את הערך של משתנים רציפים. | ברגרסיה לוגיסטית, אנו חוזים את הערכים של משתנים קטגוריים. |
ברגרסיה ליניארית, אנו מוצאים את קו ההתאמה הטוב ביותר, שבאמצעותו נוכל לחזות בקלות את הפלט. | ברגרסיה לוגיסטית, אנו מוצאים את עקומת ה-S שלפיה נוכל לסווג את הדגימות. |
שיטת אומדן הריבוע הקטן ביותר משמשת להערכת הדיוק. | שיטת הערכת הסבירות המקסימלית משמשת להערכת הדיוק. |
הפלט עבור רגרסיה לינארית חייב להיות ערך רציף, כגון מחיר, גיל וכו'. | הפלט של רגרסיה לוגיסטית חייב להיות ערך קטגורי כגון 0 או 1, כן או לא וכו'. |
ברגרסיה לינארית, נדרש שהקשר בין משתנה תלוי למשתנה בלתי תלוי חייב להיות ליניארי. | ברגרסיה לוגיסטית, אין צורך בקשר הליניארי בין המשתנה התלוי והבלתי תלוי. |
ברגרסיה ליניארית, עשויה להיות קולינאריות בין המשתנים הבלתי תלויים. | ברגרסיה לוגיסטית, לא צריכה להיות קולינאריות בין המשתנה הבלתי תלוי. |