מיזוג פנדות - הדרכה של פנדות

פנדות לְמַזֵג() מוגדר כתהליך של חיבור שני מערכי הנתונים לאחד ויישור השורות על סמך התכונות או העמודות המשותפות. זוהי נקודת כניסה לכל פעולות ההצטרפות הסטנדרטיות של מסד נתונים בין אובייקטי DataFrame:

תחביר:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

פרמטרים:

DataFrame או סדרה בשם

{'left', 'right', 'outer', 'inner'}, ברירת המחדל 'inner'

שמאלה:הוא משתמש רק במפתחות מהמסגרת השמאלית, בדומה לחיבור חיצוני שמאלי של SQL; לשמור על סדר המפתחות.ימין:הוא משתמש רק במפתחות מהמסגרת הימנית, בדומה לחיבור חיצוני ימני של SQL; לשמור על סדר המפתחות.חִיצוֹנִי:הוא השתמש באיחוד המפתחות משתי המסגרות, בדומה לחיבור חיצוני מלא של SQL; מיון מפתחות מבחינה לקסיקוגרפית.פְּנִימִי:הוא משתמש בהצטלבות של מפתחות משתי המסגרות, בדומה לחיבור פנימי של SQL; לשמור על סדר המקשים השמאלי.

תווית או רשימה

עזב ב:

תווית או רשימה, או דמוי מערך

bool, ברירת מחדל False

tuple של (str, str), ברירת מחדל ('_x', '_y')

bool, ברירת מחדל True

bool או str, ברירת מחדל False

_לְמַזֵג

'שמאל_בלבד'עבור התצפיות שמפתח המיזוג שלהן מופיע רק ב'שמאל' של ה-DataFrame, ואילו,'נכון_בלבד'מוגדר עבור תצפיות שבהן מפתח המיזוג מופיע רק ב'ימין' של ה-DataFrame,'שניהם'אם מפתח המיזוג של התצפית נמצא בשניהם.

str, אופציונלי

'one_to_one' או '1:1': הוא בודק אם מפתחות המיזוג הם ייחודיים במערך הנתונים השמאלי והימין.
'one_to_many' או '1:m': הוא בודק אם מפתחות המיזוג הם ייחודיים רק במערך הנתונים השמאלי.
'many_to_one' או 'm:1': הוא בודק אם מפתחות המיזוג הם ייחודיים רק במערך הנתונים הנכון.
'רבים_לרבים' או 'מ:מ': זה מותר, אך אינו גורם לבדיקות.

דוגמה1: מיזוג שני DataFrames על מפתח

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

תְפוּקָה

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

דוגמה 2: מיזוג שני DataFrames על מספר מפתחות:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

תְפוּקָה

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview