Pandas מסוגלת לשלב אובייקטי Series, DataFrame ו-Panel באמצעות סוגים שונים של לוגיקה סטית עבור האינדקסים ופונקציונליות האלגברה ההתייחסותית.
ה concat() הפונקציה אחראית לביצוע פעולת שרשור לאורך ציר ב-DataFrame.
תחביר:
pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False)
פרמטרים:
אם נעביר dict ב-DataFrame, המפתחות הממוינים ישמשו בתור ארגומנט keys, והערכים ייבחרו במקרה זה. אם קיימים אובייקטים שאינם אובייקטים, הוא יוסר אלא אם כולם אינם, ובמקרה זה, ValueError יועלה.
הוא אינו משתמש בערכי האינדקס על ציר השרשור, אם נכון. הציר המתקבל יסומן כ-0, ..., n - 1.
החזרות
סדרה מוחזרת כאשר אנו משרשרים את כל הסדרות לאורך הציר (ציר=0). במקרה אם objs מכיל DataFrame אחד לפחות, הוא מחזיר DataFrame.
דוגמה1:
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data])
תְפוּקָה
0 p 1 q 0 r 1 s dtype: object
דוגמה 2: בדוגמה לעיל, נוכל לאפס את האינדקס הקיים באמצעות ה- ignore_index פָּרָמֶטֶר. הקוד שלהלן מדגים את פעולתו של ignore_index .
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True)
תְפוּקָה
0 p 1 q 2 r 3 s dtype: object
דוגמה 3: אנו יכולים להוסיף אינדקס היררכי ברמה החיצונית ביותר של הנתונים על ידי שימוש ב- מפתחות פָּרָמֶטֶר.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'])
תְפוּקָה
a_data 0 p 1 q b_data 0 r 1 s dtype: object
דוגמה 4: אנו יכולים לתייג את מפתחות האינדקס באמצעות ה שמות פָּרָמֶטֶר. הקוד שלהלן מציג את פרמטר פעולת השמות.
ד כפכף
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID'])
תְפוּקָה
Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object
שרשור באמצעות append
שיטת התוספת מוגדרת כקיצור דרך שימושי לשרשרת ה-Series ו-DataFrame.
דוגמא:
import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two))
תְפוּקָה
Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88