logo

סדרת Python Pandas

ניתן להגדיר את סדרת הפנדות כמערך חד מימדי המסוגל לאחסן סוגי נתונים שונים. אנו יכולים להמיר בקלות את הרשימה, הטופל והמילון לסדרות באמצעות ' סִדרָה ' שיטה. תוויות השורות של סדרות נקראות אינדקס. סדרה לא יכולה להכיל מספר עמודות. יש לו את הפרמטר הבא:

    נתונים:זה יכול להיות כל רשימה, מילון או ערך סקלרי.אינדקס:הערך של המדד צריך להיות ייחודי וניתן לגיבוב. זה חייב להיות באורך זהה לנתונים. אם לא נעבור שום אינדקס, ברירת מחדל np.arrange(n) יהיה בשימוש.dtype:זה מתייחס לסוג הנתונים של הסדרה.עותק:הוא משמש להעתקת הנתונים.

יצירת סדרה:

אנחנו יכולים ליצור סדרה בשתי דרכים:

  1. צור סדרה ריקה
  2. צור סדרה באמצעות קלט.

צור סדרה ריקה:

אנחנו יכולים בקלות ליצור סדרה ריקה ב-Pandas מה שאומר שלא יהיה לה שום ערך.

התחביר המשמש ליצירת סדרה ריקה:

 = pandas.Series() 

הדוגמה שלהלן יוצרת אובייקט מסוג Empty Series שאין לו ערכים ובעל סוג נתונים ברירת מחדל, כלומר, לצוף64 .

דוגמא

 import pandas as pd x = pd.Series() print (x) 

תְפוּקָה

 Series([], dtype: float64) 

יצירת סדרה באמצעות קלט:

אנו יכולים ליצור סדרות באמצעות תשומות שונות:

למחוק את הקובץ ב-java
  • מַעֲרָך
  • דיקט
  • ערך סקלרי

יצירת סדרות ממערך:

לפני יצירת סדרה, ראשית, עלינו לייבא את רדום מודול ולאחר מכן השתמש בפונקציה array() בתוכנית. אם הנתונים הם ndarray, האינדקס המועבר חייב להיות באותו אורך.

אם לא נעבור אינדקס, אז כברירת מחדל אינדקס של טווח (n) מועבר כאשר n מגדיר את אורך המערך, כלומר, [0,1,2,.... range(len(array))-1 ].

דוגמא

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

תְפוּקָה

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

צור סדרה מ-dict

אנחנו יכולים גם ליצור סדרה מ-dict. אם אובייקט המילון מועבר כקלט והאינדקס לא צוין, מפתחות המילון נלקחים בסדר ממוין כדי לבנות את האינדקס .

קו חדש של פיתון

אם האינדקס יעבור, הערכים המתאימים לתווית מסוימת באינדקס יחולצו מה- מילון .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

תְפוּקָה

 x 0.0 y 1.0 z 2.0 dtype: float64 

צור סדרה באמצעות Scalar:

הורדה של xvideoservicethief אובונטו 14.04

אם ניקח את הערכים הסקלרים, אז יש לספק את האינדקס. הערך הסקלרי יחזור על עצמו לצורך התאמת אורך המדד.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

תְפוּקָה

 0 4 1 4 2 4 3 4 dtype: int64 

גישה לנתונים מסדרות עם מיקום:

לאחר שתיצור את האובייקט מסוג Series, תוכל לגשת לאינדקסים, לנתונים שלו ואפילו לאלמנטים בודדים שלו.

ניתן לגשת לנתונים בסדרה בדומה לנתונים ב-ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

תְפוּקָה

 1 

תכונות אובייקט של סדרה

התכונה Series מוגדרת ככל מידע הקשור לאובייקט Series כגון גודל, datatype. וכו'. להלן כמה מהתכונות שבהן תוכל להשתמש כדי לקבל מידע על אובייקט הסדרה:

תכונות תיאור
Series.index מגדיר את האינדקס של הסדרה.
סדרה.צורה זה מחזיר טופלה של צורה של הנתונים.
Series.dtype זה מחזיר את סוג הנתונים של הנתונים.
סדרה.גודל זה מחזיר את גודל הנתונים.
סדרה.ריק הוא מחזיר True אם אובייקט Series ריק, אחרת מחזיר false.
סדרה.חסנאנס הוא מחזיר True אם יש ערכי NaN, אחרת מחזיר false.
Series.nbytes זה מחזיר את מספר הבתים בנתונים.
סדרה אני הוא מחזיר את מספר הממדים בנתונים.
Series.itemsize זה מחזיר את הגודל של סוג הנתונים של הפריט.

אחזור מערך אינדקס ומערך נתונים של אובייקט סדרה

אנו יכולים לאחזר את מערך האינדקס ומערך הנתונים של אובייקט Series קיים על ידי שימוש במאפיינים אינדקס וערכים.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

תְפוּקָה

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

אחזור סוגים (dtype) וגודל סוג (גודל פריט)

אתה יכול להשתמש בתכונה dtype עם אובייקט סדרה בתור dtype לאחזור סוג הנתונים של אלמנט בודד של אובייקט סדרה, אתה יכול להשתמש ב- גודל פריט תכונה כדי להציג את מספר הבתים שהוקצו לכל פריט נתונים.

setinterval javascript
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

תְפוּקָה

 int64 8 float64 8 

משחזר צורה

הצורה של האובייקט Series מגדירה את המספר הכולל של אלמנטים כולל ערכים חסרים או ריקים (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

תְפוּקָה

 (4,) (3,) 

אחזור מימד, גודל ומספר בתים:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

תְפוּקָה

 1 1 4 3 32 24 

בדיקת ריקנות ונוכחות של NaNs

כדי לבדוק שהאובייקט של הסדרה ריק, אתה יכול להשתמש ב- תכונה ריקה . באופן דומה, כדי לבדוק אם אובייקט סדרה מכיל כמה ערכי NaN או לא, אתה יכול להשתמש ב- חסן תְכוּנָה.

דוגמא

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

תְפוּקָה

 False False True True False False 4 3 3 3 

פונקציות סדרה

ישנן כמה פונקציות המשמשות בסדרה שהן כדלקמן:

פונקציות תיאור
Pandas Series.map() מפה את הערכים משתי סדרות בעלות עמודה משותפת.
Pandas Series.std() חשב את סטיית התקן של קבוצת המספרים הנתונה, DataFrame, עמודה ושורות.
Pandas Series.to_frame() המר את אובייקט הסדרה ל-dataframe.
Pandas Series.value_counts() מחזירה סדרה המכילה ספירות של ערכים ייחודיים.