logo

Pandas DataFrame.describe()

שיטת describe() משמשת לחישוב נתונים סטטיסטיים כמו אחוזון, ממוצע ו סטד של הערכים המספריים של הסדרה או ה-DataFrame. הוא מנתח גם סדרות מספריות ואובייקטים וגם את קבוצות העמודות של DataFrame של סוגי נתונים מעורבים.

תחביר

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

פרמטרים

    אחוזון:זהו פרמטר אופציונלי שהוא רשימה כמו סוג נתונים של מספרים שצריכים ליפול בין 0 ל-1. ערך ברירת המחדל שלו הוא [.25, .5, .75], מה שמחזיר את האחוזונים ה-25, ה-50 וה-75.לִכלוֹל:זהו גם פרמטר אופציונלי הכולל את רשימת סוגי הנתונים תוך תיאור ה-DataFrame. ערך ברירת המחדל שלו הוא None.לא לכלול:זהו גם פרמטר אופציונלי שאינו כולל את רשימת סוגי הנתונים תוך תיאור DataFrame. ערך ברירת המחדל שלו הוא None.

החזרות

זה מחזיר את הסיכום הסטטיסטי של הסדרה וה-DataFrame.

דוגמה1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

תְפוּקָה

ל-java יש את הבא
 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

דוגמה2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

תְפוּקָה

 count 4 unique 3 top q freq 2 dtype: object 

דוגמה3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

תְפוּקָה

 categorical count 3 unique 3 top u freq 1 

דוגמה4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

תְפוּקָה

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0