מודול numpy של Python מספק פונקציה שנקראת numpy.histogram() . פונקציה זו מייצגת את התדירות של מספר הערכים שמשווים לקבוצת טווחי ערכים. פונקציה זו דומה ל- היסט() פונקציה של matplotlib.pyplot .
במילים פשוטות, פונקציה זו משמשת לחישוב ההיסטוגרמה של קבוצת הנתונים.
תחביר:
numpy.histogram(x, bins=10, range=None, normed=None, weights=None, density=None)
פרמטרים:
x: array_like
פרמטר זה מגדיר מערך שטוח עליו מחושבת ההיסטוגרמה.
bins: int או רצף של str או scalars (אופציונלי)
כיצד להסיר את התו הראשון באקסל
אם פרמטר זה מוגדר כמספר שלם, אז בטווח הנתון, הוא מגדיר את מספר הפחים ברוחב שווה. אחרת, מוגדר מערך של קצוות סל שהוגדלו באופן מונוטוני. הוא כולל גם את הקצה הימני ביותר, המאפשר רוחבי סל לא אחידים. הגרסה העדכנית ביותר של numpy מאפשרת לנו להגדיר פרמטרים של bin כמחרוזת, המגדירה שיטה לחישוב רוחב סל אופטימלי.
טווח : (צף, צף) (אופציונלי)
אלפבית של מספרים
פרמטר זה מגדיר את הטווחים התחתונים-עליונים של הפחים. כברירת מחדל, הטווח הוא (x.min(), x.max()) . מתעלמים מהערכים, שהם מחוץ לטווח. הטווחים של האלמנט הראשון צריכים להיות שווים או קטנים מהאלמנט השני.
normed: bool (אופציונלי)
פרמטר זה זהה לארגומנט הצפיפות, אך הוא יכול לתת פלט שגוי עבור רוחבי סל לא שווים.
משקלים: array_like(אופציונלי)
סעיפי sql
פרמטר זה מגדיר מערך המכיל משקלים ובעל אותה צורה כמו 'איקס' .
צפיפות: bool (אופציונלי)
אם הוא מוגדר כ-True, יביא למספר הדגימות בכל סל. אם הערך שלו הוא False, פונקציית הצפיפות תגרום לערך של פונקציית צפיפות ההסתברות בסל.
החזרות:
היסט: מערך
פונקציית הצפיפות מחזירה את ערכי ההיסטוגרמה.
edge_bin: מערך של float dtype
פונקציה זו מחזירה את קצוות הפח (אורך (היסט+1)) .
דוגמה 1:
import numpy as np a=np.histogram([1, 5, 2], bins=[0, 1, 2, 3]) a
תְפוּקָה:
מחרוזת משנה של מחרוזת java
(array([0, 1, 1], dtype=int64), array([0, 1, 2, 3]))
בקוד למעלה
- ייבאנו numpy עם שם הכינוי np.
- הכרזנו על המשתנה 'a' והקצנו את הערך המוחזר של np.histogram() פוּנקצִיָה.
- עברנו מערך ואת הערך של bin בפונקציה.
- לבסוף, ניסינו להדפיס את הערך של 'א' .
בפלט, הוא מראה ndarray שמכיל את ערכי ההיסטוגרמה.
100 קמ"ש עד קמ"ש
דוגמה 2:
import numpy as np x=np.histogram(np.arange(6), bins=np.arange(7), density=True) x
תְפוּקָה:
(array([0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667]), array([0, 1, 2, 3, 4, 5, 6]))
דוגמה 3:
import numpy as np x=np.histogram([[1, 3, 1], [1, 3, 1]], bins=[0,1,2,3]) x
תְפוּקָה:
(array([0, 4, 2], dtype=int64), array([0, 1, 2, 3]))
דוגמה 4:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist bin_edges
תְפוּקָה:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) array([0. , 0.7, 1.4, 2.1, 2.8, 3.5, 4.2, 4.9, 5.6, 6.3, 7. ])
דוגמה 5:
import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist hist.sum() np.sum(hist * np.diff(bin_edges))
תְפוּקָה:
array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) 1.4285714285714288 1.0
בקוד למעלה
- ייבאנו numpy עם שם הכינוי np.
- יצרנו מערך 'א' באמצעות np.arange() פוּנקצִיָה.
- הצהרנו על משתנים 'היסט' ו 'bin_edges' ולאחר מכן הוקצה את הערך המוחזר של np.histogram() פוּנקצִיָה.
- עברנו את המערך 'א' וקבע 'צְפִיפוּת' ל-True בפונקציה.
- ניסינו להדפיס את הערך של 'היסט' .
- ולבסוף, ניסינו לחשב את סכום ערכי ההיסטוגרמה באמצעות hist.sum() ו np.sum() שבו העברנו ערכי היסטוגרמה וקצוות של הפח.
בפלט, הוא מציג ndarray המכיל את ערכי ההיסטוגרמה ואת סכום ערכי ההיסטוגרמה.