सोडवले: पायथनमधील अनुमानित आकडेवारीसाठी कोड

पायथनमधील अनुमानित आकडेवारीसाठी कोडशी संबंधित मुख्य समस्या ही आहे की परिणाम समजणे आणि त्याचा अर्थ लावणे कठीण होऊ शकते. पायथन ही एक शक्तिशाली भाषा आहे, परंतु अनुमानात्मक आकडेवारीसाठी वापरलेला कोड वाचणे आणि समजणे कठीण होऊ शकते. याव्यतिरिक्त, पायथनमध्ये अनुमानित आकडेवारीसाठी अनेक भिन्न पॅकेजेस उपलब्ध आहेत, ज्यामुळे विशिष्ट विश्लेषणासाठी योग्य एक निवडणे कठीण होऊ शकते. शेवटी, यापैकी काही पॅकेजेस इतरांप्रमाणे अद्ययावत किंवा विश्वासार्ह नसतील, त्यामुळे त्यांचा वापर करण्यापूर्वी संशोधन करणे महत्त्वाचे आहे.

1. Chi-Square Test of Independence: 
from scipy.stats import chi2_contingency
chi2, p, dof, expected = chi2_contingency(observed)

2. One-Way ANOVA: 
from scipy import stats 
F, p = stats.f_oneway(sample1, sample2, sample3) 
  
3. Pearson’s Correlation Coefficient: 
from scipy.stats import pearsonr 
corr, _ = pearsonr(x, y)

ओळ 1: ही ओळ scipy.stats लायब्ररीमधून chi2_contingency फंक्शन इंपोर्ट करते आणि नंतर निरीक्षण केलेल्या डेटावर स्वातंत्र्याची ची-स्क्वेअर चाचणी मोजण्यासाठी वापरते. या चाचणीचे परिणाम chi2, p, dof आणि अपेक्षित व्हेरिएबल्समध्ये साठवले जातात.

ओळ 2: ही ओळ स्किपी लायब्ररीमधून f_oneway फंक्शन इंपोर्ट करते आणि नंतर तीन नमुन्यांवर (नमुना1, नमुना2, नमुना3) एक-मार्ग ANOVA मोजण्यासाठी वापरते. या चाचणीचे परिणाम F आणि p व्हेरिएबल्समध्ये साठवले जातात.

ओळ 3: ही ओळ scipy.stats लायब्ररीमधून pearsonr फंक्शन इंपोर्ट करते आणि नंतर दोन व्हेरिएबल्स (x आणि y) मधील पिअर्सनच्या सहसंबंध गुणांकाची गणना करण्यासाठी त्याचा वापर करते. या चाचणीचे परिणाम व्हेरिएबल्स कॉर आणि _ मध्ये संग्रहित केले जातात.

अनुमानात्मक आकडेवारी काय आहे

अनुमानित आकडेवारी ही आकडेवारीची एक शाखा आहे जी लोकसंख्येबद्दल अनुमान किंवा सामान्यीकरण करण्यासाठी नमुन्यातील डेटा वापरते. यात नमुन्यावरून गोळा केलेल्या डेटाच्या आधारे लोकसंख्येबद्दल निष्कर्ष काढणे समाविष्ट आहे. Python मध्ये, अनुमान काढण्यासाठी आणि अनुमान काढण्यासाठी विविध तंत्रे जसे की हायपोथिसिस चाचणी, सहसंबंध विश्लेषण, प्रतिगमन विश्लेषण आणि बरेच काही वापरून अनुमान काढण्यासाठी अनुमानित आकडेवारी वापरली जाऊ शकते. ही तंत्रे आम्हाला आमच्या डेटामधून अर्थपूर्ण अंतर्दृष्टी काढू देतात आणि आम्हाला चांगले निर्णय घेण्यास मदत करतात.

अनुमानात्मक आकडेवारीचे प्रकार

Python मध्ये, डेटाचे विश्लेषण करण्यासाठी अनेक प्रकारची अनुमानित आकडेवारी आहे. यामध्ये टी-चाचण्या, ANOVA, ची-स्क्वेअर चाचण्या, सहसंबंध चाचण्या आणि प्रतिगमन विश्लेषण यांचा समावेश आहे. डेटाच्या दोन किंवा अधिक गटांच्या माध्यमांची तुलना करण्यासाठी टी-चाचण्यांचा वापर केला जातो. ANOVA डेटाच्या अनेक गटांच्या माध्यमांची तुलना करण्यासाठी वापरला जातो. ची-स्क्वेअर चाचण्या वर्गीय चलांमधील संबंध तपासण्यासाठी वापरल्या जातात. सहसंबंध चाचण्या दोन चलांमधील रेखीय संबंधांची ताकद आणि दिशा मोजतात. शेवटी, रिग्रेशन विश्लेषणाचा वापर एक किंवा अधिक स्वतंत्र व्हेरिएबल्सवरून अवलंबून व्हेरिएबलचा अंदाज लावण्यासाठी केला जातो.

तुम्ही अनुमानित आकडेवारी कशी लिहाल

अनुमानित सांख्यिकी ही आकडेवारीची एक शाखा आहे जी नमुन्यातील डेटाचा वापर करून ज्या लोकसंख्येवरून नमुना घेतला गेला होता त्या लोकसंख्येबद्दल निष्कर्ष काढतात. Python मध्ये, SciPy, StatsModels आणि NumPy सारख्या विविध लायब्ररी वापरून अनुमानित आकडेवारी सादर केली जाऊ शकते.

पायथनमध्ये अनुमानित आकडेवारी करण्यासाठी, तुम्हाला प्रथम आवश्यक लायब्ररी आयात करावी लागतील आणि नंतर मीन(), मीडियन(), मोड(), भिन्नता(), मानक विचलन(), टी-टेस्ट(), ची सारखी फंक्शन्स वापरावी लागतील. -square test() इ. उदाहरणार्थ, जर तुम्हाला दिलेल्या डेटासेटच्या मीनची गणना करायची असेल, तर तुम्ही NumPy मधील मीन() फंक्शन वापरू शकता:

एनपी म्हणून नंपी आयात करा
डेटा = [१,२,३,४]
mean_value = np.mean(डेटा)
print(mean_value) # आउटपुट: 2.5

संबंधित पोस्ट:

एक टिप्पणी द्या