5. Pandas
Pandas डेटा प्रोसेसिंग और एनालिसिस के लिए पायथन की सबसे लोकप्रिय लाइब्रेरी है।
यह टेबल, टाइम-सीरीज़, और अन्य संरचित डेटा को प्रबंधित और अनालिसिस करने के लिए उपयोगी है। Pandas आपको डेटा को लोड करने, साफ करने, और ट्रांसफॉर्म करने की क्षमता देता है, जिससे डेटा साइंस और मशीन लर्निंग प्रोजेक्ट्स को आसान बनाया जा सकता है।
- विवरण: Pandas टेबल जैसी संरचनाओं (DataFrames) में डेटा को स्टोर करता है, जो स्प्रेडशीट्स के समान होते हैं।
- उपयोग: डेटा प्रोसेसिंग, मर्जिंग, ग्रुपिंग, और इंटरेक्टिव डेटा एनालिसिस।
Pandas को इंस्टॉल करने के लिए यह कमांड चलाएं:
pip install pandas
Pandas का उपयोग करके एक साधारण डेटा एनालिसिस का उदाहरण देखें:
import pandas as pd
# डेटा लोड करना
data = {'नाम': ['आकाश', 'अनु', 'विक्रम', 'सना'],
'उम्र': [24, 29, 22, 27],
'शहर': ['दिल्ली', 'मुंबई', 'कोलकाता', 'चेन्नई']}
df = pd.DataFrame(data)
# डेटा के कुछ राउ को प्रिंट करें
print("डेटा का पूर्वावलोकन:")
print(df.head())
# समूहित करना और विश्लेषण करना
avg_age = df['उम्र'].mean()
print(f"\nऔसत उम्र: {avg_age:.2f}")