Pour faire une analyse statistique on peut effectuer des opérations statistiques sur les données qui sont structurée à l’aide d’un objet Dataframe, à savoir ; sum(), mean(), max(), median(), info()…
L’analyse statistique peut être utilisée pour réaliser les tâches suivantes:
- Localiser des zones de pertinence, de cohérence, ou de diversité dans les données.
- Elaborer des prédictions futures basées sur des données.
- Chercher les informations clés d’un ensemble de données
- Résumer les informations.
Reprenons l’exemple 4, et calculons la somme, la moyenne et le maximum:
# operations sur dataframe; sum, mean, max
print(« sum: », »== »*22)
print(df.sum())
print(« mean: », « == »*22)
print(df.mean())
print(« max: », »== »*22)
print(df.max())
On obtiendrait les résultats suivants :
sum: ============================================
Region Oued EdDahab LagouiraLaayoune Boujdour Sakia E…
Population 4548537
Ménages 942868
dtype: object
mean: ============================================
Population 1137134.25
Ménages 235717.00
dtype: float64
max: ============================================
Region Souss Massa Draa
Population 3601917
Ménages 747476
dtype: object