- Mon Shot de Data Science
- Posts
- Supercharge la méthode value_counts() de Pandas avec Sidetable
Supercharge la méthode value_counts() de Pandas avec Sidetable
#39 - freq() de Sidetable
La méthode value_counts() est fréquemment utilisée pour analyser des colonnes catégorielles, mais elle présente de nombreuses limitations.
Par exemple, si l'on souhaite afficher le pourcentage, le nombre cumulé, etc. en un seul endroit, les choses deviennent un peu fastidieuses. Cela nécessite plus de code (et cela prend du temps).
Tu peux utiliser sidetable à la place. Considère cette teechnique comme une version surchargée de value_counts(). Comme illustré ci-dessus, la méthode freq() de sidetable fournit un résumé plus utile que value_counts().
De plus, sidetable peut également agréger plusieurs colonnes. Tu peux également fournir des points de seuil pour fusionner les données dans un seul bucket. De plus, il est possible d'imprimer des statistiques sur les données manquantes, de jolies valeurs d'impression, etc.
Plus d'informations ici : GitHub de Sidetable.
Tu peux également consulter le notebook avec l’utilisation des méthodes value_counts() et freq() de sidetable.
Ça t'a plu ? 😎 |
Reply