Supercharge la méthode value_counts() de Pandas avec Sidetable

#39 - freq() de Sidetable

Utilisation de sidetable

La méthode value_counts() est fréquemment utilisée pour analyser des colonnes catégorielles, mais elle présente de nombreuses limitations.

Par exemple, si l'on souhaite afficher le pourcentage, le nombre cumulé, etc. en un seul endroit, les choses deviennent un peu fastidieuses. Cela nécessite plus de code (et cela prend du temps).

Tu peux utiliser sidetable à la place. Considère cette teechnique comme une version surchargée de value_counts(). Comme illustré ci-dessus, la méthode freq() de sidetable fournit un résumé plus utile que value_counts().

De plus, sidetable peut également agréger plusieurs colonnes. Tu peux également fournir des points de seuil pour fusionner les données dans un seul bucket. De plus, il est possible d'imprimer des statistiques sur les données manquantes, de jolies valeurs d'impression, etc.

Plus d'informations ici : GitHub de Sidetable.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.