- Mon Shot de Data Science
- Posts
- Quand ne pas utiliser la méthode head() de Pandas
Quand ne pas utiliser la méthode head() de Pandas
#57 - nsmallest et nlargest
On récupère souvent les k premières lignes d'un DataFrame Pandas trié en utilisant la méthode head(). Cette approche présente toutefois une faille.
Si tes données contiennent des valeurs répétées, head() n'en tiendra pas compte et renverra simplement les k premières lignes.
Si tu souhaites prendre en compte les valeurs en double, utilise plutôt nlargest (ou nsmallest) à la place. Ici, tu peux spécifier le comportement souhaité pour les valeurs dupliquées en utilisant le paramètre keep.
Ça t'a plu ? 😎 |
Reply