Quand ne pas utiliser la méthode head() de Pandas

#57 - nsmallest et nlargest

nsmallest et nlargest

On récupère souvent les k premières lignes d'un DataFrame Pandas trié en utilisant la méthode head(). Cette approche présente toutefois une faille.

Si tes données contiennent des valeurs répétées, head() n'en tiendra pas compte et renverra simplement les k premières lignes.

Si tu souhaites prendre en compte les valeurs en double, utilise plutôt nlargest (ou nsmallest) à la place. Ici, tu peux spécifier le comportement souhaité pour les valeurs dupliquées en utilisant le paramètre keep.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.