By G5global on Friday, March 4th, 2022 in hot or not fr review. No Comments
Correctement que le possible le plus simple de creer une table de frequences Afin de votre objet Series dans la bibliotheque Python pandas consiste a appliquer la value_counts() technique, le resultat de votre operation semble plutot basique. Nous pouvons le rendre plus informatif en ajustant nos parametres booleens d’la technique normalize , sort , ascending , et dropna , ou en regroupant des valeurs (si elles seront numeriques) dans des bacs. Cependant, les alternatives ici paraissent assez limitees, donc Afin de ameliorer visuellement la table de frequences resultante, nous pouvons envisager des astuces simples mais crГ©er un compte hot or not indispensables, telles que le chainage de methodes, la personnalisation du propos, l’ajout du % symbole a chaque valeur de frequence et l’utilisation d’la puissance de jolie- impression.
Dans Ce texte, nous allons experimenter un ensemble de donnees Kaggle contenant des renseignements sur l’age, le sexe, l’emplacement, l’education, etc., pour 60 000 utilisateurs de l’ application de rencontres OkCupid ??. Pour des besoins, cependant, nous n’utiliserons que des precisions i propos des statuts des utilisateurs.
Pour commencer, creons un tableau de frequence d’origine pour des statuts des utilisateurs :
( Note : ci-apres, nous allons laisser tous les autres parametres en value_counts() technique par defaut, ce qui signifie que nous ne considererons que les tableaux de frequences tries avec ordre decroissant et en excluant les valeurs manquantes. Pour des besoins, utiliser ou non ces parametres ne peu importe.)
Sans connaitre le contexte, a partir du tableau ci-dessus, il pourra ne pas etre pertinent que nos nombres constituent des pourcentages et non des frequences absolues. Ajoutons 1 titre au tableau avec le formatage f-string :
Dans l’exemple ci-dessus, nous avons ajoute le % symbole au titre du tableau. Et si nous voulions plutot l’ajouter a chaque valeur de frequence ? Une solution de contournement consiste a coder une liste de valeurs de frequence avec le % symbole ajoute a chacune d’entre elles, et a creer une serie a partir de cette liste. Pour faire la liste, nous pouvons utiliser la boucle for suivante :
Enfin, nous pouvons joliment imprimer le tableau des frequences. Pour i§a, nous allons utiliser la to_markdown() technique pandas qui necessite l’installation (pas forcement l’import) du module tabulate ( pip install tabulate ).
Important : Afin de afficher convenablement les resultats, la to_markdown() technique devra etre utilisee seulement a l’interieur de la print() commande.
Jouons au milieu des parametres tablefmt et stralign . Le premier d’entre eux definit le format du tableau et pourra avoir l’une des valeurs suivantes : plain , simple , github , grid , fancy_grid , pipe , orgtbl , jira , presto , pretty , psql , rst , etc. comme, le format de tableau que nous avons vu plus haut s’appelle pipe , celui avec defaut concernant des to_markdown() pandas methode. Curieux que concernant le package tabulate lui-meme, le format de tableau par defaut est simple . Quant au deuxieme parametre, stralign , il sert a remplacer l’alignement des precisions de chaine par defaut (qui est left ). Les laternatives possibles ici sont right et center .
Attention : le floatfmt parametre ne fonctionne gui?re en combinaison avec le format du tableau pretty .
Correctement que tous la procedure nullement a pas ci-dessus ait necessite de multiples iterations et descriptions, nous trouverons ci-dessous les solutions de code finales pour 4 versions differentes de notre tableau des frequences pour profiles[‘status’] , l’article en % :
Dans ce post, nous avons discute de divers approches simples mais puissantes Afin de ameliorer la disposition du tableau des frequences et la lisibilite globale. Ils ont l’ensemble de la value_counts() methode des pandas comme facteur central, mais l’ensemble de vont au-dela et aboutissent a des representations plus percutantes. De surcroit, chacune des solutions presentees, dans sa forme definitive, necessite au maximum 3 lignes de code.
J’espere que vous avez apprecie la lecture de mon article et que vous l’avez trouve utile. Merci d’avoir lu a tout le monde, et bonne chance a ceux qui utilisent l’application de rencontres OkCupid ????
Vous pourrez trouver interessant aussi ces articles :
ACN: 613 134 375 ABN: 58 613 134 375 Privacy Policy | Code of Conduct
Leave a Reply