Comments on: Le pandas c’est bon, mangez en http://sametmax.com/le-pandas-cest-bon-mangez-en/ Du code, du cul Sat, 07 Nov 2015 11:08:18 +0000 hourly 1 http://wordpress.org/?v=4.1 By: Sam http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-146926 Wed, 15 Oct 2014 07:28:35 +0000 http://sametmax.com/?p=10113#comment-146926 @LuTarip : cette question n’a rien à voir avec l’article, et ceci est un blog, pas un forum. Va plutôt poser ta question ici : http://www.afpy.org/forums/forum_python

]]>
By: LuTarip http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-146924 Wed, 15 Oct 2014 06:59:52 +0000 http://sametmax.com/?p=10113#comment-146924 Salut,

j’ai une petite question, comment faire pour lire plusieurs fichiers texte un par un dans un dossier? merci

]]>
By: kontre http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-27926 Sun, 11 May 2014 19:29:55 +0000 http://sametmax.com/?p=10113#comment-27926 @Joshua: pandas utilise des tableaux numpy en interne, donc les opérations doivent être grosso modo aussi rapides. C’est fait pour bouffer du chiffre, alors ils font gaffe à l’optimisation. De plus les devs numpy font bien gaffe à ne pas casser les bibliothèques principales qui en dépendent lors de leurs mises à jour, je vois pas mal d’échanges sur github.

Moi ce que j’aime dans pandas c’est le chargement des données. Tu files un tableau excel et tu récupères le tableau direct, avec détection de la ligne d’entête et du type de chaque colonnes. Je l’ai fait une fois à la min avant de découvrir cette lib, j’ai tout de suite vu la différence !

]]>
By: Joshua http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-27824 Sun, 11 May 2014 13:53:01 +0000 http://sametmax.com/?p=10113#comment-27824 Moi j’ai une question niveau de l’efficacité. Est-ce que les opérations sont aussi rapides qu’avec des tableaux numpy (sum, mean et autre par ex.)?

]]>
By: François http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-27812 Sun, 11 May 2014 13:04:01 +0000 http://sametmax.com/?p=10113#comment-27812 Les avantages que je trouve à pandas dans le traitement de data :
* nommage explicite (f[‘age’] plutot que f[3]) qui est utile lorsqu’on manipule des gros tableaux 2D. Cela evite de se poser la question de ce qu’il y a dans la colonne 23.
* manipulation facile des dates, mais je n’en manipule presque pas.
* création de sous-ensembles qui est plus simple qu’avec un tableau numpy à plusieurs dimensions.

]]>
By: joshuafr http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-27205 Sat, 10 May 2014 09:17:46 +0000 http://sametmax.com/?p=10113#comment-27205 @Seb : je ne suis pas rentré dans toutes les fonctionnalités de Pandas sinon il faudrait plusieurs articles pour tout couvrir, mais je cite bien les diverses méthodes d’import de données (qui marche aussi en export d’ailleurs) et le traçage de diagrammes avec plot :)

]]>
By: Seb http://sametmax.com/le-pandas-cest-bon-mangez-en/#comment-27162 Sat, 10 May 2014 07:29:02 +0000 http://sametmax.com/?p=10113#comment-27162 Salut,

Merci pour cette présentation de Pandas.
il manque toutefois quelques infos bien pratiques.

Je les note ici en vrac pour ceux qui s’y intéressent.

Lecture de fichiers CSV

pd.read_csv

Lecture de documents JSON

pd.read_json

Ecriture de fichiers CSV

pd.to_csv

Ecriture de fichiers Excel

pd.to_excel

Les tracés (interface de plus haut niveau que Matplotlib)

df['Y'].plot()

Les tris (selon différentes colonnes)

result = df.sort(['A', 'B'], ascending=[1, 0])

Pour aller plus loin je conseille la lecture du livre Python for Data Analysis
Data Wrangling with Pandas, NumPy, and IPython de Wes McKinney l’auteur de Pandas
http://shop.oreilly.com/product/0636920023784.do

Sinon il y a la doc mais c’est moins digeste
http://pandas.pydata.org/pandas-docs/stable/

Merci encore

]]>