Sam & Max: Python, Django, Git et du cul » unpacking http://sametmax.com Deux développeurs en vadrouille qui se sortent les doigts du code Wed, 05 Feb 2014 14:20:37 +0000 en hourly 1 http://wordpress.org/?v=3.3.1 5 choses à apprendre en priorité en Python http://sametmax.com/5-choses-a-apprendre-en-priorite-en-python/ http://sametmax.com/5-choses-a-apprendre-en-priorite-en-python/#comments Sun, 22 Dec 2013 08:57:17 +0000 Sam http://sametmax.com/?p=8376 Quand on apprend un nouveau langage de programmation, on apprend d’abord les bases. Et pour la plupart des langages, elles sont communes : déclarer une variable, faire des conditions et des boucles, faire des fonctions, importer un code d’un autre fichier, etc.

Ce qui va différencier le moment où vous savez programmer dans CE langage, ce sont des notions qui lui sont spécifiques et que vous commencez à maitriser.

Voici 5 notions spécifiques au langage qu’il faut apprendre en priorité si vous voulez pouvoir dire “je code en Python” :

Pip

Pip est la moyen le plus utilisé d’installer une bibliothèque externe dans l’environnement Python. Dès qu’on veut faire un projet sérieux, on en a besoin. Tellement qu’il va en fait être inclus par défaut dans Python 3.4.

Lire l’article sur pip.

Virtualenv

Virtualenv permet d’isoler plusieurs installations de Python. A partir du moment où l’on travaille sur plusieurs projets en même temps, il devient vite indispensable. Mais personnelement, je l’utilise même quand je n’ai qu’un projet installé sur une machine car il me permet de le séparer du setup Python du système et d’utiliser des hooks.

Un outil qui a été ajouté dans la lib standard en Python 3.3. J’apprécie que le pragmatisme de l’évolution de Python qui intègre petit à petit les projets qui se sont révélés les outils de facto dans la communauté.

Lire l’article sur virtualenv.

Les listes en intention

J’ai envie de dire l’itération en générale, mais c’est un très vaste sujet, et il est couvert en grande partie par les 3 derniers points.

La liste en intention, ou liste en compréhension, est une manière de boucler sur un itérable (souvent une liste), avec optionellement un filtre, afin de produire une nouvelle liste. En une ligne.

C’est stylistiquement la marque de fabrique de Python (même si c’est piqué à Haskell). C’est également ce qui le rend aussi expressif. On peut presque coder tout un programme en déclaratif avec des enchainements de listes en intention.

C’est beau, propre, efficace et court. IN-DIS-PEN-SA-BLE.

Lire l’article sur les listes en intention.

L’unpacking

L’unpacking est une autre fonctionalité typiquement pythonienne qui permet de prendre un itérable (souvent un tuple), et de mettre ses éléments dans des variables d’une traite.

Cela permet d’augmenter drastiquement la lisibilité des programmes.

Lire les articles sur l’unpacking.

Les générateurs

Les générateurs permettent non seulement un énorme gain en performance, mais en plus ils autorisent le traitement itératif de flux de données dont on ne connait pas la taille en avance, voire de taille infinie. Si vous utilisez des expressions génératrices, vous pourrez le faire en déclaratif. Si vous utilisez yield, vous pourrez cacher un algorithme complet derrière une simple boucle for.

Lire l’article sur yield.

Le reste ?

Tout le reste, c’est du détail. Les décorateurs, la POO, l’opérateur with, les métaclasses, les astuces magiques pour faire ceci ou cela. C’est bien, mais ça peut attendre. Ce sont ces 5 notions, qui, bien utilisées, feront d’un programmeur un dev Python.

flattr this!

]]>
http://sametmax.com/5-choses-a-apprendre-en-priorite-en-python/feed/ 8
Changement dans l’unpacking des iterables en Python 3 http://sametmax.com/changement-dans-lunpacking-des-iterables-en-python-3/ http://sametmax.com/changement-dans-lunpacking-des-iterables-en-python-3/#comments Fri, 20 Dec 2013 07:49:59 +0000 Sam http://sametmax.com/?p=7656 fait le tour de cette fonctionalité merveilleuse, et PAF, on découvre encore autre chose. Par exemple, la syntaxe a été améliorée avec Python 3, et accepte maintenant un unpacking partiel !]]> Ahhh, l’unpacking… On croit qu’on a complètement fait le tour de cette fonctionalité merveilleuse, et PAF, on découvre encore autre chose.

Par exemple, la syntaxe a été améliorée avec Python 3, et accepte maintenant un unpacking partiel !

Ca se fait en l’utilisant l’opérateur splat, c’est à dire l’étoile :

>>> l = list(range(5))
>>> l
[0, 1, 2, 3, 4]
>>> a, *b = l
>>> a
0
>>> b
[1, 2, 3, 4]
>>> a, *b, c = l
>>> a
0
>>> b
[1, 2, 3]
>>> c
4

Ca marche bien entendu également dans les boucles for.

flattr this!

]]>
http://sametmax.com/changement-dans-lunpacking-des-iterables-en-python-3/feed/ 6
Petite astuce d’unpacking en Python http://sametmax.com/petite-astuce-dunpacking-en-python/ http://sametmax.com/petite-astuce-dunpacking-en-python/#comments Sat, 07 Dec 2013 08:46:44 +0000 Sam http://sametmax.com/?p=8245 L’unpacking, fonction géniale de Python s’il en est, peut se faire sur un seul element :

>>> a = [1]
>>> b, = a
>>> b
1

Pour cet exemple, pas super utile. Par contre dans une boucle :

>>> l = ([1], [1], [1])
>>> for i, in l:
...     print(i)
...     
1
1
1

flattr this!

]]>
http://sametmax.com/petite-astuce-dunpacking-en-python/feed/ 2
Paramètres imbriqués dans une fonction Python http://sametmax.com/parametres-imbriques-dans-une-fonction-python/ http://sametmax.com/parametres-imbriques-dans-une-fonction-python/#comments Sat, 23 Nov 2013 07:24:35 +0000 Sam http://sametmax.com/?p=7613 Une fonction très peu connue de Python est la possibilité de définir un paramètre en indiquant qu’il s’agit d’une séquence. Python va automatiquement appliquer l’unpacking dessus :

>>> def message_geolocalise((long, lat), message):
    print '%s' % message
    print 'Longitude : %s' % long
    print 'Latitude : %s' % lat
...     
>>> point = (4.344, 2.44)
>>> message = "glittering prizes"
>>> message_geolocalise(point, message)
glittering prizes
Longitude : 4.344
Latitude : 2.44

Cette fonctionnalité a été retirée en Python 3, jugée rarement utilisée, et surtout facilement remplaçable par un unpacking explicite :

>>> def message_geolocalise(coord, message):
    long, lat = coord
    print '%s' % message
    print 'Longitude : %s' % long
    print 'Latitude : %s' % lat

En effet, en Python on peut utiliser de l’unpacking imbriqué :

a, (b, c) = [1, [2, 3]]

Et cela a été abusé en le mélangeant la syntaxe des paramètres imbriqués, qui rend le truc franchement illisible.

Voilà, c’était le post “vous aviez un poney que vous ne saviez pas et maintenant que vous le savez vous l’avez plus”.

flattr this!

]]>
http://sametmax.com/parametres-imbriques-dans-une-fonction-python/feed/ 5
La virgule n’est pas un opérateur en Python http://sametmax.com/la-virgule-nest-pas-un-operateur-en-python/ http://sametmax.com/la-virgule-nest-pas-un-operateur-en-python/#comments Fri, 22 Feb 2013 10:57:33 +0000 Sam http://sametmax.com/?p=4379 Premiers tutos, et vous apprenez l’existence du tuple :

t = (1, 2)
print t
## (1, 2)
print type(t)
## <type 'tuple'>

Puis en creusant un peu, vous apprenez qu’un tuple, en fait, c’est juste une série d’objets séparés par des virgules :

t = 1, 2
print t
## (1, 2)

Les parenthèses sont optionnelles pour créer un tuple.

Du coup si on rajoute l’unpacking :

a, b = (1, 2)
print a
## 1
print b
## 2

Du coup on peut faire des fonctions qui semblent (mais c’est une illusion), retourner plusieurs valeurs à la fois :

def foo():
    return 1, 2
 
print foo()
## (1, 2)
print type(foo())
## <type 'tuple'>
a, b = foo()
print a
## 1
print b
## 2

Mais un jour, au lieu de faire ça :

t = "a" in ("b", "a")
print t
## True

Vous faites ça

t = "a" in "b", "a"
print t
## (False, 'a')

Enfer, damnation et baba au rhum !

Ce n’est pas du tout ce que vous attendiez !

La raison à cela est que la virgule en Python n’est pas un opérateur, c’est un simple séparateur. Votre expression a donc été analysée comme :

("a" in "b"), "a"

C’est pour cela qu’utiliser les parenthèses est recommandé avec les tuples : pour clarifier la priorisation des opérations. Car comme la virgule n’est pas un opérateur, elle n’a pas de priorité définie comme pour *, /, and et or, et c’est un peu la fête du slip.

Moralité : à part pour l’unpacking, utilisez toujours des parenthèses dans vos tuples.

Ça vous évitera des aventures du genre :

s = "Ceci est un %s %s" % "test", "idiot"
## TypeError: not enough arguments for format string
print s
 
s = "Ceci est un %s" % "test", "idiot"
print s
## ('Ceci est un test', 'idiot')
 
s = "Ceci est un %s %s" % ("test", "idiot")
print s
## Ceci est un test idiot

Télécharger le code source de ce tuto

flattr this!

]]>
http://sametmax.com/la-virgule-nest-pas-un-operateur-en-python/feed/ 5
L’opérateur splat (l’étoile: *) en Python http://sametmax.com/operateur-splat-ou-etoile-en-python/ http://sametmax.com/operateur-splat-ou-etoile-en-python/#comments Fri, 01 Jun 2012 18:34:59 +0000 Sam http://sametmax.com/?p=173 *, dit opérateur "splat") en Python est très simple, mais certains cas sont peu intuitifs. Les nouveaux venus ont souvent besoin d'un peu plus d'explications que ce que donne la doc. Les utilisateurs d'autres langages sont généralement déroutés car ils sont habitués certaines fonctionnalités qu'on ne retrouvent pas en Python. ]]> L’utilisation du signe étoile (*, dit opérateur “splat”) en Python est très simple, mais certains cas sont peu intuitifs. Les nouveaux venus ont souvent besoin d’un peu plus d’explications que ce que donne la doc. Les utilisateurs d’autres langages sont généralement déroutés car ils sont habitués certaines fonctionnalités qu’on ne retrouvent pas en Python.

Ce que * ne permet pas de faire

Il n’y a pas de pointeurs en Python, et les passages par référence sont automatiques. Du coup :

mon_objet = MaClasse()
mon_pointeur = *mon_objet
ma_valeur = **mon_pointeur

N’existe pas en Python. On ne peut pas récupérer un pointeur. On ne peut pas choisir si l’on passe une variable par valeur ou par référence. Tout est automatique et transparent.

Les usages basiques de *

La multiplication et la puissance fonctionnent comme on l’attend :

>>> print(2*3) # multiplier 2 par 3 
6   
>>> print(2**3) # élever 2 à la puissance 3    
8

Mais déjà, Python se démarque du lot car l’opérateur * est surchargé par défaut, et peut s’appliquer aux chaînes de caractères et aux listes. Pour les chaînes, c’est simple :

>>> print("a" * 3) # on peut multiplier une chaîne par un nombre, et cela donne une chaîne  
aaa 
>>> print("a" ** 3) # ça ne marche pas avec les puissances 
TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'

Pour les listes, c’est plus subtile. Une liste de nombres se multiplie sans y penser :

>>> l = [0, 1, 3]   
>>> print(l * 2)   
 # on peut multiplier une liste par un nombre, cela donne une liste 
[0, 1, 3, 0, 1, 3]  
>>> print(l ** 2)  
 # ça ne marche pas avec les puissances 
TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

En revanche, multiplier une liste d’objets modifiables ne fait que répéter la référence vers cet objet :

>>> l = [{}]    
 # on fait une liste contenant un dictionnaire  
>>> dicos = l * 3  
 # on peut multiplier une liste par un nombre, cela donne une liste 
>>> print(dicos)   
[{}, {}, {}]

On a l’impression que le comportement est le même que précédemment, en fait pas du tout. Ici on a pas une liste de 3 dictionnaires, mais une liste de 3 références vers le même dictionnaire. Si on modifie le premier élément de la liste, tous sont modifiés :

>>> d = dicos[0] # on récupère ce qu'on croit être le premier dictionnaire    
>>> d["Nouvelle cle"] = "Nouvelle valeur" # on le modifie  
>>> print(dicos) # afficher la liste montre que les 3 dictionnaires sont en fait un seul et même objet 
[{'Nouvelle cle': 'Nouvelle valeur'},   
 {'Nouvelle cle': 'Nouvelle valeur'},   
 {'Nouvelle cle': 'Nouvelle valeur'}]

Unpacking

Python intègre une fonctionnalité, l’unpacking, qui permet de prendre chaque élément d’une séquence et de les attribuer à des variables distinctes, d’un seul coup. C’est un raccourcis très pratique :

>>> drapeau = ("bleu", "blanc", "rouge") # ici on utilise un tuple, mais ça marche avec les listes   
>>> premiere_couleur = drapeau[0]  
>>> deuxieme_couleur = drapeau[1]  
>>> troisieme_couleur = drapeau[2] 
>>> print(premiere_couleur)    
'bleu'  
>>> print(deuxieme_couleur)    
'blanc' 
>>> print(troisieme_couleur)   
'rouge' 
>>> couleur1, couleur2, couleur3 =  drapeau # la même opération, en une ligne grace à l'unpacking  
>>> print(couleur1)    
'bleu'  
>>> print(couleur2)    
'blanc' 
>>> print(couleur3)    
'rouge'

Vous n’avez rien à faire, l’unpacking est automatique : il suffit de mettre à gauche du signe = le même nombre de variables qu’il y a d’éléments dans la séquence à droite du signe =. Dans le cas contraire, Python râle :

>>> un, deux = drapeau 
ValueError: too many values to unpack   
>>> un, deux, trois, quatre = drapeau  
ValueError: need more than 3 values to unpack

Quel rapport avec * ? Et bien il permet de forcer l’unpacking dans le cas où c’est ambigüe. Faisons une petite fonction de test qui ne
fait qu’afficher chacun de ses paramètres :

>>> def afficher_trois_elements(elem1, elem2=None, elem3=None): 
...     print(elem1)    
...     print(elem2)    
...     print(elem3)    
... 
... 
>>> afficher_trois_elements(drapeau)   
('bleu', 'blanc', 'rouge')  
None    
None

Passer drapeau affiche logiquement le tuple comme premier paramètre, et ensuite les valeurs par défaut du premier et du second paramètre.

En utilisant *, nous pouvons forcer l’unpacking de telle sorte que les valeurs du tuple soient passées individuellement comme autant de paramètres :

>>> afficher_trois_elements(*drapeau)  
bleu    
blanc   
rouge

Très pratique quand vous utilisez une collection tout au long du programme pour vous éviter de sans cesse trainer des variables intermédiaires. D’autant que ça marche combiné aux slices :

>>> l = [1, 2, 3, "element que l'on ne veut pas"]   
>>> afficher_trois_elements(*l[:-1])   
1   
2   
3

Encore mieux, on peut utiliser ** pour forcer l’unpacking des dictionnaires. Les valeurs du dictionnaires deviennent les valeurs des paramètres, mais cette association se fait par nom : chaque clé du dictionnaire doit correspondre à un nom de paramètre. Ainsi :

>>> elements = {"elem1": "eau", "elem2": "feu", "elem3": "air"}    
 # les clés ont le bon nom  
>>> afficher_trois_elements(**elements)    
eau 
feu 
air

Si une clé ne possède pas le nom adéquat, tout plante :

>>> elements = {"elem1": "eau", "elem2": "feu", "rien_a_voir": "air"}    
>>> afficher_trois_elements(**elements)    
TypeError: afficher_trois_elements() got an unexpected keyword argument 'rien_a_voir'

Une autre erreur courante est d’utiliser * avec un dictionnaire. Dans ce cas l’unpacking fonctionne, mais comme itérer sur une dictionnaire donne une liste de clés, c’est comme si vous passiez une liste en paramètres contenant les clés :

>>> elements = {"elem1": "eau", "elem2": "feu", "elem3";: "air"} 
>>> afficher_trois_elements(*elements) 
elem2   
elem3   
elem1

Si vous donnez moins de valeurs qu’il n’y a de paramètres, Python remplit tout ce qu’il peut :

>>> afficher_trois_elements(*drapeau[:-1])  
bleu    
blanc   
None    
>>> elements = {"elem1": "eau"}   
>>> afficher_trois_elements(**elements)    
eau 
None    
None

Dans le cas inverse – si i il y a plus d’élements que de paramètres – Python vous envoie vous brosser :

>>> forces = ("rouge", "bleu", "jaune", "rose", "vert")   
>>> afficher_trois_elements(*forces)   
TypeError: afficher_trois_elements() takes at most 3 arguments (5 given)

Paramétrage dynamique

Il est parfois pratique de définir une fonction qui accepte un nombre infini d’arguments. Exemple bidon, une fonction qui multiplie ses arguments entre eux :

>>> def multiply(a, b):    
...     return a * b # attention, là on utilise <code>*</code> pour multiplier, ne cherchez rien de compliqué ;-)    
... 
>>> print(multiply(2, 3))  
6

Bien sûr, si on veut rajouter un troisième paramètre, il faut la réécrire. Pareil pour un quatrième. Finalement, on finit par demander de passer une liste pour permettre un nombre arbitraire :

>>> def multiply(elements_a_multiplier):  
...     res = 1 
...     for i in elements_a_multiplier: 
...         res = res * i   
...     return res  
... 
>>> multiply((1, 2, 3, 4)) 
24

Et bien sachez qu’il existe une autre possibilité, autoriser le passage d’une infinité de paramètres ! Cela se fait bien sur avec *.

>>> def multiply(*tous_les_elements): # on ne change pas grand chose, on rajoute juste <code>*</code>   
...     res = 1 
...     for i in tous_les_elements):    
...         res = res * i   
...     return res  
... 
>>> multiply(1, 2, 3)  
 # mais plus besoin d'une séquence !    
26  
>>> multiply(1, 2, 3, 4, 5)    
120

Comment ça marche ? C’est simple, tous les arguments sont automatiquement stockés dans une liste, et cette liste est le paramètre que l’on a désigné par *.

Ce système très puissant peut être utilisé conjointement avec des paramètres normaux :

>>>def afficher(elem1, elem2, *elemx):  
...    print(elem1) 
...    print(elem2) 
...    for e in elemx: 
...        print("(*) %s" % e)>>> afficher("Toi", "Moi", "Luke", "Anakin", "Obi Wan", "Robert")  
Toi 
Moi 
(*) Luke    
(*) Anakin  
(*) Obi Wan 
(*) Robert

La seule condition est de mettre * sur un paramètre situé après tous les autres. * est toujours en dernier, et il n’apparait qu’une seule fois. Enfin, il existe une convention pour le nom de cet argument : *args.

Bonne nouvelle, on peut utiliser aussi **. Comme on peut s’y attendre, il permet de récupérer aussi une infinité de paramètres, mais sous forme de dictionnaire. Cela signifie qu’il ne récupère que les paramètres nommés :

>>> def afficher_recette(recette, **ingredients): # ingrédients sera un dictionnaire    
...     print(recette)  
...     for ingredient in ingredients.iteritems():  
...         print " - %s: %s" % ingredient 
... 
>>> afficher_recette("moukraines à la glaviouse",  
...                  creme="trop", # on doit donner le nom de ce paramètre   
...                  moukraines= "suffisamment", 
...                  glaviouse="si disponible") # mais l'ordre des paramètres importe peu    
moukraines à la glaviouse   
 - glaviouse : si disponible    
 - creme : trop 
 - moukraines : suffisamment

Il faut également mettre ** après tous les autres arguments. La convention pour nommer ce paramètre est **kwargs, pour « keyword arguments ». Enfin, on peut mélanger tout ça d’un coup :

>>> def affichage_hybride(parametre_normal,    
...                       parametre_avec_default="valeur par défaut",   
...                       *args,    
...                       **kwargs):    
...     print(parametre_normal) 
...     print(parametre_avec_default)   
...     print(args) 
...     print(kwargs)   
... 
>>> affichage_hybride("param1", "param2", "infini1", "infini2", kwinfini1=1, kwinfini2=2)  
param1  
param2  
('infini1', 'infini2')  
{'kwinfini1': 1, 'kwinfini2': 2}

On doit absolument mettre les paramètres dans cet ordre :

  1. paramètres normaux et obligatoires;
  2. paramètres normaux facultatifs (valeur par défaut);
  3. paramètres dynamiques;
  4. paramètres dynamiques nommés.

En plus, cela permet en effet de faire jouer les valeurs par défaut de manière très souple :

>>> affichage_hybride("param tout seul")    
param tout seul 
valeur par défaut   
()  
{}

Si vous vous sentez à l’aise avec tout ça, vous pouvez mélanger plusieurs usages de * d’un coup. Je vous laisse donc en guise de conclusion un petit combo qui utilise un code précédent :

>>> def multiply(*args):   
...     res = 1 
...     for i in elements_a_multiplier: 
...         res = res * i   
...     return res  
... 
>>> print(multiply(*([2]*6)) == 2**6)  
True

flattr this!

]]>
http://sametmax.com/operateur-splat-ou-etoile-en-python/feed/ 21