# Les g√©n√©rateurs

Les g√©n√©rateurs sont tr√®s simples √† utiliser et tr√®s puissants. Ils vous permettront d'optimiser votre code √† moindre frais. Alors pourquoi se priver ?

Imaginons que je veuille extraire d'une liste de mots la liste des mots comportants le caract√®re 'a'. Je vais √©crire une fonction.

In [45]:
def with_a(words):
    """
    Re√ßoit une liste de mots et renvoie la liste des mots contenant le car. 'a'
    """
    res = []
    for word in words:
        if 'a' in word:
            res.append(word)
    return res
    

In [34]:
mots = ["le", "petit", "chat", "est", "mort", "ce", "matin"]
mots_a = with_a(mots)
print("\n".join(mots_a))

chat
matin


Jusque l√† rien de m√©chant. Comme il est question d'optimisation je vais mesurer le temps de traitement avec `timeit`.  
ipython est plein de magie, `%time` hup hup hup barbatruc et voil√†.

In [None]:
%time mots_a = with_a(mots)
mots_big = mots * 1000000
%time mots_a = with_a(mots_big)

Comme on pouvait s'y attendre le temps d'ex√©cution de la fonction augmente avec la taille de la liste initiale.  
Voyons ce que √ßa donne avec un g√©n√©rateur. Construire un g√©n√©rateur c'est simple : vous remplacez `return` par `yield` dans votre fonction.  
C'est tout ? C'est tout.  

<small>Vous pouvez quand m√™me en apprendre plus [ici](http://intermediatepythonista.com/python-generators) ou lire la [PEP 255](https://www.python.org/dev/peps/pep-0255/) si vous aimez √ßa.</small>

In [46]:
def gen_with_a(words):
    """
    Re√ßoit une liste de mots et renvoie les mots contenant le car. 'a' sous forme de g√©n√©rateur
    """
    for word in words:
        if 'a' in word:
            yield(word)

In [47]:
mots_big = mots * 100
%time mots_a = with_a(mots_big)
%time mots_a_gen = gen_with_a(mots_big)

CPU times: user 0 ns, sys: 0 ns, total: 0 ns
Wall time: 76.8 ¬µs
CPU times: user 0 ns, sys: 0 ns, total: 0 ns
Wall time: 8.82 ¬µs


üò≤ !!!!!!!!!  
Oui c'est de la magie. Enfin c'est plut√¥t de la triche, regardez :

In [48]:
print("mots_a is a {}".format(type(mots_a)))
print("mots_a_gen is a {}".format(type(mots_a_gen)))
import sys
print("Taille de mots_a : {}".format(sys.getsizeof(mots_a)))
print("Taille de mots_a_gen : {}".format(sys.getsizeof(mots_a_gen)))

mots_a is a <class 'list'>
mots_a_gen is a <class 'generator'>
Taille de mots_a : 1672
Taille de mots_a_gen : 88


`mots_a_gen` n'est pas une liste, c'est un objet `generator`.  
Il ne stocke rien ou presque en m√©moire, on ne peut pas conna√Ætre sa taille (essayez `len(mots_a_gen)` pour voir.  
Mais c'est un it√©rable, on peut le parcourir comme une liste. Par contre on ne peut pas les "trancher", on ne peut acc√©der √† un √©l√©ment d'index `i` comme pour une liste.  
Encore une diff√©rence d'avec les listes : vous ne pouvez parcourir un g√©n√©rateur qu'une seule fois.

In [18]:
%time mots_a_gen = list(gen_with_a(mots_big))

CPU times: user 4 ms, sys: 0 ns, total: 4 ms
Wall time: 5.68 ms


Mais m√™me sans tricher les g√©n√©rateurs demeurent tr√®s efficaces. Vous aurez compris qu'il vous est d√©sormais chaudement recommand√© de les utiliser. 

Vous pouvez aussi utiliser des g√©n√©rateurs en compr√©hension, √† la mani√®re des listes en compr√©hension : 

In [24]:
[mot for mot in mots if 'a' in mot]

['chat', 'matin']

In [25]:
(mot for mot in mots if 'a' in mot)

<generator object <genexpr> at 0x7fd2a44637d8>