<span style="font-size:2em; color:blue">
    Tema 5: Definiciones de listas por comprensión
</span>  

----------

[José A. Alonso](https://www.cs.us.es/~jalonso)  
[Departamento de Ciencias de la Computación e I.A.](https://www.cs.us.es)  
[Universidad de Sevilla](http://www.us.es)  
Sevilla, 1 de agosto de 2019

> __Notas:__ 
+ La versión interactiva de este tema se encuentra en [Binder](https://mybinder.org/v2/gh/jaalonso/Temas_interactivos_de_PF_con_Haskell/master?urlpath=lab/tree/temas/Tema-05.ipynb).
+ Se desactiva el [corrector estilo de Haskell](https://github.com/gibiansky/IHaskell/wiki#opt-no-lint).

In [1]:
:opt no-lint

Nota: En este tema se usarán las siguientes librerías

In [2]:
import Data.Char  
import Test.QuickCheck

# Generadores

**Definiciones por comprensión**

+ Definiciones por comprensión en Matemáticas:<br>
  $\{x^2 : x \in \{2,3,4,5\}\} = \{4,9,16,25\}$

+ Definiciones por comprensión en Haskell:

In [3]:
[x^2 | x <- [2..5]]

[4,9,16,25]

+ La expresión `x <- [2..5]` se llama un *generador*.

+ Ejemplos con más de un generador:

In [4]:
[(x,y) | x <- [1,2,3], y <- [4,5]]

[(1,4),(1,5),(2,4),(2,5),(3,4),(3,5)]

In [5]:
[(x,y) | y <- [4,5], x <- [1,2,3]]

[(1,4),(2,4),(3,4),(1,5),(2,5),(3,5)]

**Generadores dependientes**

+ Ejemplo con generadores dependientes:

In [6]:
[(x,y) | x <- [1..3], y <- [x..3]]

[(1,1),(1,2),(1,3),(2,2),(2,3),(3,3)]

+ `(concat xss)` es la concatenación de la lista de listas `xss`. Por ejemplo,

```
concat [[1,3],[2,5,6],[4,7]] == [1,3,2,5,6,4,7]
```

In [7]:
concat' :: [[a]] -> [a]
concat' xss = [x | xs <- xss, x <- xs]

In [8]:
concat' [[1,3],[2,5,6],[4,7]]

[1,3,2,5,6,4,7]

**Generadores con variables anónimas**

+ Ejemplo de generador con variable anónima: `(primeros ps)` es la lista de los
  primeros elementos de la lista de pares `ps`. Por ejemplo,

```sesion
primeros [(1,3),(2,5),(6,3)]  ==  [1,2,6]`
```

In [9]:
primeros :: [(a, b)] -> [a]
primeros ps =  [x | (x,_) <- ps]

In [10]:
primeros [(1,3),(2,5),(6,3)]

[1,2,6]

+ Definición de la longitud por comprensión

In [11]:
longitud :: [a] -> Int
longitud xs = sum [1 | _ <- xs]

In [12]:
longitud [4,2,7]

3

In [13]:
longitud "Sevilla"

7

# Guardas

+ Las listas por comprensión pueden tener *guardas* para restringir los valores.

+ Ejemplo de guarda:

In [14]:
[x | x <- [1..10], even x]

[2,4,6,8,10]

+ `(factores n)` es la lista de los factores del número `n`. Por ejemplo,

```sesion
factores 30  ==  [1,2,3,5,6,10,15,30]`
```

In [15]:
factores :: Int -> [Int]
factores n = [x | x <- [1..n], n `mod` x == 0]

In [16]:
factores 30

[1,2,3,5,6,10,15,30]

+ `(primo n)` se verifica si `n` es primo. Por ejemplo,

```sesion
primo 30  == False
primo 31  == True
```

In [17]:
primo :: Int -> Bool
primo n = factores n == [1, n]

In [18]:
primo 30

False

In [19]:
primo 31

True

+ `(primos n)` es la lista de los primos menores o iguales que `n`. Por
  ejemplo,

```sesion
primos 31  == [2,3,5,7,11,13,17,19,23,29,31]
```

In [20]:
primos :: Int -> [Int]
primos n = [x | x <- [2..n], primo x]

In [21]:
primos 31

[2,3,5,7,11,13,17,19,23,29,31]

**Guarda con igualdad**

+ Una *lista de asociación* es una lista de pares formado por una clave y un
  valor. Por ejemplo,

```sesion
[("Juan",7),("Ana",9),("Eva",3)]
```

+ `(busca c t)` es la lista de los valores de la lista de asociación `t` cuyas
  claves valen `c`. Por ejemplo

```sesion
busca 'b' [('a',1),('b',3),('c',5),('b',2)] ==  [3,2]
```

In [22]:
busca :: Eq a => a -> [(a, b)] -> [b]
busca c t = [v | (c', v) <- t, c' == c]

# La función `zip`

**La función `zip` y elementos adyacentes**

+ `(zip xs ys)` es la lista obtenida emparejando los elementos de las listas
  `xs` e `ys`. Por ejemplo,

```sesion
ghci> zip ['a','b','c'] [2,5,4,7]
[('a',2),('b',5),('c',4)]  
```

+ `(adyacentes xs)` es la lista de los pares de elementos adyacentes de la
  lista xs. Por ejemplo,

```sesion
adyacentes [2,5,3,7]  ==  [(2,5),(5,3),(3,7)]
```

In [23]:
adyacentes :: [a] -> [(a, a)]
adyacentes xs = zip xs (tail xs)

In [24]:
adyacentes [2,5,3,7]

[(2,5),(5,3),(3,7)]

**Las funciones `zip`, `and` y listas ordenadas**

+ `(and xs)` se verifica si todos los elementos de `xs` son
  verdaderos. Por ejemplo, 

In [25]:
and [2 < 3, 2+3 == 5]         

True

In [26]:
and [2 < 3, 2+3 == 5, 7 < 7]  

False

+ `(ordenada xs)` se verifica si la lista `xs` está ordenada. Por ejemplo,

```sesion
ordenada [1,3,5,6,7]  ==  True
ordenada [1,3,6,5,7]  ==  False
```

In [27]:
ordenada :: Ord a => [a] -> Bool
ordenada xs = and [x <= y | (x,y) <- adyacentes xs]

In [28]:
ordenada [1,3,5,6,7]

True

In [29]:
ordenada [1,3,6,5,7]

False

**La función `zip` y lista de posiciones**

+ `(posiciones x xs)` es la lista de las posiciones ocupadas por el elemento
  `x` en la lista `xs`. Por ejemplo,

```sesion
posiciones 5 [1,5,3,5,5,7]  ==  [1,3,4]
```

In [30]:
posiciones :: Eq a => a -> [a] -> [Int]
posiciones x xs = 
    [i | (x',i) <- zip xs [0..n], x == x']
    where n = length xs - 1

In [31]:
posiciones 5 [1,5,3,5,5,7]

[1,3,4]

# Comprensión de cadenas

**Cadenas y listas**

+ Las cadenas son listas de caracteres. Por ejemplo,

In [32]:
"abc" == ['a','b','c']

True

+ La expresión<br>
  `"abc" :: String`<br>
  es equivalente a<br>
  `['a','b','c'] :: [Char]`

+ Las funciones sobre listas se aplican a las cadenas:

In [33]:
length "abcde"              

5

In [34]:
reverse "abcde"             

"edcba"

In [35]:
"abcde" ++ "fg"             

"abcdefg"

In [36]:
posiciones 'a' "Salamanca"  

[1,3,5,8]

**Definiciones sobre cadenas con comprensión**

+ `(minusculas c)` es la cadena formada por las letras minúsculas de
  la cadena `c`. Por ejemplo,

```sesion
minusculas "EstoEsUnaPrueba"  ==  "stosnarueba"
```

In [37]:
minusculas :: String -> String
minusculas xs = [x | x <- xs, elem x ['a'..'z']]

In [38]:
minusculas "EstoEsUnaPrueba"

"stosnarueba"

+ `(ocurrencias x xs)` es el número de veces que ocurre el carácter
  `x` en la cadena `xs`. Por ejemplo,

```sesion
ocurrencias 'a' "Salamanca"  ==  4
```

In [39]:
ocurrencias :: Char -> String -> Int
ocurrencias x xs = length [x' | x' <- xs, x == x']  

In [40]:
ocurrencias 'a' "Salamanca"

4

# Cifrado César

+ En el [cifrado César](http://es.wikipedia.org/wiki/Cifrado_César) cada letra
  en el texto original es reemplazada por otra letra que se encuentra 3
  posiciones más adelante en el alfabeto.

+ La codificación de<br>
  `"en todo la medida"`<br>
  es<br>
  `"hq wrgr od phglgd"`
  
+ Se puede generalizar desplazando cada letra n posiciones.

+ La codificación con un desplazamiento 5 de<br>
  `"en todo la medida"`<br>
  es<br>
  `"js ytit qf rjinif"`<br>

+ La descodificación de un texto codificado con un desplazamiento n se
  obtiene codificándolo con un desplazamiento -n.

## Codificación y descodificación

**Las funciones `ord` y `char`**

+ `(ord c)` es el código del carácter `c`. Por ejemplo,

In [41]:
ord 'a'  

97

In [42]:
ord 'b'  

98

In [43]:
ord 'A'  

65

+ `(char n)` es el carácter de código `n`. Por ejemplo,

In [44]:
chr 97  

'a'

In [45]:
chr 98  

'b'

In [46]:
chr 65  

'A'

**Codificación y descodificación: Código de letra**

+ Simplificación: Sólo se codificarán las letras minúsculas dejando los
  restantes caracteres sin modificar.

+ `(let2int c)` es el entero correspondiente a la letra minúscula
  `c`. Por ejemplo,

```sesion
let2int 'a'  ==  0
let2int 'd'  ==  3
let2int 'z'  ==  25
```

In [47]:
let2int :: Char -> Int
let2int c = ord c - ord 'a'

In [48]:
let2int 'a'

0

In [49]:
let2int 'd'

3

In [50]:
let2int 'z'

25

**Codificación y descodificación: Letra de código**

+ `(int2let n)` es la letra minúscula correspondiente al entero `n`. Por
  ejemplo,

```sesion
int2let 0   ==  'a'
int2let 3   ==  'd'
int2let 25  ==  'z'
```

In [51]:
int2let :: Int -> Char
int2let n = chr (ord 'a' + n)

In [52]:
int2let 0   

'a'

In [53]:
int2let 3   

'd'

In [54]:
int2let 25  

'z'

**Codificación y descodificación: Desplazamiento**

+ `(desplaza n c)` es el carácter obtenido desplazando `n` caracteres el
  carácter `c`. Por ejemplo,

```sesion
desplaza   3  'a'  ==  'd'
desplaza   3  'y'  ==  'b'
desplaza (-3) 'd'  ==  'a'
desplaza (-3) 'b'  ==  'y'
```

In [55]:
desplaza :: Int -> Char -> Char
desplaza n c 
    | elem c ['a'..'z'] = int2let ((let2int c+n) `mod` 26)
    | otherwise         = c

In [56]:
desplaza   3  'a'  

'd'

In [57]:
desplaza   3  'y'  

'b'

In [58]:
desplaza (-3) 'd'  

'a'

In [59]:
desplaza (-3) 'b'  

'y'

**Codificación y descodificación**

+ `(codifica n xs)` es el resultado de codificar el texto `xs` con un
  desplazamiento `n`. 

In [60]:
codifica :: Int -> String -> String
codifica n xs = [desplaza n x | x <- xs]

In [61]:
codifica   3  "En todo la medida" 

"Eq wrgr od phglgd"

In [62]:
codifica (-3) "Eq wrgr od phglgd"   

"En todo la medida"

**Propiedades de la codificación con QuickCheck**

+ Propiedad: Al desplazar n un carácter desplazado n, se obtiene el carácter
  inicial.

In [63]:
prop_desplaza n xs = 
    desplaza (-n) (desplaza n xs) == xs

In [64]:
quickCheck prop_desplaza

+++ OK, passed 100 tests.

+ Propiedad: Al codificar con -n una cadena codificada con n, se obtiene la
  cadena inicial.

In [65]:
prop_codifica n xs = 
    codifica (-n) (codifica n xs) == xs

In [66]:
quickCheck prop_codifica

+++ OK, passed 100 tests.

## Análisis de frecuencias

**Tabla de frecuencias**

+ Para descifrar mensajes se parte de la
  [frecuencia de aparición de letras](http://es.wikipedia.org/wiki/Frecuencia_de_aparición_de_letras).

+ `tabla` es la lista de la frecuencias de las letras en castellano, Por
  ejemplo, la frecuencia de la `'a'` es del 12.53%, la de la `'b'` es 1.42%.

In [67]:
tabla :: [Float]
tabla = [12.53, 1.42, 4.68, 5.86, 13.68, 0.69, 1.01, 
          0.70, 6.25, 0.44, 0.01,  4.97, 3.15, 6.71, 
          8.68, 2.51, 0.88, 6.87,  7.98, 4.63, 3.93, 
          0.90, 0.02, 0.22, 0.90,  0.52]

**Frecuencias**

+ `(porcentaje n m)` es el porcentaje de `n` sobre `m`. Por ejemplo,

```sesion
porcentaje 2 5  ==  40.0  
```

In [68]:
porcentaje :: Int -> Int -> Float
porcentaje n m = (fromIntegral n / fromIntegral m) * 100

In [69]:
porcentaje 2 5

40.0

+ `(frecuencias xs)` es la frecuencia de cada una de las minúsculas
    de la cadena `xs`. Por ejemplo,

```sesion
ghci> frecuencias "en todo la medida"
[14.3,0,0,21.4,14.3,0,0,0,7.1,0,0,7.1,
 7.1,7.1,14.3,0,0,0,0,7.1,0,0,0,0,0,0]
```

In [70]:
frecuencias :: String -> [Float]
frecuencias xs = 
    [porcentaje (ocurrencias x xs) n | x <- ['a'..'z']]
    where n = length (minusculas xs)

In [71]:
frecuencias "en todo la medida"

[14.285715,0.0,0.0,21.428572,14.285715,0.0,0.0,0.0,7.1428576,0.0,0.0,7.1428576,7.1428576,7.1428576,14.285715,0.0,0.0,0.0,0.0,7.1428576,0.0,0.0,0.0,0.0,0.0,0.0]

## Descifrado

**Descifrado: Ajuste chi cuadrado**

+ Una medida de la discrepancia entre la distribución observada $os_i$ y
  la esperada $es_i$ es<br> 
  $\chi^2 = \displaystyle \sum_{i=0}^{n-1}\frac{(os_i-es_i)^2}{es_i}$<br>
  Los menores valores corresponden a menores discrepancias.

+ `(chiCuad os es)` es la medida chi cuadrado de las distribuciones `os` y
  `es`. Por ejemplo,

```sesion
chiCuad [3,5,6] [3,5,6]  ==  0.0
chiCuad [3,5,6] [5,6,3]  ==  3.9666667
```

In [72]:
chiCuad :: [Float] -> [Float] -> Float
chiCuad os es = 
    sum [((o-e)^2)/e | (o,e) <- zip os es]

In [73]:
chiCuad [3,5,6] [3,5,6]  

0.0

In [74]:
chiCuad [3,5,6] [5,6,3]  

3.9666667

**Descifrado: Rotación**

+ `(rota n xs)` es la lista obtenida rotando `n` posiciones los elementos de la
  lista `xs`. Por ejemplo,

```sesion
rota 2 "manolo"  ==  "noloma"  
```

In [75]:
rota :: Int -> [a] -> [a]
rota n xs = drop n xs ++ take n xs

In [76]:
rota 2 "manolo"

"noloma"

**Descifrado**

+ `(descifra xs)` es la cadena obtenida descodificando la cadena `xs` por el
  antidesplazamiento que produce una distribución de minúsculas con la
  menor desviación chi cuadrado respecto de la tabla de distribución de las
  letras en castellano. Por ejemplo,

```sesion
codifica 5 "Todo para nada" ==  "Ttit ufwf sfif"
descifra "Ttit ufwf sfif"   ==  "Todo para nada"
```

In [77]:
descifra :: String -> String
descifra xs =  codifica (-factor) xs
 where
  factor = head (posiciones (minimum tabChi) tabChi)
  tabChi = [chiCuad (rota n tabla') tabla | n <- [0..25]]
  tabla' = frecuencias xs

In [78]:
codifica 5 "Todo para nada" 

"Ttit ufwf sfif"

In [79]:
descifra "Ttit ufwf sfif"   

"Todo para nada"

# Bibliografía

+ R. Bird. *Introducción a la programación funcional con Haskell*. Prentice Hall, 2000.
    + Cap. 4: Listas.

+ G. Hutton. *Programming in Haskell*. Cambridge University Press.
    + Cap. 5: List comprehensions. 

+ B. O'Sullivan, D. Stewart y J. Goerzen. *Real World Haskell*. O'Reilly, 2008.
    + Cap. 12: Barcode Recognition.

+ B.C. Ruiz, F. Gutiérrez, P. Guerrero y J.E. Gallardo. *Razonando con
  Haskell*. Thompson, 2004.
    + Cap. 6: Programación con listas.

+ S. Thompson. *Haskell: The Craft of Functional Programming*, Second
  Edition. Addison-Wesley, 1999. 
    + Cap. 5: Data types: tuples and lists.