# Merge Sort

**Sortieren durch Zusammenfügen** arbeitet grundlegend anders als die Algorithmen, die Sie bisher gesehen haben und ist wesentlich schneller. Wie die Binäre Suche arbeitet Merge Sort nach dem Prinzip &laquo;Teile und Herrsche&raquo; (&laquo;Divide & Conquer&raquo;). 

---
**Ziele**

Sie können

* den Merge-Sort-Algorithmus in eigenen Worten beschreiben.
* zwei geordnete Listen geordnet zusammenfügen.
---

## Funktionsweise

**Aufgabe 1 – Funktionsweise von Merge Sort**

Schauen Sie sich die folgende Animation an und beschreiben Sie den Merge-Sort-Algorithmus in eigenen Worten.

<img src="./bilder/mergesort-algorithmus.gif" width="75%" />

Bei Interesse können Sie auch eine Visualisierung direkt auf [visualgo.net](https://visualgo.net/en/sorting?slide=11) anschauen.

Beschreiben Sie den Merge-Sort-Algorithmus in eigenen Worten.

In [None]:
# Machen Sie aus dieser Zelle eine Markdownzelle und 
# beschreiben Sie den Merge-Sort-Algorithmus in eigenen Worten.

Lösung:  
Beim Merge Sort wird die zu sortierende Liste so oft in zwei Hälften geteilt, bis nur noch einzelne Elemente (in Form von Listen mit einem Element) übrig bleiben. Listen mit einem Element sind immer sortiert. 

Anschliessend werden je zwei Listen zusammengesetzt, indem jeweils die vordersten Elemente verglichen und – falls nach aufsteigender Grösse sortiert werden soll – das kleinere (ansonsten das grössere) in eine neue Liste eingefügt. Dieser Vorgang wird so oft wiederholt, bis alle Teillisten wieder zu einer sortierten Liste zusammengesetzt sind.

**Aufgabe 2 – Merge Sort mit Papier**

Vor allem um das Teilen zu erfahren, sollten Sie Merge Sort auf Papier durchspielen.

Nehmen Sie dazu einen feinen Papierstreifen und schreiben Sie Zahlen drauf, z. B.

```Python
7 4 6 3 9 2 5 1
```

*Zerreissen* Sie anschliessend den Papierstreifen Schritt für Schritt und setzen Sie die Teilstücke wieder geordnet zusammen. Das Zerreissen an der richtigen Stelle ist wichtig, damit Sie sich die Funktionsweise des Algorithmus besser vorstellen und einprägen können.


## Aufteilen

Sie haben in der Animation beobachten können, dass die Liste ziemlich schnell aufgeteilt ist. Die Aufteilung geschieht nach demselben Prinzip wie bei der binären Suche.

Aber wie oft wird aufgeteilt? 

**Aufgabe 3 – Aufteilen**

Versuchen Sie herauszufinden, wie oft aufgeteilt werden muss.

<details>
    <summary>
        Hinweis 
    </summary>

Gehen Sie von kurzen Listen aus, empfohlen sind die Längen 1, 2, 3, 4, 5, 8 und 16.  
Sehen Sie eine Gesetzmässigkeit?
</details> 

In [1]:
# Ihre Ideen...

Lösung:  
Schauen Sie sich die folgende Animation an.

<img src="./bilder/mergesort-aufteilen.gif" width="100%" />

## Zusammenfügen (Merge)

Wenn Sie Merge Sort implementieren möchten, können Sie von den Einzelelementen ausgehen und diese sortiert zusammenfügen. Dazu müssen Sie sich überlegen, wie Sie zwei sortierte Listen zusammenfügen können.

Schauen Sie sich dazu die folgende Animation an.

<img src="./bilder/merge.gif" width="50%" />

**Aufgabe 4 – Zusammenfügen zweier aufsteigend sortierter Listen**

Erstellen Sie zwei geordnete Listen, `ungerade` mit den ungeraden Zahlen von 1 bis 9 und eine Liste gerade mit den geraden Zahlen von 2 bis 10.

Schreiben Sie anschliessend eine Funktion `merge(liste1, liste2)`, welche zwei Listen entgegennimmt und sie geordnet zusammenfügt.

In [None]:
# Ihr Code...

In [None]:
# Lösung:

# Die beiden Listen liste1 und liste2 bleiben unverändert, das Resultat wird in eine neue Liste geschrieben.
gerade = [2*x for x in range(1,6)]
print(gerade)
ungerade = [2*x-1 for x in range(1,6)]
print(ungerade)

def merge(liste1, liste2):
    sortierte_liste = [] # neue Liste, am Anfang noch leer
    index1 = 0 # zeigt auf das erste Element der Liste
    index2 = 0 # zeigt auf das erste Element der Liste
    # Solange index1 bzw. index2 noch in die Liste zeigt
    # werden die entsprechenden Elemente verglichen und 
    # das kleinere an die sortierte_liste angehängt,
    # danach muss der enstsprechende Index angepasst werden
    while index1<len(liste1) and index2<len(liste2): 
        if liste1[index1] < liste2[index2]:
            sortierte_liste.append(liste1[index1])
            index1 +=1
        else:
            sortierte_liste.append(liste2[index2])
            index2 += 1
    # Wenn eine Liste durchgearbeitet wurde, ist index1 oder index2 
    # nicht mehr in der Liste enthalten und der Rest der anderen Liste
    # kann an das Resultat angehängt werden.
    if index1 == len(liste1):
        sortierte_liste += liste2[index2:]
    else:
        sortierte_liste += liste1[index1:]
    return sortierte_liste

print(merge(ungerade, gerade))

**Challenge – Implementation Merge Sort**

Erstellen Sie nun eine Funktion `mergesort()`, welche eine Liste entgegennimmt und sortiert. Verwenden Sie zum Zusammenfügen die Funktion `merge()` von Aufgabe 4.

Tipps

* Den Teilprozess können Sie überspringen und gleich bei den Teillisten der Länge 1 beginnen. 
* Sie können eine neue Liste `teillisten` machen, welche die Teillisten enthält.
* In der Liste `teillisten` können Sie schliesslich jeweils zwei Listen in eine zusammenfügen.
  *Dabei werden aus zwei Teillisten eine...*
* An Anfang enthält `teillisten` soviele Elemente wie Elemente in der ursprünglichen Liste vorhanden sind.
* Wieviele Elemente sollte `teillisten` am Ende noch enthalten?

In [None]:
# Ihr Code...

In [None]:
# mögliche Lösung:

def mergesort(liste):
    
    # Eine Liste machen, die jeweils die Teillisten enthält
    teillisten = []

    # Aus jedem Listenelement eine Liste machen und sie in der Liste teillisten speichern
    # Die Teillisten (Elemente von teillisten) werden beim Zusammenfügen grösser werden,
    # die Liste teillisten wird immer kürzer werden
    for i in range(len(liste)):
        teillisten.append([liste[i]])

    # Solange teillisten mehr als ein Element drin hat, gibt es noch Teillisten, 
    # die noch zusammengesetzt werden müssen.
    while(len(teillisten) != 1):  
        i = 0        
        # Reihum müssen jeweils zwei Elemente aus teillisten zusammengefügt werden.
        while i < len(teillisten) - 1:
            # jeweils zwei benachbarte Teillisten in die erste "mergen"...
            teillisten[i] = merge(teillisten[i], teillisten[i+1])
            # ... und die zweite löschen
            teillisten.pop(i+1)
            i = i+1
                
        # Zur Kontrolle: Ausgabe der Liste teillisten, sie enthält den Stand nach den Merge-Vorgängen
        print(teillisten)

    # Am Ende der Schleife ist nur noch die sortierte (also vollständig zusammengefügte) Liste in teillisten.
    return teillisten[0]

liste = [10-x for x in range(10)]
mergesort(liste)


# Grafische Darstellung

Es ist möglich, Ihre Liste in einem Säulendiagramm grafisch darzustellen. Um hier abzukürzen ist die entsprechende Funktion `show_diagram()` gegeben. Sie nimmt folgende Parameter:
* `list`: Liste, die dargestellt werden soll
* `title`: Diagrammtitel (optional; Defaultwert: "Säulendiagramm")
* `sleep`: Wartezeit in Sekunden (optional, Defaultwert: 0.2)


Sie ist mit Kommentaren versehen, falls Sie sie verstehen möchten.

Führen Sie die folgenden beiden Zellen aus, um die Funktion verwenden zu können.
Die erste Zelle kümmert sich um die Imports. Falls die Bibliotheken nicht installiert sind, steht im Kommentar, wie Sie sie installieren können.

In [None]:
import matplotlib.pyplot as plt # PyPlot: Bibliothek für Visualisierungen (Plots)
import numpy as np # NumPy: Bibliothek für numerische Berechnungen
from IPython import display # <--- Jupyter-Notebook-spezifische Bibliothek (ausserhalb von Jupyter: löschen)

# In der Anacondadistribution ist matplotlib bereits vorinstalliert. 
# Falls Ihnen matplotlib oder numpy fehlen, können Sie diese wie folgt installieren, 
# kommentieren Sie die folgende Zeile ein (numpy wird mit matplotlib mitinstalliert):
# pip install matplotlib

def show_diagram(list, title = "Säulendiagramm", sleep = 0.2):

    # Den Output der aktuellen Zelle (des Jupyter Notebooks) löschen
    # parameter wait=True: warten, bis der neue Output bereitsteht
    display.clear_output(wait=True)
        
    # Balkenindex (x-Koordinaten der Balken)
    anzahl_elemente=len(list)
    bar_index = np.arange(anzahl_elemente)
    # Balkenbreite (1 bedeutet bis zum nächsten Balken)
    bar_width = 0.5

    # Titel
    plt.title(title)

    # Keine besondere Beschriftung der x- und y-Achsen:
    # plt.xticks und plt.yticks nicht definieren

    # Balkendiagramm
    plt.bar(bar_index, height=list, width=bar_width, color='blue')

    # Plot anzeigen 
    plt.show()
    
    # kurz warten, weil sonst nichts sichtbar
    plt.pause(sleep)


**Challenge 2 – Visualisierung**

Nun möchten Sie ihre Liste jedes Mal visualisieren, wenn ein Element neu einsortiert wurde.

Kopieren Sie dazu Ihre Implementation des Merge-Sort-Algorithmus in die untenstehende Zelle und rufen Sie die Funktion `show_diagram()` so auf, dass jeweils die neue Liste dargestellt wird, sobald ein Element einsortiert wurde.

Erstellen Sie noch einmal die drei Listen `aufsteigend`, `absteigend` und `zufaellig` und wenden Sie Ihre `mergessort()`-Funktion auf diese drei Listen an.

In [None]:
# Ihr Code

In [None]:
# Lösung:

def mergesort(liste, visualisierung=False):
    
        # Eine Liste machen, die jeweils die Teillisten enthält
    teillisten = []

    # Aus jedem Listenelement eine Liste machen und sie in der Liste teillisten speichern
    # Die Teillisten (Elemente von teillisten) werden beim Zusammenfügen grösser werden,
    # die Liste teillisten wird immer kürzer werden
    for i in range(len(liste)):
        teillisten.append([liste[i]])

    # Solange teillisten mehr als ein Element drin hat, gibt es noch Teillisten, 
    # die noch zusammengesetzt werden müssen.
    while(len(teillisten) != 1):  
        i = 0        
        # Reihum müssen jeweils zwei Elemente aus teillisten zusammengefügt werden.
        while i < len(teillisten) - 1:
            # jeweils zwei benachbarte Teillisten in die erste "mergen"...
            teillisten[i] = merge(teillisten[i], teillisten[i+1])
            # ... und die zweite löschen
            teillisten.pop(i+1)
            i = i+1
                
        # Zur Kontrolle: Ausgabe der Liste teillisten, sie enthält den Stand nach den Merge-Vorgängen
        # print(teillisten)
        if visualisierung:
            # Da die Liste in Listen aufgeteilt ist, müssen die einzelnen Elemente 
            # zur Visualisierung erst in eine neue (flache) Liste geschrieben werden...
            visualisierungs_liste = []
            for j in teillisten:
                for k in range(len(j)):
                    visualisierungs_liste.append(j[k])
            # ... dann kann die Liste visualisiert werden.
            show_diagram(visualisierungs_liste, "Merge Sort (Teillistenlänge "+ str(len(teillisten[0]))+")", sleep = 0.2)



    # Am Ende der Schleife ist nur noch die sortierte (also vollständig zusammengefügte) Liste in teillisten.
    return teillisten[0]

In [None]:
# Lösung:

laenge = 1000

aufsteigend = [x for x in range(laenge)]

mergesort(aufsteigend, True)
print(aufsteigend)

In [None]:
# Lösung:

absteigend  = [laenge-1-x for x in range(laenge)]

mergesort(absteigend, True)
print(absteigend)

In [None]:
# Lösung:

import random

zufaellig = [random.randint(1, 100) for x in range(laenge)]

mergesort(zufaellig, True)
print(zufaellig)

## Quiz

Alles klar?

Sie sollten Merge Sort nun in eigenen Worten beschreiben und Ihre Implementation erklären können.

Testen Sie Ihr Verständnis anhand der Fragen, die erstellt werden, wenn Sie die folgenden Zellen gemäss Ihrer Umgebung ausführen.

### NUR FALLS SIE AUF GOOGLE COLAB ARBEITEN

Führen Sie bitte die **beiden** folgenden Zellen aus, um die Bibliothek für das Quiz zu laden.

In [None]:
# NUR falls Sie AUF GOOGLE COLAB arbeiten:
# Führen Sie diese Zelle aus, um das Quiz zu sehen.

%%writefile quizclone.py
import os
from subprocess import getoutput
getoutput("git clone -l -s https://github.com/donze-informatikunterricht/quiz.git cloned-repo")
os.chdir('cloned-repo')
print('repo cloned successfully')

In [None]:
# NUR falls Sie AUF GOOGLE COLAB arbeiten:
# Führen Sie diese Zelle aus, um das Quiz zu sehen.

import quizclone

##### Quiz erstellen (unabhängig von Ihrer Arbeitsumgebung)

Nun können Sie das Quiz erstellen. Führen Sie dazu bitte die folgende Zelle aus.

Fragen 3 und 4 des Quiz basieren auf der folgenden Liste:

```python
a = [2, 3, 7, 1, 6, 8, 4, 0, 5, 9]
```

Bitte führen Sie die folgende Zelle aus, um das Quiz zu erstellen.

In [None]:
from IPython.display import display
import quiz

display(quiz.Q1_merge)
display(quiz.Q2_merge)
display(quiz.Q3_merge)
display(quiz.Q4_merge)
display(quiz.Q5_merge)

## Abschluss: Sortiertanz

Nun haben Sie sich mit dem Merge-Sort-Algorithmus auseinandergesetzt. 

Sehr empfehlenswert für Such- und Sortieralgorithmen ist der [YouTube-Kanal AlgoRythmics](https://www.youtube.com/channel/UCIqiLefbVHsOAXDAxQJH7Xw), der Algorithmen in Form von Tänzen präsentiert.

Führen Sie die folgende Zelle aus, um den Tanz zu Merge Sort sehen zu können.

In [None]:
# Führen Sie diese Zelle aus, um den Videoclip sehen zu können.

import IPython

IPython.display.IFrame(src="https://www.youtube.com/embed/XaqR3G_NVoo", width=560, height=315)