# Kapitel 9: Listen
[Chapter 9: Lists](https://colab.research.google.com/github/AllenDowney/ThinkPython/blob/v3/chapters/chap09.ipynb)

In diesem Kapitel lernen wir einen der nützlichsten eingebauten Datentypen von Python kennen: Listen. Wir lernen auch mehr über Objekte und was passieren kann, wenn es mehr als einen Namen für das gleiche Objekt gibt.

In den Übungen am Ende des Kapitels werden wir eine Wortliste erstellen und diese nutzen, um nach besonderen Worten wie zum Beispiel Palindromen und Anagrammen zu suchen.

### Ihre Lernziele:

Beschreiben Sie in 2-3 Stichpunkten kurz was Sie im Seminar heute lernen wollen. Klicken Sie dazu doppelt auf diesen Text und bearbeiten Sie dann den Text:

- 
- 
- 

## Exkurs: Was mir an Python gefällt
In dieser Rubrik, die immer am Anfang eines Kapitels steht, möchte ich Ihnen zeigen, wofür ich Python nutze und warum ich es mag. Sie werden vielleicht noch nicht verstehen, was ich genau mache, aber Sie sehen damit schon einmal die Möglichkeiten von Python und können später darauf zurückgreifen. Da dies auch ein Exkurs ist, können Sie diese Rubrik gerne auch erst einmal überspringen.

Die Python-Standardbibliothek bietet viele Module, die die Arbeit erleichtern. Beispielsweise ermöglicht das Modul [json](https://docs.python.org/3/library/json.html) das Lesen und Schreiben von [JSON](https://en.wikipedia.org/wiki/JSON)-Dateien:


In [None]:
import json                                  # Modul für JSON-Dateien
from collections import Counter              # wir wollen wieder etwas zählen

def count_words(counter, lines):             # eine Funktion zum Wörterzählen
    """Zählt die Vorkommen der Wörter in lines.
       counter: ein Zählobjekt (collections.Counter)
       lines: eine Liste von Zeichenketten
    """
    for line in lines:                       # alle Zeilen durchlaufen
        for word in line.split():            # Zeichenketten in Wörter aufteilen
            counter[word] += 1               # Vorkommen des Wortes zählen


nb = json.load(open("seminar11.ipynb", "r")) # Jupyter-Notebooks sind JSON-Dateien!
counter = Counter()                          # zählt Vorkommen von Wörtern

for c in nb["cells"]:                        # über alle Zellen iterieren
    if c["cell_type"] == "markdown":         # für jede Markdown-Zelle ...
        count_words(counter, c["source"])    # Wörter im Text zählen

for word, freq in counter.most_common(10):   # die zehn häufigsten Wörter finden ...
    print(word, freq, sep='\t')              # und ausgeben

## Herunterladen des unterstützenden Codes
Die folgende Zelle lädt eine Datei herunter und führt einen Code aus, der speziell für dieses Notebook verwendet wird. Sie müssen diesen Code nicht verstehen, aber Sie sollten die Zelle vor allen weiteren Zellen in diesem Notebook ausführen:

In [None]:
from os.path import basename, exists

def download(url):
    filename = basename(url)
    if not exists(filename):
        from urllib.request import urlretrieve

        local, _ = urlretrieve(url, filename)
        print("Downloaded " + str(local))
    return filename

download('https://github.com/AllenDowney/ThinkPython/raw/v3/thinkpython.py');
download('https://github.com/AllenDowney/ThinkPython/raw/v3/diagram.py');

import thinkpython

## Eine Liste ist eine Folge

Wie eine Zeichenkette, ist eine **Liste** (Englisch: *list*) eine Folge (Englisch: *sequence*) von Werten. In einer Zeichenkette sind die Werte Zeichen; in einer Listen können sie von jedem Typ sein. Die Werte in einer Liste heißen **Elemente** (Englisch: *items* oder *elements*).

Es gibt mehrere Möglichkeiten, eine neue Liste zu erzeugen. Die einfachste ist es, Elemente in eckigen Klammern einzuschließen (`[` und `]`).
Hier ist zum Beispiel eine Liste mit zwei ganzen Zahlen:

In [None]:
zahlen = [42, 123]

Und diese Liste enthält drei Zeichenketten:

In [None]:
käse = ['Cheddar', 'Edamer', 'Gouda']

Die Elemente einer Liste müssen nicht vom gleichen Typ sein. Die folgende Liste enthält eine Zeichenkette, eine Gleitkommazahl, eine ganze Zahl und (ja!) eine andere Liste:

In [None]:
t = ['spam', 2.0, 5, [10, 20]]

Eine Liste innerhalb einer anderen Liste ist **verschachtelt** (Englisch: *nested*).

Eine Liste, die keine Elemente enthält wird **leere Liste** genannt. Wir können Sie mit Hilfe von leeren Klammern erzeugen:

In [None]:
leer = []

Die `len`-Funktion gibt die Länge einer Liste zurück:

In [None]:
len(käse)

Die Länge einer leeren Liste ist `0`:

In [None]:
len(leer)

Die folgende Abbildung zeigt Zustandsdiagramme für `käse`, `zahlen` und `leer`:

In [None]:
from diagram import make_list, Binding, Value

list1 = make_list(käse, dy=-0.3, offsetx=0.17)
binding1 = Binding(Value('käse'), list1)

list2 = make_list(zahlen, dy=-0.3, offsetx=0.17)
binding2 = Binding(Value('zahlen'), list2)

list3 = make_list(leer, dy=-0.3, offsetx=0.1)
binding3 = Binding(Value('leer'), list3)

In [None]:
from diagram import diagram, adjust, Bbox

width, height, x, y = [3.66, 1.58, 0.45, 1.2]
ax = diagram(width, height)
bbox1 = binding1.draw(ax, x, y)
bbox2 = binding2.draw(ax, x+2.25, y)
bbox3 = binding3.draw(ax, x+2.25, y-1.0)

bbox = Bbox.union([bbox1, bbox2, bbox3])
#adjust(x, y, bbox)

Listen werden durch Kästen dargestellt, die innen die nummerierten Elemente der Liste enthalten und an denen außen das Wort "list“ steht.

## Listen sind veränderbar

Die Syntax, um auf Elemente einer Liste zuzugreifen, ist die gleiche wie die zum Zugriff auf die Zeichen einer Zeichenkette: der Klammer-Operator. Der Ausdruck innerhalb der Klammern gibt den Index an. Denken Sie daran, dass die Zählung der Indizes mit `0` beginnt:

In [None]:
käse[0]

Anders als Zeichenketten sind Listen veränderbar. Wenn der Klammer-Operator auf der linken Seite einer Zuweisung auftaucht, identifiziert er das Element der Liste, dessen Wert geändert wird:

In [None]:
zahlen[1] = 17
zahlen

Das zweite Element von `numbers`, welches `123` war, ist jetzt  `17`.

Listenindizes funktionieren genauso wie Indizes bei Zeichenketten:
- Jeder Ausdruck, der eine ganze Zahl ergibt, kann als Index verwendet werden.
- Wenn wir versuchen, ein Element zu lesen oder zu schreiben, welches nicht existiert, erhalten wir einen `IndexError`.
- Wenn ein Index einen negativen Wert hat, zählt er rückwärts vom Ende der Liste.

Der `in`-Operator funktioniert auch für Listen:

In [None]:
'Edamer' in käse

In [None]:
'Wensleydale' in käse

Obwohl eine Liste eine andere Liste enthalten kann, zählt die verschachtelte Liste trotzdem als einzelnes Element -- die folgende Liste enthält also nur vier Elemente:

In [None]:
t = ['spam', 2.0, 5, [10, 20]]
len(t)

Und `10` wird nicht als Element von `t` betrachtet, da es ein Element der verschachtelten Liste und keines von `t` ist:

In [None]:
10 in t

## Listen-Segmente

Der `slice`-Operator funktioniert mit Listen genauso wie mit Zeichenketten.
Im folgenden Beispiel werden das zweite und dritte Element aus einer Liste mit vier Buchstaben ausgewählt:

In [None]:
buchstaben = ['a', 'b', 'c', 'd']
buchstaben[1:3]

Wenn wir den ersten Index weglassen, dann beginnt das Segment mit dem Anfang der Liste:

In [None]:
buchstaben[:2]

Wenn wir den zweiten Index weglassen, dann geht das Segment bis zum Ende der Liste:

In [None]:
buchstaben[2:]

Wenn wir also beide weglassen, dann ist das Segment eine Kopie der gesamten Liste:

In [None]:
buchstaben[:]

Ein weiterer Weg, eine Liste zu kopieren, ist die `list`-Funktion zu verwenden:

In [None]:
list(buchstaben)

Weil `list` schon der Name einer eingebauten Funktion ist, sollten Sie es vermeiden, diesen als Variablennamen zu verwenden.


## Listenoperatoren

Der `+`-Operator verknüpft Listen:

In [None]:
t1 = [1, 2]
t2 = [3, 4]
t1 + t2

Der `*`-Operator wiederholt eine Liste so oft wie angegeben:

In [None]:
['spam'] * 4

Darüber hinaus sind keine der anderen mathematischen Operatoren mit Listen verwendbar, aber die eingebaute Funktion `sum` addiert die Elemente der Liste:

In [None]:
sum(t1)

Und `min` und `max` finden jeweils das kleinste und das größte Element:

In [None]:
min(t1)

In [None]:
max(t2)

## Methoden für Listen

Python stellt Methoden zur Verfügung, die auf Listen angewendet werden können. `append` fügt zum Beispiel ein neues Element am Ende einer Liste hinzu:

In [None]:
buchstaben.append('e')
buchstaben

`extend` nimmt eine Liste als Argument auf und hängt alle Elemente an:

In [None]:
buchstaben.extend(['f', 'g'])
buchstaben

Es gibt zwei Methoden, um Elemente einer Liste zu entfernen.
Wenn wir den Index des gewünschten Elements kennen, können wir `pop` verwenden:

In [None]:
t = ['a', 'b', 'c']
t.pop(1)

Der Rückgabewert ist das Element, das entfernt wurde.
Nun können wir überprüfen, ob die Liste angepasst wurde:

In [None]:
t

Wenn wir das Element kennen, dass wir entfernen wollen (aber nicht dessen Index), können wir `remove` verwenden:

In [None]:
t = ['a', 'b', 'c']
t.remove('b')

Der Rückgabewert von `remove` ist `None`.
Aber wir können auch hier durch eine Überprüfung bestätigen, dass die Liste verändert wurde:

In [None]:
t

Wenn das Element, das wir versuchen zu entfernen kein Teil der Liste ist, führt das zu einem `ValueError`:

In [None]:
%%expect ValueError

t.remove('d')

## Listen und Zeichenketten

Eine Zeichenkette ist eine Folge von Zeichen und eine Liste ist eine Folge von Werten, aber eine Liste von Zeichen ist nicht das gleiche wie eine Zeichenkette. Um eine Zeichenkette in eine Liste von Zeichen zu konvertieren, können wir die Funktion `list` verwenden:


In [None]:
s = 'spam'
t = list(s)
t

Die `list`-Funktion teilt eine Zeichenkette in die individuellen Zeichen auf. Wenn wir eine Zeichenkette in die enthaltenen Wörter aufteilen wollen, können wir die `split`-Methode verwenden:

In [None]:
s = 'Sehnsucht nach den Fjorden'
t = s.split()
t

Ein optionales Argument, genannt **Trennzeichen** (Englisch: *delimiter*) gibt an, welche Zeichen als Wortgrenzen verwendet werden sollen. Im folgenden Beispiel wird ein Bindestrich als Trennzeichen verwenden:

In [None]:
s = 'Ex-Papagei'
t = s.split('-')
t

Das Gegenstück zu `split` ist `join`. Die Methode erwartet eine Liste von Zeichenketten und verkettet die einzelnen Elemente. `join` ist eine Zeichenketten-Methode, daher müssen wir sie auf ein Trennzeichen anwenden und die Liste als Parameter übergeben:

In [None]:
trennzeichen = ' '
t = ['Sehnsucht', 'nach', 'den', 'Fjorden']
s = trennzeichen.join(t)
s

In diesem Fall ist das Trennzeichen das Leerzeichen, so dass `join` ein Leerzeichen zwischen die Wörter setzt. Um die Zeichenketten ohne Trennzeichen miteinander zu verketten, können wir die leere Zeichenkette  `''` als Trennzeichen verwenden.

## Eine Liste durchlaufen

Wir können eine `for`-Anweisung verwenden, um in einer Schleife durch die Elemente einer Liste zu laufen:

In [None]:
for käse in käse:
    print(käse)

Wir können `for` zum Beispiel verwenden, nachdem wir mit `split` eine Liste mit Wörtern erstellt haben, um diese zu durchlaufen:

In [None]:
s = 'Sehnsucht nach den Fjorden'

for word in s.split():
    print(word)

Eine `for`-Schleife über einer leeren Liste führt die eingerückten Anweisungen niemals aus:

In [None]:
for x in []:
    print('Das passiert nie.')

## Listen sortieren

Python stellt eine eingebaute Funktion namens `sorted` zur Verfügung, die die Elemente einer Liste sortiert:

In [None]:
durcheinander = ['c', 'a', 'b']
sorted(durcheinander)

Die ursprüngliche Liste bleibt unverändert:

In [None]:
durcheinander

`sorted` funktioniert mit jeder Art von Abfolge, nicht nur Listen. Also können wir so auch die Buchstaben einer Zeichenkette sortieren:

In [None]:
sorted('buchstaben')

Das Ergebnis ist eine Liste.
Um diese in eine Zeichenkette umzuwandeln können wir `join` verwenden:

In [None]:
''.join(sorted('buchstaben'))

Mit einer leeren Zeichenkette als Trennzeichen werden die Elemente der Liste ohne etwas dazwischen zusammengefügt.

## Objekte und Werte

Wenn wir diese beiden Zuweisungen ausführen:

In [None]:
a = 'banana'
b = 'banana'

wissen wir, dass sowohl `a` als auch `b` auf eine Zeichenkette verweisen, aber wir wissen nicht, ob sie auf *dieselbe* Zeichenkette verweisen. Es gibt zwei mögliche Zustände:

In [None]:
from diagram import Frame, Stack

s = 'banana'
bindings = [Binding(Value(name), Value(repr(s))) for name in 'ab']
frame1 = Frame(bindings, dy=-0.25)

binding1 = Binding(Value('a'), Value(repr(s)), dy=-0.11)
binding2 = Binding(Value('b'), draw_value=False, dy=0.11)
frame2 = Frame([binding1, binding2], dy=-0.25)

stack = Stack([frame1, frame2], dx=1.7, dy=0)

In [None]:
width, height, x, y = [2.85, 0.76, 0.17, 0.51]
ax = diagram(width, height)
bbox = stack.draw(ax, x, y)
# adjust(x, y, bbox)

Im ersten Fall verweisen `a` und `b` auf zwei unterschiedliche **Objekte** (Englisch: *object*), die den gleichen Wert haben. Im zweiten Fall verweisen sie auf dasselbe Objekt.

Um zu prüfen, ob zwei Variablen auf dasselbe Objekt verweisen, können wir den `is`-Operator verwenden:

In [None]:
a = 'banana'
b = 'banana'
a is b

In diesem Beispiel erzeugt Python nur ein Zeichenketten-Objekt und sowohl `a` als auch `b` verweisen darauf. Wenn wir jedoch zwei Listen erzeugen, erhalten wir zwei Objekte:

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

Das Zustandsdiagramm sieht in diesem Fall so aus:

In [None]:
t = [1, 2, 3]
binding1 = Binding(Value('a'), Value(repr(t)))
binding2 = Binding(Value('b'), Value(repr(t)))
frame = Frame([binding1, binding2], dy=-0.25)

In [None]:
width, height, x, y = [1.16, 0.76, 0.21, 0.51]
ax = diagram(width, height)
bbox = frame.draw(ax, x, y)
# adjust(x, y, bbox)

In diesem Fall würden wir sagen, dass die beiden Listen **äquivalent** (Englisch: *equivalent*) sind, denn sie enthalten die gleichen Elemente, aber sie sind nicht **identisch** (Englisch: *identical*), denn sie sind nicht das selbe Objekt. Wenn zwei Objekte identisch sind, sind sie auch äquivalent; aber wenn sie äquivalent sind, sind sie nicht notwendig auch identisch.

## Aliasing

Wenn `a` auf ein Objekt verweist und wir die Zuweisung `b = a` ausführen, dann verweisen beide Variablen auf dasselbe Objekt:

In [None]:
a = [1, 2, 3]
b = a
b is a

Das Zustandsdiagramm sieht dann folgendermaßen aus:

In [None]:
t = [1, 2, 3]
binding1 = Binding(Value('a'), Value(repr(t)), dy=-0.11)
binding2 = Binding(Value('b'), draw_value=False, dy=0.11)
frame = Frame([binding1, binding2], dy=-0.25)

In [None]:
width, height, x, y = [1.11, 0.81, 0.17, 0.56]
ax = diagram(width, height)
bbox = frame.draw(ax, x, y)
# adjust(x, y, bbox)

Die Verbindung einer Variable mit einem Objekt wird **Referenz** (Englisch: *reference*) genannt. In diesem Beispiel gibt es zwei Referenzen auf das selbe Objekt.

Ein Objekt mit mehr als einer Referenz hat mehr als einen Namen, daher sagen wir, dass dieses Objekt ein **Alias** besitzt. 

Falls das Objekt mit Alias veränderbar ist, dann betreffen Veränderungen, die an einem Alias vorgenommen werden auch das andere.

Verändern wir in diesem Beispiel also das Objekt, auf das sich `b` bezieht, verändern wir auch das Objekt, auf das sich `a` bezieht:

In [None]:
b[0] = 5
a

Also würden wir hier sagen, dass `a` diese Veränderung "sieht".
Obwohl dieses Verhalten nützlich sein kann, ist es auch fehleranfällig. Im Allgemeinen ist es sicherer, **Aliasing** (Englisch:**) zu vermeiden wenn wir mit veränderbaren Objekten arbeiten.

Bei unveränderbaren Objekte wie z.B. Zeichenketten ist Aliasing kein großes Problem. Im Beispiel:

In [None]:
a = 'banana'
b = 'banana'

macht es so gut wie nie einen Unterschied, ob `a` und `b` auf die gleiche Zeichenkette verweisen oder nicht.

## Listenargumente

Wenn Sie eine Liste an eine Funktion übergeben, erhält die Funktion eine Referenz zur Liste. Wenn die Funktion die Liste abändert, sieht der Aufrufer die Änderung. Zum Beispiel verwendet `pop_first` die Listenmethode `pop`, um das erste Element aus einer Liste zu entfernen:

In [None]:
def pop_first(lst):
    return lst.pop(0)

Wir können das so verwenden:

In [None]:
buchstaben = ['a', 'b', 'c']
pop_first(buchstaben)

Der Rückgabewert ist das erste Element, das aus der Liste entfernt wurde -- wie wir durch Anzeigen der veränderten Liste sehen können:

In [None]:
buchstaben

In diesem Beispiel sind der Parameter `lst` und die variable `buchstaben` Aliase desselben Objekts, das Zustandsdiagramm sieht also so aus:

In [None]:
lst = make_list('abc', dy=-0.3, offsetx=0.1)
binding1 = Binding(Value('buchstaben'), draw_value=False)
frame1 = Frame([binding1], name='__main__', loc='left')

binding2 = Binding(Value('lst'), draw_value=False, dx=0.61, dy=0.35)
frame2 = Frame([binding2], name='pop_first', loc='left', offsetx=0.08)

stack = Stack([frame1, frame2], dx=-0.3, dy=-0.5)

In [None]:
width, height, x, y = [2.04, 1.24, 1.06, 0.85]
ax = diagram(width, height)
bbox1 = stack.draw(ax, x, y)
bbox2 = lst.draw(ax, x+0.5, y)
bbox = Bbox.union([bbox1, bbox2])
#adjust(x, y, bbox)

Eine Referenz zu einem Objekt als Argument an eine Funktion zu übergeben, stellt eine Form des Aliasing dar.
Wenn die Funktion das Objekt verändert, bleiben diese Änderungen auch bestehen, nachdem die Funktion durchgelaufen ist:

## Erstellen einer Wortliste

Im vorherigen Kapitel haben wir die Datei `words.txt` gelesen und nach Wörtern mit bestimmten Eigenschaften, zum Beispiel die Verwendung des Buchstaben `e`, durchsucht.
Allerdings haben wir hierfür die gesamte Datei sehr oft gelesen, was nicht effizient ist.
Es ist besser, die Datei nur einmal zu lesen und die Wörter einer Liste hinzuzufügen.
Die folgende Schleife zeigt wie das geht:

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/words.txt');

In [None]:
word_list = []

for line in open('words.txt'):
    word = line.strip()
    word_list.append(word)
    
len(word_list)

Vor der Schleife wird `word_list` mit einer leeren Liste initialisiert.
Bei jedem Durchlauf der Schleife fügt die `append`-Methode ein Wort am das Ende der Liste hinzu.
Wenn die Schleife endet, enthält die Liste mehr als 113.000 Wörter.

Eine andere Art, das zu tun, ist `read` zu verwenden, um die gesamte Datei in eine Zeichenkette einzulesen:

In [None]:
string = open('words.txt').read()
len(string)

Das Ergebnis ist eine einzelne Zeichenkette mit mehr als einer Millionen Zeichen.
Wir können die `split`-Methode verwenden, um diese in eine Liste aus Wörtern aufzuteilen:

In [None]:
word_list = string.split()
len(word_list)

Jetzt können wir, um zu überprüfen, ob eine Zeichenkette in der Liste auftaucht, den `in`-Operator verwenden.
Das englische Wort `'demiotic'` befindet sich zum Beispiel in der Liste:

In [None]:
'demotic' in word_list

`'contrafibularities'` hingegen ist nicht auf der Liste zu finden. (*Anmerkung: 'contrafibularieties' ist ein erfundenes Wort aus der britischen Serie "Blackadder"*)

In [None]:
'contrafibularities' in word_list

Und ich muss sagen, dass ich darüber 'anaspeptic' bin. (*Anmerkung: 'anaspeptic' ist ebenfalls ein erfundenes Wort aus "Blackadder"*)

## Debugging

### Denken Sie daran, dass die meisten Methoden für Listen das Argument verändern und `None` zurückgeben.
Das ist das Gegenteil von Methoden für Zeichenketten, die eine neue Zeichenkette zurückgeben und das Original nicht verändern.

Wenn Sie daran gewöhnt sind, auf diese Weise Code für Zeichenketten zu schreiben:

In [None]:
word = 'Gefieder!'
word = word.strip('!')
word

ist es verlockend, solchen Code für Listen zu schreiben:

In [None]:
t = [1, 2, 3]
t = t.remove(3)  # FALSCH!

`remove` verändert die Liste und gibt `None` zurück, die nächste Operation, die Sie versuchen mit `t` auszuführen wird also wahrscheinlich fehlschlagen:

In [None]:
%%expect AttributeError

t.remove(2)

Diese Fehlermeldung benötigt einiges an Erklärung.
Ein **Attribut** eines Objekts ist eine Variable oder eine Methode, die damit in Verbindung steht.
In diesem Fall ist der Wert von `t` `None`, was ein `NoneType`-Objekt ist. Dieses hat kein Attribut namens `remove`, also ist das Ergebnis ein `AttributeError`.

Wenn Sie eine solche Fehlermeldung sehen sollten Sie rückwärts durch das Programm gehen, um festzustellen, ob Sie vielleicht eine Listen-Methode falsch aufgerufen haben.

## Glossar

Legen wir uns eine Liste mit den wichtigsten Begriffen an, die wir im Kapitel 9 gelernt haben:

- Liste: eine Folge von Werten
- Element:
- verschachtelte Liste: 
- Objekt:
- äquivalent:
- identisch:
- Referenz:
- Aliasing:
- Trennzeichen:
- Attribut: einer der benannten Werte, die mit einem Objekt verknüpft sind

Ergänzen Sie die Liste in eigenen Worten. Das ist eine gute Erinnerungs- und Übungsmöglichkeit.


## Übung


In [None]:
# Diese Zelle weist Jupyter an, detallierte Debugging-Informationen auszugeben, wenn ein Laufzeitfehler
# passiert. Lassen Sie sie daher laufen, bevor Sie beginnen an den Aufgaben zu arbeiten.

%xmode Verbose

### Fragen Sie einen virtuellen Assistenten

In diesem Kapitel habe ich die Wörter "contrafibularities" und "anaspeptic" verwendet, die gar keine echten englischen Wörter sind.
Sie wurden in der britischen TV-Serie *Blackadder*, in Staffel 3, Folge 2, "Leidende Literaten" (Englisch: *"Ink and Incapability"*) verwendet.

Als ich allerdings ChatGPT 3.5 (Version vom 03. August 2023) fragte, wo diese Wörter herkommen, behauptete es zunächst, sie kämen von Monty Python, und später, sie seien aus dem Stück *Rosencrantz und Guildenstern sind tot* von Tom Stoppard.

Wenn Sie jetzt diese Frage stellen, erhalten Sie vielleicht ein anderes Ergebnis.
Aber dieses Beispiel ist eine Erinnerung daran, dass virtuelle Assistenten nicht immer zuverlässig sind und Sie daher immer überprüfen sollten, ob die Ergebnisse korrekt sind.
Mit zunehmender Erfahrung werden Sie ein Gespür dafür entwickeln, welche Fragen virtuelle Assistenten zuverlässig beantworten können.
In diesem Beispiel kann eine einfache Web-Suche die Quelle der Wörter schnell identifizieren.

Wenn Sie bei einer der Übungen zu diesem Kapitel hängenbleiben, denken Sie darüber nach, einen virtuellen Assistenten um Hilfe zu fragen.
Wenn Sie ein Ergebnis erhalten, das Funktionen verwendet, die wir noch nicht gelernt haben, können Sie dem VA eine "Rolle" zuweisen.

Probieren Sie zum Beispiel "Rolle: Lehrer für grundlegende Python-Programmierung" einzugeben, bevor Sie eine Frage stellen.
Wenn Sie immer noch Funktionen sehen, die Sie noch nicht kennen, können sie im Anschluss fragen: "Kannst du das umschreiben und diesmal nur grundlegende Python-Funktionen verwenden?".

### Aufgabe 1

Zwei Wörter bilden ein *Anagramm*, wenn wir die Buchstaben des einen Wortes so anordnen können, dass sich das andere Wort ergibt. (Beispielsweise bilden *ATLAS* und *SALAT* ein Anagramm.) Schreiben Sie eine Funktion `is_anagram`, die zwei Zeichenketten erwartet und `True` zurückgibt, falls sie ein Anagramm bilden (sonst `False`). 


<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Ein Anagramm liegt dann vor, wenn die Zeichen in einer Zeichenkette und die Zeichen in einer anderen Zeichenkette genau die gleichen sind. Wie können Sie das überprüfen?
      
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Zeichenketten und Listen verhalten sich sehr ähnlich. Sie können die `sorted`-Funktion auf Zeichenketten anwenden und erhalten eine sortierte Liste von Zeichen in einer Zeichenkette. Bilden zwei Zeichenketten ein Anagramm sind die sortierten Listen gleich. Gehen Sie analog zu `is_sorted()` vor um zu prüfen, ob die Zeichenketten gleich sind.
      
  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wenn Sie sich im englischsprachigen Raum bewegen, sind sie nun fertig, da Sie Groß- und Kleinschreibung ignorieren können. Wenn wir für die deutsche Sprache akurate Ergebnisse erhalten wollen, müssen wir sicherstellen, dass die Zeichenketten nur Kleinbuchstaben enthält, da sonst zum Beispiel 'Lager' und 'Regal' nicht gleich sind. Wie können wir sicherstellen, dass dies der Fall ist? (D.h. gegebenenfalls Großbuchstaben umwandeln?)

  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Verwenden Sie die Zeichenkettenmethode `lower()` um die Zeichenkette umzuwandeln. Vergessen Sie nicht, die aktualisierten Zeichenketten zu speichern. Testen Sie Ihre Funktion mit Groß- und Kleinbuchstaben.
  </div>       
</details>

In [None]:
def is_anagram(v, w):
    pass
    # Implementieren Sie hier die Funktion

Sie können `doctest` verwenden, um Ihre Funktion zu testen:

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
    run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(is_anagram)

Finden Sie unter Verwendung Ihrer Funktion und der Wortliste alle Anagramme von `takes`.


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def is_anagram(word1, word2):
    """Checks whether two words are anagrams

    word1: string or list
    word2: string or list

    returns: boolean
    """

    return sorted(word1) == sorted(word2)


### Aufgabe 2

Python stellt eine eingebaute Funktion namens `reversed` zur Verfügung, die als Argument eine Abfolge von Elementen -- wie eine Liste oder Zeichenkette -- aufnimmt und ein `reversed`-Objekt zurückgibt, das die Elemente in umgekehrter Reihenfolge enthält:

In [None]:
reversed('parrot')

Wenn Sie diese umgekehrten Elemente in einer Liste speichern wollen, können Sie die `list`-Funktion verwenden:

In [None]:
list(reversed('parrot'))

Wie in den Kapiteln zuvor erklärt, ist ein Palindrom ist ein Wort, welches vorwärts und rückwärts gleich geschrieben wird, wie "Rentner" oder "Regallager".
Schreiben Sie die Funktion `is_palindrome` um. Nutzen Sie hierzu die neuen Funktionen aus dieser Lektion: `reversed`, `list` und `join`.

Hier ist eine Struktur für die Funktion, die Doctests enthält, mit denen Sie Ihre Funktion testen können.

In [None]:
def is_palindrome(word):
    """Prüfen ob ein Wort ein Palindrom ist.
    
    >>> is_palindrome('bob')
    True
    >>> is_palindrome('alice')
    False
    >>> is_palindrome('a')
    True
    >>> is_palindrome('')
    True
    """
    return False


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def is_palindrome(word):
    """Prüfen ob ein Wort ein Palindrom ist.
    
    >>> is_palindrome('bob')
    True
    >>> is_palindrome('alice')
    False
    >>> is_palindrome('a')
    True
    >>> is_palindrome('')
    True
    """
    return word == ''.join(reversed(word)) 

In [None]:
run_doctests(is_palindrome)

Sie können die folgende Schleife verwenden, um alle Palindrome in der Wortliste zu finden, die mindestens 7 Buchstaben haben:

In [None]:
for word in word_list:
    if len(word) >= 7 and is_palindrome(word):
        print(word)

### Aufgabe 3

Schreiben Sie eine Funktion namens `reverse_sentence`, die als Argument eine Zeichenkette mit einer beliebigen Anzahl durch Leerzeichen getrennter Wörter enthält.
Sie sollte eine neue Zeichenkette zurückgeben, die die gleichen Wörter in umgekehrter Reihenfolge enthält.
Wenn das Argument zum Beispiel "Drehe diesen Satz um" ist, sollte das Ergebnis "Um Satz diesen drehe" sein.

Tipp: Sie können die `capitalize`-Methoden verwenden, um den ersten Buchstaben des ersten Wortes großzuschreiben. 

Für den Anfang ist hier eine Gliederung der Funktion mit Doctests:

In [None]:
def reverse_sentence(input_string):
    ''' Kehre die Reihenfolge der Wörter eines Strings um und schreibe das erste Wort groß.
    
    >>> reverse_sentence('Schreibe diesen Satz umgekehrt')
    'Umgekehrt Satz diesen Schreibe'
    
    >>> reverse_sentence('Python')
    'Python'
    
    >>> reverse_sentence('')
    ''
    
    >>> reverse_sentence('One for all and all for one')
    'One for all and all for one'
    '''

    return None

In [None]:
run_doctests(reverse_sentence)

### Aufgabe 4

Schreiben Sie eine Funktion namens `total_length`, die eine Liste mit Zeichenketten aufnimmt und die Gesamtlänge der Zeichenketten zurückgibt.
Die Gesamtlänge der Wörter in `word_list` sollte $902{.}728$ sein.

### Aufgabe 5
Schreiben Sie eine Funktion `nested_sum`, die eine Liste von Listen von ganzen Zahlen erwartet, die Werte der einzelnen Elemente aufaddiert und das Ergebnis zurückgibt. Beispielsweise sollte die Funktion für die Liste `t = [[1, 2], [3], [4, 5, 6]]` den Wert `21` zurückgeben.



<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wie immer schreiben wir zuerst den Kopf der Funktion mit den nötigen Parametern und eine `return`-Anweisung mit einem Platzhalter.
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
In diesem Notebook wird eine Funktion vorgestellt, mit der Sie die Summe einer einzelnen Liste berechnen können. Schauen Sie nach, wie diese Funktion heißt und überlegen Sie, wie Sie diese Funktion hier verwenden können.

  </div>       
</details>  
  
  
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Um die Funktion nutzen zu können, die die Summe einer einzelnen Liste berechnet, müssen Sie auf die einzelnen Elemente der Liste von Listen zugreifen. Dafür verwenden Sie eine `for`- Schleife.
    
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Sie brauchen eine Variable, in der Sie die Summen der untergeordneten Listen zusammenaddieren und speichern können.
      
  </div>       
</details>  
  
  

<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Sie müssen die Variable außerhalb der `for`-Schleife implementieren. Setzen Sie innerhalb der `for`-Schleife diese Variable immer gleich des aktuellen Wertes plus der Summe der aktuellen Subliste. Am Ende geben Sie diese Zahl aus. 
      
    </div>       
</details>  

In [None]:
def nested_sum(t):
    # Implementieren Sie hier die Funktion
    pass


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def nested_sum(t):
    """Berechnet die Gesamtsumme aller Zahlen in einer Liste mit Listen.
   
    t: Liste mit Listen von ganzen Zahlen

    Rückgabe: Zahl
    """
    total = 0
    for nested in t:
        total += sum(nested)
    return total

t = [[1, 2], [3], [4, 5, 6]]
nested_sum(t)

### Aufgabe 6

Schreiben Sie eine Funktion `cumsum`, die eine Liste von Zahlen erwartet und die kumulative Summe zurückgibt, d.h. eine neue Liste, in der das $i$-te Element die Summe der ersten $i + 1$ Elemente der Original-Liste enthält. Beispielsweise sollte die Funktion für die Liste `t = [1, 2, 3]` die Liste `[1, 3, 6]` zurückgeben.


<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wie immer schreiben wir zuerst den Kopf der Funktion mit den nötigen Parametern und eine `return`-Anweisung mit einem Platzhalter.
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Da wir eine neue Liste ausgeben wollen, müssen wir eine neue (zunächst leere) Liste erstellen. Ebenso brauchen wir eine Variable, die die aktuelle Summe speichern kann. 
      
  </div>       
</details>  
  
  
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir müssen die alte Liste in einer `for`-Schleife durchlaufen. Was sind die zwei Schritte, die innerhalb der Schleife vorgenommen werden müssen?
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Zunächst muss die neue Summe berechnet werden. Anschließend muss dieses Ergebnis an die (neue) Ergebnisliste angehängt werden.
      
  </div>       
</details>  
  
  

<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Denken Sie daran, dass die `return`-Anweisung am Ende die neue Liste zurückgeben muss.
      
   </div>       
</details>  

In [None]:
def cumsum(t):
    # Implementieren Sie hier die Funktion
    pass

Testen Sie die Funktion mit verschiedenen Listen als Eingabe.

Welche Liste müssten Sie der Funktion `cumsum` übergeben, um als Ergebnis die Liste `[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]` der ersten zehn Fibonacci-Zahlen zu erhalten?

<details>
    <summary type="button" class="btn btn-success">Lösung für die Liste</summary>
  <div class="alert alert-success" role="alert">
      Die korrekte Liste ist: [1,0,1,1,2,3,5,8, 13, 21]
  </div>       
</details> 

In [None]:
#Testen Sie hier verschiedene Listen, bis Sie das korrekte Ergebnis erhalten.


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def cumsum(t):
    """Berechnet die kumulative Summe der Zahlen in t.

    t: Liste mit Zahlen

    Rückgabe: Liste mit Zahlen
    """
    total = 0
    res = []
    for x in t:
        total += x
        res.append(total)
    return res

t = [1,4,1,6,9] 
cumsum(t)


### Aufgabe 7
Schreiben Sie eine Funktion `middle`, die eine Liste als Argument erwartet und eine neue Liste zurückgibt, die alle Elemente bis auf das erste und letzte der Ausgangsliste enthält. Beispielsweise sollte die Funktion für die Liste `t = [1,2,3,4]` die Liste `[2,3]` zurückgeben:

```python
t = [1,2,3,4]
middle(t)
```
sollte `[2,3]` ergeben.    

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wie immer schreiben wir zuerst den Kopf der Funktion mit den nötigen Parametern und eine `return`-Anweisung mit einem Platzhalter.
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir wollen den `Segment`-Operator verwenden, um die Teilliste auszuwählen. Schauen Sie sich nochmal an, wie dieser verwendet wird.
      
  </div>       
</details>  
  
  
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Zunächst wollen wir dafür sorgen, dass die Liste ab dem zweiten Element zurückgegeben wird. Welchen Index hat das erste Element der Liste, welchen das zweite? Testen Sie ob Ihre Funktion korrekt die Liste ab dem 2. Element zurückgibt.
      
  </div>       
</details>   
   
<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
In Notebook 8 haben Sie gelernt, wie Sie von hinten auf Zeichenketten zugreifen können, ohne ihre Länge zu kennen. Das funktioniert analog für Listen. Schauen Sie nochmal in Notebook 8 nach, wenn Sie sich nicht mehr sicher sind (nutzen Sie gegebenenfalls `str`+`f`und suchen Sie nach `rückwärts` um die entsprechende Stelle zu finden). Achten Sie dabei darauf, wie die Segmente ausgegeben werden. Probieren Sie verschiedene Indizes bis es richtig funktioniert.
    
  </div>       
</details>  

In [None]:
def middle(t):
    # Implementieren Sie hier die Funktion
    pass


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def middle(t):
    """Gibt alles außer dem ersten und letzten Element von t zurück.

    t: Liste

    Rückgabe: neue Liste
    """
    return t[1:-1]

t = [5,4,6,7,9]
middle(t)


### Aufgabe 8
Schreiben Sie eine Funktion `chop`, die eine Liste als Argument erwartet, das erste und letzte Element entfernt und `None` zurückgibt. Beispielsweise sollte

```python
t = [1,2,3,4]
chop(t)
t
```
`[2,3]` ergeben. Worin besteht der Unterschied zur Funktion `middle` von Aufgabe 7?  
<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Zunächst mag es scheinen, als sei diese Funktion dasselbe wie `middle`, aber wenn Sie ihre ursprüngliche Liste ausgeben lassen, nachdem Sie `middle` angewendet haben, dann ist die Liste unverändert. Im Gegensatz dazu verändern wir mit `chop` die ursprüngliche Liste.
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Schauen Sie in diesem Notebook nach, wie Sie Elemente anhand ihres Indexes löschen können.     
  </div>       
</details>  
  
  
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir benötigen 2 Zeilen, eine für jeden Index, den wir entfernen wollen. Testen Sie ob Sie den richtigen Index entfernt haben indem Sie die Funktion testen und verändern Sie gegebenenfalls den Index bis Sie das richtige Ergebnis erhalten.      
  </div>       
</details>   


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def chop(t):
    """Removes the first and last elements of t.

    t: list

    returns: None
    """
    del t[0]
    del t[-1]

t = [5,4,6,7,9]
chop(t)


In [None]:
t

### Aufgabe 9
Schreiben Sie eine Funktion `is_sorted`, die eine Liste als Argument erwartet und `True` zurückgibt, falls die Liste in aufsteigender Reihenfolge sortiert ist und ansonsten `False`. Also zum Beispiel:

```python
>>> is_sorted([1, 2, 2])
True
>>> is_sorted(['b', 'a'])
False
```



<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir müssen die eingegebene Liste mit der sortierten Version derselben vergleichen. Sind sie gleich, gibt der Vergleichsoperator `True` zurück, ansonsten `False`.
      
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

In diesem Notebook haben Sie eine eingebaute Funktion kennengelernt, die eine gegebene Liste sortiert. Schauen Sie nach, wie diese Funktion aussieht und wenden Sie diese auf die eingegebene Liste an.
      
  </div>       
</details>  


  
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Mit `==`können Sie zwei Listen in einer Zeile vergleichen. Das Ergebnis des Vergleichs ist ein `boolscher`-Wert, also `True` oder `False`. Daher können Sie die ganze Funktion in einer Zeile implementieren. 
      
  </div>       
</details> 

In [None]:
def is_sorted(t):
    # Implementieren Sie hier die Funktion
    pass


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def is_sorted(t):
    """Überprüft, ob eine Liste sortiert ist.

    t: Liste

    Rückgabe: Boolscher Wert
    """
    return t == sorted(t)

t = [1,4,7,8]
is_sorted(t)


In [None]:
t = [3,2,7,8]
is_sorted(t)

### Aufgabe 10
Schreiben Sie eine Funktion `has_duplicates`, die eine Liste als Argument erwartet und `True` zurückgibt, falls ein Element der Liste mehr als einmal in der Liste enthalten ist. Die Funktion soll die Ursprungsliste nicht verändern.

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Als Basis soll die Funktion `False` zurückgeben, nur wenn zwei gleiche Elemente gefunden werden, wird stattdessen `True` zurückgegeben. Schreiben Sie die beiden möglichen Rückgaben. Wo genau diese stehen müssen, überlegen wir uns im Laufe der Entwicklung der Funktion.
      
      
  </div>       
</details>   
   
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wenn wir schauen wollen, ob sich Elemente in einer Liste wiederholen, ist es sinnvoll, die Liste zu sortieren. Wenn die Liste sortiert ist, stehe gleiche Elemente nebeneinander, statt an beliebigen -- unabhängigen -- Stellen in der Liste. Lassen Sie sich die sortierte Liste in einer 'print'-Anweisung innerhalb der Funktion ausgeben und geben Sie gleichzeitig die Originalliste aus um sicher zu gehen, dass Sie die Originalliste nicht verändern.
      
  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Um in einer sortierten Liste zu überprüfen, ob es Duplikate gibt, müssen wir lediglich für jeden Index schauen, ob der benachbarte Index das gleiche Element enthält. Da Sie jeden Index ansteuern, müssen Sie immer nur einen Nachbarn überprüfen, je nachdem, welchen Sie auswählen, müssen Sie den Start und End Index gegebenenfalls anpassen. Hier schauen wir uns immer den rechten Nachbarn (also den mit dem nächstgrößeren Index) an. 

  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir durchlaufen die Liste mit einer `for`-Schleife. Nutzen Sie die `len`-Funktion um die Länge der Liste zu ermitteln und zu schauen, wie oft die `for`-Schleife durchlaufen werden muss. Achten Sie dabei auf den Index um sogenannte `off by one` Fehler zu vermeiden. 
  </div>       
</details>


<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
In diesem Fall wollen wir in der `for`-Schleife 2 Elemente der Liste vergleichen, daher können wir die Liste nicht einfach Element für Element durchlaufen, sondern benötigen einen Index. Schreiben Sie die Schleife und lassen Sie sich jeweils den Index ausgeben, um zu testen, dass alle benötigten Werte angenommen werden
  </div>      
</details>


<details>
    <summary type="button" class="btn btn-primary">6. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
In der Schleife müssen Sie das Element mit dem Index `i` mit dem Element mit dem Index `i+1` vergleichen. Sind diese gleich, kann die Funktion abbrechen und `True` zurückgeben. Wird die Schleife durchlaufen, ohne dass zwei Elemente gleich sind, wird die Schleife verlassen und `False` zurückgegeben.
    
  </div>       
</details>




In [None]:
def has_duplicates(t):
    # Implementieren Sie hier die Funktion
    pass


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def has_duplicates(s):
    """Gibt True zurück, wenn ein Element mehr als einmal in einer Folge autaucht.

    s: Zeichenkette oder Liste

    Rückgabe: Boolscher Wert
    """
    # Kopie von t erstellen, um nicht den Parameter zu verändern
    t = list(s)
    t.sort()

    # prüfe auf benachbarte Elemente, die gleich sind
    for i in range(len(t)-1):
        if t[i] == t[i+1]:
            return True
    return False

t = [1, 4, 7, 5]
has_duplicates(t)


In [None]:
t = [1, 5, 5, 9]
has_duplicates(t)


### Aufgabe 11
In dieser Aufgabe geht es um das sogenannte "Geburtstags-Paradoxon" über das Sie mehr in [Wikipedia](http://en.wikipedia.org/wiki/Birthday_paradox) lesen können.

Wenn 23 Studierende in Ihrem Kurs sind, wie hoch ist dann die Wahrscheinlichkeit, dass zwei davon am gleichen Tag Geburtstag haben? Sie können diese Wahrscheinlichkeit schätzen, indem Sie zufällig 23 Geburtstage auswürfeln und prüfen, ob mindestens zwei davon identisch sind.

<details>
    <summary type="button" class="btn btn-info">Hinweis</summary>
  <div class="alert alert-info" role="alert">

Sie können zufällige Geburtstage mit Hilfe der Funktion `randint` aus dem <a href= "https://docs.python.org/3/library/random.html">Modul `random`</a> erzeugen.
      
  </div>       
</details> 

Die Originallösung aus dem Buch finden Sie [hier](http://thinkpython2.com/code/birthday.py), es folgen wie gewohnt Lösungsschritte mit denen Sie versuchen können, die Aufgabe selbstständig zu lösen.

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

In Essenz besteht diese Aufgabe aus 2 Teilen. Zum einen müssen wir eine Funktion schreiben, die eine gegebene Anzahl an Geburtstagen auswürfelt. Zum anderen brauchen wir eine Funktion, die prüft, ob zwei davon identisch sind. Und da eine einzelne Simulation keine guten Daten zu der Wahrscheinlichkeit des Datensets liefert, sollten wir eine Funktion schreiben, die diesen Test wiederholt durchführt und dann das Ergebnis zurückgibt.      
      
  </div>       
</details>   

Erstellen der Geburtstagsliste:
  
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir fangen mit dem Erzeugen der Geburtstagsliste an. Schreiben Sie zunächst den Kopf der Funktion. Wir verwenden n=23 als Parameter, so kann die Funktion ausgeführt werden, ohne dass ein Wert für die Länge der Liste festgelegt werden muss, aber wir haben in der Zukunft die Möglichkeit Listen unterschiedlicher Länge zu erzeugen. Ein so gestellter Parameter sagt: "Setze für n 23 ein, ausser der Funktionsaufruf spezifiziert etwas anderes".     
  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir brauchen eine leere Liste, in der wir die zufällig erstellten Geburtstage speichern können. Erstellen Sie diese. 
  </div>       
</details>  


<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Um uns das Erzeugen von Geburtstagen einfacher zu machen, speichern wir Geburtstage nicht im TT-MM Format, sondern als eine Zahl zwischen 1 und 365 (oder 366, wenn man Schaltjahre in Betracht ziehen möchte). Da wir nur eine zufällige Zahl erzeugen wollen, können wir sehr einfach die `randint`Funktion verwenden. Die Syntax für `randint` ist: `randint(1,365)`. Wobei in den Klammern zuerst die kleinste mögliche Zahl, dann ein Komma und dann die größtmögliche Zahl steht. Vergessen Sie nicht den so erzeugten Wert in einer Variablen zu speichern. 
  </div>       
</details>


<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Es reicht natürlich nicht, einen zufälligen Geburtstag zu erzeugen, wir brauchen eine Liste von 23 zufälligen Geburtstagen. Wir können eine `for`-Schleife verwenden um `randint` entsprechend oft aufzurufen und den erzeugten Wert an die Liste anzuhängen.
    </div>      
</details>


<details>
    <summary type="button" class="btn btn-primary">6. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Vergessen Sie nicht, die Liste zurückzugeben. Rufen Sie die Funktion mehrfach auf und schauen Sie sich die Rückgabe an. Wird immer die korrekte Anzahl an Werten zurückgegeben? Liegen alle Werte im erwarteten Bereich?     
  </div>       
</details>

Nun haben Sie eine Liste mit zufälligen Geburtstagen. Wie können Sie weiter vorgehen?

<details>
    <summary type="button" class="btn btn-primary">7. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Überlegen Sie, wie Sie prüfen können, ob zwei Werte der Liste gleich sind. Sie dürfen Code, den Sie bereits geschrieben haben gerne wiederverwenden.
    
   </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">8. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Verwenden Sie die Funktion `has_duplicates`, die Sie bereits geschrieben haben um zu prüfen, ob Sie zwei gleiche Geburtstage haben. 
    
   </div>       
</details>

Da ein einzelner Test nichts über die Wahrscheinlichkeit aussagen kann, ob ein Phänomen auftritt, schreiben wir nun eine Funktion, die diesen Test mehrfach durchführt und das Ergebnis ausgibt.


<details>
    <summary type="button" class="btn btn-primary">9. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Schreiben Sie zunächst den Kopf der Funktion, überlegen Sie, ob Sie Werte zurückgeben lassen wollen oder lieber mit `print`-Statements arbeiten möchten. Beides ist möglich. Im Beispielcode wird mit `print`-Statements gearbeitet. Dieser Funktion müssen Sie übergeben, wie oft Sie den Test durchführen wollen.    
   </div>       
</details>


<details>
    <summary type="button" class="btn btn-primary">10. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Da wir am Ende wissen möchten wie viele der Tests gleiche Geburtstage hatten, müssen wir einen Zähler initialisieren, der erhöht wird, wann immer der Test auf Duplikate positiv ist.     
  </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">11. Hinweis</summary>
  <div class="alert alert-info" role="alert">
     
Um den Test wiederholt mit zufälligen Werten durchzuführen, benötigen wir eine `for`-Schleife, die so oft läuft, wie wir im Kopf der Funktion angegeben haben. In der Schleife müssen wir die Geburtstagsliste erzeugen, auf Duplikate testen und wenn der Test positiv ausfällt den Zähler um 1 erhöhen. 
  </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">11. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Sie könnten die Geburtstagsliste in einer Variablen erstellen, diese Variable an `has_duplicates` übergeben, den Wert von `has_duplicates` in einer weiteren Variablen speichern und diese dann an eine `if`-Bedingung übergeben und dann die Zählererhöhung schreiben. Alternativ kann man die Funktionsaufrufe schachteln. Wir müssen die Liste nicht speichern, stattdessen können wir in der `if`-Bedingung auf has_duplicates() testen. has_duplicates wiederum kann birthdays() aufrufen. 
  </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">12. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Nachdem die Schleife erfolgreich durchlaufen wurde, haben Sie die Zahl der erfolgreichen Versuche. Diese müssen wir jetzt noch ausgeben. Schreiben Sie ein `print`-Statement, das sagt, wie viele Versuche Sie durchgeführt haben, und wie viele davon mindestens einen doppelten Geburtstag hatte. 
Im Beispielcode wird auch noch berechnet und ausgegeben, welcher Anteil an Tests dies in Prozent ist. Dafür können Sie die Anzahl an Versuchen mit doppeltem Geburtstag durch die Gesamtzahl an Versuchen teilen und das Ergebnis mit `100` multiplizieren. 
  </div>       
</details>

Denken Sie daran Ihre Funktion zu testen. Was stellen Sie fest, wenn Sie die Wahrscheinlichkeitsfunktion mit $n=10.000$ mehrfach hintereinander aufrufen?

In [None]:
from random import randint

# Implementieren Sie hier Ihr Programm


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
from random import randint
    

def birthdays(n=23):
    bday_list=[]
    for i in range(n):
        birthday= randint(1, 365)
        bday_list.append(birthday)
    return bday_list


def likelyhood(n):
    count=0
    for i in range(n):
        if has_duplicates(birthdays()):
            count= count+1
    percentage= (count/n)*100
    print ("In %d Versuchen gab es %d Versuche in denen mindestens 2 Studierende am selben Tag Geburtstag haben."
           %(n,count))
    print ("Das sind %d Prozent der Fälle" %percentage)
    
likelyhood(10000)

### Aufgabe 12

Schreiben Sie eine Funktion, die die Datei `top10000de.txt` (siehe [unser Verzeichnis](https://scm.cms.hu-berlin.de/ibi/python/-/blob/tp3_seminar09/notebooks/top10000de.txt?ref_type=heads)) oder `words.txt` einliest (siehe [Abschnitt 9.1](seminar09.ipynb#9.1-Wortlisten-einlesen)) und daraus eine  mit den Wörtern als Elementen erzeugt. Implementieren Sie zwei Versionen dieser Funktion: eine, die die Methode `append` verwendet und eine, die den Operator `+` mittels `t = t + [wort]` verwendet. Welche der beiden Versionen hat eine größere Laufzeit? Warum?

Eine Lösung für diese Aufgabe finden Sie hier: http://thinkpython2.com/code/wordlist.py

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wenn wir die Laufzeit der beiden Methoden unterscheiden wollen, können wir ein Gerüst schreiben, das die Wortliste einliest und dann so verarbeitet, dass die Worte an die Liste angehängt werden können. Die Zeile in der jeweils das Wort an die Liste angehängt wird, unterscheidet sich dann in beiden Funktionen.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Als erstes müssen wir eine leere Liste erzeugen und das Dokument mit der Wortliste öffnen. Wenn Sie sich nicht mehr daran erinnern können, wie Wortlisten geöffnet werden, schauen Sie weiter oben in diesem Notebook nach.

  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Sie haben in diesem Notebook auch gesehen, wie Sie das Dokument Wort für Wort durchlaufen können. Schreiben Sie diese Schleife.

  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

An dieser Stelle müssen Sie das Wort zu der Liste hinzufügen, hier unterscheiden sich die beiden Funktionen. Überlegen Sie was anders sein könnte.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">4.5 Hinweis - Append</summary>
  <div class="alert alert-info" role="alert">

Wenn Sie ein Element mit Hilfe von `append()` an die Liste anhängen wollen lautet die gesamte Zeile `t.append(word)` **nicht** `t = t.append(word)`.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">4.5 Hinweis - Add</summary>
  <div class="alert alert-info" role="alert">

Im Gegensatz dazu muss die gesamte Zeile für das Anhängen mit dem `+`-Zeichen `t= t+[word]`lauten, wenn Sie `t+[word]` nicht wieder `t` zuweisen, wird die Liste nicht länger
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">5. Hinweis </summary>
  <div class="alert alert-info" role="alert">
      
Abschließend müssen Sie die vollständige Liste zurück zu geben. Verwenden Sie dafür ein `return`-Statement

  </div>       
</details> 


Nun können Sie mit Bauchgefühl bereits abschätzen welche Funktion schneller ist und welche langsamer. Im folgenden schreiben wir eine Funktion, die die tatsächliche Laufzeit zurückgibt um die Situation genau abzuschätzen.

Hinweise zum Modul `time`:

<details>
    <summary type="button" class="btn btn-primary">6. Hinweis </summary>
  <div class="alert alert-info" role="alert">
      
In der Musterlösung wird mithilfe des `time`-Moduls ermittelt, wie lange die Funktionen jeweils zum Durchlaufen benötigen.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">7. Hinweis </summary>
  <div class="alert alert-info" role="alert">
      
 Zunächst wird der Zeitpunkt festgehalten, bevor die Funktion gestartet wird, dies geschieht indem die aktuelle Zeit in Sekunden und Millisekunden seit dem Referenzzeitpunkt mit `time.time()` abgefragt und in einer Variable gespeichert wird.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">8. Hinweis </summary>
  <div class="alert alert-info" role="alert">
      
Dann wird einfach der Funktionsaufruf ausgeführt.
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">9. Hinweis </summary>
  <div class="alert alert-info" role="alert">
      
Sobald der Funktionsaufruf beendet ist, wird erneut die aktuelle Zeit abgefragt. Ziehen wir davon die Zeit ab, die wir zuvor gespeichert haben, bleibt die Anzahl an Sekunden übrig, die zwischen Referenzzeitpunkt und Ende des Funktionsaufrufs vergangen sind. Vergessen Sie nicht, das Ergebnis ausgeben zu lassen!
      
  </div>       
</details>

Im Folgenden wird einmal kurz das Ergebnis der Aufgabe besprochen:


<details>
    <summary type="button" class="btn btn-success">Lösung </summary>
  <div class="alert alert-success" role="alert">
      
Die Additionsfunktion hat eine größere Laufzeit. In `append` wird die Liste aufgerufen, bis ans Ende gelaufen und dann einmal das neue Wort geschrieben, in der Additionsfunktion hingegen, muss die liste jedes mal komplett neu geschrieben werden.
      
  </div>       
</details>


In [None]:
# Implementieren Sie hier die beiden Varianten Ihrer Funktion


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
import time

def appending():
    t = []
    fin = open('top10000de.txt')
    for line in fin:
        word = line.strip()
        t.append(word)
    return t

start_time= time.time()
word_list= appending()
elapsed_time = time.time() - start_time

print (elapsed_time)


In [None]:
def adding():
    t = []
    fin = open('top10000de.txt')
    for line in fin:
        word = line.strip()
        t=t+[word]
    return t


start_time= time.time()
adding()
elapsed_time = time.time() - start_time

print (elapsed_time)


### Aufgabe 13

Um zu überprüfen, ob sich ein Wort in einer Wortliste befindet, können wir den Operator `in` verwenden, was aber recht lange dauert, da der Operator dazu die Liste linear durchlaufen muss.

Wenn wir mit einer sortierten Liste arbeiten, können wir den Vorgang beschleunigen, indem wir *binäre Suche* (auch bekannt als *bisection search*) verwenden. Das entspricht dem Verfahren, welches wir verwenden, wenn wir ein Wort in einem Wörterbuch nachschlagen: wir beginnen in der Mitte und schauen, ob das gesuchte Wort vor dem Wort in der Mitte der Liste stehen müsste. Falls dem so ist, durchsuchen wir die erste Hälfte der Liste auf die gleiche Art, ansonsten durchsuchen wir die zweite Hälfte.

In jedem Fall halbieren wir damit den Suchraum. Im Fall unserer Wortliste mit 10000 Wörtern benötigen wir höchstens 13 Schritte, um das gesuchte Wort zu finden oder festzustellen, dass die Liste das Wort nicht enthält. 

Schreiben Sie eine Funktion `binary_search` die eine sortierte Liste sowie ein Wort als Argumente erwartet und `True` zurückgibt, falls das Wort in der Liste enthalten ist, ansonsten `False`.

Alternativ können Sie auch die [Dokumentation für das Modul `bisect`](https://docs.python.org/3.5/library/bisect) lesen und dieses verwenden. Eine Lösung finden Sie hier: https://github.com/AllenDowney/ThinkPython2/blob/master/code/inlist.py


<details>
    <summary type="button" class="btn btn-info">Hinweis</summary>
  <div class="alert alert-info" role="alert">

Damit die binäre Suche funktioniert, muss die Liste sortiert sein. Das können Sie, wie wir es bereits getan haben, mit der Funktion `sort` erreichen. Mit `help(list.sort)` kriegen Sie mehr Informationen.    
  </div>       
</details>  

.   

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wir verwenden Rekursion um die Suche durchzuführen
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Wenn wir Rekursion verwenden, müssen wir uns zuerst die beiden Abbruchbedingungen überlegen. Eine Abbruchbedingung für das Finden des Wortes und eine Abbruchbedingung, für den Fall, dass das Wort nicht in der Liste ist.
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Der erste Fall ist einfach: das Wort, das wir suchen, stimmt mit dem Wort überein, das wir uns gerade anschauen. Dies benötigt einen Vergleich zwischen dem gesuchten Wort und dem Wort, das wir uns anschauen. Gibt dieser Vergleich `TRUE` aus, können wir die Suche abbrechen und `TRUE` zurückgeben. Schreiben Sie einen Platzhaltervergleich, der dies prüft. Dazu können Sie das gesuchte Wort mit einer zufälligen Zeichenkette vergleichen. Die Zeichenkette werden wir später ersetzen.
Die andere Abbruchbedingung ist das nicht finden des Wortes in der Liste. In der Rekursion halbieren wir die Wortliste in jedem Schritt bis die Liste irgendwann 0 Elemente lang ist. Erinnern Sie sich daran, wie Sie die Länge der Liste überprüfen? Wenn dieser Test 0 zurückgibt, müssen Sie `FALSE` zurückgeben.
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Da wir in jedem Schritt die Liste halbieren und anschließend die Hälfte der Liste ignorieren, müssen wir entscheiden welche Hälfte der Liste wir ignorieren und mit welcher Hälfte wir weiterarbeiten. Dazu schauen wir uns das Trennelement in der Mitte der Liste an und entscheiden ob das gesuchte Wort größer oder kleiner ist als das Trennelement ist. Dazu berechnen wir den Index in der Mitte der Liste. 
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Um den Index zu berechnen, ermitteln wir die Länge der Liste mit `len()` und verwenden dann Ganzzahldivision um den Index herauszufinden.
      
  </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">6. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Mit Hilfe von diesem Index können wir nun das Element ansteuern. Nun prüfen wir zuerst, ob das Wort an dieser Stelle gleich dem gesuchten Wort ist. Ersetzen Sie die Zeichenkette aus dem Platzhaltervergleich mit einem Zugriff auf die Liste an diesem Index. 
      
  </div>       
</details> 


<details>
    <summary type="button" class="btn btn-primary">7. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Gibt dieser Vergleich nicht `TRUE` zurück, prüfen wir als nächstes, ob das Element an Indexstelle `i` größer ist, als das gesuchte Wort. Ist das Wort an dieser Stelle größer als das gesuchte Wort, wird in der vorderen Listenhälfte gesucht. Andernfalls wird in der hinteren Listenhälfte gesucht. Schreiben Sie den Vergleich und Platzhalter `return`-Anweisungen. Testen Sie ihre Funktion und schauen Sie, ob alle `return`-Anweisungen erreicht werden können. 
      
  </div>       
</details>


<details>
    <summary type="button" class="btn btn-primary">8. Hinweis</summary>
  <div class="alert alert-info" role="alert">

An dieser Stelle fügen wir die Rekursion ein. Bisher wird nur geprüft ob das Wort genau in der Mitte steht, oder ob es größer oder kleiner ist. Mithilfe der Rekursion rufen wir an der Stelle, an der wir entscheiden ob das Wort in der vorderen oder hinteren Listenhälfte steht die Funktion erneut auf, diesmal aber mit der geteilten Liste. 
  </div>       
</details>


<details>
    <summary type="button" class="btn btn-primary">9. Hinweis</summary>
  <div class="alert alert-info" role="alert">


In den `return`-Anweisungen rufen wir die `binary_search`-Funktion auf, dabei übergeben wir immer noch das gesuchte Wort, aber statt der ursprünglichen Liste übergeben wir nur die halbe Liste. Das erreichen wir, indem wir die ursprüngliche Liste zusamen mit einem Segementoperator übergeben, indem wir entweder auf die Liste bis zum `i`-ten Element zugreifen, oder aber erst auf die Liste ab dem `i+1`-ten Element zugreifen.
      
  </div>       
</details>


In [None]:
def binary_search(t, w):
    # Implementieren Sie hier die Funktion
    pass


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def binary_search(word_list, word):
    
    word_list = sorted(word_list)
    
    if len(word_list) == 0:
        return False 

    i = len(word_list) // 2
    
    if word_list[i] == word:
        return True

    if word_list[i] > word:
        # search the first half
        return binary_search(word_list[:i], word)
    else:
        # search the second half
        return binary_search(word_list[i+1:], word)

t = [1,3,6,2,7,19,22]
binary_search(t, 29)

### Aufgabe 14
Zwei Wörter sind ein "umgekehrtes Paar" (Englisch: *reverse pair*), wenn jedes Wort rückwärts gelesen das jeweils andere ergibt (wie bei "LAGER" und "REGAL"). Schreiben Sie ein Programm, welches alle umgekehrten Paare in unserer Wortliste findet. (Ignorieren Sie dabei wieder Groß- und Kleinschreibung oder verwenden sie die englischsprachige Liste) Eine Lösung finden Sie hier: https://github.com/AllenDowney/ThinkPython2/blob/master/code/reverse_pair.py

<details>
    <summary type="button" class="btn btn-info">Hinweis</summary>
  <div class="alert alert-info" role="alert">
Wenn Sie die deutsche Wortliste verwenden, werden Sie einige doppelte Paare finden, was daran liegt, dass in top10000.txt Groß- und Kleinschreibung unterschieden wird. 
  </div>       
</details>

.

<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
An dieser Stelle werden eigentlich 2 Funktionen gesucht. Eine Funktion, die ein umgekehrtes Paar findet, und eine Funktion, die die gesamte Liste durchläuft und für jedes Wort prüft ob es Teil eines umgekehrten Paares ist und diese Antwort zurückgibt. Teilen wir also die Aufgabe und konzentrieren uns zunächst einmal darauf ein umgekehrtes Paar zu finden, wenn ein beliebiges Wort eingegeben wird.
      
  </div>       
</details> 

Teil 1

<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Der Funktion müssen natürlich ein Wort und die komplette Wortliste übergeben werden, damit wir unser Wort mit der Liste vergleichen können.
      
  </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">
  
Der einfachste Weg herauszufinden, ob das Wort, das wir übergeben, Teil eines umgekehrten Paares ist, ist es das umgekehrte Wort dieses Wortes zu bilden und zu schauen, ob es in der Liste vorhanden ist. In Notebook 8 haben Sie gelernt, wie man ein Wort schrittweise rückwärts durchläuft, dies können Sie nutzen um das umgekehrte Wort zu bilden.
    </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">

 Nun können wir die binäre Suche von vorher wiederverwenden, um zu überprüfen, ob das so gebildete Wort in der Liste ist. Diese Funktion gibt `TRUE` zurück, wenn dies der Fall ist. Hier könnten wir das Wortpaar ausgeben. In dem Beispielcode gibt diese Funktion allerdings `TRUE` oder `FALSE` an die nächste Funktion, die wir schreiben zurück, die dann wiederum die Ausgabe händelt.
    </div>       
</details> 

Teil 2 

<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Um alle Worte in der Liste zu finden, die Teil eines umgekehrten Paases sind, müssen wir mit einer Schleife die Liste Wort für Wort durchlaufen.
    </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">6. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Wenn Sie die deutsche Liste verwenden, stellen Sie sicher, dass sie die Liste auf Kleinschreibung normalisieren, wie wir das bereits in anderen Aufgaben dieses Notebooks gemacht haben.
    </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">7. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Rufen Sie innerhalb der Schleife die Funktion auf, die wir in Teil 1 geschrieben haben. Übergeben Sie jeweils das aktuelle Wort in der Schleife. Da die Funktion `TRUE` oder `FALSE` zurückgibt, können Sie sie verwenden um zu entscheiden ob das Wort als Teil eines umgekehrten Paares ausgegeben oder aber übersprungen werden soll. Wie können wir solche Entscheidungen treffen?
    </div>       
</details> 

<details>
    <summary type="button" class="btn btn-primary">8. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Innerhalb der if-Bedingung müssen wir das gesamte umgekehrte Paar ausgeben. Sie dürfen die Umkehrung des Wortes analog zu Teil 1 treffen. Verwenden Sie für die Ausgabe eine `print`-Anweisung.
    </div>       
</details>

In [None]:
# Implementieren Sie hier Ihr Programm



<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def reverse_pair(word_list, word):
    reverse = word[::-1]
    return binary_search (word_list, reverse)


def reverse_list(word_list):
    for word in word_list:
        word= word.lower()
        if reverse_pair(word_list, word): 
            print (word, word[::-1])

t = ["viel", "lager", "regal", "als", "lief"]
reverse_list(t)


### Aufgabe 15
Zwei Wörter "greifen ineinander" (Englisch: *interlock*), wenn sich durch abwechselndes Hinzufügen eines Buchstabens aus beiden Wörtern ein neues Wort ergibt. Beispielsweise greifen "Mai" und "im" ineinander und bilden das Wort "Miami". 

![Mai + im = Miami](https://amor.cms.hu-berlin.de/~jaeschkr/teaching/spp/miami.svg)

1. Schreiben Sie ein Programm, welches alle Wortpaare findet, die ineinandergreifen. 


<details>
    <summary type="button" class="btn btn-info">Hinweis</summary>
  <div class="alert alert-info" role="alert">
      Durchlaufen Sie nicht alle möglichen Wortpaare!
  </div>       
</details>

2. Gibt es Wörter, die dreifach ineinandergreifen; das heißt, jeder dritte Buchstabe ergibt ein Wort, beginnend mit dem ersten, zweiten oder dritten Buchstaben? (*Leider ist unsere Wortliste mit 10000 Wörtern recht kurz ... als einziges einigermaßen sinnvolles Beispiel ergibt sich "bekommt", welches die "Wörter" "Bot", "EM", und "km" enthält.*)

(Diese Aufgabe wurde durch ein Beispiel auf http://puzzlers.org/ inspiriert, eine Lösung finden Sie hier: https://github.com/AllenDowney/ThinkPython2/blob/master/code/interlock.py)


<details>
    <summary type="button" class="btn btn-primary">1. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Ähnlich wie in der vorherigen Aufgabe benötigen wir wieder zwei Funktionen um die Frage zu beantworten. Eine Funktion, die prüft, ob ein gegebenes Wort aus `n` ineinander greifenden Wörtern besteht und eine zweite Funktion, die die ganze Liste Wort für Wort ausliest. Auch in diesem Fall schreiben wir zuerst den Test dafür, ob ein einzelnes Wort aus anderen -- in der Wortliste vorkommenden -- Worten zusammengesetzt ist.
    </div>       
</details>

Teil 1 
<details>
    <summary type="button" class="btn btn-primary">2. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Im Kopf der Funktion müssen wir das Wort, die Liste, in der wir die Teilworte finden wollen, und die Schrittweite, also die Anzahl an Teilworten aus denen das gegebene Wort zusammengesetzt sein soll, übergeben. Schreiben Sie den Kopf der Funktion.
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">3. Hinweis</summary>
  <div class="alert alert-info" role="alert">
 Analog zur vorherigen Aufgabe müssen wir wieder aus dem Original-Wort die Worte bilden, die wir in der Wortliste suchen wollen. Überlegen Sie sich, wie Sie dabei vorgehen können.
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">4. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Um die Teilworte zu bilden, nutzen wir den Segment-Operator. Wir können hier den ersten Buchstaben und die Schrittweite festlegen. Mit diesen Angaben werden dann nur die gewünschten Buchstaben genommen. Diese können Sie in einer Variable speichern. Versuchen Sie zunächst diesen Teil der Aufgabe zu lösen indem Sie die Teilworte jeweils ausgeben lassen und prüfen ob das gegebene Ergebnis mit dem erwarteten übereinstimmt. Testen Sie dies indem sie alle "Teilworte" (sinnvoll oder nicht) eines beliebigen Wortes sowohl für 2 als auch für 3 Teilworte erstellen. Behalten Sie diese Anweisungen, wir benötigen sie im nächsten Schritt.
      
    </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">5. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Da wir die Aufgabe sowohl für 2 als auch für 3 Teilworte lösen wollen, ist es ratsam diese Erstellung so allgemein zu halten, dass sie mit jeder beliebigen Schrittweite funktionieren würde. Dies können wir mit einer Schleife erreichen. Schauen Sie sich die Segmentoperatoren an, die Sie geschrieben haben. Was fällt Ihnen auf? Wie könnte man das verallgemeinern?
      
    </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">6. Hinweis</summary>
  <div class="alert alert-info" role="alert">
     Wir verwenden eine `for`-Schleife, in der eine Platzhalter-Variable hochgezählt wird, bis wir die Schrittweite also die Anzahl an Worten erreichen. Damit wird die korrekte Anzahl an Worten gefunden. Das erste Wort beginnt am Index `0`, das Zweite am Index `1` und so weiter. Damit dann diese Hilfsvariable verwendet werden um den Startpunkt für jedes der Worte zu setzten. Die Schrittweite ist für alle Worte gleich und ist als Variable vorhanden. Diese kann daher übergeben werden. 
    </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">7. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      Für jedes Wort, das wir so erzeugen, müssen wir prüfen, ob das Wort in der übergebenen Liste enthalten ist. Wie haben wir dies bisher im Notebook erledigt?
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">8. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Da alle erzeugten Wörter in der Wortliste vorhanden sein müssen und wir möglichst wenige Operationen durchführen wollen, testen wir in der in der Schleife direkt nach der Erstellung das Wort. Was passiert, wenn wir einen einfachen Wahrheitstest machen und das Ergebnis zurück geben? Was passiert, wenn das erste Wort zwar in der Wortliste ist, das zweite oder dritte aber nicht? Überlegen Sie, wie Sie sicherstellen können, dass nur dann `TRUE` zurückgegeben wird, wenn alle Worte in der Liste sind.
    </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">9. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Wir geben nur dann `TRUE` zurück, wenn die Schleife verlassen wird. Daher prüfen wir in der Schleife ob wir `FALSE` zurück geben müssen. Wenn des Ergebnis von `binary_search` `TRUE` ist, wird in der Schleife nichts weiter mit dem Wort gemacht und die Schleife startet -- falls nötig -- mit dem nächsten Wort. Sobald eines der Wörter nicht in der Liste ist, wird `FALSE` zurück gegeben. Mit `if not` können Sie eine Anweisung schreiben, die sagt: "Wenn das Ergebnis von `binary_search` nicht `TRUE` ist, dann tue:"
    </div>       
</details>

Teil 2:
<details>
    <summary type="button" class="btn btn-primary">10. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
 In dieser Funktion wollen wir alle Worte finden, die aus einer bestimten Anzahl an ineinander greifenden Worten bestehen. Als solches muss diese Funktion die Liste und die gewünschte Anzahl an ineinander greifenden Worten übergeben bekommen. Schreiben Sie den Kopf der Funktion.
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">11. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Innerhalb der Funktion müssen wir die Liste Wort für Wort durchlaufen und prüfen ob das Wort ineinander greifende Worte innerhalb der Liste enthält.
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">12. Hinweis</summary>
  <div class="alert alert-info" role="alert">
Jedes Wort, das kürzer ist als die Anzahl an ineinander greifenden Worten, können wir komplett überspringen. Schreiben Sie das 'if'-Statement, das dies überprüft. Mit 'pass' können Sie den Rest eines Schleifendurchlaufs überspringen.   
       
Wenn wir ein Wort finden, wollen wir dieses ausgeben. Hierfür geben wir einen Header aus, der anzeigt, dass ein Wort gefunden wurde und das Wort ausgibt, bevor ähnlich wie in der Prüffunktion die Subworte aus dem Originalwort erzeugt und einzeln ausgegeben werden. Dabei wird jedes Wort in einer eigenen Zeile ausgegeben, aber dafür kann die Funktion ohne angepasst zu werden Worte mit beliebig vielen Unterworten finden.   
    </div>       
</details>
<details>
    <summary type="button" class="btn btn-primary">13. Hinweis</summary>
  <div class="alert alert-info" role="alert">
      
Die erste Funktion gibt entweder `TRUE` oder `FALSE` zurück. Schreiben Sie eine `if`-Anweisung analog zu der in der Funktion zum Finden von umgekehrten Paaren.
    </div>       
</details>

<details>
    <summary type="button" class="btn btn-primary">14. Hinweis</summary>
  <div class="alert alert-info" role="alert">

Innerhalb dieser `if`-Bedingung wollen wir die ineinander greifenden Worte ausgeben. Um die Funktion weiterhin für jede beliebige Menge an Teilworten nutzen zu können, können wir die Schleife aus der ersten Funktion wiederverwenden. Statt innerhalb der Schleife zu prüfen ob das Wort in der Liste ist, können wir das Wort mit einer `print`-Anweisung ausgeben. Das bedeutet, dass jedes Wort und jedes Teilwort in einer eigenen Zeile ausgegeben wird. Vergessen Sie nicht, dass vollständige Wort auszugeben. Es ist daher auch hilfreich eine Trennzeile auszugeben, in der gesagt wird, dass ein neues Wort folgt.
      
    </div>       
</details>

In [None]:
# Implementieren Sie hier das Programm

Schauen Sie mit Ihrer Funktion nach, ob es ineinandergreifende Wörter gibt in der Liste `top10000de.txt`:

In [None]:
# erstellen der Wortliste
reader = open('top10000de.txt')
word_list = []
for line in reader:
    word_list.append(line.strip())
    


<a data-flickr-embed="true"  href="https://www.flickr.com/photos/jasoneppink/4964471335" title="Spoiler Alert"><img src="https://farm5.staticflickr.com/4110/4964471335_1f86a923f3_n.jpg" width="320" height="213" alt="Spoiler Alert"></a><script async src="//embedr.flickr.com/assets/client-code.js" charset="utf-8"></script>

(Quelle: Jason Eppink, Flickr)


In [None]:
def interlock(word_list, word):
    """Prüft, ob ein Wort zwei ineinandergreifende Wörter enthält.
    word_list: Liste der Wörter
    word: Wort
    """
    evens = word[::2] # Buchstaben auf geraden Indizes
    odds = word[1::2] # Buchstaben auf ungeraden Indizes
    print(odds)
    print(evens)
    return binary_search(word_list, evens) and binary_search(word_list, odds) 
        

def interlock_general(word_list, word, n=3):
    """Prüft, ob ein Wort zwei ineinandergreifende Wörter enthält.
    word_list: Liste der Wörter
    word: Wort
    n: Anzahl der ineinandergreifenden Wörter
    """
    for i in range(n):
        inter = word[i::n]
        if not binary_search(word_list, inter):
            return False
    return True

def find_interlock(word_list, n):
    for word in word_list:
        if len(word)<n:
            pass
        if interlock_general(word_list, word, n):
            print ("New word found:")
            print (word)
            for i in range (n):
                print(word[i::n])    

find_interlock(word_list, 2)


![Speichern](https://amor.cms.hu-berlin.de/~jaeschkr/teaching/spp/floppy.png) Speichern Sie dieses Notebook, so dass Ihre Änderungen nicht verlorengehen (nicht auf einem Pool-Rechner). Rufen Sie dazu im Menü *File* den Punkt *Download as* → *Notebook* auf und nutzen Sie beispielsweise einen USB-Stick, E-Mail, Google Drive, Dropbox oder Ihre [HU-Box](https://box.hu-berlin.de/).  


![Smiley](https://upload.wikimedia.org/wikipedia/commons/thumb/7/79/Face-smile.svg/48px-Face-smile.svg.png)

Herzlichen Glückwunsch! Sie haben das 9. Kapitel geschafft!

<img src="https://scm.cms.hu-berlin.de/ibi/python/-/raw/master/img/by-nc-sa.png" alt="CC BY-NC-SA" style="width: 150px;"/>

Der Text dieses Notebooks ist als freies Werk unter der Lizenz [CC BY-NC-SA 4.0 ](https://creativecommons.org/licenses/by-nc-sa/4.0/) verfügbar.
Der Code dieses Notebooks ist als freies Werk unter der Lizenz [MIT License](https://mit-license.org/) verfügbar.

Es handelt sich um übersetzte und leicht veränderte Notebooks von [Allen B. Downey](https://allendowney.com) aus [Think Python: 3rd Edition](https://allendowney.github.io/ThinkPython/index.html).
