# Kapitel 11: Tupel
[Chapter 11: Tuples](https://colab.research.google.com/github/AllenDowney/ThinkPython/blob/v3/chapters/chap11.ipynb)

In diesem Kapitel wird ein weiterer eingebauter Datentyp, das Tupel, vorgestellt und gezeigt, wie Listen, assoziative Datenfelder und Tupel zusammenarbeiten.
Außerdem beinhaltet das Kapitel Informationen zu Tupel-Zuweisungen und einer nützlichen Eigenschaft für Funktionen mit Argumentlisten variabler Länge: die Verpack- und Entpack-Operatoren.

In den Übungen werden wir Tupel zusammen mit Listen und assoziativen Datenfeldern verwenden, um mehr Worträtsel zu lösen und effiziente Algorithmen zu implementieren.

### Ihre Lernziele:

Beschreiben Sie in 2-3 Stichpunkten kurz was Sie im Seminar heute lernen wollen. Klicken Sie dazu doppelt auf diesen Text und bearbeiten Sie dann den Text:

- 
- 
- 


## Herunterladen des unterstützenden Codes
Die folgende Zelle lädt eine Datei herunter und führt einen Code aus, der speziell für dieses Notebook verwendet wird. Sie müssen diesen Code nicht verstehen, aber Sie sollten die Zelle vor allen weiteren Zellen in diesem Notebook ausführen:

In [None]:
from os.path import basename, exists

def download(url):
 filename = basename(url)
 if not exists(filename):
 from urllib.request import urlretrieve

 local, _ = urlretrieve(url, filename)
 print("Downloaded " + str(local))
 return filename

download('https://github.com/AllenDowney/ThinkPython/raw/v3/thinkpython.py');
download('https://github.com/AllenDowney/ThinkPython/raw/v3/diagram.py');

import thinkpython

## Tupel sind wie Listen

Ein **Tupel** (Englisch: *tuple*) ist eine Abfolge von Werten. Diese Werte können jeden Datentypen haben und sind mit ganzen Zahlen indexiert, in dieser Hinsicht sind Tupel Listen also sehr ähnlich.
Der wichtigste Unterschied zwischen den beiden ist aber, dass Tupel unveränderbar sind.

Um ein Tupel zu erstellen können wir eine Liste mit Werten schreiben, die durch Kommata getrennt werden:

In [None]:
t = 'l', 'u', 'p', 'i', 'n'
type(t)

Auch wenn es nicht unbedingt notwendig ist, werden Tupel häufig in runden Klammern geschrieben:

In [None]:
t = ('l', 'u', 'p', 'i', 'n')
type(t)

Um ein Tupel mit einem einzigen Element zu erstellen, müssen wir es mit einem Komma am Ende schreiben:

In [None]:
t1 = 'p',
type(t1)

Ein einzelner Wert in Klammern ist kein Tupel:

In [None]:
t2 = ('p')
type(t2)

Ein anderer Weg, ein Tupel zu erstellen, ist die eingebaute Funktion `tuple`. Ohne Argument erstellt diese ein leeres Tupel:

In [None]:
t = tuple()
t

Wenn das Argument eine Folge ist (eine *Zeichenkette*, eine *Liste* oder ein *Tupel*), ist das Ergebnis ein Tupel mit den Elementen der Folge:

In [None]:
t = tuple('lupin')
t

Da `tuple` der Name einer eingebauten Funktion ist, sollten wir vermeiden, es als Variablennamen zu verwenden.

Die meisten Operatoren für Listen funktionieren auch mit Tupeln.
Der Klammer-Operator zum Beispiel indexiert ein Element:

In [None]:
t[0]

Und der Slice-Operator wählt Elemente aus einem angegebenen Bereich aus:

In [None]:
t[1:3]

Der `+`-Operator konkateniert Tupel:

In [None]:
tuple('lup') + ('i', 'n')

Und der `*`-Operator dupliziert ein Tupel eine angegebene Anzahl von Malen:

In [None]:
tuple('spam') * 2

Die `sorted`-Function funktioniert auch mit Tupeln -- aber das Ergebnis ist eine Liste, kein Tupel:

In [None]:
sorted(t)

Die `reversed`-Function funktioniert ebenfalls mit Tupeln:

In [None]:
reversed(t)

Das Ergebnis ist ein `reversed`-Object, das wir in eine Liste oder ein Tupel konvertieren können:

In [None]:
tuple(reversed(t))

Ausgehend von den bisher gezeigten Beispielen könnte man annehmen, dass Tupel das Gleiche sind wie Listen.

## Aber Tupel sind unveränderlich

Wenn wir versuchen, ein Tupel mit dem Klammer-Operator zu modifizieren, erhalten wir einen `TypeError`:

In [None]:
%%expect TypeError

t[0] = 'L'

Und Tupel haben keine der Methoden, die verwendet werden um Listen zu verändern, wie etwa `append` und `remove`:

In [None]:
%%expect AttributeError

t.remove('l')

Erinnern Sie sich daran, dass ein "Attribut" eine Variable oder eine Methode ist, die in Zusammenhang mit einem Objekt steht -- diese Fehlermeldung bedeutet, dass Tupel keine Methode namens `remove` haben.

Weil Tupel unveränderlich sind, sind sie hashbar, was bedeutet, dass sie als Schlüssel in einem assoziativen Datenfeld verwendet werden können.
Das folgende assoziative Datenfeld enthält zum Beispiel zwei Tupel, die als Schlüssel auf ganze Zahlen verweisen.

In [None]:
d = {}
d[1, 2] = 3
d[3, 4] = 7

So können wir Tupel in einem assoziativen Datenfeld suchen:

In [None]:
d[1, 2]

Oder wir können, wenn es eine Variable gibt, die sich auf das Tupel bezieht, diese als Schlüssel verwenden:

In [None]:
t = (3, 4)
d[t]

Tupel können auch als Werte in einem assoziativen Datenfeld vorkommen:

In [None]:
t = tuple('abc')
d = {'schluessel': t}
d

## Tupel-Zuweisung

Wir können ein Tupel mit Variablen auf die linke und ein Tupel mit Werten auf die rechte Seite einer Zuweisung schreiben:

In [None]:
a, b = 1, 2

Die Werte werden den Variablen von links nach rechts zugewiesen -- in diesem Beispiel erhält `a` den Wert `1` und `b` den Wert `2`.
Wir können so die Ergebnisse anzeigen:

In [None]:
a, b


Etwas allgemeiner gesprochen: wenn die linke Seite einer Zuweisung ein Tupel ist, dann kann die rechte Seite jede Art von Folge sein -- *Zeichenkette*, *Liste* oder *Tupel*.

Um eine email-Adresse in Username und Domain aufzuteilen können wir zum Beispiel schreiben:

In [None]:
email = 'monty@python.org'
username, domain = email.split('@')

Der Rückgabewert von `split` ist eine Liste mit zwei Elementen -- das erste Element wird ` username` zugewiesen, das zweite `domain`:

In [None]:
username, domain

Die Anzahl der Variablen auf der linken und die Anzahl der Werte auf der rechten Seite müssen gleich sein -- andernfalls erhalten wir einen `ValueError`:

In [None]:
%%expect ValueError

a, b = 1, 2, 3

Tupel-Zuweisung ist praktisch für die Fälle in denen wir die Werte zweier Variablen tauschen möchten.
Bei einer konventionellen Zuweisung müssten wir hierfür eine temporäre Variable verwenden, wie im folgenden Beispiel:

In [None]:
temp = a
a = b
b = temp

Das funktioniert zwar, aber mit einer Tupel-Zuweisung können wir das Gleiche ohne die temporäre Variable tun:

In [None]:
a, b = b, a

Das funktioniert, da alle Ausdrücke auf der rechten Seite vor jeglichen Zuweisungen ausgewertet werden.

Wir können Tupel-Zuweisungen auch in `for`-Ausdrücken verwenden.
Zum Beispiel können wir, um in einer Schleife durch die Elemente eines assoziativen Datenfeldes zu gehen, die `items`-Methode benutzen:

In [None]:
d = {'eins': 1, 'zwei': 2}

for item in d.items():
 schluessel, wert = item
 print(schluessel, '->', wert)

Bei jedem Durchgang der Schleife wird `item` ein Tupel zugewiesen, das einen *Schlüssel* und den korrespondierenden *Wert* enthält.

Wir können diese Schleife auch etwas prägnanter schreiben:

In [None]:
for schluessel, wert in d.items():
 print(schluessel, '->', wert)

Bei jedem Durchgang der Schleife werden ein Schlüssel und der korrespondierende Wert direkt `schluessel` und `wert` zugewiesen.

## Tupel als Rückgabewerte

Streng genommen kann eine Funktion nur einen Wert zurückgeben, wenn dieser Wert aber ein Tupel ist, hat dies den gleichen Effekt als würde man mehrere Werte zurückgeben.
Wenn wir zum Beispiel zwei ganze Zahlen dividieren und den Quotienten sowie den Rest berechnen möchten, ist es ineffizient zuerst `x//y` und dann `x%y` zu berechnen. Es ist besser, beide gleichzeitig zu berechnen.

Die eingebaute Funktion `divmod` nimmt zwei Argumente auf und gibt ein Tupel mit zwei Werten, dem *Quotienten* und dem *Rest* zurück:

In [None]:
divmod(7, 3)

Wir können Tupel-Zuweisung nutzen, um die Elemente des Tupels in zwei Variablen zu speichern:

In [None]:
quotient, rest = divmod(7, 3)
quotient

In [None]:
rest

Hier ist ein Beispiel für eine Funktion, die ein Tupel zurückgibt:

In [None]:
def min_max(t):
 return min(t), max(t)

`max` und `min` sind eingebaute Funktionen, die das größte und das kleinste Element einer Folge finden.
`min_max` berechnet beide und gibt ein Tupel mit zwei Werten zurück:

In [None]:
min_max([2, 4, 1, 3])

So können wir die Ergebnisse Variablen zuweisen:

In [None]:
niedrig, hoch = min_max([2, 4, 1, 3])
niedrig, hoch

## Argumente verpacken

Funktionen können eine variable Anzahl von Argumenten aufnehmen.
Ein Parametername, der mit dem `*`-Operator beginnt, **verpackt** (Englisch: *packs*) die Argumente in ein Tupel.
Die folgende Funktion nimmt zum Beispiel eine beliebige Zahl an Argumenten auf und berechnet deren arithmetisches Mittel -- also deren Summe, geteilt durch die Anzahl der Argumente:

In [None]:
def mittel(*args):
 return sum(args) / len(args)

Der Parameter kann jeden beliebigen Namen haben, die übliche Benennung ist aber `args`.
Wir können die Funktion so aufrufen:

In [None]:
mittel(1, 2, 3)

Wenn wir eine Folge von Werten haben und diese als mehrere Argumente an eine Funktion übergeben wollen, können wir den `*`-Operator verwenden, um das Tupel zu **entpacken** (Englisch: *unpack*).
`divmod` nimmt zum Beispiel exakt zwei Argumente auf -- wenn wir ein Tupel als Parameter übergeben erhalten wir eine Fehlermeldung:

In [None]:
%%expect TypeError

t = (7, 3)
divmod(t)

Obwohl das Tupel zwei Elemente enthält, zählt es als ein einzelnes Argument.
Aber wenn wir das Tupel entpacken, wird es behandelt als wären es zwei Argumente:

In [None]:
divmod(*t)

Verpacken und entpacken können nützlich sein, wenn wir das Verhalten einer schon existierenden Funktion anpassen wollen.
Diese Funktion nimmt zum Beispiel eine beliebige Anzahl von Argumenten auf, entfernt das niedrigste und das höchste und berechnet den Mittelwert vom Rest:

In [None]:
def getrimmt_mittel(*args):
 niedrig, hoch = min_max(args)
 getrimmt = list(args)
 getrimmt.remove(niedrig)
 getrimmt.remove(hoch)
 return mittel(*getrimmt)

Zuerst verwendet sie `min_max`, um das niedrigste und das höchste Element zu finden.
Danach konvertiert sie `args` zu einer Liste, damit die `remove`-Methode verwendet werden kann.
Zuletzt entpackt sie die Liste, sodass die Elemente als separate Argumente und nicht als eine Liste an `mitte` weitergegeben werden.

Hier ist ein Beispiel, das die Auswirkungen davon zeigt:

In [None]:
mittel(1, 2, 3, 10)

In [None]:
getrimmt_mittel(1, 2, 3, 10)

Diese Art von "getrimmtem" Mittelwert wird in manchen Sportarten mit subjektiver Bewertung -- zum Beispiel Tauchen oder Gymnastik -- verwendet, um die Auswirkungen eines einzelnen Wertungsrichters, dessen Bewertung sich sehr von denen der anderen unterscheidet zu reduzieren.

## Zip

Tupel sind praktisch, um in einer Schleife durch die Elemente zweier Folgen zu gehen und Operationen an den korrespondierenden Elementen durchzuführen.
Nehmen wir zum Beispiel an, zwei Mannschaften spielen eine Serie von sieben Spielen und wir tragen die Ergebnisse in zwei Listen ein, eine pro Team:

In [None]:
ergebnisse1 = [1, 2, 4, 5, 1, 5, 2]
ergebnisse2 = [5, 5, 2, 2, 5, 2, 3]

Lasst uns nun überprüfen, wie viele Spiele jede Mannschaft gewonnen hat.
Dafür werden wir `zip` verwenden, eine eingebaute Funktion, die zwei oder mehr Folgen aufnimmt und ein **Zip-Objekt** zurückgibt, das so genannt wird, weil es die Elemente der Folgen wie die Zähnchen eines Reißverschlusses (Englisch: *zipper*) verpaart:

In [None]:
zip(ergebnisse1, ergebnisse2)

Wir können das Zip-Objekt verwenden, um in einer Schleife paarweise durch die Werte der Folgen zu gehen:

In [None]:
for paar in zip(ergebnisse1, ergebnisse2):
 print(paar)

Bei jedem Schleifendurchlauf wird `pair` ein Tupel mit Ergebnissen zugewiesen.
Jetzt können wir die Ergebnisse Variablen zuweisen und dann folgendermaßen die Siege des ersten Teams zählen:

In [None]:
siege = 0
for team1, team2 in zip(ergebnisse1, ergebnisse2):
 if team1 > team2:
 siege += 1

siege

Leider hat die erste Mannschaft nur drei Spiele gewonnen und damit diese Serie verloren.

Wenn wir zwei Listen haben und eine Liste mit Paaren haben wollen, können wir `zip` und `list` verwenden:

In [None]:
t = list(zip(ergebnisse1, ergebnisse2))
t

Das Ergebnis ist eine Liste mit Tupeln, also können wir so das Ergebnis des letzten Spiels bekommen:

In [None]:
t[-1]

Wenn wir eine Liste mit Schlüsseln und eine Liste mit Werten haben, können wir `zip` und `dict` verwenden, um ein assoziatives Datenfeld zu erstellen.
So können wir zum Beispiel ein assoziatives Datenfeld erstellen, das von jedem Buchstaben auf seine Position im Alphabet verweist:

In [None]:
buchstaben = 'abcdefghijklmnopqrstuvwxyz'
zahlen = range(len(buchstaben))
buchstaben_verweis = dict(zip(buchstaben, zahlen))

Jetzt können wir nach einem Buchstaben suchen und erhalten den Index von dessen Position im Alphabet:

In [None]:
buchstaben_verweis['a'], buchstaben_verweis['z']

In diesem Mapping ist der Index von `'a'` `0` und der Index von `'z'` `25`.

Wenn wir in einer Schleife durch die Elemente einer Folge und deren Indizes gehen müssen, können wir die eingebaute Funktion `enumerate` verwenden:

In [None]:
enumerate('abc')

Das Ergebnis ist ein **Enumerate-Objekt** (Deutsch etwa: *Aufzählungs-Objekt*), das eine Folge von Paaren in einer Schleife durchläuft, wobei jedes Paar einen Index (beginnend bei `0`) und ein Element aus der angegebenen Folge enthält:

In [None]:
for index, element in enumerate('abc'):
 print(index, element)

## Vergleichen und Sortieren

Die relationalen Operatoren funktionieren auch mit Tupeln und anderen Folgen.
Wenn wir zum Beispiel den `<`-Operator mit Tupeln verwenden, beginnt er damit, das erste Element jeder Folge zu vergleichen.
Wenn diese gleich sind, geht er zum nächsten Elemente-Paar weiter, und so weiter und so fort, bis er ein Paar findet, das sich unterscheidet:

In [None]:
(0, 1, 2) < (0, 3, 4)

Nachfolgende Elemente werden nicht mehr betrachtet -- selbst wenn sie sehr groß sind:

In [None]:
(0, 1, 2000000) < (0, 3, 4)

Diese Art Tupel zu vergleichen ist praktisch, um eine Liste von Tupeln zu sortieren, oder um ein Minimum oder Maximum zu finden.
Lasst uns als ein Beispiel den häufigsten Buchstaben in einem Wort finden.
Im vorherigen Kapitel haben wir `wert_zaehlen` geschrieben, was eine Zeichenkette aufnimmt und ein assoziatives Datenfeld zurückgibt, in dem jeder Buchstabe auf die Anzahl der Male, die er vorkommt verweist:

In [None]:
def wert_zaehlen(string):
 zaehler = {}
 for buchstabe in string:
 if buchstabe not in zaehler:
 zaehler[buchstabe] = 1
 else:
 zaehler[buchstabe] += 1
 return zaehler

Hier ist das Ergebnis für die Zeichenkette `'banana'`:

In [None]:
zaehler = wert_zaehlen('banana')
zaehler

Mit nur drei Elementen können wir leicht sehen, dass der häufigste Buchstabe das `'a'` ist, das dreimal vorkommt.
Aber gäbe es mehr Elemente, dann wäre es praktisch, diese automatisch sortieren zu können.

Wir können so die Elemente von `zaehler` erhalten:

In [None]:
elemente = zaehler.items()
elemente

Das Ergebnis ist ein `dict_items`-Objekt, das sich wie eine Liste von Tupeln verhält, wir können es also folgendermaßen sortieren:

In [None]:
sorted(elemente)

Standardmäßig wird das erste Element aus jedem Tupel zum Sortieren der Liste verwendet und im Fall eines Gleichstands auf das zweite Element zurückgegriffen.

Um aber das Element mit dem höchsten Zähler zu finden, wollen wir das zweite Element zum Sortieren der Liste verwenden.
Wir können das tun, indem wir eine Funktion schreiben, die ein Tupel nimmt und dessen zweites Element zurückgibt:

In [None]:
def zweites_element(t):
 return t[1]

Dann können wir diese Funktion an `sorted` als optionales Element namens `key` weitergeben, was anzeigt, dass diese Funktion verwendet werden soll, um den **Sortier-Schlüssel** (Englisch: *sort key*) für jedes Element zu berechnen:

In [None]:
elemente_sortiert = sorted(elemente, key=zweites_element)
elemente_sortiert

Der Sortier-Schlüssel bestimmt die Reihenfolge der Elemente in der Liste.
Der Buchstabe mit der niedrigsten Zahl erscheint zuerst, der Buchstabe mit der höchsten Zahl zuletzt.
So können wir wie folgt den häufigsten Buchstaben finden:

In [None]:
elemente_sortiert[-1]

Wenn wir nur das Maximum wollen, müssen wir die Liste nicht sortieren.
Wir können `max` verwenden, was ebenfalls `key` als optionales Argument aufnimmt:

In [None]:
max(elemente, key=zweites_element)

Um den Buchstaben mit der niedrigsten Zahl zu finden, könnten wir `min` auf die gleiche Weise nutzen.

## Assoziatives Datenfeld umkehren

Nehmen wir an, wir wollen ein assoziatives Datenfeld invertieren, sodass wir nach einem Wert suchen können und dessen korrespondierenden Schlüssel erhalten.
Wenn wir zum Beispiel einen Wortzähler haben, der von jedem Wort auf die Anzahl von dessen Vorkommen verweist, können wir ein assoziatives Datenfeld erstellen, das von ganzen Zahlen auf die Wörter verweist, die entsprechend oft vorkommen.

Aber es gibt ein Problem -- die Schlüssel in einem assoziativen Datenfeld müssen im Gegensatz zu den Werten einmalig sein. In einem Wortzähler könnte es zum Beispiel viele Wörter geben, die gleich oft vorkommen.

Ein Weg, das assoziative Datenfeld umzukehren ist also, ein neues assoziatives Datenfeld zu erstellen, in dem die Werte Listen mit Schlüsseln aus dem ursprünglichen Datenfeld sind.
Lasst uns zum Beispiel die Buchstaben in `papagei` zählen.

In [None]:
d = wert_zaehlen('papagei')
d

Wenn wir dieses assoziative Datenfeld umkehren, sollte das Ergebnis `{2: ['p', 'a'], 1: ['g', 'e', 'i']}` sein, was darauf hinweist, dass die Buchstaben, die einmal vorkommen `'g'`, `'e'` und `'i'`, und die Buchstaben, die zweimal vorkommen `'p'` und `'a'` sind.

Die folgende Funktion nimmt ein assoziatives Datenfeld und gibt dieses umgekehrt als neues assoziatives Datenfeld zurück:

In [None]:
def invertiert_dict(d):
 neu = {}
 for schluessel, wert in d.items():
 if wert not in neu:
 neu[wert] = [schluessel]
 else:
 neu[wert].append(schluessel)
 return neu

Die `for`-Anweisung geht in einer Schleife durch die Schlüssel und Werte in `d`.
Wenn sich ein Wert noch nicht in dem neuen assoziativen Datenfeld befindet, wird er hinzugefügt und mit einer Liste verknüpft, die ein einzelnes Element enthält.
Andernfalls wird er an die bestehende Liste angehängt.

Wir können das so testen:

In [None]:
invertiert_dict(d)

Und wir erhalten das erwartete Ergebnis,

Das ist das erste Beispiel, das wir gesehen haben, in dem die Werte eines assoziativen Datenfelds Listen sind.
Weitere werden folgen!

## Debuggen

Listen, assoziative Datenfelder und Tupel sind **Datenstrukturen** (Englisch: *data structures*).
In diesem Kapitel beginnen wir, zusammengesetzte Datenstrukturen zu sehen, wie Listen von Tupeln oder assoziative Datenfelder, die Tupel als Schlüssel und Listen als Werte enthalten.
Zusammengesetzte Datenstrukturen sind praktisch, aber auch anfällig für Fehler, die zum Beispiel vorkommen wenn eine Datenstruktur den falschen Datentyp, die falsche Größe oder Struktur hat.
Wenn eine Funktion zum Beispiel eine Liste aus ganzen Zahlen erwartet und Sie ihr nur eine einfache ganze Zahl geben (nicht in einer Liste), wird sie wahrscheinlich nicht funktionieren.

Um beim Debuggen dieser Art von Fehler zu helfen, habe ich ein Modul namens `structshape` geschrieben, das eine Funktion, die ebenfalls `structshape` heißt, zur Verfügung stellt. Diese nimmt jegliche Art von Datenstruktur als Argument auf und gibt eine Zeichenkette zurück, die deren Struktur beschreibt.
Sie können es hier herunterladen:
<https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/structshape.py>.

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/structshape.py');

Wir können es so importieren:

In [None]:
from structshape import structshape

Hier ist ein Beispiel mit einer einfachen Liste:

In [None]:
t = [1, 2, 3]
structshape(t)

Hier ist eine Liste mit Listen:

In [None]:
t2 = [[1,2], [3,4], [5,6]]
structshape(t2)

Wenn die Elemente einer Liste nicht dem gleichen Datentypen entsprechen, gruppiert sie `structshape` nach Typ:

In [None]:
t3 = [1, 2, 3, 4.0, '5', '6', [7], [8], 9]
structshape(t3)

Hier ist eine Liste aus Tupeln:

In [None]:
s = 'abc'
lt = list(zip(t, s))
structshape(lt)

Und hier ist ein assoziatives Datenfeld mit drei Elementen, das von ganzen Zahlen zu Zeichenketten verweist:

In [None]:
d = dict(lt)
structshape(d)

Wenn es Ihnen Schwierigkeiten bereitet, einen Überblick über Ihre Datenstrukturen zu behalten, kann `structshape` helfen.

## Glossar

Legen wir uns eine Liste mit den wichtigsten Begriffen an, die wir im Kapitel 11 gelernt haben:

- verpacken:
- entpacken:
- Zip-Objekt:
- Enumerate-Objekt:
- Sortier-Schlüssel:
- Datenstruktur:

Ergänzen Sie die Liste in eigenen Worten. Das ist eine gute Erinnerungs- und Übungsmöglichkeit.


## Übung

In [None]:
# Diese Zelle weist Jupyter an, detallierte Debugging-Informationen auszugeben, wenn ein Laufzeitfehler
# passiert. Lassen Sie sie daher laufen, bevor Sie beginnen an den Aufgaben zu arbeiten.

%xmode Verbose

### Fragen Sie einen virtuellen Assistenten

Die Übungen in diesem Kapitel könnten etwas schwieriger sein, als die in vorherigen Kapiteln, daher möchte ich Sie ermutigen, einen virtuellen Assistenten um Hilfe zu fragen.
Wenn Sie schwierigere Fragen stellen könnte Ihnen auffallen, dass die Antworten beim ersten Versuch noch nicht richtig sind, daher ist dies eine gute Möglichkeit, das Schreiben von guten Prompts und nachfolgenden Verfeinerungen zu üben.

Eine Strategie, die Sie in Erwägung ziehen könnten, ist das Zerteilen von großen Problemen in kleinere Teile, die mit einfachen Funktionen gelöst werden können.
Bitten Sie einen virtuellen Assistenten darum, diese Funktionen zu schreiben und zu testen.
Dann, sobald diese funktionieren, fragen Sie nach einer Lösung für das urspüngliche Problem.

Bei einige der Aufgaben unten mache ich Vorschläge, welche Datenstrukturen oder Algorithmen sich hier eignen würden.
Sie finden die Vorschläge vielleicht hilfreich, während Sie an den Aufgaben arbeiten, diese sind aber auch gute Prompts zum Weitergeben an einen virtuellen Assistenten.

### Aufgabe 1

In diesem Kapitel habe ich gesagt, dass Tupel als Schlüssel in assoziativen Datenfeldern genutzt werden können, weil sie unveränderlich und dadurch hashbar sind.
Das ist aber nicht immer der Fall.

Wenn ein Tupel einen veränderbaren Wert wie etwa eine Liste oder ein assoziatives Datenfeld enthält, ist es nicht mehr hashbar, da es Elemente enthält, die nicht hashbar sind. Hier ist zum Beispiel ein Tupel, das zwei Listen mit ganzen Zahlen enthält:

In [None]:
liste0 = [1, 2, 3]
liste1 = [4, 5]

t = (liste0, liste1)
t

Schreiben Sie eine Code-Zeile, die den Wert `6` an das Ende der zweiten Liste in `t` anhängt. Wenn Sie `t` ausgeben sollte das Ergebnis `([1, 2, 3], [4, 5, 6])` sein.

In [None]:
# Lösung hierhin schreiben

Versuchen Sie, ein assoziatives Datenfeld zu erstellen, das von `t` auf eine Zeichenkette verweist und überprüfen Sie, ob Sie einen `TypeError` erhalten.

In [None]:
# Lösung hierhin schreiben

Für mehr Informationen zu diesem Thema fragen Sie einen virtuellen Assistenten: "Sind Tupel in Python immer hashbar?".

### Aufgabe 2

In diesem Kapitel haben wir ein assoziatives Datenfeld erstellt, dass von jedem Buchstaben zu dessen Index im Alphabet verweist:

In [None]:
buchstaben = 'abcdefghijklmnopqrstuvwxyz'
zahlen = range(len(buchstaben))
buchstaben_verweis = dict(zip(buchstaben, zahlen))

Der Index von `'a'` ist zum Beispiel `0`:

In [None]:
buchstaben_verweis['a']

Um in die andere Richtung zu gehen, können wir Listen-Indexierung verwenden.
Der Buchstabe am Index `1` ist zum Beispiel `'b'`:

In [None]:
buchstaben[1]

Wir können `buchstaben_verweis` und `buchstaben` verwenden, um Wörter mittels einer Cäsar-Chiffre zu ver- und entschlüsseln.

Eine Cäsar-Chiffre ist eine schwache Form der Verschlüsselung, bei der jeder Buchstabe um eine festgelegte Zahl von Stellen im Alphabet verschoben wird. Würde eine Verschiebung über `z` hinausgehen, wird wieder bei `a` begonnen. Zum Beispiel ist `'a'` um `2` verschoben `'c'` und `'z'` um `1` verschoben ist `'a'`.

Schreiben sie eine Funktion namens `wort_verschieben`, die als Parameter eine Zeichenkette und eine ganze Zahl aufnimmt und eine neue Zeichenkette zurückgibt, die alle Buchstaben der ursprünglichen Zeichenkette verschoben um die angegebene Anzahl Stellen enthält.

Um Ihre Funktion zu testen, überprüfen Sie, ob `"cheer"` um `7` Stellen verschoben `"jolly"` und `"melon"`um `16` Stellen verschoben `"cubed"` ergibt.

Tipps: Verwenden Sie den Modulus-Operator um vom `z` wieder zu `a` zurückzuspringen.
Gehen Sie in einer Schleife die Buchstaben des Worts, verschieben Sie diese und hängen das Ergebnis an das Ende einer Liste mit Buchstaben an.
Verwenden Sie dann `join`, um die Buchstaben zu einer Zeichenkette zu konkatenieren.

Verwenden Sie als Starthilfe diese Gliederung:

In [None]:
def wort_verschieben(wort, n):
 """Verschieben die Buchstaben von `wort` um `n` Stellen.

 >>> wort_verschieben('cheer', 7)
 'jolly'
 >>> wort_verschieben('melon', 16)
 'cubed'
 """
 return None

In [None]:
# Lösung hierhin schreiben

In [None]:
wort_verschieben('cheer', 7)

In [None]:
wort_verschieben('melon', 16)

Sie können `doctest` verwenden, um Ihre Funktion zu testen:

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
 run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(wort_verschieben)

### Aufgabe 3

Schreiben Sie eine Funktion namens `haeufigste_buchstaben`, die eine Zeichenkette aufnimmt und die einzelnen Buchstaben in absteigender Reihenfolge ihrer Häufigkeit ausgibt.

Um die Elemente in absteigender Reihenfolge zu erhalten können Sie `reversed` zusammen mit `sorted` verwenden, oder Sie können `reverse=True` als Schlüsselwort-Parameter an `sorted` übergeben.

Als Einstieg können Sie diese Skizze der Funktion verwenden:

In [None]:
def haeufigste_buchstaben(zeichenkette):
 return None

In [None]:
# Lösung hierhin schreiben

Und dieses Beispiel können Sie verwenden, um Ihre Funktion zu testen:

In [None]:
haeufigste_buchstaben('brontosaurus')

Sobald Ihre Funktion funktioniert können Sie den folgenden Code verwenden, um die häufigsten Buchstaben aus *Dracula* auszugeben (der Text kann über Projekt Gutenberg heruntergeladen werden):

In [None]:
download('https://www.gutenberg.org/cache/epub/345/pg345.txt');

In [None]:
zeichenkette = open('pg345.txt').read()
haeufigste_buchstaben(zeichenkette)

Nach Zims "Codes and Secret Writing" beginnt die Buchstabenfolge für die englische Sprache, absteigend nach Häufigkeit sortiert, mit "ETAONRISH".
Wie lässt sich diese Folge mit den Ergebnissen von *Dracula* vergleichen?

### Aufgabe 4

In einer vorherigen Übung haben wir getestet, ob zwei Zeichenketten Anagramme voneinander sind, indem wir die Buchstaben beider Wörter sortiert, und überprüft haben ob diese gleich sind.
Lasst uns nun das gleiche Problem etwas herausfordernder machen.

Wir werden ein Programm schreiben, das eine Wortliste aufnimmt und alle Wortgruppen daraus ausgibt, die Anagramme sind.
Der Output könnte zum Beispiel so aussehen:

 ['deltas', 'desalt', 'lasted', 'salted', 'slated', 'staled']
 ['retainers', 'ternaries']
 ['generating', 'greatening']
 ['resmelts', 'smelters', 'termless']

Tipp: Sortieren Sie für jedes Wort in der Liste die Buchstaben und verbinden Sie zu einer Zeichenkette. Erstellen Sie nun ein assoziatives Datenfeld `anagramm_dict`, das von dieser geordneten Zeichenkette auf eine Liste mit Wörtern verweist, die dessen Anagramme sind.

Die folgende Zelle lädt `words.txt` herunter und liest die Wörter in eine Liste ein:

In [None]:
download('https://raw.githubusercontent.com/AllenDowney/ThinkPython/v3/words.txt');

In [None]:
wort_liste = open('words.txt').read().split()

Hier ist die `wort_sortieren`-Funktion, die wir schon verwendet haben:

In [None]:
def wort_sortieren(wort):
 return ''.join(sorted(wort))

In [None]:
# Lösung hierhin schreiben

Um die längste Liste mit Anagrammen zu finden können Sie die folgende Funktion verwenden, die ein Schlüssel-Wert-Paar aufnimmt, bei dem der Schlüssel eine Zeichenkette und der Wert eine Liste mit Wörtern ist.
Sie gibt die Länge der Liste zurück:

In [None]:
def wert_laenge(paar):
 schluessel, wert = paar
 return len(wert)

Wir können diese Funktion als Sortierschlüssel verwenden, um die längste Anagramm-Liste zu finden:

In [None]:
anagramm_elemente = sorted(anagramm_dict.items(), key=wert_laenge)
for schluessel, wert in anagramm_elemente[-10:]:
 print(wert)

Wenn Sie die längsten Wörter, von denen es Anagramme gibt erfahren wollen, verwenden Sie die folgende Schleife um einige von ihnen auszugeben:

In [None]:
laengste = 7

for schluessel, wert in anagramm_elemente:
 if len(wert) > 1:
 wort_laenge = len(wert[0])
 if wort_laenge > laengste:
 laengste = wort_laenge
 print(wert)

### Aufgabe 5

Schreiben Sie eine Funktion namens `wort_distanz`, die zwei Wörter derselben Länge aufnimmt, und die Anzahl der Stellen zurückgibt, an denen sich diese unterscheiden.

Tipp: Verwenden Sie `zip`, um in einer Schleife durch die korrespondierenden Buchstaben der Wörter zu gehen.

Hier ist eine Gliederung der Funktion mit Doctests, die Sie verwenden können, um Ihre Funktion zu testen:

In [None]:
def wort_distanz(wort1, wort2):
 """Berechnet die Anzahl der Stellen, an denen sich die beiden Wörter unterscheiden.

 >>> wort_distanz("hello", "hxllo")
 1
 >>> wort_distanz("ample", "apply")
 2
 >>> wort_distanz("kitten", "mutton")
 3
 """
 return None

In [None]:
# Lösung hierhin schreiben

In [None]:
from doctest import run_docstring_examples

def run_doctests(func):
 run_docstring_examples(func, globals(), name=func.__name__)

run_doctests(wort_distanz)

### Aufgabe 6

"Metathese“ bezeichnet das Vertauschen von Buchstaben in einem Wort.
Zwei Wörter bilden ein "Metathese-Paar“, wenn man das eine in das andere umwandeln kann, indem man zwei Buchstaben vertauscht, wie zum Beispiel bei `converse` und `conserve`.
Schreiben Sie ein Programm, das alle Metathesepaare in der Wortliste findet.

Tipp: Die Wörter in einem Metathesepaar müssen Anagramme voneinander sein.

Credit: Diese Aufgabe ist inspiriert von einem Beispiel auf <http://puzzlers.org>.

In [None]:
# Lösung hierhin schreiben

### Aufgabe 7

Dies ist eine Bonus-Aufgabe, die sich nicht im Buch befindet.
Sie ist schwieriger als die anderen Übungen in diesem Kapitel, also fragen Sie vielleicht einen virtuellen Assistenten um Hilfe oder kommen Sie auf die Aufgabe zurück, nachdem Sie weitere Kapitel gelesen haben.

Hier ist ein weiterer Car Talk Puzzler
(<http://www.cartalk.com/content/puzzlers>):

> Welches ist das längste englische Wort, das ein gültiges Wort bleibt,
> nachdem man einen Buchstaben nach dem anderen entfernt hat?
>
> Buchstaben können von beiden Enden des Wortes und aus dessen Mitte entfernt werden, aber Sie dürfen
> keine der Buchstaben vertauschen. Jedes Mal wenn Sie einen Buchstaben entfernen,
> erhalten Sie ein neues Wort. Wenn Sie das eine Weile tun, enden Sie irgendwann bei einem
> einzelnen Buchstaben und auch dieser wird ein englisches Wort sein --
> eines, das im Wörterbuch steht. Ich will nun wissen, welches das längste Wort ist
> und wie viele Buchstaben dieses hat.
>
> Ich werde hierfür ein kleines Beispiel geben: "Sprite". Ok? Wir beginnen mit
> `"sprite"`, entfernen einen Buchstaben aus der Mitte des Wortes, in diesem Fall das `r`,
> und erhalten das Wort `"spite"`, davon entfernen wir das `e` und bekommen `"spit"`,
> wovon wir wiederum das `s` entfernen und `"pit"` bekommen, dann `"it"` und zuletzt `"I"`.

Schreiben Sie ein Programm, das alle Wörter findet, die auf diese Weise reduziert werden können und finden Sie von diesen das schließlich das Längste.

Diese Übung ist ein bisschen schwieriger als die meisten anderen, also sind hier einige Empfehlungen:

1. Sie sollten vielleicht eine Funktion schreiben, die für ein Wort eine Liste aller Wörter berechnet, die daraus durch Entfernen eines Buchstabens gebildet werden können. Das sind die "Kinder“ dieses Wortes.

2. Rekursiv ist ein Wort reduzierbar, wenn eines seiner Kinder reduzierbar ist. Als Basisfall können Sie die leere Zeichenkette als reduzierbar betrachten.

3. Die Wortliste, die wir bisher verwendet haben enthält keine Wörter aus einzelnen Buchstaben. Also sollten Sie vielleicht "I" und "a" hinzufügen.

4. Um die Leistung Ihres Programmes zu verbessern könnten Sie die Wörter, von denen schon bekannt ist, dass sie reduzierbar sind memoisieren.

In [None]:
# Lösung hierhin schreiben

In [None]:
# Lösung hierhin schreiben

In [None]:
# Lösung hierhin schreiben

In [None]:
# Lösung hierhin schreiben

In [None]:
# Lösung hierhin schreiben

 Speichern Sie dieses Notebook, so dass Ihre Änderungen nicht verlorengehen (nicht auf einem Pool-Rechner). Klicken Sie dazu oben links auf das Disketten-Icon und nutzen Sie beispielsweise einen USB-Stick, E-Mail, Google Drive, Dropbox oder Ihre [HU-Box](https://box.hu-berlin.de/). 



Herzlichen Glückwunsch! Sie haben das 11. Kapitel geschafft.

<img src="https://scm.cms.hu-berlin.de/ibi/python/-/raw/master/img/by-nc-sa.png" alt="CC BY-NC-SA" style="width: 150px;"/>

Der Text dieses Notebooks ist als freies Werk unter der Lizenz [CC BY-NC-SA 4.0 ](https://creativecommons.org/licenses/by-nc-sa/4.0/) verfügbar.
Der Code dieses Notebooks ist als freies Werk unter der Lizenz [MIT License](https://mit-license.org/) verfügbar.

Es handelt sich um übersetzte und leicht veränderte Notebooks von [Allen B. Downey](https://allendowney.com) aus [Think Python: 3rd Edition](https://allendowney.github.io/ThinkPython/index.html).
