{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Wahrscheinlichkeit" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Zufallsexperimente" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-02.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Was meint der erste Stichpunkt? Nehmen wir das Beispiel automatische syntaktische Analyse eines deutschen Satzes (sprich: Parsing). Es ist auch für große Anwendungen nicht realistisch, ALLE Regeln der deutschen Syntax und deren Zusammenspiel zu implementieren. Dazu kommt, dass viele große NLP-Systeme für einen Satz mehrere mögliche Strukturen (z.B. Parse-Bäume) finden werden. Die Wahrscheinlichkeitstheorie brauchen wir also, um formal sagen zu können: Diese Struktur hat einen höheren Wert als jene, weil sie eine größere Wahrscheinlichkeit hat.\n", "\n", "Der zweite Stichpunkt meint im einfachsten Fall: Beim Würfeln/Münze werfen/Mensch-ärgere-dich-nicht gibt es nur eine endliche Menge möglicher Ereignisse: 1 gewürfelt/Kopf/Blau würfelt 4." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-04.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Für Interessierte:** Die Erläuterung abzählbarer Mengen findet sich [hier](https://de.wikipedia.org/wiki/Abz%C3%A4hlbare_Menge)." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-05.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Wir ordnen also jedem Ergebnis bzw. Elementarereignis eine Wahrscheinlichkeit zu. Beispiel Würfeln mit einem fairen Würfel:\n", "\n", "$e1=\\{1\\}, e2=\\{2\\}$ usw.\n", "\n", "$P(e1)=P(e2)=...=P(e6)=\\frac{1}{6}$\n", "\n", "Die Wahrscheinlichkeit des Ereignisses \"gerade Zahl\" $eg=e2 \\cup e4 \\cup e6 = \\{2,4,6\\}$ ist also gleich $P(eg)=\\frac{1+1+1}{6}=0.5$\n", "\n", "Ungerade Zahl als Gegenereignnis zu gerade Zahl: Das Gegenereignis zu \"gerade Zahl\" $eu$ ist das Komplement in $\\Omega$ des Ereignisses \"gerade Zahl\".\n", "\n", "$eu= \\Omega \\setminus eg = \\{1,3,5\\}$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 1:\n", "\n", "Estelle mischt 30 Karten mit Zahlen von 1 bis 30. Auf jeder Karte steht die Zahl von Bonbons, die sie kriegt, wenn sie die Karte zieht. \n", "Nachdem sie eine Karte gezogen hat, wie hoch ist die Wahrscheinlichkeit, dass sie mehr als 25 Bonbons kriegt?\n", " \n", "\n", "

a) $\\frac{1}{6}$

\n", "

b) $\\frac{1}{4}$

\n", "

c) $\\frac{1}{2}$

\n", "

d) $\\frac{1}{8}$

\n", " \n", "[Lösung](sol/08-Wahr-Karten.txt)\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 2:\n", "\n", "Nadine hat zwei faire sechsseitige Würfel. Jede Seite ist von 1 bis 6 nummeriert.\n", "\n", "Nadine behauptet, dass, wenn sie beide Würfel würfelt, ihre Summe einen beliebigen ganzzahligen Wert zwischen einschließlich 2 und 12 haben kann, \n", "was 11 verschiedene Summen-Möglichkeiten darstellt. Daher ist die Chance, dass sie eine Summe von 12 würfelt, $\\frac{1}{11}$ ist.\n", "\n", "Ist die Aussage von Nadine wahr oder falsch?\n", "\n", "[Lösung](sol/08-zwoelf-wuerfeln.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-06.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Die Vereinigung der Ereignisse Summe 1, Summe 2, $\\dots$, Summe 12 gibt also $\\Omega=\\{1-1,1-2,1-3,1-4,1-5,1-6,2-1,2-2,\\dots,6-6\\}$. $1-3$ bezeichnet das Ereignis \"erst 1, dann 3\". Es gilt außerdem: $|\\Omega|=6*6=36$, und jedes Elementarereignis $e\\in\\Omega$ hat Wahrscheinlichkeit $P(e)=\\frac{1}{36}$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 3:\n", "\n", "Ungefähr welcher Anteil der menschlichen Bevölkerung wurde am 29. Februar geboren?\n", "\n", "

a) $\\frac{1}{366}$

\n", "

b) $\\frac{1}{365}$

\n", "

c) $\\frac{1}{1461}$

\n", "

d) $\\frac{2}{29}$

\n", "\n", "[Lösung](sol/08-Geburtstag.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 5:\n", "\n", "Erika und Mio können sich nicht entscheiden, wer bei einem Basketballspiel den Ball zuerst bekommt. Sarah schlägt vor, dass sie eine ganze Zahl zwischen 1 und 100 einschließlich wählen sollen. Wer näher an der Zahl ist, die Sarah zufällig ausgewählt hat, bekommt den Ball zuerst.\n", "Erika rät zufällig die Zahl 37. Mio wählt dann eine Zahl aus, die ihre Gewinnchancen maximiert. Welche Nummer hat Mio gewählt?\n", "\n", "[Lösung](sol/08-Basketball.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 6:\n", "\n", "Estelle mischt wieder 30 Karten mit Zahlen von 1 bis 30. Auf jeder Karte steht die Zahl von Bonbons, die sie kriegt, wenn sie die Karte zieht. \n", "Nachdem sie eine Karte gezogen hat, wie hoch ist die Wahrscheinlichkeit, dass sie mehr als 25 Bonbons oder weniger als 10 Bonbons kriegt?\n", " \n", "\n", "

a) $\\frac{2}{3}$

\n", "

b) $\\frac{7}{15}$

\n", "

c) $\\frac{9}{11}$

\n", "

d) $\\frac{3}{10}$

\n", "\n", "[Lösung](sol/08-Wahr-Karten2.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 7:\n", "\n", "Mel und ihr Vater spielen ein Würfel-Spiel. Sie würfeln einen fairen 10-seitigen Würfel, wobei jede Seite eine ganze Zahl von 1 bis 10 hat.\n", "Wenn der Würfelwurf 6 oder größer ist, erhält Mel einen Punkt. Wenn es sich um eine gerade Zahl handelt, erhält ihr Vater einen Punkt.\n", "\n", "Wie hoch ist die Wahrscheinlichkeit, dass Mel's Vater einen Punkt erhält, aber nicht Mel?\n", " \n", "\n", "

a) $\\frac{2}{5}$

\n", "

b) $\\frac{1}{5}$

\n", "

c) $\\frac{3}{10}$

\n", "

d) $\\frac{1}{10}$

\n", "\n", "[Lösung](08-zehn-wuerfeln.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 8:\n", "\n", "Der Professor gibt seiner Klasse eine Klausur mit 10 Fragen. Um jedoch Betrug zu verhindern, hat jede Kopie der Klausur die 10 Fragen in zufälliger Reihenfolge.\n", "\n", "Wie hoch ist die Wahrscheinlichkeit, dass zwei Studierende, die nebeneinander sitzen, bei beiden Klausuren die gleiche \"Frage 1\" haben?\n", " \n", "\n", "

a) $\\frac{2}{5}$

\n", "

b) $\\frac{1}{5}$

\n", "

c) $\\frac{3}{10}$

\n", "

d) $\\frac{1}{10}$

\n", "\n", "[Lösung](sol/08-Klausur.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Diskrete Wahrscheinlichkeitsräume" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-07.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Warum ist $P$ eine Funktion von ${POT}(\\Omega)$ nach $\\mathbb{R}$, die die auf der Folie genannten Eigenschaften erfüllt?\n", "$P$ ordnet jedem möglichen Ereignis, das man mit $\\Omega$ bilden kann, eine Wahrscheinlichkeit im Intervall $[0;1]$ zu.\n", "\n", "Alle möglichen Ereignisse bei einem Experiment sind Elemente von $Pot(\\Omega)$. Beispiel zweimaliges Werfen einer Münze: $\\Omega=\\{KK,KZ,ZK,ZZ\\}$. $Pot(\\Omega)=\\{\\emptyset,\\{KK\\},\\{KZ\\},\\{ZK\\},\\{ZZ\\},\\{KK,KZ\\},\\{KK,ZK\\},\\{KK,ZZ\\},\\dots,\\Omega\\}$. So ist sowohl das \"leere Ereignis\" $\\emptyset$ abgedeckt, als auch das Ereignis $\\Omega$ sowie alle Kombinationen aus einem oder mehr Ergebnissen.\n", "Aus Punkt 2.3 auf der Folie folgt, dass $P(\\emptyset)=0$.\n", "

Man kann sich diesen Punkt wie folgt anschaulich machen: Erst ordnen wir jedem der Ergebnisse $\\{KK\\},\\{KZ\\},\\{ZK\\},\\{ZZ\\}$ eine Wahrscheinlichkeit zu. Die kennen wir: bei fairen Münzen ist das jeweils $\\frac{1}{4}$. $\\{KK\\}$ und $\\{KZ\\}$ sind paarweise disjunkt, und deshalb gilt: $P(\\{KK\\}\\cup\\{KZ\\})=P(\\{\\{KK\\},\\{KZ\\}\\})=P(\\{KK\\}+P\\{KZ\\})=\\frac{1}{2}$

\n", "\n", "Da z.B. $P(\\Omega)=P(\\{KK,KZ,ZK,ZZ\\})=P(\\{KK\\})+P(\\{KZ\\})+P(\\{ZK\\})+P(\\{ZZ\\})=\\frac{1}{4}*4=1$ und $P(\\{KK\\})=P(\\{KK\\}\\cup \\emptyset) = \\frac{1}{4}$, muss $P(\\emptyset)=0$ sein." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 9:\n", "\n", "Wenn zwei faire Münzen gleichzeitig geworfen werden, wie hoch ist die Wahrscheinlichkeit, dass genau ein Kopf erscheint?\n", "\n", "

a) $\\frac{1}{2}$

\n", "

b) $\\frac{3}{4}$

\n", "

c) $\\frac{1}{4}$

\n", "

d) $\\frac{1}{1}$

\n", "\n", "[Lösung](sol/08-Muenzen.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-08.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Punkt ***1*** und ***2*** sind oben schon erläutert. Was bedeutet *\"Tertium non datur\"*? Wörtlich übersetzt: Das dritte ist nicht gegeben. Es tritt entweder $A$ oder das Gegenereignis zu $A$, $\\overline{A}=\\Omega\\setminus A$ ein. $A\\cup\\overline{A}=\\Omega$ und $P(\\Omega)=1$.\n", "\n", "Punkt ***4***: Ereignis $A$ impliziert Ereignis $B$ bedeutet: Wer A sagt, muss auch B sagen bzw. Wenn $A$ eintritt, tritt auch $B$ ein. Beispiel Zweimal Münze werfen: $A=\\{KK\\}, B=\\{KK,ZZ\\}$ und $A \\subseteq B$. $P(B\\setminus A)=P(\\{ZZ\\})=P(B)-P(A)=\\frac{1}{2}-\\frac{1}{4}=\\frac{1}{4}$. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-10.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Aufgabe 11:\n", "\n", "Sei X die Anzahl der Fernseher in einem nach dem Zufallsprinzip ausgewählten Haushalt. Für alle Haushalte in der Stadt gilt, dass\n", " $P(X = 0) = 0.08,\n", " P(X = 1) = 0.18,\n", " P(X = 2) = 0.36,\n", " P(X = 3) = 0.3,\n", " P(X = 4) = 0.04$\n", " \n", "Was ist $P(X < 4)$?\n", "\n", "[Lösung](sol/08-TV.txt)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Folie 1](Folien/08/slide-11.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Die zweite Folie ist besser, denn hier gilt: $P(\\Omega)=0.09+0.36+0.25+0.3=1$. Es handelt sich also um einen \"guten\" Wahrscheinlichkeitsraum." ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.4" } }, "nbformat": 4, "nbformat_minor": 2 }