In [1]:
import pandas as pd
from scipy.stats import poisson

<h1>Poisson-jakauma</h1>

Kun binomijakauman toistojen määrää n kasvatetaan ja todennäköisyyttä p pienennetään, niin binomijakauma lähestyy Poisson jakaumaa. 

Poisson-jakaumaa voidaan käyttää jos toistojen määrä n on suuri ja tarkasteltava tapahtuma on harvinainen (todennäköisyys p on pieni). Toistojen määrän ei itse asiassa tarvitse edes olla tiedossa. Ainoa tarvittava tieto on odotusarvo, joka on tapahtumien keskimääräinen lukumäärä (kuinka monta kertaa tapahtuma keskimäärin on sattunut tarkasteltavana olevassa erässä, aikavälissä jne.). Yleisimmin Poisson-jakaumaa sovelletaan tietyssä aikavälissä sattuvien tapahtumien lukumäärän tarkasteluun.

Esimerkki. Pankin konttoriin lounasaikana viiden minuutin aikana saapuvien asiakkaiden määrän voidaan olettaa olevan Poisson-jakautunut. Toistojen määrä on suuri (kaikki pankin asiakkaat) ja todennäköisyys, että tietty satunnaisesti valittu pankin asiakas saapuu juuri kyseisen viiden minuutin aikana, on pieni. Poisson-jakauman käyttämiseksi lounasaikana saapuvien asiakkaiden määrää pitää tarkkailla viiden minuutin ajanjaksoissa, josta saadaan laskettua keskimäärin viidessä minuutissa saapuvien asiakkaiden määrä.

Esimerkki. Tieliikenteessä vuosittain kuolevien lukumäärää voidaan mallintaa Poisson-jakaumalla. Toistojen määrä on suuri (kaikki tieliikenteessä liikkuvat) ja todennäköisyys, että tietty satunnaisesti valittu henkilö kuolee juuri kyseisen vuoden aikana tieliikenteessä, on pieni. Poisson-jakauman käyttämiseksi tarvitaan historiatietoja, joiden perusteella voidaan laskea keskimäärin vuodessa tieliikenteessä kuolleiden luku-määrä.

Esimerkki. Ensiapuaseman johtajaa saattaa kiinnostaa tietää kuinka suurta potilasmäärää ensiapuasemalle voidaan tietyssä työvuorossa lauantai-iltana odottaa, jotta henkilökunnan määrä voitaisiin mitoittaa sopivaksi. Aikaisempien viikkojen ja kuukausien tietoja tarkastelemalla selviää, että keskimäärin ensiapuasemalle on saapunut lauantai-iltaisin 3 potilasta tunnissa. Johtaja ajattelee, että juurihan viime viikolla varauduttiin kolmen potilaan käsittelyyn tunnissa, mutta tuloksena oli täysi kaaos ja joukko vihaisia odotushuoneessa odottavia potilaita. Tarkastellaanpa pelkän keskiarvon sijasta todennäköisyysjakaumaa: Tietyssä aikavälissä saapuvien asiakkaiden määrän voidaan olettaa noudattavan Poisson-jakaumaa.

In [2]:
mu = 3
x_values = list(range(0, 10))

dist = [poisson.pmf(x, mu) for x in x_values] #pmf = probability mass function
cum = [poisson.cdf(x, mu) for x in x_values] #cdf = cumulative distribution function
surv = [poisson.sf(x, mu) for x in x_values] #sf = survival function

jakauma1 = pd.DataFrame({'Todennäköisyys': dist, 'Kertymä': cum, 'Enemmän': surv})
jakauma1.index.name = 'Asiakkaita'
jakauma1

Unnamed: 0_level_0,Todennäköisyys,Kertymä,Enemmän
Asiakkaita,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
0,0.049787,0.049787,0.950213
1,0.149361,0.199148,0.800852
2,0.224042,0.42319,0.57681
3,0.224042,0.647232,0.352768
4,0.168031,0.815263,0.184737
5,0.100819,0.916082,0.083918
6,0.050409,0.966491,0.033509
7,0.021604,0.988095,0.011905
8,0.008102,0.996197,0.003803
9,0.002701,0.998898,0.001102


Taulukosta voidaan nähdä, että varautumalla kuuteen (6) asiakkaaseen tunnissa todennäköisyys kapasiteetin riittämiseen on noin 96,6 %. Todennäköisyys isomalle asiakasmäärälle on noin 3,4 %. 

Esimerkki. Kodinkoneliike haluaa arvioida kuinka monta tietyn mallista TV:tä kannattaa pitää varastossa, kun tiedetään keskimääräiseksi viikkomyynniksi 5 kpl. Edellisen esimerkin taulukosta saadaan pienin muutoksin tähän esimerkkiin sopiva taulukko. Keskimääräisen potilasmäärän 3 tilalle kirjoitetaan TV:n keskimääräinen myyntimäärä 5. Taulukosta voidaan tämän jälkeen etsiä esimerkiksi lukumäärä, joka takaa riittävyyden 90 % varmuudella.

In [3]:
mu = 5
x_values = list(range(0, 10))

dist = [poisson.pmf(x, mu) for x in x_values]
cum = [poisson.cdf(x, mu) for x in x_values]
surv = [poisson.sf(x, mu) for x in x_values]

jakauma2 = pd.DataFrame({'Todennäköisyys': dist, 'Kertymä': cum, 'Enemmän': surv})
jakauma2.index.name = 'Kysyntä'
jakauma2

Unnamed: 0_level_0,Todennäköisyys,Kertymä,Enemmän
Kysyntä,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
0,0.006738,0.006738,0.993262
1,0.03369,0.040428,0.959572
2,0.084224,0.124652,0.875348
3,0.140374,0.265026,0.734974
4,0.175467,0.440493,0.559507
5,0.175467,0.615961,0.384039
6,0.146223,0.762183,0.237817
7,0.104445,0.866628,0.133372
8,0.065278,0.931906,0.068094
9,0.036266,0.968172,0.031828


Lisätietoa https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.poisson.html