{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Päivitetty 2023-10-23 / Aki Taanila\n" ] } ], "source": [ "from datetime import datetime\n", "print(f'Päivitetty {datetime.now().date()} / Aki Taanila')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Luokiteltu jakauma\n", "\n", "Määrällisen muuttujan jakaumaan tutustun luokitellun jakauman avulla. Luokitellun jakauman voin esittää frekvenssitaulukkona tai histogrammina." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "sns.set_style('whitegrid')" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | nro | \n", "sukup | \n", "ikä | \n", "perhe | \n", "koulutus | \n", "palveluv | \n", "palkka | \n", "johto | \n", "työtov | \n", "työymp | \n", "palkkat | \n", "työteht | \n", "työterv | \n", "lomaosa | \n", "kuntosa | \n", "hieroja | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "38 | \n", "1 | \n", "1.0 | \n", "22.0 | \n", "3587 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
1 | \n", "2 | \n", "1 | \n", "29 | \n", "2 | \n", "2.0 | \n", "10.0 | \n", "2963 | \n", "1 | \n", "5.0 | \n", "2 | \n", "1 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
2 | \n", "3 | \n", "1 | \n", "30 | \n", "1 | \n", "1.0 | \n", "7.0 | \n", "1989 | \n", "3 | \n", "4.0 | \n", "1 | \n", "1 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
3 | \n", "4 | \n", "1 | \n", "36 | \n", "2 | \n", "1.0 | \n", "14.0 | \n", "2144 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
4 | \n", "5 | \n", "1 | \n", "24 | \n", "1 | \n", "2.0 | \n", "4.0 | \n", "2183 | \n", "2 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
77 | \n", "78 | \n", "1 | \n", "22 | \n", "1 | \n", "3.0 | \n", "0.0 | \n", "1598 | \n", "4 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "NaN | \n", "1.0 | \n", "1.0 | \n", "NaN | \n", "
78 | \n", "79 | \n", "1 | \n", "33 | \n", "1 | \n", "1.0 | \n", "2.0 | \n", "1638 | \n", "1 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
79 | \n", "80 | \n", "1 | \n", "27 | \n", "1 | \n", "2.0 | \n", "7.0 | \n", "2612 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "1.0 | \n", "NaN | \n", "
80 | \n", "81 | \n", "1 | \n", "35 | \n", "2 | \n", "2.0 | \n", "16.0 | \n", "2808 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
81 | \n", "82 | \n", "2 | \n", "35 | \n", "2 | \n", "3.0 | \n", "15.0 | \n", "2183 | \n", "3 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
82 rows × 16 columns
\n", "\n", " | nro | \n", "sukup | \n", "ikä | \n", "perhe | \n", "koulutus | \n", "palveluv | \n", "palkka | \n", "johto | \n", "työtov | \n", "työymp | \n", "palkkat | \n", "työteht | \n", "työterv | \n", "lomaosa | \n", "kuntosa | \n", "hieroja | \n", "palkkaluokka | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "38 | \n", "1 | \n", "1.0 | \n", "22.0 | \n", "3587 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[3000, 4000) | \n", "
1 | \n", "2 | \n", "1 | \n", "29 | \n", "2 | \n", "2.0 | \n", "10.0 | \n", "2963 | \n", "1 | \n", "5.0 | \n", "2 | \n", "1 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[2000, 3000) | \n", "
2 | \n", "3 | \n", "1 | \n", "30 | \n", "1 | \n", "1.0 | \n", "7.0 | \n", "1989 | \n", "3 | \n", "4.0 | \n", "1 | \n", "1 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[1000, 2000) | \n", "
3 | \n", "4 | \n", "1 | \n", "36 | \n", "2 | \n", "1.0 | \n", "14.0 | \n", "2144 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[2000, 3000) | \n", "
4 | \n", "5 | \n", "1 | \n", "24 | \n", "1 | \n", "2.0 | \n", "4.0 | \n", "2183 | \n", "2 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[2000, 3000) | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
77 | \n", "78 | \n", "1 | \n", "22 | \n", "1 | \n", "3.0 | \n", "0.0 | \n", "1598 | \n", "4 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "NaN | \n", "1.0 | \n", "1.0 | \n", "NaN | \n", "[1000, 2000) | \n", "
78 | \n", "79 | \n", "1 | \n", "33 | \n", "1 | \n", "1.0 | \n", "2.0 | \n", "1638 | \n", "1 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[1000, 2000) | \n", "
79 | \n", "80 | \n", "1 | \n", "27 | \n", "1 | \n", "2.0 | \n", "7.0 | \n", "2612 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "1.0 | \n", "NaN | \n", "[2000, 3000) | \n", "
80 | \n", "81 | \n", "1 | \n", "35 | \n", "2 | \n", "2.0 | \n", "16.0 | \n", "2808 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[2000, 3000) | \n", "
81 | \n", "82 | \n", "2 | \n", "35 | \n", "2 | \n", "3.0 | \n", "15.0 | \n", "2183 | \n", "3 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "[2000, 3000) | \n", "
82 rows × 17 columns
\n", "\n", " | f | \n", "% | \n", "
---|---|---|
palkkaluokka | \n", "\n", " | \n", " |
[1000, 2000) | \n", "19 | \n", "23.2 % | \n", "
[2000, 3000) | \n", "50 | \n", "61.0 % | \n", "
[3000, 4000) | \n", "8 | \n", "9.8 % | \n", "
[4000, 7000) | \n", "5 | \n", "6.1 % | \n", "
Yhteensä | \n", "82 | \n", "100.0 % | \n", "