{ "cells": [ { "cell_type": "code", "execution_count": 1, "id": "5505d2e3", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Päivitetty 2025-11-30 / Aki Taanila\n" ] } ], "source": [ "from datetime import datetime\n", "print(f'Päivitetty {datetime.now().date()} / Aki Taanila')" ] }, { "cell_type": "markdown", "id": "99e63c07", "metadata": {}, "source": [ "## Histplot - määrällisen muuttujan luokiteltu jakauma\n", "\n", "Määrällisen muuttujan jakauman graafiseen esittämiseen voidaan käyttää\n", "\n", "- Ruutu- ja janakaaviota (boxplot), joka perustuu tilastollisiin tunnuslukuihin. Katso https://github.com/taanila/kaaviot/blob/master/sns_box.ipynb.\n", "- Histogrammia, joka esittää luokitellun muuttujan lukumäärä- tai prosenttiyhteenvedon.\n", "\n", "Tässä muistiossa esitetään esimerkkejä histogrammin käytöstä.\n", "\n", "### Tuonnit ja alkuvalmistelut\n", "\n", "- Grafiikan tyylimäärittelyssä voit käyttää **'whitegrid'** sijasta **'white'**, **'dark'**, **'darkgrid'** tai **'ticks'**. Voit myös jättää tyylimäärittelyn tekemättä.\n", "- **PercentFormatter** auttaa muotoilemaan akselin prosenttiasteikon.\n", "- **MultipleLocator** auttaa muuttamaan akselin asteikon jaotusta." ] }, { "cell_type": "code", "execution_count": 2, "id": "6cf278ec", "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "sns.set_style('whitegrid')\n", "from matplotlib.ticker import PercentFormatter, MultipleLocator\n", "ticks = PercentFormatter(xmax=100, decimals=0, symbol=' %')" ] }, { "cell_type": "markdown", "id": "986f4c2d-1807-4e5a-9d47-d0ea804e568c", "metadata": {}, "source": [ "### Datan avaaminen\n", "\n", "Seaborn-paketin esimerkkidata **tips** sisältää tietoja ravintolassa asioineista seurueista." ] }, { "cell_type": "code", "execution_count": 3, "id": "595ef5a4-f318-4fb4-90f7-3cc2cea5692d", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | total_bill | \n", "tip | \n", "sex | \n", "smoker | \n", "day | \n", "time | \n", "size | \n", "
|---|---|---|---|---|---|---|---|
| 0 | \n", "16.99 | \n", "1.01 | \n", "Female | \n", "No | \n", "Sun | \n", "Dinner | \n", "2 | \n", "
| 1 | \n", "10.34 | \n", "1.66 | \n", "Male | \n", "No | \n", "Sun | \n", "Dinner | \n", "3 | \n", "
| 2 | \n", "21.01 | \n", "3.50 | \n", "Male | \n", "No | \n", "Sun | \n", "Dinner | \n", "3 | \n", "
| 3 | \n", "23.68 | \n", "3.31 | \n", "Male | \n", "No | \n", "Sun | \n", "Dinner | \n", "2 | \n", "
| 4 | \n", "24.59 | \n", "3.61 | \n", "Female | \n", "No | \n", "Sun | \n", "Dinner | \n", "4 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 239 | \n", "29.03 | \n", "5.92 | \n", "Male | \n", "No | \n", "Sat | \n", "Dinner | \n", "3 | \n", "
| 240 | \n", "27.18 | \n", "2.00 | \n", "Female | \n", "Yes | \n", "Sat | \n", "Dinner | \n", "2 | \n", "
| 241 | \n", "22.67 | \n", "2.00 | \n", "Male | \n", "Yes | \n", "Sat | \n", "Dinner | \n", "2 | \n", "
| 242 | \n", "17.82 | \n", "1.75 | \n", "Male | \n", "No | \n", "Sat | \n", "Dinner | \n", "2 | \n", "
| 243 | \n", "18.78 | \n", "3.00 | \n", "Female | \n", "No | \n", "Thur | \n", "Dinner | \n", "2 | \n", "
244 rows × 7 columns
\n", "