{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Päivitetty 2025-05-16 / Aki Taanila\n"
     ]
    }
   ],
   "source": [
    "from datetime import datetime\n",
    "print(f'Päivitetty {datetime.now().date()} / Aki Taanila')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Desimaalipisteet pilkuiksi\n",
    "\n",
    "Pythonissa käytetään desimaalierottimena pistettä. Seuraavassa esittelen keinoja vaihtaa desimaalierottimeksi pilkku."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Pandas-kirjaston versiosta 1.3.0 lähtien desimaalipisteet voi näyttää pilkkuina **style.format**-funktion **decimal**-parametria käyttäen."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_de903\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_de903_level0_col0\" class=\"col_heading level0 col0\" >nro</th>\n",
       "      <th id=\"T_de903_level0_col1\" class=\"col_heading level0 col1\" >sukup</th>\n",
       "      <th id=\"T_de903_level0_col2\" class=\"col_heading level0 col2\" >ikä</th>\n",
       "      <th id=\"T_de903_level0_col3\" class=\"col_heading level0 col3\" >perhe</th>\n",
       "      <th id=\"T_de903_level0_col4\" class=\"col_heading level0 col4\" >koulutus</th>\n",
       "      <th id=\"T_de903_level0_col5\" class=\"col_heading level0 col5\" >palveluv</th>\n",
       "      <th id=\"T_de903_level0_col6\" class=\"col_heading level0 col6\" >palkka</th>\n",
       "      <th id=\"T_de903_level0_col7\" class=\"col_heading level0 col7\" >johto</th>\n",
       "      <th id=\"T_de903_level0_col8\" class=\"col_heading level0 col8\" >työtov</th>\n",
       "      <th id=\"T_de903_level0_col9\" class=\"col_heading level0 col9\" >työymp</th>\n",
       "      <th id=\"T_de903_level0_col10\" class=\"col_heading level0 col10\" >palkkat</th>\n",
       "      <th id=\"T_de903_level0_col11\" class=\"col_heading level0 col11\" >työteht</th>\n",
       "      <th id=\"T_de903_level0_col12\" class=\"col_heading level0 col12\" >työterv</th>\n",
       "      <th id=\"T_de903_level0_col13\" class=\"col_heading level0 col13\" >lomaosa</th>\n",
       "      <th id=\"T_de903_level0_col14\" class=\"col_heading level0 col14\" >kuntosa</th>\n",
       "      <th id=\"T_de903_level0_col15\" class=\"col_heading level0 col15\" >hieroja</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row0\" class=\"row_heading level0 row0\" >count</th>\n",
       "      <td id=\"T_de903_row0_col0\" class=\"data row0 col0\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col1\" class=\"data row0 col1\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col2\" class=\"data row0 col2\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col3\" class=\"data row0 col3\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col4\" class=\"data row0 col4\" >81,0</td>\n",
       "      <td id=\"T_de903_row0_col5\" class=\"data row0 col5\" >80,0</td>\n",
       "      <td id=\"T_de903_row0_col6\" class=\"data row0 col6\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col7\" class=\"data row0 col7\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col8\" class=\"data row0 col8\" >81,0</td>\n",
       "      <td id=\"T_de903_row0_col9\" class=\"data row0 col9\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col10\" class=\"data row0 col10\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col11\" class=\"data row0 col11\" >82,0</td>\n",
       "      <td id=\"T_de903_row0_col12\" class=\"data row0 col12\" >47,0</td>\n",
       "      <td id=\"T_de903_row0_col13\" class=\"data row0 col13\" >20,0</td>\n",
       "      <td id=\"T_de903_row0_col14\" class=\"data row0 col14\" >9,0</td>\n",
       "      <td id=\"T_de903_row0_col15\" class=\"data row0 col15\" >22,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row1\" class=\"row_heading level0 row1\" >mean</th>\n",
       "      <td id=\"T_de903_row1_col0\" class=\"data row1 col0\" >41,5</td>\n",
       "      <td id=\"T_de903_row1_col1\" class=\"data row1 col1\" >1,2</td>\n",
       "      <td id=\"T_de903_row1_col2\" class=\"data row1 col2\" >38,0</td>\n",
       "      <td id=\"T_de903_row1_col3\" class=\"data row1 col3\" >1,6</td>\n",
       "      <td id=\"T_de903_row1_col4\" class=\"data row1 col4\" >2,0</td>\n",
       "      <td id=\"T_de903_row1_col5\" class=\"data row1 col5\" >12,2</td>\n",
       "      <td id=\"T_de903_row1_col6\" class=\"data row1 col6\" >2563,9</td>\n",
       "      <td id=\"T_de903_row1_col7\" class=\"data row1 col7\" >3,1</td>\n",
       "      <td id=\"T_de903_row1_col8\" class=\"data row1 col8\" >4,1</td>\n",
       "      <td id=\"T_de903_row1_col9\" class=\"data row1 col9\" >3,2</td>\n",
       "      <td id=\"T_de903_row1_col10\" class=\"data row1 col10\" >2,1</td>\n",
       "      <td id=\"T_de903_row1_col11\" class=\"data row1 col11\" >3,2</td>\n",
       "      <td id=\"T_de903_row1_col12\" class=\"data row1 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row1_col13\" class=\"data row1 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row1_col14\" class=\"data row1 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row1_col15\" class=\"data row1 col15\" >1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row2\" class=\"row_heading level0 row2\" >std</th>\n",
       "      <td id=\"T_de903_row2_col0\" class=\"data row2 col0\" >23,8</td>\n",
       "      <td id=\"T_de903_row2_col1\" class=\"data row2 col1\" >0,4</td>\n",
       "      <td id=\"T_de903_row2_col2\" class=\"data row2 col2\" >9,8</td>\n",
       "      <td id=\"T_de903_row2_col3\" class=\"data row2 col3\" >0,5</td>\n",
       "      <td id=\"T_de903_row2_col4\" class=\"data row2 col4\" >0,8</td>\n",
       "      <td id=\"T_de903_row2_col5\" class=\"data row2 col5\" >8,8</td>\n",
       "      <td id=\"T_de903_row2_col6\" class=\"data row2 col6\" >849,4</td>\n",
       "      <td id=\"T_de903_row2_col7\" class=\"data row2 col7\" >1,1</td>\n",
       "      <td id=\"T_de903_row2_col8\" class=\"data row2 col8\" >0,8</td>\n",
       "      <td id=\"T_de903_row2_col9\" class=\"data row2 col9\" >1,2</td>\n",
       "      <td id=\"T_de903_row2_col10\" class=\"data row2 col10\" >1,1</td>\n",
       "      <td id=\"T_de903_row2_col11\" class=\"data row2 col11\" >1,0</td>\n",
       "      <td id=\"T_de903_row2_col12\" class=\"data row2 col12\" >0,0</td>\n",
       "      <td id=\"T_de903_row2_col13\" class=\"data row2 col13\" >0,0</td>\n",
       "      <td id=\"T_de903_row2_col14\" class=\"data row2 col14\" >0,0</td>\n",
       "      <td id=\"T_de903_row2_col15\" class=\"data row2 col15\" >0,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row3\" class=\"row_heading level0 row3\" >min</th>\n",
       "      <td id=\"T_de903_row3_col0\" class=\"data row3 col0\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col1\" class=\"data row3 col1\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col2\" class=\"data row3 col2\" >20,0</td>\n",
       "      <td id=\"T_de903_row3_col3\" class=\"data row3 col3\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col4\" class=\"data row3 col4\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col5\" class=\"data row3 col5\" >0,0</td>\n",
       "      <td id=\"T_de903_row3_col6\" class=\"data row3 col6\" >1521,0</td>\n",
       "      <td id=\"T_de903_row3_col7\" class=\"data row3 col7\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col8\" class=\"data row3 col8\" >2,0</td>\n",
       "      <td id=\"T_de903_row3_col9\" class=\"data row3 col9\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col10\" class=\"data row3 col10\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col11\" class=\"data row3 col11\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col12\" class=\"data row3 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col13\" class=\"data row3 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col14\" class=\"data row3 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row3_col15\" class=\"data row3 col15\" >1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row4\" class=\"row_heading level0 row4\" >25%</th>\n",
       "      <td id=\"T_de903_row4_col0\" class=\"data row4 col0\" >21,2</td>\n",
       "      <td id=\"T_de903_row4_col1\" class=\"data row4 col1\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col2\" class=\"data row4 col2\" >31,0</td>\n",
       "      <td id=\"T_de903_row4_col3\" class=\"data row4 col3\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col4\" class=\"data row4 col4\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col5\" class=\"data row4 col5\" >3,8</td>\n",
       "      <td id=\"T_de903_row4_col6\" class=\"data row4 col6\" >2027,0</td>\n",
       "      <td id=\"T_de903_row4_col7\" class=\"data row4 col7\" >2,0</td>\n",
       "      <td id=\"T_de903_row4_col8\" class=\"data row4 col8\" >4,0</td>\n",
       "      <td id=\"T_de903_row4_col9\" class=\"data row4 col9\" >3,0</td>\n",
       "      <td id=\"T_de903_row4_col10\" class=\"data row4 col10\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col11\" class=\"data row4 col11\" >3,0</td>\n",
       "      <td id=\"T_de903_row4_col12\" class=\"data row4 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col13\" class=\"data row4 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col14\" class=\"data row4 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row4_col15\" class=\"data row4 col15\" >1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row5\" class=\"row_heading level0 row5\" >50%</th>\n",
       "      <td id=\"T_de903_row5_col0\" class=\"data row5 col0\" >41,5</td>\n",
       "      <td id=\"T_de903_row5_col1\" class=\"data row5 col1\" >1,0</td>\n",
       "      <td id=\"T_de903_row5_col2\" class=\"data row5 col2\" >37,5</td>\n",
       "      <td id=\"T_de903_row5_col3\" class=\"data row5 col3\" >2,0</td>\n",
       "      <td id=\"T_de903_row5_col4\" class=\"data row5 col4\" >2,0</td>\n",
       "      <td id=\"T_de903_row5_col5\" class=\"data row5 col5\" >12,5</td>\n",
       "      <td id=\"T_de903_row5_col6\" class=\"data row5 col6\" >2320,0</td>\n",
       "      <td id=\"T_de903_row5_col7\" class=\"data row5 col7\" >3,0</td>\n",
       "      <td id=\"T_de903_row5_col8\" class=\"data row5 col8\" >4,0</td>\n",
       "      <td id=\"T_de903_row5_col9\" class=\"data row5 col9\" >3,0</td>\n",
       "      <td id=\"T_de903_row5_col10\" class=\"data row5 col10\" >2,0</td>\n",
       "      <td id=\"T_de903_row5_col11\" class=\"data row5 col11\" >3,0</td>\n",
       "      <td id=\"T_de903_row5_col12\" class=\"data row5 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row5_col13\" class=\"data row5 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row5_col14\" class=\"data row5 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row5_col15\" class=\"data row5 col15\" >1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row6\" class=\"row_heading level0 row6\" >75%</th>\n",
       "      <td id=\"T_de903_row6_col0\" class=\"data row6 col0\" >61,8</td>\n",
       "      <td id=\"T_de903_row6_col1\" class=\"data row6 col1\" >1,0</td>\n",
       "      <td id=\"T_de903_row6_col2\" class=\"data row6 col2\" >44,0</td>\n",
       "      <td id=\"T_de903_row6_col3\" class=\"data row6 col3\" >2,0</td>\n",
       "      <td id=\"T_de903_row6_col4\" class=\"data row6 col4\" >3,0</td>\n",
       "      <td id=\"T_de903_row6_col5\" class=\"data row6 col5\" >18,2</td>\n",
       "      <td id=\"T_de903_row6_col6\" class=\"data row6 col6\" >2808,0</td>\n",
       "      <td id=\"T_de903_row6_col7\" class=\"data row6 col7\" >4,0</td>\n",
       "      <td id=\"T_de903_row6_col8\" class=\"data row6 col8\" >5,0</td>\n",
       "      <td id=\"T_de903_row6_col9\" class=\"data row6 col9\" >4,0</td>\n",
       "      <td id=\"T_de903_row6_col10\" class=\"data row6 col10\" >3,0</td>\n",
       "      <td id=\"T_de903_row6_col11\" class=\"data row6 col11\" >4,0</td>\n",
       "      <td id=\"T_de903_row6_col12\" class=\"data row6 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row6_col13\" class=\"data row6 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row6_col14\" class=\"data row6 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row6_col15\" class=\"data row6 col15\" >1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_de903_level0_row7\" class=\"row_heading level0 row7\" >max</th>\n",
       "      <td id=\"T_de903_row7_col0\" class=\"data row7 col0\" >82,0</td>\n",
       "      <td id=\"T_de903_row7_col1\" class=\"data row7 col1\" >2,0</td>\n",
       "      <td id=\"T_de903_row7_col2\" class=\"data row7 col2\" >61,0</td>\n",
       "      <td id=\"T_de903_row7_col3\" class=\"data row7 col3\" >2,0</td>\n",
       "      <td id=\"T_de903_row7_col4\" class=\"data row7 col4\" >4,0</td>\n",
       "      <td id=\"T_de903_row7_col5\" class=\"data row7 col5\" >36,0</td>\n",
       "      <td id=\"T_de903_row7_col6\" class=\"data row7 col6\" >6278,0</td>\n",
       "      <td id=\"T_de903_row7_col7\" class=\"data row7 col7\" >5,0</td>\n",
       "      <td id=\"T_de903_row7_col8\" class=\"data row7 col8\" >5,0</td>\n",
       "      <td id=\"T_de903_row7_col9\" class=\"data row7 col9\" >5,0</td>\n",
       "      <td id=\"T_de903_row7_col10\" class=\"data row7 col10\" >5,0</td>\n",
       "      <td id=\"T_de903_row7_col11\" class=\"data row7 col11\" >5,0</td>\n",
       "      <td id=\"T_de903_row7_col12\" class=\"data row7 col12\" >1,0</td>\n",
       "      <td id=\"T_de903_row7_col13\" class=\"data row7 col13\" >1,0</td>\n",
       "      <td id=\"T_de903_row7_col14\" class=\"data row7 col14\" >1,0</td>\n",
       "      <td id=\"T_de903_row7_col15\" class=\"data row7 col15\" >1,0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x1edc0b13770>"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Avaan datan\n",
    "df = pd.read_excel('https://taanila.fi/data1.xlsx')\n",
    "\n",
    "# Lasken tunnuslukuja ja esitän tulokset yhdellä desimaalilla desimaalipilkkua käyttäen\n",
    "df.describe().style.format('{:.1f}', decimal=',')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_76f67\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"index_name level0\" ></th>\n",
       "      <th id=\"T_76f67_level0_col0\" class=\"col_heading level0 col0\" >f</th>\n",
       "      <th id=\"T_76f67_level0_col1\" class=\"col_heading level0 col1\" >%</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_76f67_level0_row0\" class=\"row_heading level0 row0\" >Peruskoulu</th>\n",
       "      <td id=\"T_76f67_row0_col0\" class=\"data row0 col0\" >27</td>\n",
       "      <td id=\"T_76f67_row0_col1\" class=\"data row0 col1\" >33,3 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_76f67_level0_row1\" class=\"row_heading level0 row1\" >2. aste</th>\n",
       "      <td id=\"T_76f67_row1_col0\" class=\"data row1 col0\" >30</td>\n",
       "      <td id=\"T_76f67_row1_col1\" class=\"data row1 col1\" >37,0 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_76f67_level0_row2\" class=\"row_heading level0 row2\" >Korkeakoulu</th>\n",
       "      <td id=\"T_76f67_row2_col0\" class=\"data row2 col0\" >22</td>\n",
       "      <td id=\"T_76f67_row2_col1\" class=\"data row2 col1\" >27,2 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_76f67_level0_row3\" class=\"row_heading level0 row3\" >Ylempi korkeakoulu</th>\n",
       "      <td id=\"T_76f67_row3_col0\" class=\"data row3 col0\" >2</td>\n",
       "      <td id=\"T_76f67_row3_col1\" class=\"data row3 col1\" >2,5 %</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x1edbc474910>"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Frekvenssitaulukko koulutuksesta\n",
    "\n",
    "df1 = pd.crosstab(df['koulutus'], 'f')\n",
    "df1['%'] = df1/df1.sum()*100\n",
    "df1.columns.name = ''\n",
    "df1.index = ['Peruskoulu', '2. aste', 'Korkeakoulu', 'Ylempi korkeakoulu']\n",
    "\n",
    "# Frekvenssit ilman desimaaleja, prosentit yhdellä desimaalilla, desimaalierottimena pilkku\n",
    "df1.style.format({'n':'{:.0f}', '%':'{:.1f} %'}, decimal=',')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Vanhemmat pandas-kirjaston versiot"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "style.format-funktion decimal-parametri on käytettävissä pandas-versiosta 1.3.0 alkaen. Vanhemmissa versiossa desimaalipisteen vaihtaminen pilkuiksi tarvitsee tehdä toisella tavalla.\n",
    "\n",
    "Seuraavassa **pilkut**-funktio pyöristää (round) luvun yhden desimaalin tarkkuuteen ja korvaa merkkijonoksi muutetusta luvusta (str) pisteen pilkulla.\n",
    "\n",
    "Jos x ei ole luku, niin round-funktio kaatuu virheilmoitukseen. Tässä kaatuminen estetään virheensieppauksella (try - except).\n",
    "\n",
    "**pilkutp**-funktio lisää perään välilyönnin ja %-merkin."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "def pilkut(x):\n",
    "    try:\n",
    "        x = round(x, 1)\n",
    "    except:\n",
    "        pass\n",
    "    x = str(x).replace('.', ',')\n",
    "    return x\n",
    "\n",
    "def pilkutp(x):\n",
    "    try:\n",
    "        x = round(x, 1)\n",
    "    except:\n",
    "        pass\n",
    "    x = str(x).replace('.', ',')\n",
    "    return x+' %'"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>nro</th>\n",
       "      <th>sukup</th>\n",
       "      <th>ikä</th>\n",
       "      <th>perhe</th>\n",
       "      <th>koulutus</th>\n",
       "      <th>palveluv</th>\n",
       "      <th>palkka</th>\n",
       "      <th>johto</th>\n",
       "      <th>työtov</th>\n",
       "      <th>työymp</th>\n",
       "      <th>palkkat</th>\n",
       "      <th>työteht</th>\n",
       "      <th>työterv</th>\n",
       "      <th>lomaosa</th>\n",
       "      <th>kuntosa</th>\n",
       "      <th>hieroja</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>count</th>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>81,0</td>\n",
       "      <td>80,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>81,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>82,0</td>\n",
       "      <td>47,0</td>\n",
       "      <td>20,0</td>\n",
       "      <td>9,0</td>\n",
       "      <td>22,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>mean</th>\n",
       "      <td>41,5</td>\n",
       "      <td>1,2</td>\n",
       "      <td>38,0</td>\n",
       "      <td>1,6</td>\n",
       "      <td>2,0</td>\n",
       "      <td>12,2</td>\n",
       "      <td>2563,9</td>\n",
       "      <td>3,1</td>\n",
       "      <td>4,1</td>\n",
       "      <td>3,2</td>\n",
       "      <td>2,1</td>\n",
       "      <td>3,2</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>std</th>\n",
       "      <td>23,8</td>\n",
       "      <td>0,4</td>\n",
       "      <td>9,8</td>\n",
       "      <td>0,5</td>\n",
       "      <td>0,8</td>\n",
       "      <td>8,8</td>\n",
       "      <td>849,4</td>\n",
       "      <td>1,1</td>\n",
       "      <td>0,8</td>\n",
       "      <td>1,2</td>\n",
       "      <td>1,1</td>\n",
       "      <td>1,0</td>\n",
       "      <td>0,0</td>\n",
       "      <td>0,0</td>\n",
       "      <td>0,0</td>\n",
       "      <td>0,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>min</th>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>20,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>0,0</td>\n",
       "      <td>1521,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25%</th>\n",
       "      <td>21,2</td>\n",
       "      <td>1,0</td>\n",
       "      <td>31,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>3,8</td>\n",
       "      <td>2027,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>50%</th>\n",
       "      <td>41,5</td>\n",
       "      <td>1,0</td>\n",
       "      <td>37,5</td>\n",
       "      <td>2,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>12,5</td>\n",
       "      <td>2320,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>75%</th>\n",
       "      <td>61,8</td>\n",
       "      <td>1,0</td>\n",
       "      <td>44,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>18,2</td>\n",
       "      <td>2808,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>3,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>max</th>\n",
       "      <td>82,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>61,0</td>\n",
       "      <td>2,0</td>\n",
       "      <td>4,0</td>\n",
       "      <td>36,0</td>\n",
       "      <td>6278,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>5,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "      <td>1,0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "        nro sukup   ikä perhe koulutus palveluv  palkka johto työtov työymp  \\\n",
       "count  82,0  82,0  82,0  82,0     81,0     80,0    82,0  82,0   81,0   82,0   \n",
       "mean   41,5   1,2  38,0   1,6      2,0     12,2  2563,9   3,1    4,1    3,2   \n",
       "std    23,8   0,4   9,8   0,5      0,8      8,8   849,4   1,1    0,8    1,2   \n",
       "min     1,0   1,0  20,0   1,0      1,0      0,0  1521,0   1,0    2,0    1,0   \n",
       "25%    21,2   1,0  31,0   1,0      1,0      3,8  2027,0   2,0    4,0    3,0   \n",
       "50%    41,5   1,0  37,5   2,0      2,0     12,5  2320,0   3,0    4,0    3,0   \n",
       "75%    61,8   1,0  44,0   2,0      3,0     18,2  2808,0   4,0    5,0    4,0   \n",
       "max    82,0   2,0  61,0   2,0      4,0     36,0  6278,0   5,0    5,0    5,0   \n",
       "\n",
       "      palkkat työteht työterv lomaosa kuntosa hieroja  \n",
       "count    82,0    82,0    47,0    20,0     9,0    22,0  \n",
       "mean      2,1     3,2     1,0     1,0     1,0     1,0  \n",
       "std       1,1     1,0     0,0     0,0     0,0     0,0  \n",
       "min       1,0     1,0     1,0     1,0     1,0     1,0  \n",
       "25%       1,0     3,0     1,0     1,0     1,0     1,0  \n",
       "50%       2,0     3,0     1,0     1,0     1,0     1,0  \n",
       "75%       3,0     4,0     1,0     1,0     1,0     1,0  \n",
       "max       5,0     5,0     1,0     1,0     1,0     1,0  "
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Lasken tunnuslukuja\n",
    "df2 = df.describe()\n",
    "\n",
    "# Korvaan pisteet pilkuilla\n",
    "for col in df2.columns:\n",
    "    df2[col] =  df2[col].apply(pilkut)\n",
    "\n",
    "df2"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>f</th>\n",
       "      <th>%</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>Peruskoulu</th>\n",
       "      <td>27</td>\n",
       "      <td>33.333333</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2. aste</th>\n",
       "      <td>30</td>\n",
       "      <td>37.037037</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Korkeakoulu</th>\n",
       "      <td>22</td>\n",
       "      <td>27.160494</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Ylempi korkeakoulu</th>\n",
       "      <td>2</td>\n",
       "      <td>2.469136</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                     f          %\n",
       "Peruskoulu          27  33.333333\n",
       "2. aste             30  37.037037\n",
       "Korkeakoulu         22  27.160494\n",
       "Ylempi korkeakoulu   2   2.469136"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Aiemmin tehty frekvenssitaulukko koulutuksesta\n",
    "df1"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>f</th>\n",
       "      <th>%</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>Peruskoulu</th>\n",
       "      <td>27</td>\n",
       "      <td>33,3 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2. aste</th>\n",
       "      <td>30</td>\n",
       "      <td>37,0 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Korkeakoulu</th>\n",
       "      <td>22</td>\n",
       "      <td>27,2 %</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Ylempi korkeakoulu</th>\n",
       "      <td>2</td>\n",
       "      <td>2,5 %</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                     f       %\n",
       "Peruskoulu          27  33,3 %\n",
       "2. aste             30  37,0 %\n",
       "Korkeakoulu         22  27,2 %\n",
       "Ylempi korkeakoulu   2   2,5 %"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Pisteet pilkuiksi (df1 muuttuu pysyvästi)\n",
    "\n",
    "df1['%'] = df1['%'].apply(pilkutp)\n",
    "df1"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Lisätietoa\n",
    "\n",
    "Data-analytiikka Pythonilla https://tilastoapu.wordpress.com/python/"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.13.2"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}