{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Päivitetty 2024-02-07 / Aki Taanila\n" ] } ], "source": [ "from datetime import datetime\n", "print(f'Päivitetty {datetime.now().date()} / Aki Taanila')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# csv-datan avaaminen\n", "\n", "* Pandas-kirjaston **read_csv()** avaa csv-muotoisen (comma separated value) datan dataframeen.\n", "\n", "* Pelkällä tiedostonimellä avaat koodin kanssa samaan kansioon tallennetun csv-muotoisen datan.\n", "\n", "* Jos tiedosto on muussa kansiossa tai netissä, niin lisää tiedostopolku tai nettiosoite, esimerkiksi *'https://taanila.fi/data1.csv'*.\n", "\n", "* Suomessa csv-muotoinen data tallennetaan usein käyttämällä sarake-erottimena pilkun sijasta puolipistettä, jotta pilkkua voidaan käyttää desimaalierottimena. Tällöin tarvitaan parametreja `sep = ';'` ja `decimal = ','`.\n", "\n", "* Datan alku- ja loppuosan näet avaamisen jälkeen antamalla komentona dataframen nimen, esimerkiksi **df**." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | nro | \n", "sukupuoli | \n", "ikä | \n", "perhe | \n", "koulutus | \n", "palvelusvuodet | \n", "palkka | \n", "tyytyväisyys johtoon | \n", "tyytyväisyys työtovereihin | \n", "tyytyväisyys työympäristöön | \n", "tyytyväisyys palkkaan | \n", "tyytyväisyys työtehtäviin | \n", "työterveyshuolto | \n", "lomaosake | \n", "kuntosali | \n", "hieroja | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "1 | \n", "38 | \n", "1 | \n", "1.0 | \n", "22.0 | \n", "3587 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
1 | \n", "2 | \n", "1 | \n", "29 | \n", "2 | \n", "2.0 | \n", "10.0 | \n", "2963 | \n", "1 | \n", "5.0 | \n", "2 | \n", "1 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
2 | \n", "3 | \n", "1 | \n", "30 | \n", "1 | \n", "1.0 | \n", "7.0 | \n", "1989 | \n", "3 | \n", "4.0 | \n", "1 | \n", "1 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
3 | \n", "4 | \n", "1 | \n", "36 | \n", "2 | \n", "1.0 | \n", "14.0 | \n", "2144 | \n", "3 | \n", "3.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
4 | \n", "5 | \n", "1 | \n", "24 | \n", "1 | \n", "2.0 | \n", "4.0 | \n", "2183 | \n", "2 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
77 | \n", "78 | \n", "1 | \n", "22 | \n", "1 | \n", "3.0 | \n", "0.0 | \n", "1598 | \n", "4 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "NaN | \n", "1.0 | \n", "1.0 | \n", "NaN | \n", "
78 | \n", "79 | \n", "1 | \n", "33 | \n", "1 | \n", "1.0 | \n", "2.0 | \n", "1638 | \n", "1 | \n", "3.0 | \n", "2 | \n", "1 | \n", "2 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
79 | \n", "80 | \n", "1 | \n", "27 | \n", "1 | \n", "2.0 | \n", "7.0 | \n", "2612 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "1.0 | \n", "NaN | \n", "1.0 | \n", "NaN | \n", "
80 | \n", "81 | \n", "1 | \n", "35 | \n", "2 | \n", "2.0 | \n", "16.0 | \n", "2808 | \n", "3 | \n", "4.0 | \n", "3 | \n", "3 | \n", "3 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
81 | \n", "82 | \n", "2 | \n", "35 | \n", "2 | \n", "3.0 | \n", "15.0 | \n", "2183 | \n", "3 | \n", "4.0 | \n", "4 | \n", "3 | \n", "4 | \n", "1.0 | \n", "NaN | \n", "NaN | \n", "NaN | \n", "
82 rows × 16 columns
\n", "\n", " | Date | \n", "Bid | \n", "Ask | \n", "Opening price | \n", "High price | \n", "Low price | \n", "Closing price | \n", "Average price | \n", "Total volume | \n", "Turnover | \n", "Trades | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "2020-10-23 | \n", "44.73 | \n", "44.75 | \n", "44.69 | \n", "45.24 | \n", "44.69 | \n", "44.85 | \n", "44.931 | \n", "229445 | \n", "10309386.89 | \n", "2035 | \n", "
1 | \n", "2020-10-22 | \n", "44.61 | \n", "44.63 | \n", "45.26 | \n", "45.27 | \n", "44.53 | \n", "44.69 | \n", "44.784 | \n", "389332 | \n", "17437720.20 | \n", "3759 | \n", "
2 | \n", "2020-10-21 | \n", "45.30 | \n", "45.34 | \n", "45.98 | \n", "46.35 | \n", "45.26 | \n", "45.26 | \n", "45.504 | \n", "593667 | \n", "27015171.47 | \n", "4559 | \n", "
3 | \n", "2020-10-20 | \n", "45.89 | \n", "45.92 | \n", "46.72 | \n", "47.06 | \n", "45.88 | \n", "45.88 | \n", "46.300 | \n", "539265 | \n", "24969498.26 | \n", "4616 | \n", "
4 | \n", "2020-10-19 | \n", "46.82 | \n", "46.86 | \n", "47.45 | \n", "48.25 | \n", "46.61 | \n", "46.72 | \n", "47.039 | \n", "630587 | \n", "29663318.55 | \n", "5823 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
1274 | \n", "2015-09-29 | \n", "29.94 | \n", "29.97 | \n", "30.13 | \n", "30.28 | \n", "29.65 | \n", "29.94 | \n", "29.954 | \n", "356913 | \n", "10690866.82 | \n", "2243 | \n", "
1275 | \n", "2015-09-28 | \n", "30.32 | \n", "30.35 | \n", "30.95 | \n", "31.20 | \n", "30.32 | \n", "30.32 | \n", "30.555 | \n", "393189 | \n", "12013906.22 | \n", "2391 | \n", "
1276 | \n", "2015-09-25 | \n", "31.09 | \n", "31.10 | \n", "29.84 | \n", "31.10 | \n", "29.78 | \n", "31.10 | \n", "30.784 | \n", "486413 | \n", "14973624.11 | \n", "2446 | \n", "
1277 | \n", "2015-09-24 | \n", "29.28 | \n", "29.29 | \n", "29.69 | \n", "29.97 | \n", "29.18 | \n", "29.29 | \n", "29.484 | \n", "934256 | \n", "27603660.50 | \n", "2567 | \n", "
1278 | \n", "2015-09-23 | \n", "29.68 | \n", "29.70 | \n", "29.56 | \n", "29.97 | \n", "29.43 | \n", "29.69 | \n", "29.717 | \n", "383423 | \n", "11393976.95 | \n", "1587 | \n", "
1279 rows × 11 columns
\n", "