In [1]:
from datetime import datetime
print(f'Päivitetty {datetime.now().date()} / Aki Taanila')

Päivitetty 2023-05-02 / Aki Taanila


# Desimaalipisteet pilkuiksi

Pythonissa käytetään desimaalierottimena pistettä. Seuraavassa esittelen keinoja vaihtaa desimaalierottimeksi pilkku.

In [2]:
import pandas as pd

Pandas-kirjaston versiosta 1.3.0 lähtien desimaalipisteet voi näyttää pilkkuina **style.format**-funktion **decimal**-parametria käyttäen.

In [3]:
# Avaan datan
df = pd.read_excel('https://taanila.fi/data1.xlsx')

# Lasken tunnuslukuja ja esitän tulokset yhdellä desimaalilla desimaalipilkkua käyttäen
df.describe().style.format('{:.1f}', decimal=',')

Unnamed: 0,nro,sukup,ikä,perhe,koulutus,palveluv,palkka,johto,työtov,työymp,palkkat,työteht,työterv,lomaosa,kuntosa,hieroja
count,820,820,820,820,810,800,820,820,810,820,820,820,470,200,90,220
mean,415,12,380,16,20,122,25639,31,41,32,21,32,10,10,10,10
std,238,4,98,5,8,88,8494,11,8,12,11,10,0,0,0,0
min,10,10,200,10,10,0,15210,10,20,10,10,10,10,10,10,10
25%,212,10,310,10,10,38,20270,20,40,30,10,30,10,10,10,10
50%,415,10,375,20,20,125,23200,30,40,30,20,30,10,10,10,10
75%,618,10,440,20,30,182,28080,40,50,40,30,40,10,10,10,10
max,820,20,610,20,40,360,62780,50,50,50,50,50,10,10,10,10


In [4]:
# Frekvenssitaulukko koulutuksesta

df1 = pd.crosstab(df['koulutus'], 'f')
df1['%'] = df1/df1.sum()*100
df1.columns.name = ''
df1.index = ['Peruskoulu', '2. aste', 'Korkeakoulu', 'Ylempi korkeakoulu']

# Frekvenssit ilman desimaaleja, prosentit yhdellä desimaalilla, desimaalierottimena pilkku
df1.style.format({'n':'{:.0f}', '%':'{:.1f} %'}, decimal=',')

Unnamed: 0,f,%
Peruskoulu,27,"33,3 %"
2. aste,30,"37,0 %"
Korkeakoulu,22,"27,2 %"
Ylempi korkeakoulu,2,"2,5 %"


## Vanhemmat pandas-kirjaston versiot

style.format-funktion decimal-parametri on käytettävissä pandas-versiosta 1.3.0 alkaen. Vanhemmissa versiossa desimaalipisteen vaihtaminen pilkuiksi tarvitsee tehdä toisella tavalla.

Seuraavassa **pilkut**-funktio pyöristää (round) luvun yhden desimaalin tarkkuuteen ja korvaa merkkijonoksi muutetusta luvusta (str) pisteen pilkulla.

Jos x ei ole luku, niin round-funktio kaatuu virheilmoitukseen. Tässä kaatuminen estetään virheensieppauksella (try - except).

**pilkutp**-funktio lisää perään välilyönnin ja %-merkin.

In [5]:
def pilkut(x):
    try:
        x = round(x, 1)
    except:
        pass
    x = str(x).replace('.', ',')
    return x

def pilkutp(x):
    try:
        x = round(x, 1)
    except:
        pass
    x = str(x).replace('.', ',')
    return x+' %'

In [6]:
# Lasken tunnuslukuja
df2 = df.describe()

# Korvaan pisteet pilkuilla
for col in df2.columns:
    df2[col] =  df2[col].apply(pilkut)

df2

Unnamed: 0,nro,sukup,ikä,perhe,koulutus,palveluv,palkka,johto,työtov,työymp,palkkat,työteht,työterv,lomaosa,kuntosa,hieroja
count,820,820,820,820,810,800,820,820,810,820,820,820,470,200,90,220
mean,415,12,380,16,20,122,25639,31,41,32,21,32,10,10,10,10
std,238,4,98,5,8,88,8494,11,8,12,11,10,0,0,0,0
min,10,10,200,10,10,0,15210,10,20,10,10,10,10,10,10,10
25%,212,10,310,10,10,38,20270,20,40,30,10,30,10,10,10,10
50%,415,10,375,20,20,125,23200,30,40,30,20,30,10,10,10,10
75%,618,10,440,20,30,182,28080,40,50,40,30,40,10,10,10,10
max,820,20,610,20,40,360,62780,50,50,50,50,50,10,10,10,10


In [7]:
# Aiemmin tehty frekvenssitaulukko koulutuksesta
df1

Unnamed: 0,f,%
Peruskoulu,27,33.333333
2. aste,30,37.037037
Korkeakoulu,22,27.160494
Ylempi korkeakoulu,2,2.469136


In [8]:
# Pisteet pilkuiksi (df1 muuttuu pysyvästi)

df1['%'] = df1['%'].apply(pilkutp)
df1

Unnamed: 0,f,%
Peruskoulu,27,"33,3 %"
2. aste,30,"37,0 %"
Korkeakoulu,22,"27,2 %"
Ylempi korkeakoulu,2,"2,5 %"


## Lisätietoa

Data-analytiikka Pythonilla https://tilastoapu.wordpress.com/python/