# Python 的資料型別

> 不同應用場景的基礎資料型別。

[數據交點](https://www.datainpoint.com) | 郭耀仁 

## 自行定義函數的方式

在 [Python 的函數使用方式](https://medium.com/datainpoint/using-functions-in-python-1b66711379aa)我們得知,函數的來源包含內建函數總共有四個管道可以取得:

1. 內建函數。
2. 標準模組。
3. 第三方模組。
4. 自行定義。

這四個管道之中,僅有內建函數可以供我們直接使用,另外三個管道的函數都必須在呼叫之前確定好在欲產生作用的範疇中已經被載入或者定義。取用標準模組以及第三方模組中的函數之前,必須確認模組是否已經安裝、是否已經載入,取用自行定義的函數之前,則是必須確認該函數是否已經完成定義,自行定義函數需要考慮五個組成要件:

1. 函數名稱 `function_name`。
2. 輸入 `INPUTS`。
3. 參數 `PARAMETERS`。
4. 函數主體(縮排的程式區塊)。
5. 輸出 `return` 以及 `OUTPUTS`。

```
def function_name(INPUTS, PARAMETERS):
 # body of the function
 # ...sequence of statements
 # ...
 return OUTPUTS
``` 

五個組成要件看似抽象,不過想想平日購買珍珠鮮奶茶的流程,就跟函數的組成一般:

1. 函數名稱:購買珍珠鮮奶茶。
2. 輸入:中杯 35 元;大杯 50 元。
3. 參數:甜度(無糖、微糖、半糖、少糖、全糖)與冰塊(去冰、少冰、全冰)。
4. 函數主體:點餐、貼標籤、加珍珠、加冰塊、倒茶、加鮮奶一直到封口。
5. 輸出:珍珠鮮奶茶。

如果將哈囉世界改寫為函數形式,每次只需要輸入函數名稱並加上小括號 `hello_world()`,就可以獲得 `"Hello, World!"` 這個字串為輸出。

In [1]:
def hello_world():
 return "Hello, World!"
print(hello_world())

Hello, World!


## 五種基礎資料型別

由於常見對資料型別應用函數的時候,都是對已經完成宣告的物件應用,而非直接對資料型別本身應用,這是因為程式設計通常在後續還會有資料記錄與運算處理的需求,並不止於將其印出來而已。所以我們需要一個能夠將完成宣告的物件所儲存之資料型別告知使用者的內建函數 `type()`,作用是將被應用物件的資料型別回傳,我們可以進而將其印出,包含字串在內,Python 有五種基礎的資料型別提供給我們使用:

1. 整數 `int`
2. 浮點數 `float`
3. 字串 `str`
4. 布林 `bool`
5. None `NoneType`

In [2]:
an_integer = 55
a_float = 66.0
a_string = "Hello, World!"
bool_true = True
bool_false = False
none_type = None
# Print out object types
print(type(an_integer))
print(type(a_float))
print(type(a_string))
print(type(bool_true))
print(type(bool_false))
print(type(none_type))









函數、資料型別以及將來講到的資料結構、流程控制和類別就像是積木、樂高以及拼圖一般,在單個元件存在的當下看起來沒有什麼作用,但是透過堆疊與組裝之後,就能夠建構出讓人眼睛一亮的成品,萬丈高樓平地起雖然八股,但卻能精準地傳達由程式碼搭建出應用程式的精神。
具體來說,我們需要整數與浮點數來做數值運算、需要字串來做文字表示與處理、需要布林來做流程控制。
數值運算
整數與浮點數能夠用來進行數值運算,能夠作用在整數與浮點數上的數值運算符號有:

1. `+`、`-`、`*`、`/`:加減乘除。
2. `**` :次方。
3. `%` :回傳餘數。
4. `//` :回傳商數。

數值運算時的優先順序遵循:小括號最優先、再來是次方、接著是乘除、最後是加減的慣例,如果在數值運算時希望調整優先順序,可以使用小括號 `()` 將希望先完成運算的部分包括起來,例如將華氏氣溫換算為攝氏氣溫的運算。

In [3]:
def fahrenheit_to_celsius(x):
 return (x - 32) * 5/9
print(fahrenheit_to_celsius(32))
print(fahrenheit_to_celsius(212))

0.0
100.0


## 文字表示與處理

字串能夠用來進行文字表示與處理,可以透過三種成對的引號將字面值包裝起來建立:

1. 使用成雙的單引號 '' 包裝。
2. 使用成對的雙引號 "" 包裝。
3. 使用成對的三個雙引號 """""" 包裝。

多數的時候使用這三種不會有任何分別,但是在部分情境中,使用成雙的單引號或成對的雙引號標註文字是有差別的,像是在英文句子中經常出現的非成雙單引號 '(Apostrophe)以及用作嘲諷強調的空氣雙引號(Air-quotes),當文字中的內容有出現這些元件時如果沒有特別關注,宣告的當下就會產生錯誤。

In [4]:
mcd = 'I'm lovin' it'

SyntaxError: invalid syntax (, line 1)

這時候就可以使用跳脫字元反斜線 \、不同樣式的引號或者三個雙引號來完成宣告。

In [14]:
mcd = 'I\'m lovin\' it'
mcd = "I'm lovin' it"
mcd = """I'm lovin' it"""

其中由成對的三個雙引號 `""""""` 建立的文字常被直接放在自行定義函數的主體下的第一段,被稱為文件字串(Docstring),如果在自行定義函數時有擺放文件字串,將會在自行定義函數被應用 `help()` 函數查詢時印出來。

In [15]:
def fahrenheit_to_celsius(x):
 """
 Return the Fahrenheit degree from a Celsius degree.
 """
 return (x - 32) * 5/9
help(fahrenheit_to_celsius)

Help on function fahrenheit_to_celsius in module __main__:

fahrenheit_to_celsius(x)
 Return the Fahrenheit degree from a Celsius degree.



運用文字時常會使用到的技巧是以特定格式印出(Print with format),具體來說是在文字中嵌入宣告好的物件,如此文字顯示的內容將隨著物件中所儲存的值而變動,透過文字的 `format()` 方法以及 f-string 語法搭配成雙的大括號 `{}` 中指定顯示外型都可以達成特定格式印出,我們透過改寫 `hello_world()` 函數為 `hello_anyone()` 函數示範。

In [16]:
def hello_anyone_format(anyone):
 return "Hello, {}!".format(anyone) # format
def hello_anyone_fstring(anyone):
 return f"Hello, {anyone}!" # f-string
print(hello_anyone_format("Luke Skywalker"))
print(hello_anyone_fstring("Anakin Skywalker"))

Hello, Luke Skywalker!
Hello, Anakin Skywalker!


我自己常用的特定格式有指定小數點 n 位的浮點數格式 `:.nf`、具有千分位逗號的金額格式 `:,` 這些都可以透過字串的 `format()` 方法以及 f-string 語法達成。

In [17]:
def fahrenheit_to_celsius(x):
 msg = "{:.1f} degrees celsius is equal to {:.1f} degrees fahrenheit".format(x, (x - 32) * 5/9)
 return msg
def big_mac_index(country, currency, price):
 msg = f"A Big Mac costs {price:,.2f} {currency} in {country}."
 return msg
print(fahrenheit_to_celsius(32))
print(fahrenheit_to_celsius(212))
print(big_mac_index('US', 'USD', 5.65))
print(big_mac_index('South Korea', 'Won', 6520))

32.0 degrees celsius is equal to 0.0 degrees fahrenheit
212.0 degrees celsius is equal to 100.0 degrees fahrenheit
A Big Mac costs 5.65 USD in US.
A Big Mac costs 6,520.00 Won in South Korea.


其他更多的字串特定格式,可以參考:。
相較於在數值上運算能夠使用七個運算符號,字串能夠搭配的運算符號僅有兩個:加號 `+` 能夠進行字串的合併、乘號 `*` 能夠進行字串的複製。

In [18]:
def concatenate_strings(x, y):
 return x + y
def duplicate_strings(x, n):
 return x*n
print(concatenate_strings("55", "66"))
print(duplicate_strings("5566", 3))

5566
556655665566


## 布林

我們未來進行程式碼的流程控制或者資料篩選的時候會需要條件(Conditions)以及條件的評估結果布林 bool,布林只有 `True` 與 `False` 這兩個值。這裡特別提醒,Python 與絕大多數的程式語言相同,對於英文大小寫是敏感的(Case-sensitive),像是 `True` 能夠被識別為布林,但是 `TRUE` 或者 `true` 則會被視作物件名稱。

In [19]:
# Recognize as booleans
print(type(True))
print(type(False))
# Recognize as object names, NameError will occur
print(type(true))
#print(type(TRUE))
#print(type(false))
#print(type(FALSE))





NameError: name 'true' is not defined

除了直接輸入 `True` 與 `False`,我們也可以透過條件得到布林,條件可以透過兩種運算符號:關係運算符(Relational operators)以及邏輯運算符(Logical operators)建立,條件的評估結果就會是布林,其中關係運算符包含:

- `==`、`!=`:等於以及不等於。
- `>` 、`>=`、`<`、`<=`:大於、大於等於、小於以及小於等於。
- `a in b`:`a` 是否存在於 `b` 之中。
- `is None` :是否為 `None`。

In [20]:
x = 55
y = 66
a_string = "Hello, World!"
none_type = None
# Relational operators apply to numerics and text
print(x == y)
print(x != y)
print(x > y)
print(x >= y)
print(x < y)
print(x <= y)
print("H" in a_string)
print("I" in a_string)
print(none_type is None)

False
True
False
False
True
True
True
False
True


邏輯運算符則包含:

- `and`、`or`:交集與聯集。
- `not`:非。

In [21]:
# Logical operators apply to booleans
print(True and True)
print(True and False)
print(False and False)
print(True or True)
print(True or False)
print(False or False)
print(not True)
print(not False)

True
False
False
True
True
False
False
True


關係運算符與邏輯運算符的差別在於前者針對數值或者文字應用,後者則針對布林應用。

## None

None 是未定義值(Undefined value),未定義值與 NA 值(Not Available)或虛無值 Null 等觀念相近,在一個沒有使用 `return` 回傳輸出的自行定義函數,None 就會是該函數的預設輸出。例如我們自行定義了一個只有把 `"Hello, World!"` 字串印出、而沒有 `return` 的 `hello_world()` 函數。

In [22]:
def hello_world():
 print("Hello, World!")
functions_output = hello_world()
print(functions_output)
print(type(functions_output))

Hello, World!
None



很多的時候光是將物件以 `print()` 函數印出不足以判斷該物件的資料型別為何,像是下列的程式碼看不出來究竟是字串、布林或者 None。

In [23]:
a_string = "False"
another_string = "None"
bool_false = False
none_type = None
print(a_string)
print(another_string)
print(bool_false)
print(none_type)

False
None
False
None


這時候除了對物件應用內建函數 `type()` 之外,還能夠用其他內建函數協助判斷以及轉換資料型別。

## 判斷資料型別的函數

使用 `isinstance(x, classinfo)` 函數判斷輸入物件是否為某個資料型別,其中 `x` 輸入物件名稱、 `classinfo` 參數輸入資料型別名稱。

In [24]:
# Check if input is an int
print(isinstance(5566, int))
print(isinstance("5566", int))
# Check if input is a float
print(isinstance(5566.0, float))
print(isinstance(5566, float))
# Check if input is a str
print(isinstance("True", str))
print(isinstance(True, str))
# Check if input is a bool
print(isinstance(False, bool))
print(isinstance("False", bool))

True
False
True
False
True
False
True
False


## 轉換資料型別的函數

使用與目標轉換型別同名的函數轉換資料型別。

- `int()`:轉換為整數型別。
- `float()`:轉換為浮點數型別。
- `bool()`:轉換為布林型別。
- `str()`:轉換為文字型別。

使用 `int()` 函數可以輸入浮點數、布林與文字讓 Python 轉換成整數。

In [25]:
print(int(5566.0))
print(int(True))
print(int(False))
print(int("5566"))

5566
1
0
5566


使用 `float()` 函數可以輸入整數、布林與文字讓 Python 轉換成浮點數。

In [26]:
print(float(5566))
print(float(True))
print(float(False))
print(float("5566"))

5566.0
1.0
0.0
5566.0


使用 `bool()` 函數可以輸入整數、浮點數與文字讓 Python 轉換成布林,輸入浮點數或整數類型的 0 會轉換成為 `False`,其他數字則一律轉換為 `True`,若輸入文字,無論輸入文字內容為何都一律轉換成 `True`。

In [27]:
print(bool(0))
print(bool(0.0))
print(bool(1))
print(bool(1.0))
print(bool(5566.0))
print(bool(-5566.0))
print(bool("True"))
print(bool("TRUE"))
print(bool("true"))
print(bool("False"))
print(bool("FALSE"))
print(bool("false"))

False
False
True
True
True
True
True
True
True
True
True
True


使用 `str()` 函數可以輸入整數、浮點數與布林讓 Python 轉換成文字。

In [28]:
print(str(5566))
print(str(5566.0))
print(str(True))
print(str(False))

5566
5566.0
True
False


在轉換資料型別的過程,我們從布林、整數、浮點數最後到字串,這個順序並不是任意編排的,而是有意識地從資料的子集合逐漸往母集合提升,例如布林被包含於整數(0 與 1)之中、整數被包含於浮點數之中、而任何數值都能夠用字串去表示。這也意味著,如果我們試圖反向地從母集合往子集合轉換,資料型別的轉換並不保證能成功。

In [29]:
print(float("True"))

ValueError: could not convert string to float: 'True'

在認識五種基礎資料型別、判斷與轉換資料型別函數之後,Python 的資料型別這篇文章來到尾聲。
喜歡這篇文章嗎?訂閱數據交點 可以收到我的電子報😻

## 延伸閱讀

- [Python String format() Method](https://www.w3schools.com/python/ref_string_format.asp)