{
"nbformat": 4,
"nbformat_minor": 0,
"metadata": {
"colab": {
"provenance": [],
"collapsed_sections": [
"sl1jEzMR4Vzx"
]
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3"
},
"language_info": {
"name": "python"
}
},
"cells": [
{
"cell_type": "markdown",
"source": [
"# Pythonの基礎2\n",
"前回はPythonの基礎の前編として、エディタや実行環境、データ型、および演算子について学びました。今回は、後編として次の項目について学びます。\n",
"\n",
"- 制御構文\n",
"- 文字列の操作\n",
"- 予約語\n",
"- 関数とメソッド\n",
"- 例外\n",
"- 注意すべき用語"
],
"metadata": {
"id": "Xo-Q2KOGAkmE"
}
},
{
"cell_type": "markdown",
"source": [
"# 代表的な制御構文\n",
"ここまで見てきたソースコードは、複数の命令を記述されたとおりに上から下へ、順に実行していくだけのものでした。\n",
"\n",
"Pythonを含むプログラム言語では、制御構文というものを用いて、条件により実行する処理を変化させたり、まとまった処理のかたまりを複数回繰り返し実行することができます。\n",
"\n",
"ここでは代表的な制御構文として、「if文」と「for文」について紹介します。"
],
"metadata": {
"id": "J6b8g3scdDvK"
}
},
{
"cell_type": "markdown",
"source": [
"## 条件により処理を変更する(if文)"
],
"metadata": {
"id": "99mtNLZ6mSar"
}
},
{
"cell_type": "markdown",
"source": [
"### if文の基本\n",
"「**if文**」を使用すると、条件によってプログラムの処理を変更することができます。if文の基本的な構文は、次の通りです。\n",
"\n",
"```\n",
"if 条件式:\n",
" 条件式を満たしたときだけ実行する命令1\n",
" 条件式を満たしたときだけ実行する命令2\n",
" :\n",
"```\n",
"* 条件式は、「比較演算子(x == y、x > yなど)」や「ブール演算子(and、orなど)」などを用いて記述します。\n",
"* 条件式の後ろの:(コロン)を忘れないようにしましょう。\n",
"\n",
"次のソースコードは、if文を用いて実行する命令を変化させる例です。"
],
"metadata": {
"id": "UrcADUIqmYId"
}
},
{
"cell_type": "code",
"source": [
"x = 10\n",
"y = 10\n",
"\n",
"# xとyが等しいとき\n",
"if x == y:\n",
" print(\"xとyは等しいです\")\n",
"\n",
"# xがyより大きいとき\n",
"if x > y:\n",
" print(\"xはyより大きいです\")"
],
"metadata": {
"id": "V1JaEREjfFgt"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"- ifの後ろに記述した「x == y」「x > y」が、比較演算子による条件式です。これがTrueとなった場合だけ、後続のprint関数が実行されます。\n",
"- 一つ目のif文ではprint関数が実行されますが、二つ目のif文ではprint関数が実行されません。"
],
"metadata": {
"id": "Pt0ZrpcJfdfb"
}
},
{
"cell_type": "markdown",
"source": [
"### インデントについて\n",
"ところで、次のソースコードを見てみてください。条件式「x == y」はFalseであり条件を満たしませんが、出力結果はどうなるでしょうか。"
],
"metadata": {
"id": "d9HyWoa_mapD"
}
},
{
"cell_type": "code",
"source": [
"x = 10\n",
"y = 100\n",
"\n",
"# 条件式を満たさない例\n",
"if x == y:\n",
" print(\"1つ目のprint関数\")\n",
" print(\"2つ目のprint関数\")\n",
" print(\"3つ目のprint関数\")\n",
"print(\"4つ目のprint関数\")\n",
"print(\"5つ目のprint関数\")\n",
"print(\"6つ目のprint関数\")"
],
"metadata": {
"id": "PNIZl119smfs"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"条件式を満たさないので、if文以降のprint関数は実行されませんが、4つ目のprint関数以降は実行されました。つまり、次のことが分かります。\n",
"\n",
"* 1つ目~3つ目のprint関数は、if文が有効である。\n",
"* 4つ目~6つ目のprint関数は、if文が有効でない。\n",
"\n",
"この有効範囲は、どのように決定したのでしょうか。答えは「行頭に1つ以上の連続した半角空白があるかどうか」です。このようにPythonでは、制御文の有効範囲を行頭の半角空白で決定します。\n",
"\n",
"行頭に1つ以上の連続した半角空白を入れることを、「**インデント**」または「字下げ」と呼びます。本講座では、「インデント」の方に表現を統一します。\n",
"\n",
"半角空白の個数は任意ですが、4個とすることが多いです。本講座の資料でも4個としていますが、Google Colaboratoryのデフォルト値は2個となっていますので、お好みの設定に変更してください。\n",
"\n",
"また逆に、制御文の有効範囲以外の場所で、行頭に半角空白を入れるとプログラムはエラーとなります。次のプログラムを実行してみましょう。\n",
"\n"
],
"metadata": {
"id": "C2E5-P45snGz"
}
},
{
"cell_type": "code",
"source": [
" print(\"1つ目のprint関数\")\n",
"\n",
"if x == y:\n",
" print(\"2つ目のprint関数\")"
],
"metadata": {
"id": "2Dqx0bkm2rHp"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"【小ネタ】Python以外のプログラミング言語では、例えば次のような方法で、制御文の有効範囲を決定します。これらの方法では、行頭の半角空白は単に見やすさのために入れているだけであり、必須ではありません。\n",
"\n",
"* {}などの括弧で囲まれた範囲を有効範囲とする。(C、Javaなど)\n",
"~~~\n",
"if (条件式) {\n",
" 条件式を満たしたときに実行する命令1\n",
" 条件式を満たしたときに実行する命令2\n",
"}\n",
"~~~\n",
"* 「then」「end」というキーワードで囲まれた範囲を有効範囲とする。(Rubyなど)\n",
"~~~\n",
"if 条件式 then\n",
" 条件式を満たしたときに実行する命令1\n",
" 条件式を満たしたときに実行する命令2\n",
"end\n",
"~~~"
],
"metadata": {
"id": "O9hylBi52rbp"
}
},
{
"cell_type": "markdown",
"source": [
"### else\n",
"ifに加えてelseを使用すると、条件式を満たしたときだけではなく、条件式を満たさなかったときだけ実行する命令を記述することができます。if-elseの基本的な構文は、次の通りです。\n",
"\n",
"```\n",
"if 条件式:\n",
" 条件式を満たしたときに実行する命令1\n",
" 条件式を満たしたときに実行する命令2\n",
" :\n",
"else:\n",
" 条件式を満たさなかったときに実行する命令1\n",
" 条件式を満たさなかったときに実行する命令2\n",
" :\n",
"```\n",
"\n",
"- 条件式を満たさなかったときに実行する命令も、インデントを使って有効範囲を定めます。\n",
"- elseの後ろの:(コロン)を忘れないようにしましょう。\n",
"\n",
"次のソースコードは、if-elseを用いて実行する命令を変化させる例です。"
],
"metadata": {
"id": "1TJgsLnHmdi8"
}
},
{
"cell_type": "code",
"source": [
"x = 10\n",
"y = 20\n",
"\n",
"if x == y:\n",
" print(\"xとyは等しいです\")\n",
"else:\n",
" print(\"xとyは等しくないです\")"
],
"metadata": {
"id": "A-2Ww1ny3cB-"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"if-elseに加えて、さらにelifを使用すると、条件1を満たしたときだけ処理1を実行、条件2を満たしたときだけ処理2を実行・・・といった記述ができます。if-elif-elseの基本的な構文は、次の通りです。\n",
"\n",
"```\n",
"if 条件式1:\n",
" 条件式1を満たしたときに実行する命令1\n",
" 条件式1を満たしたときに実行する命令2\n",
" :\n",
"elif 条件式2:\n",
" 条件式2を満たしたときに実行する命令1\n",
" 条件式2を満たしたときに実行する命令2\n",
" :\n",
"elif 条件式3:\n",
" 条件式3を満たしたときに実行する命令1\n",
" 条件式3を満たしたときに実行する命令2\n",
" :\n",
"else:\n",
" ifおよびelifの条件式を満たさなかったときに実行する命令1\n",
" ifおよびelifの条件式を満たさなかったときに実行する命令2\n",
" :\n",
"```\n",
"\n",
"- 上記ではelifを2つ記述していますが、何個でも記述することができます。\n",
"- elifの条件式を満たしたときに実行する命令も、インデントを使って有効範囲を定めます。\n",
"\n",
"次のソースコードは、if-elif-elseを用いて実行する命令を変化させる例です。"
],
"metadata": {
"id": "pCbrP0gS4H_m"
}
},
{
"cell_type": "code",
"source": [
"x = 20\n",
"y = 10\n",
"\n",
"if x == y:\n",
" print(\"xとyは等しいです\")\n",
"elif x > y:\n",
" print(\"xはyより大きいです\")\n",
"else:\n",
" print(\"xはyより小さいです\")"
],
"metadata": {
"id": "z1nwRgAM4U4y"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"## 処理を繰り返す(for、range関数、リスト内包表記)"
],
"metadata": {
"id": "94WRW4aR5jTh"
}
},
{
"cell_type": "markdown",
"source": [
"### for文の基本的な使い方\n",
"「**for文**」を使用すると、まとまった処理のかたまりを、複数回繰り返し実行することができます。\n",
"\n",
"for文の基本的な構文は、次の通りです。\n",
"\n",
"```\n",
"for 変数 in 繰り返し要素:\n",
" 繰り返す処理1\n",
" 繰り返す処理2\n",
" :\n",
"```\n",
"- 「繰り返し要素」は、リストやタプル、後述する数列など、繰り返し処理したい複数の要素を持つデータです。\n",
"- 「繰り返し要素」から順番に値が取り出され、「変数」に格納されます。この「変数」は、繰り返し処理の中で使うことができます。\n",
"- 「繰り返し要素」の値をすべて取り出すまで、処理を繰り返し実行します。\n",
"- 「繰り返し要素」の後ろの、:(コロン)を忘れないようにしましょう。\n",
"\n",
"次のソースコードは、繰り返し要素として整数のリストを使っています。\n",
"\n",
"文字列に対する「+」演算子、「str関数」なども使っていますので、復習しておきましょう。"
],
"metadata": {
"id": "-12BkDkumg1T"
}
},
{
"cell_type": "code",
"source": [
"num_list = [1, 2, 3]\n",
"\n",
"# 繰り返し要素(num_list)の内容を一つずつ取り出して処理を繰り返す\n",
"for num in num_list:\n",
" print(\"num=\" + str(num) + \", 命令1\")\n",
" print(\"num=\" + str(num) + \", 命令2\")"
],
"metadata": {
"id": "JNJPaeBz6EoI"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"リストの値が順番に取り出され、変数numに格納されます。\n",
"\n",
"リストの値をすべて取り出すまで、2つのprint関数を繰り返し実行します。\n",
"\n",
"要素を持たない空っぽのリストだった場合、**繰り返し回数がゼロ回**になって何も表示されない事に注意してください。\n",
"\n",
"if文と同様に、for文も有効範囲をインデントで定めます。次のソースコードを実行してみましょう。"
],
"metadata": {
"id": "6O34pg0R62W-"
}
},
{
"cell_type": "code",
"source": [
"num_list = [1, 2, 3]\n",
"\n",
"# 繰り返し要素(num_list)の内容を一つずつ取り出して処理を繰り返す\n",
"for num in num_list:\n",
" print(\"num=\" + str(num) + \", 命令1\")\n",
" print(\"num=\" + str(num) + \", 命令2\")\n",
"print(\"命令 X\")\n",
"print(\"命令 Y\")"
],
"metadata": {
"id": "UnDS0Yu4E2Yv"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"最後の2行、\"命令 X\"と\"命令 Y\"を出力するprint関数は、インデントされていませんのでfor文の有効範囲外です。\n",
"\n",
"for文の繰り返しがすべて終わった後で、一度ずつだけ実行されています。"
],
"metadata": {
"id": "VueQgtWGMKIl"
}
},
{
"cell_type": "markdown",
"source": [
"### range関数\n",
"for文とともによく使われる関数として、数列を生成する「**range関数**」があります。\n",
"* range(N)と記述すると、0~(N-1)の数列を作成します。\n",
"* range(N, M)と記述すると、N~(M-1)の数列を作成します。このとき、N < Mとなるようにします。\n",
"* range(N, M, D)と記述すると、次のとおりとなります。\n",
" * N < M かつ D > 0 のとき、N~(M-1)の範囲でDずつ増えていく数列を作成します。\n",
" * N > M かつ D < 0 のとき、N~(M+1)の範囲でDずつ減っていく数列を作成します。\n",
"\n",
"次のソースコードは、繰り返し要素としてrange関数で作成した数列を記述しています。繰り返し処理では、変数numの値を出力します。"
],
"metadata": {
"id": "PCNW_uSsdBQx"
}
},
{
"cell_type": "code",
"source": [
"for num in range(6):\n",
" print(num)\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"for num in range(5, 10):\n",
" print(num)\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"for num in range(5, 10, 2):\n",
" print(num)\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"for num in range(9, 4, -2):\n",
" print(num)"
],
"metadata": {
"id": "BxC15PqZ7EOa"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"### リスト内包表記\n",
"for文の応用的な使い方として、「**リスト内包表記**」があります。リスト内包表記は、特定のルールに従った新しいリストを作成するのに役立ちます。\n",
"\n",
"リスト内包表記は、[ 式 for 変数 in 繰り返し要素 ] と記述します。\n",
"\n",
"次のソースコードは、繰り返し要素としてrange関数で作成した数列を記述しています。式には、変数の2乗を記述しています。"
],
"metadata": {
"id": "TDkW2pSadJB_"
}
},
{
"cell_type": "code",
"source": [
"# 0~9それぞれを2乗した値のリストを作成します\n",
"for_list = [ num ** 2 for num in range(10) ]\n",
"\n",
"# リストの内容を画面に出力します\n",
"print(for_list)"
],
"metadata": {
"id": "C-8IU1YU9YkY"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"- range関数で作成した数列の値が順番に取り出され、変数numに格納されます。\n",
"- ここでは0~9の数列が作成され、それぞれを2乗した値を要素として持つリストが作成されます。"
],
"metadata": {
"id": "g6Nxi-vTInFn"
}
},
{
"cell_type": "markdown",
"source": [
"### その他の繰り返し制御文\n",
"処理を繰り返すもう一つの制御構文として、while文というものがあります。\n",
"\n",
"しかし、while文でできることはfor文で大概のことはできますので、あまり使われません。\n",
"\n",
"本講座では取り上げませんが、興味があれば各自で調べてトライしてみてください。\n",
"\n",
"\n"
],
"metadata": {
"id": "3yNXRBz6c0uY"
}
},
{
"cell_type": "markdown",
"source": [
"## 制御文の入れ子記述\n",
"制御文は、if文の中にif文を記述したり、for文の中にif文を記述するなど、入れ子で記述することができます。\n",
"\n",
"このとき、インデントの半角空白の個数に注意が必要です。例として、if文の中にif文を記述する場合は、次のように記述します。\n",
"\n",
"\n",
"\n",
"- 2つ目のif文であるif 条件式2:は、1つ目のif文であるif 条件式1を満たしたときだけ実行されるので、if 条件式1:よりも半角空白4つぶんインデントされています。\n",
"\n",
"\n",
"- 命令3および命令4は、2つ目のif文であるif 条件式2:を満たしたときだけ実行されるので、if 条件式2:よりも半角空白4つぶんインデントされています。\n",
"\n",
"\n",
"- 結果として、命令3および命令4は行頭から半角空白8つぶんインデントされています。これは、命令3および命令4がif 条件式1とif 条件式2の両方を満たしたときだけ実行されることを意味します。\n",
"\n",
"このように、入れ子の深さの分だけインデントする必要があります。if文の中にfor文を記述するなど、ほかの組み合わせでも同じようにインデントで制御文の有効範囲を定めます。"
],
"metadata": {
"id": "sl1jEzMR4Vzx"
}
},
{
"cell_type": "markdown",
"source": [
"# break文とcontinue文\n",
"ここで、break文とcontinue文について学びます。\n",
"\n",
"break文とcontinue文はfor文(+while文)の機能ですが、for文とif文の入れ子構造で頻繁に使用されるため、あえてここで紹介します。"
],
"metadata": {
"id": "xdqe5DCfcwMd"
}
},
{
"cell_type": "markdown",
"source": [
"## break\n",
"for文で繰り返す命令の中に「**break文**」を記述すると、次の通り動作します。\n",
"\n",
"* 現在の繰り返し処理を中断する。\n",
"* 次の繰り返し処理に進まず、for文を終了する。\n",
"\n",
"次のソースコードを見てみましょう。"
],
"metadata": {
"id": "ZcD2GFNUmlgm"
}
},
{
"cell_type": "code",
"source": [
"num_list = [1, 2, 3]\n",
"\n",
"# 繰り返し要素(num_list)の内容を一つずつ取り出して処理を繰り返す\n",
"for num in num_list:\n",
" print(\"num=\" + str(num) + \", 命令1\")\n",
" if num == 2:\n",
" break\n",
"\n",
" print(\"num=\" + str(num) + \", 命令2\")\n",
"\n",
"print(\"ループ外。次の処理へ\")"
],
"metadata": {
"id": "RPwcYkoAebwU"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"for文の中にif文を記述する、入れ子構造になっていますね。print関数やif文は半角空白4つぶんのインデント、breakは半角空白8つぶんのインデントとなっています。\n",
"\n",
"変数numには整数1、2、3と順番に格納されていきますが、numが2になったとき、条件式を満たすためbreak文が実行されます。次の点に注目してください。\n",
"\n",
"* 「\"num=2, 命令2\"」が出力されない。(命令を中断する)\n",
"* num = 3 の繰り返し処理は行われない。(for文による繰り返し処理を強制的に終了)"
],
"metadata": {
"id": "sTWvxuSke3I3"
}
},
{
"cell_type": "markdown",
"source": [
"## continue文\n",
"for文で繰り返す命令群の中に「**continue文**」を記述すると、次の通り動作します。\n",
"\n",
"* 現在の繰り返し処理を中断する。\n",
"* 次の繰り返し処理に進み、for文を継続する。\n",
"\n",
"次のソースコードは、前のソースコードのbreak文がcontinue文に変わっただけです。実際に動かしてみましょう。"
],
"metadata": {
"id": "bn2RLn__mn0I"
}
},
{
"cell_type": "code",
"source": [
"num_list = [1, 2, 3]\n",
"\n",
"# 繰り返し要素(num_list)の内容を一つずつ取り出して処理を繰り返す\n",
"for num in num_list:\n",
" print(\"num=\" + str(num) + \", 命令1\")\n",
" if num == 2:\n",
" continue\n",
"\n",
" print(\"num=\" + str(num) + \", 命令2\")\n",
"\n",
"print(\"ループ外。次の処理へ\")"
],
"metadata": {
"id": "bG5OzfFOe9dj"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"今回も変数numには整数1、2、3と順番に格納されていきますが、numが2になったとき、条件式を満たすためcontinue文が実行されます。次の点に注目してください。\n",
"\n",
"* 「\"num=2, 命令2\"」が出力されない。(命令を中断する)\n",
"* num = 3 の繰り返し処理が実行される。(次の繰り返し処理に進む)\n",
"\n",
"2点めの「num = 3 の繰り返し処理が実行される」という点が、break文とcontinue文の違いになります。"
],
"metadata": {
"id": "H9xfhRV1T8lC"
}
},
{
"cell_type": "markdown",
"source": [
"# 文字列の操作\n",
"\"Hello, world.\"などの文字列について、ここまでprint関数による画面出力などの例を見てきました。\n",
"\n",
"ここでは、文字列の加工や検索など、データ構造化でよく使われる様々な操作方法を紹介します。"
],
"metadata": {
"id": "c5PglFzWsJDx"
}
},
{
"cell_type": "markdown",
"source": [
"## 文字列の分割(split)\n",
"「**split**」という命令を使用すると、文字列を任意の区切り文字で分割することができます。\n",
"\n",
"- 文字列.split(区切り文字列) と記述すると、文字列を区切り文字列で分割したリストを取得できます。\n",
"- 区切り文字列を指定しない場合、連続した半角空白・タブ・改行で分割します。**指定した場合と挙動が異なる**ので注意です。\n",
"\n",
"次のソースコードは、カンマおよび半角空白で文字列を分割しています。"
],
"metadata": {
"id": "sJamrYL8mrsB"
}
},
{
"cell_type": "code",
"source": [
"# カンマ区切りの文字列を分割\n",
"comma_str = \"aaa,bbb,ccc\"\n",
"print(comma_str.split(\",\"))\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"# 空白区切りの文字列を分割\n",
"space_str = \"xxx yyy zzz\"\n",
"print(space_str.split())\n",
"print(space_str.split(\" \"))"
],
"metadata": {
"id": "t7P1fFqKLerm"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"## 文字列の先頭および末尾の文字を削除(strip、lstrip、rstrip)\n",
"「**strip**」「**lstrip**」「**rstrip**」という命令を利用すると、文字列の先頭および末尾の不要なデータを削除できます。\n",
"\n",
"- 文字列.strip(削除文字列) と記述すると、**文字列の先頭および末尾の両方から**、連続した削除文字列をすべて削除します。削除文字列を指定しないと、連続した全角空白・半角空白・タブ・改行を削除します。\n",
"- 文字列.lstrip(削除文字列) と記述すると、**文字列の先頭からだけ**、連続した削除文字列をすべて削除します。削除文字列を指定しないと、連続した全角空白・半角空白・タブ・改行を削除します。\n",
"- 文字列.rstrip(削除文字列) と記述すると、**文字列の末尾からだけ**、連続した削除文字列をすべて削除します。削除文字列を指定しないと、連続した全角空白・半角空白・タブ・改行を削除します。\n",
"\n",
"削除文字列は実際には文字列ではなく、**削除対象文字のリストとして扱われる**ことに注意しましょう。\n",
"\n",
"次のソースコードは、上記のstrip、lstrip、およびrstripそれぞれについて、先頭および末尾の不要なデータを削除しています。"
],
"metadata": {
"id": "UXa10_hELfKp"
}
},
{
"cell_type": "code",
"source": [
"abc_str = \"aabbccxyzabcabc\"\n",
"\n",
"# 先頭および末尾の文字列を削除\n",
"print(abc_str.strip(\"abc\"))\n",
"\n",
"# 先頭の文字列を削除\n",
"print(abc_str.lstrip(\"abc\"))\n",
"\n",
"# 末尾の文字列を削除\n",
"print(abc_str.rstrip(\"abc\"))\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"space_str = \" xyz \"\n",
"# 先頭および末尾の文字列を削除\n",
"print(space_str.strip() + \"END\")\n",
"\n",
"# 先頭の文字列を削除\n",
"print(space_str.lstrip() + \"END\")\n",
"\n",
"# 末尾の文字列を削除\n",
"print(space_str.rstrip() + \"END\")"
],
"metadata": {
"id": "vzvdNMH1ORG-"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"【ワンポイント】「split」と「strip」は、どちらも文字列に対する操作で、かつ名称が似ているため、非常に間違いやすいです。\n",
"\n",
"データ構造化のプログラムでは、「split」と「strip」はメタデータの抽出において必須となる操作です。csvの数値列、文字列から必要となるメタデータや値を得るためにsplit(分割)が多用され、不要な空白や改行をなくすためにstrip(削除)が多用されます。"
],
"metadata": {
"id": "G0BW2d-8PeC1"
}
},
{
"cell_type": "markdown",
"source": [
"## 文字列の判定(in、not in、startswith、endswith)\n",
"比較演算子「**in**」を使用すると、if文などと組み合わせて、文字列全体の中に特定の文字列が含まれるかどうか判定できます。\n",
"\n",
"次のソースコードは、文字列中に特定の部分文字列が含まれるかどうかを判定しています。"
],
"metadata": {
"id": "6kifyRed56CB"
}
},
{
"cell_type": "code",
"source": [
"in_str = \"abcdefg\"\n",
"\n",
"# inの結果がTrueとなるケース\n",
"if \"def\" in in_str:\n",
" print(\"defが含まれています。(True)\")\n",
"else:\n",
" print(\"defが含まれていません。(False)\")\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"# inの結果がFalseとなるケース\n",
"if \"xyz\" in in_str:\n",
" print(\"xyzが含まれています。(True)\")\n",
"else:\n",
" print(\"xyzが含まれていません。(False)\")"
],
"metadata": {
"id": "ILalLaH1Px9K"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"inとは逆に、「**not in**」を使用すると、文字列全体の中に特定の文字列が含まれないかどうか判定できます。\n",
"\n",
"次のソースコードは、文字列中に特定の部分文字列が含まれないかどうかを判定しています。"
],
"metadata": {
"id": "oBPvfyEDQYTC"
}
},
{
"cell_type": "code",
"source": [
"in_str = \"abcdefg\"\n",
"\n",
"# not inの結果がFalseとなるケース\n",
"if \"def\" not in in_str:\n",
" print(\"defが含まれていません。(True)\")\n",
"else:\n",
" print(\"defが含まれています。(False)\")\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"# not inの結果がTrueとなるケース\n",
"if \"xyz\" not in in_str:\n",
" print(\"xyzが含まれていません。(True)\")\n",
"else:\n",
" print(\"xyzが含まれています。(False)\")"
],
"metadata": {
"id": "ZkZjl6-8QcRZ"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"「**startswith**」を使用すると、文字列全体が特定の文字列で開始するかどうか判定できます。startswithは、「文字列.startswith(部分文字列)」という構文で記述します。start's'withの's'を忘れがちなので、気を付けてください。\n",
"\n",
"次のソースコードは、文字列が特定の部分文字列で開始するかどうかを判定しています。"
],
"metadata": {
"id": "79oUJdZKRVyK"
}
},
{
"cell_type": "code",
"source": [
"startend_str = \"abcdef\"\n",
"\n",
"# startwithの結果がTrueとなるケース\n",
"if startend_str.startswith(\"abc\"):\n",
" print(\"abcで開始します。(True)\")\n",
"else:\n",
" print(\"abcで開始しません。(False)\")\n",
"\n",
"print(\"---------------------------------\")\n",
"\n",
"# startwithの結果がFalseとなるケース\n",
"if startend_str.startswith(\"xyz\"):\n",
" print(\"xyzで開始します。(True)\")\n",
"else:\n",
" print(\"xyzで開始しません。(False)\")"
],
"metadata": {
"id": "YGj6CjMHRfUf"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"startswithとは逆に、「**endswith**」を使用すると、文字列全体が特定の文字列で終了するかどうか判定できます。endswithは、「文字列.endswith(部分文字列)」という構文で記述します。end's'withの's'を忘れがちなので、気を付けてください。\n",
"\n",
"使い方は、startswithとほとんど同じです。こちらはソースコード例を載せませんので、各自でチャレンジしてみてください。"
],
"metadata": {
"id": "LBWKm4m4TevV"
}
},
{
"cell_type": "markdown",
"source": [
"【ワンポイント】これらの判定は、特定のメタデータの探索に多用されます。特に in 演算子は、英文的にもわかりやすい演算子です。"
],
"metadata": {
"id": "Rj5XJ3zu_Emg"
}
},
{
"cell_type": "markdown",
"source": [
"## 文字列の検索(find、count)\n",
"「**find**」を使用すると、文字列全体で特定の文字列が何文字目に存在するかを取得できます。このとき、最初の文字は0文字目であることに注意が必要です。\n",
"\n",
"次のソースコードでは、特定の部分文字列が文字列全体の何文字目に存在するかを取得しています。"
],
"metadata": {
"id": "gkiqzudEVs4P"
}
},
{
"cell_type": "code",
"source": [
"abc_str = \"abcdefg\"\n",
"\n",
"# \"def\"が何文字目に存在するかを取得する\n",
"# 0文字目から開始する点に注意\n",
"print(abc_str.find(\"def\"))"
],
"metadata": {
"id": "ysgbnOP0eRHt"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"「**count**」を使用すると、文字列全体で特定の文字列が何回出現するかを取得できます。\n",
"\n",
"次のソースコードでは、特定の部分文字列が文字列全体で何回出現するかを取得しています。"
],
"metadata": {
"id": "46TKjZlwempp"
}
},
{
"cell_type": "code",
"source": [
"abc_str = \"abcdefgabcdefgabc\"\n",
"\n",
"# \"abc\"が何回出現するかを取得する\n",
"print(abc_str.count(\"abc\"))"
],
"metadata": {
"id": "SJQlac6kewAu"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"# 関数とメソッド"
],
"metadata": {
"id": "f9BdeCu5HAd9"
}
},
{
"cell_type": "markdown",
"source": [
"## 関数についての詳細\n",
"ここまでに、print関数、len関数、type関数などの「**関数**」を紹介しました。このように、Pythonではよく使用する便利な機能を「関数」という形で提供しています。\n",
"\n",
"関数はデータを入力として受け取り、受け取った入力データに対して計算や画面出力などの機能を実行して、結果のデータを出力します。\n",
"\n",
"入力するデータを「**引数**」、出力する結果のデータを「**戻り値**」と言います。\n",
"\n",
"\n",
"\n",
"数学の関数と基本的な考え方は同じです。$y = f(x)$ の $x$ が引数に、$y$ が戻り値に、それぞれ相当するイメージとなります。\n",
"\n",
"「文字列を出力する」のところで、「print(\"Hello, world.\")」という命令を実行しました。\n",
"- 文字列\"Hello, world.\"が、入力データである「引数」です。\n",
"- print関数には、出力データである「戻り値」はありません(厳密には、値がないことを示す「None」という戻り値を出力しています)。\n",
"- 画面に出力した文字列は、あくまでprint関数の機能として画面表示を行っているだけであり、関数の「戻り値」ではない点に注意してください。\n",
"\n",
"「文字列の長さを求める」のところで、「len(\"Hello, world.\")」という命令を実行しました。\n",
"- 文字列\"Hello, world.\"が、入力データである「引数」です。\n",
"- 文字列\"Hello, world.\"の長さである13が、出力データである戻り値です。\n",
"\n",
"ここで、前回の「文字列の長さを求める」でご紹介した、次のソースコードを思い出してください。"
],
"metadata": {
"id": "9U93dPiJmw8o"
}
},
{
"cell_type": "code",
"source": [
"str_len = len(\"Hello, world.\")\n",
"print(str_len)"
],
"metadata": {
"id": "TpSFOS7pe_j6"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"len関数の戻り値(文字列の長さ)を変数に格納して、その変数の値をprint関数で出力するプログラムでした。\n",
"\n",
"それでは次に、次のソースコードを見てみましょう。"
],
"metadata": {
"id": "0TSUpUDhfEpX"
}
},
{
"cell_type": "code",
"source": [
"print(len(\"Hello, world.\"))"
],
"metadata": {
"id": "s1MiBnHmHC5E"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"このソースコードも、「文字列の長さを求める」のソースコードと同じ結果となります。\n",
"\n",
"違いとして、len関数の戻り値を変数に格納せず、そのままprint関数の引数としています。数学で言うところの合成関数、$z = g(f(x))$と同様の振る舞いです。\n",
"\n",
"\n",
"\n",
"このように関数の引数には、文字列や数値などの値、および変数に加えて、関数を直接記述することで、その戻り値を渡すこともできます。"
],
"metadata": {
"id": "EoQW_dzpHLg1"
}
},
{
"cell_type": "markdown",
"source": [
"## メソッド\n",
"今回「文字列の操作」の中で、「文字列.split(区切り文字)」や「文字列.strip(削除文字列)」といった命令をご紹介しました。\n",
"\n",
"これらも関数の一種で、区切り文字や削除文字列が「引数」、操作した結果得られた文字列やリストが「戻り値」となります。\n",
"\n",
"ただし、このように「対象のデータ」(この例では「文字列」)に.(ピリオド)を付けて呼び出す関数のことを、特別に「**メソッド**」と呼びます。\n",
"\n",
"~~~\n",
"対象のデータ.メソッド名(引数)\n",
"~~~\n",
"\n",
"ただし、.(ピリオド)を付けて呼び出したものはすべてメソッド、ということではないので、注意が必要です。\n",
"\n",
"今回の講義の最後で「モジュール」というものについて簡単にご説明しますが、次のようなパターンも存在します。このパターンは、メソッドではなく関数です。\n",
"\n",
"~~~\n",
"モジュール名.関数名(引数)\n",
"~~~\n",
"\n",
"メソッドについて詳細を理解するには、今回はご説明しませんが、「クラス」という機能を学ぶ必要があります。\n",
"\n",
"かなり分かりにくい話とは思いますが、関数とメソッドのいずれも、入力として引数を渡し、出力として戻り値を得る、という基本的な仕組みは変わりません。今のところは、関数の一種としてメソッドと呼ばれるものがある、ということだけ覚えておいてください。"
],
"metadata": {
"id": "iFZJgrj1m1_f"
}
},
{
"cell_type": "markdown",
"source": [
"## 関数を自作する\n",
"print関数やlen関数のような、Pythonであらかじめ用意された関数は「**組み込み関数**」と呼ばれます。\n",
"\n",
"それ以外にもPythonでは、自分で関数を作成することもできます。関数を自作するには、「**def**」というキーワードを使用します。\n",
"\n",
"~~~\n",
"def 自作関数名(引数):\n",
" 自作関数で行う処理\n",
"~~~\n",
"自作した関数を使うときは、基本的にはprint関数やlen関数と同じように、「関数名(引数)」と記述するだけです。\n",
"\n",
"(「基本的には」としたのは、メソッドのところで紹介した「モジュール名.関数(引数)」というパターンもあるためです。)\n",
"\n",
"実際に自作関数を作って、呼び出してみます。次のソースコードで、結果を確認してみましょう。"
],
"metadata": {
"id": "72QOkFaovcKe"
}
},
{
"cell_type": "code",
"source": [
"def display_add10(num):\n",
" print(num + 10)\n",
"\n",
"# 自作関数add10を呼び出す\n",
"display_add10(5)"
],
"metadata": {
"id": "AgRpymKBluyo"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"引数は、複数個とすることができます。その場合、関数定義、関数呼び出し、どちらも引数を,(カンマ)で区切って複数個指定します。次のソースコードで、確認してみましょう。"
],
"metadata": {
"id": "YqXDz-TKmQyx"
}
},
{
"cell_type": "code",
"source": [
"def display_add3nums(num1, num2, num3):\n",
" print(num1 + num2 + num3)\n",
"\n",
"# 自作関数display_add3numsを呼び出す\n",
"display_add3nums(5, 10, 15)"
],
"metadata": {
"id": "DWiu26eJnWLW"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"## 戻り値を返す関数を自作する\n",
"これまで自作した関数は、数値を画面に出力するだけで、戻り値はありませんでした。\n",
"\n",
"今度は、display_add3nums関数を改良して、合計した結果を画面に出力するのではなく、戻り値として返すようにしてみます。\n",
"\n",
"戻り値を返すには、関数内で「**return文**」を記述します。\n",
"\n",
"~~~\n",
"def 自作関数名(引数):\n",
" 自作関数で行う処理\n",
" :\n",
" return 戻り値\n",
"~~~\n",
"\n",
"次のソースコードで、確認してみましょう。"
],
"metadata": {
"id": "i2kEEA-Gnh4m"
}
},
{
"cell_type": "code",
"source": [
"def return_add3nums(num1, num2, num3):\n",
" return num1 + num2 + num3\n",
"\n",
"# 自作関数return_add3numsを呼び出す\n",
"ret_val = return_add3nums(5, 10, 15)\n",
"\n",
"print(ret_val + 10)"
],
"metadata": {
"id": "z7esrcouoLYm"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"関数で取得した戻り値に、さらに10を加算して画面に出力しました。\n",
"\n",
"このように、関数の結果を使って後続の処理を行う場合は、結果を戻り値として返し、後続の処理に引き継ぎます。"
],
"metadata": {
"id": "OXwjwg9prKPo"
}
},
{
"cell_type": "markdown",
"source": [
"## 関数を使うコツ\n",
"ソースコードを記述するときは、プログラムの全てをダラダラと上から下へ書いていくのではなく、機能ごとに関数を作成するのがコツです。\n",
"\n",
"特に、何度も実行するようなお決まりの処理は、関数にすることでソースコードが分かりやすくなります。"
],
"metadata": {
"id": "lVvtlcSqqZ_8"
}
},
{
"cell_type": "markdown",
"source": [],
"metadata": {
"id": "WIF7Om2ISGL7"
}
},
{
"cell_type": "markdown",
"source": [
"【注意事項】\n",
"\n",
"次の2つの自作関数を実行してみて、結果を比べて見てください。どうなるでしょうか。"
],
"metadata": {
"id": "Un2NsGLJXeCp"
}
},
{
"cell_type": "code",
"source": [
"def display_value(num):\n",
" print(num)\n",
"\n",
"# 自作関数display_valueを呼び出す\n",
"display_value(10)"
],
"metadata": {
"id": "yj0sblAArrtv"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"source": [
"def return_value(num):\n",
" return num\n",
"\n",
"# 自作関数return_valueを呼び出す\n",
"return_value(10)"
],
"metadata": {
"id": "wbG0wd3UQeYs"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"どうでしょうか。どちらも、引数の値が画面に出力されました。一見、同じ結果に見えます。\n",
"\n",
"ここで、前回【注意事項 (とても重要!)】としてご説明した内容を、思い出してください。\n",
"\n",
"Google Colaboratoryでデータの型を取得するtype関数を実行すると、取得したデータ型が画面に出力されました。しかしこれは、Google ColaboratoryやJupyter Notebookの独自機能であり、本来は画面への出力にはprint関数を使う、とご説明しました。\n",
"\n",
"今回の例も、まさにこの注意事項どおりの動作となっています。\n",
"\n",
"2番目のプログラムのように、関数を実行して、その戻り値を変数に代入したりせず何も処理しないとき、Google ColaboratoryやJupyter Notebookの独自機能で、戻り値が画面に出力されます。\n",
"\n",
"しかし、画面に出力するprint関数と、戻り値を返すreturn文は全く別の機能です。print関数は値を画面に出力するだけで戻り値は返しませんし、return文は戻り値を返すだけで、画面に出力はしません。しっかりと理解をするようにしましょう。"
],
"metadata": {
"id": "6MDrvLTdsDeu"
}
},
{
"cell_type": "markdown",
"source": [
"# エラー、例外\n",
"Pythonにおけるプログラムのエラーには、次の2種類があります。\n",
"\n",
"- 構文エラー(syntax error)\n",
"- 例外 (exception)"
],
"metadata": {
"id": "6W7qRnJTVLcB"
}
},
{
"cell_type": "markdown",
"source": [
"## 構文エラー\n",
"「**構文エラー**」はその名のとおり、ソースコードへ記述した処理に構文の誤りがある場合に発生します。「(」に対する「)」を書いていない、if文で条件式の末尾に「:(コロン)」が書かれていない、といった場合に発生するエラーです。\n",
"\n",
"次のプログラムを実行してみましょう。「SyntaxError」が発生することが分かります。"
],
"metadata": {
"id": "57mlqMEum5wz"
}
},
{
"cell_type": "code",
"source": [
"print(\"Start\")\n",
"num_list = [1, 2, 3,\n",
"print(num_list)"
],
"metadata": {
"id": "dkLILiJBjFnY"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"構文エラーがあると、そもそもプログラムの実行が開始しません。\n",
"\n",
"あらかじめ、構文エラーが発生しないようにソースコードを記述する必要があります。"
],
"metadata": {
"id": "l90GuZNimtg9"
}
},
{
"cell_type": "markdown",
"source": [
"## 例外\n",
"ソースコードに構文エラーがなければ、プログラムは実行を開始します。しかし、それでも実行中に何らかのエラーが発生することがあります。\n",
"\n",
"このように、ソースコードの構文に問題がなくても、プログラム実行中に発生するエラーを「**例外**」と言います。\n",
"\n",
"例えば、次のプログラムを実行してみてください。何が起きるでしょうか。"
],
"metadata": {
"id": "ztRrc-HgjYpY"
}
},
{
"cell_type": "code",
"source": [
"div_value = 0\n",
"print(div_value)\n",
"print(100 / div_value)"
],
"metadata": {
"id": "vO_YpXjLUzae"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"print(div_value)の結果として0が出力されましたので、プログラムの実行は開始しています。\n",
"\n",
"しかし、0で割り算しようとしたことでプログラムがエラーになりました。これは、「ZeroDivisionError」という例外です。\n",
"\n",
"この例では、プログラムの構文の誤りはありません。しかし、これ以上プログラムを継続できないために例外となり、プログラムの実行は中止されます。\n",
"\n",
"この例はごく簡単なものなので、「明らかに間違っているのだから、構文エラーのようにプログラム実行前の時点でエラーと分かるのでは?」と思われるかもしれません。\n",
"\n",
"しかしPythonではあくまで、プログラム実行前には、構文が正しいかどうかのチェックしか行いません。\n",
"\n",
"例えばデータ構造化プログラムにおいて、CSVファイルから読み込んだ値を使って割り算をするとしたら、どうでしょうか。\n",
"\n",
"プログラムを開始して、実際にファイルを読み込んでみるまで、どのような値が出てくるかは分かりません。そもそもファイルのフォーマットが不正で、読み込むことさえできないかもしれません。\n",
"\n",
"こういったケースから、例外は構文エラーとは異なり、プログラム実行前の時点ではエラーかどうか分からないことがイメージしていただけると思います。"
],
"metadata": {
"id": "_0iZL9McU_6J"
}
},
{
"cell_type": "markdown",
"source": [
"## 例外を処理する\n",
"次のソースコードを見てみましょう。リストの文字列を順番に取り出して、浮動小数点数へ変換し、変換後の値で割り算を行います。\n",
"\n",
"なお「**float関数**」は、浮動小数点数型でないデータを、浮動小数点数型に変換する関数です。例えば文字列\"2.0\"を引数に渡すと、浮動小数点数型の「2.0」に変換してくれます。\n"
],
"metadata": {
"id": "dYITmVPaDxx3"
}
},
{
"cell_type": "code",
"source": [
"for numstr in [\"2.5\", \"0.0\", \"Number\", \"3.5\", \"4.5\"]:\n",
" num = float(numstr)\n",
" value = 100 / num\n",
" print(value)"
],
"metadata": {
"id": "wgb5UF087TtQ"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"最初の\"2.5\"は問題ありませんが、次の\"0.0\"でZeroDivisionErrorとなります。\n",
"\n",
"【試してみましょう】リストから\"0.0\"を削除したら、どうなるでしょうか。結果を予想して、プログラムを動かして試してみましょう。"
],
"metadata": {
"id": "oMIwBITKzQXi"
}
},
{
"cell_type": "markdown",
"source": [
"### エラーへの対応\n",
"\"0\"や数字でない文字列が出現したら、その場でプログラムがエラー終了してよいのであれば、このままでも問題ありません。\n",
"\n",
"しかし例えば、\"0\"や数字でない文字列が出現しても警告メッセージを出力して処理を続行し、リストの最後まで実行を続けたい(\"3.5\"や\"4.5\"を処理したい)場合は、どうすればよいでしょうか。"
],
"metadata": {
"id": "FwcbsF7pm8ih"
}
},
{
"cell_type": "markdown",
"source": [
"### ZeroDivisionErrorへの対応\n",
"次のようにif文を使えば、ZeroDivisionErrorが発生しないようにできます。"
],
"metadata": {
"id": "H7hy2Na9m9rD"
}
},
{
"cell_type": "code",
"source": [
"for numstr in [\"2.5\", \"0.0\", \"Number\", \"3.5\", \"4.5\"]:\n",
" num = float(numstr)\n",
" if num == 0:\n",
" print(\"警告:値が0です\")\n",
" else:\n",
" value = 100 / num\n",
" print(value)"
],
"metadata": {
"id": "GeISW4RxHEtn"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"### ValueErrorへの対応\n",
"float関数の引数に\"Number\"といった数字でない文字列を渡すと、「ValueError」という例外が発生します。\n",
"\n",
"このValueErrorについても、ZeroDivisionErrorと同じように、あらかじめif文で、float関数が変換できる文字列であるかをチェックすることはできます。\n",
"\n",
"しかし、float関数が変換できる文字列は、次のように色々なパターンがあります。\n",
"\n",
"* 3、3.0、+3、-3.0、5e3、5e-3、3(全角) などなど\n",
"\n",
"これらをif文でチェックしようとすると、かなり大変です。もっと簡単に、チェックできないものでしょうか。"
],
"metadata": {
"id": "SsQMFdPPHceQ"
}
},
{
"cell_type": "markdown",
"source": [
"### try~except\n",
"Pythonでは、プログラムを実行して例外が発生する可能性があるとき、「もしこの例外が発生したらこうする」とあらかじめ定めておくことができます。\n",
"\n",
"これには次のように、「**try文**」を使用します。\n",
"\n",
"~~~\n",
"try:\n",
" 例外が発生する可能性のある処理\n",
"except 発生しうる例外1\n",
" 例外1が発生したときの処理\n",
"except 発生しうる例外2\n",
" 例外2が発生したときの処理\n",
" :\n",
"~~~\n",
"\n",
"* try文に続けて、「例外が発生する可能性のある処理」を記述します。\n",
"* try文とセットで記述する「**except**」で、「例外1が発生したときの処理」を記述します。この処理を実行した後、プログラムはエラー終了することなく処理を継続します。\n",
"* 発生しうる例外が複数ある場合は、それぞれの例外ごとにexceptを複数記述します。\n",
"\n",
"実際のプログラムの例を見てみましょう。"
],
"metadata": {
"id": "SDHSu1Y7nAGw"
}
},
{
"cell_type": "code",
"source": [
"for numstr in [\"2.5\", \"0.0\", \"Number\", \"3.5\", \"4.5\"]:\n",
" try:\n",
" num = float(numstr)\n",
" if num == 0:\n",
" print(\"警告:値が0です\")\n",
" else:\n",
" value = 100 / num\n",
" print(value)\n",
" except ValueError:\n",
" print(\"警告:値が数字ではありません\")"
],
"metadata": {
"id": "lg1vupzwMA7D"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"「ZeroDivisionErrorへの対応」で示したソースコードに、try~exceptの処理を追加しています。\n",
"\n",
"ValueErrorが発生したら、exceptで定義されたprint関数で警告メッセージを出力して、for文の繰り返しを継続できます。"
],
"metadata": {
"id": "vai7jKDTK_d6"
}
},
{
"cell_type": "markdown",
"source": [
"### ifとtry~exceptの使い分け\n",
"ここまでの例を見て、ZeroDivisionErrorもexceptで処理すればよいのでは?と考えたかもしれません。確かに、「発生しうる例外が複数ある場合は、それぞれの例外ごとにexceptを複数記述します。」とご説明したとおり、次のように記述することもできます。"
],
"metadata": {
"id": "WCu-xCooJmT0"
}
},
{
"cell_type": "code",
"source": [
"for numstr in [\"2.5\", \"0.0\", \"Number\", \"3.5\", \"4.5\"]:\n",
" try:\n",
" num = float(numstr)\n",
" value = 100 / num\n",
" print(value)\n",
" except ValueError:\n",
" print(\"警告:値が数字ではありません\")\n",
" except ZeroDivisionError:\n",
" print(\"警告:値が0です\")"
],
"metadata": {
"id": "qaMU9H25J6rv"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"ifとtry~exceptの使い分けについての明確な線引きはありませんが、基本的には、次のように考えることが多いです。\n",
"\n",
"* if文でどのようにチェックしても例外が発生する可能性が残ってしまう場合は、try~exceptを使う。\n",
"* if文でチェックするとチェックが多すぎたり、ソースコードが読みづらくなったりする場合は、try~exceptを使う。\n",
"* 上記以外は、if文を使う。\n",
"\n",
"ValueErrorの例は、上記の2点目に該当するといえます。"
],
"metadata": {
"id": "A__nutcEKOnp"
}
},
{
"cell_type": "markdown",
"source": [
"### try~exceptに関するその他の機能\n",
"try文には他にも、「例外が発生しなかったときだけ動く処理」を定義するelseや、「例外が起きても起きなくても必ず動く処理」を定義するfinallyなどがあります。\n",
"\n",
"~~~\n",
"try:\n",
" 例外が発生する可能性のある処理\n",
"except 発生しうる例外1\n",
" 例外1が発生したときの処理\n",
"except 発生しうる例外2\n",
" 例外2が発生したときの処理\n",
" :\n",
"else:\n",
" 例外が発生しなかったときだけ動く処理\n",
"finally:\n",
" 例外が起きても起きなくても必ず動く処理\n",
"~~~\n",
"\n",
"また、例外の詳しい情報を取得したり、例外を自作したりすることもできます。本講座ではこれ以上の詳しい説明はしませんが、try文を実際に使うときにはぜひ、例外について色々調べてみてください。"
],
"metadata": {
"id": "N-BVNkQVJfN0"
}
},
{
"cell_type": "markdown",
"source": [
"【小ネタ】\n",
"\n",
"try文には「例外が発生する可能性のある処理」を記述します。ところで、そもそも、どんな例外が発生する可能性があるか、どうやって知るのでしょうか。\n",
"\n",
"実は、Pythonが提供する関数や演算子などで、どのような例外が発生する可能性があるのか、公式ドキュメントを見ても書いていません。それこそPython実行環境そのもののソースコードを調査しないと、正確なところは分かりません。\n",
"\n",
"そのため、次のようにする必要があります。\n",
"\n",
"* 知識・経験から知っている例外についてあらかじめ処理を入れておく\n",
"* 実際にプログラムを動かしてみたら例外が起きてしまったので、そこで初めて例外処理を入れる\n",
"\n",
"他のプログラム言語では、発生するエラーが公式ドキュメントに明記されているものもあります。\n",
"\n",
"【注意事項】\n",
"\n",
"Pythonには「**pass**」という構文があります。これは、「何もしない命令」です。例えば、ある例外が起こってもプログラムの動作に影響がないことが分かっているため、無視して処理を続行する、という場合に使用します。\n",
"\n",
"次の例ではZeroDivisionErrorが起きていますが、passすることで何もせず処理を継続します。"
],
"metadata": {
"id": "XVIYYM4Uhe6Z"
}
},
{
"cell_type": "code",
"source": [
"for numstr in [\"2.5\", \"0\", \"Number\", \"3.5\", \"4.5\"]:\n",
" try:\n",
" num = float(numstr)\n",
" value = 100 / num\n",
" print(value)\n",
" except ZeroDivisionError:\n",
" pass\n",
" except ValueError:\n",
" print(\"警告:値が数字ではありません\")"
],
"metadata": {
"id": "qdl3TjYTpnpF"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"くれぐれも気を付けていただきたいのは、「何か例外が起きるけど、よく分からないからpassして動かしちゃえ!」としないでください、ということです。\n",
"\n",
"たとえば、極端なプログラムとして、下記のようなものがあります。\n",
"\n",
"~~~\n",
"try:\n",
" 例外が発生する可能性のある処理1\n",
" 例外が発生する可能性のある処理2\n",
" :\n",
"except:\n",
" pass\n",
"\n",
"継続処理\n",
"~~~\n",
"\n",
"exceptに例外名を指定しないと、「すべての例外」を意味します。このプログラムはどんな例外が起こっても、無視してプログラムが継続します。しかし、もし例外が起きていたら、プログラムが期待通りの動作をしたという保証はありません。\n",
"\n",
"上記のようなプログラムにはせず、例外が発生したらきちんと調査をして、exceptで適切な処理をしてください。もちろん、調査した結果、無視してよいと確認できたのであれば、passを使っても問題ありません。"
],
"metadata": {
"id": "zU4FrgIGpn9S"
}
},
{
"cell_type": "markdown",
"source": [
"# 予約語\n",
"Pythonでは、あらかじめ予約された語句が定められています。このような語句を変数名や関数名として使用すると、プログラムが正しく動作しないことがあるため、注意が必要です。\n",
"\n",
"- 予約語の例\n",
" - if、forなど制御文の名前\n",
" - print、len、strなど組み込み関数の名前\n",
"\n",
"上記以外にも、Pythonの機能としてあらかじめ定められた語句が予約語となっています。\n",
"\n",
"次のソースコードでは、予約語のprintを変数名として使用したため、後続の処理でprint関数が使えなくなってしまう例です。プログラムを実行すると、print関数が実行できずにエラーとなります。"
],
"metadata": {
"id": "dxBREI9ne7cH"
}
},
{
"cell_type": "code",
"source": [
"# 予約語であるprintを変数名として使用\n",
"print = \"abc\"\n",
"\n",
"# print関数が使えなくなってしまう\n",
"print(\"Hello, world.\")"
],
"metadata": {
"id": "TfmHqfQZgCZb"
},
"execution_count": null,
"outputs": []
},
{
"cell_type": "markdown",
"source": [
"【注意事項】上記のソースコードを実行したあとは、必ずGoogle Colaboratoryの画面上部にあるメニューから、[ランタイム]→[ランタイムを再起動]を実行してください。この操作をしないと、本資料のソースコードで使用されているすべてのprint関数も動作しなくなります。"
],
"metadata": {
"id": "7O3nyaB6iHP0"
}
},
{
"cell_type": "markdown",
"source": [
"# 注意すべき用語\n",
"以上で、Pythonの基本的な構文の紹介を終わります。\n",
"\n",
"最後に、Pythonにまつわる様々な用語のうち、使う人や文脈により、同じ意味でも異なる表現となるような用語をご紹介します。"
],
"metadata": {
"id": "MgUAsh8eRP_A"
}
},
{
"cell_type": "markdown",
"source": [
"## ソースコード、スクリプト\n",
"前回「Pythonの実行環境・エディタの紹介」でご紹介したとおり、Pythonのプログラムを作成するときは、最初にエディタで「ソースコード」を作成します。\n",
"\n",
"しかし人・書籍などによっては、ソースコードの代わりに「**スクリプト**」「**Pythonスクリプト**」などと呼ぶこともあります。\n",
"\n",
"様々なプログラミング言語のソースコードのうち、あらかじめコンピュータが理解できる形式に変換(コンパイル)しなくても、そのまま実行できるものをスクリプトと呼びます。\n",
"\n",
"Pythonのソースコードはコンパイルせずにそのまま実行できるので、ソースコードと同じ意味でスクリプトと呼ぶことがあります。\n",
"\n",
"本講座では、「ソースコード」に呼び方を統一しています。"
],
"metadata": {
"id": "p3WEWhj5nHne"
}
},
{
"cell_type": "markdown",
"source": [
"## モジュール、パッケージ、ライブラリ\n",
"前回の「Pythonの実行環境・エディタの紹介」で、Pythonは、非常に多くのさまざまな機能が「パッケージ」という形で公開されているとご紹介しました。\n",
"\n",
"ここでは「パッケージ」と、それに関連する用語として「モジュール」「ライブラリ」についてご紹介します。"
],
"metadata": {
"id": "Sl_fbMhUnMFj"
}
},
{
"cell_type": "markdown",
"source": [
"### モジュール\n",
"Google ColaboratoryやJupyter Notebookでは、Webブラウザの画面上でソースコードを記述するのであまり意識しませんが、通常、ソースコードは拡張子「.py」のテキストファイルに記述して保存します。\n",
"\n",
"この拡張子「.py」のファイルは、「**モジュール**」と呼びます。\n",
"\n",
"「モジュール」は前述の「ソースコード」とも近い用語ではありますが、あまり混同されることなく、区別して使われていることが多いです。\n",
"\n",
"「ソースコード」は「.py」ファイルの中身(記述された処理)、「モジュール」は「.py」ファイルそのもの、というニュアンスが一般的です。"
],
"metadata": {
"id": "M4zQhvsxnNsu"
}
},
{
"cell_type": "markdown",
"source": [
"### パッケージ\n",
"「**パッケージ**」は、ある機能を提供するために必要な複数のモジュールをまとめたものです。"
],
"metadata": {
"id": "xsvJDXnFnPZj"
}
},
{
"cell_type": "markdown",
"source": [
"### ライブラリ\n",
"パッケージに近い用語として「**ライブラリ**」があります。\n",
"\n",
"しかし、モジュールとパッケージはPythonの公式ドキュメントで定義された用語なのですが、ライブラリという用語には厳密な定義がありません。\n",
"\n",
"ライブラリは、主に次のような意味で使われます。\n",
"\n",
"* パッケージよりも大きな機能のくくりで、複数のパッケージをまとめたもの\n",
"* パッケージ、モジュール、関数など、様々なプログラムで汎用的に使用する前提で作られた部品の総称\n",
"* パッケージと同じ意味\n",
"\n",
"使われ方がケースバイケースな用語ですが、非常によく使われる用語なので、覚えておきましょう。\n",
"\n",
"本講座の資料では、Python公式ドキュメントの用語に合わせ、「モジュール」「パッケージ」の用語を使用しています。\n",
"\n",
"今回の講義は、ここまでとなります。次回は「パッケージとモジュール・ファイル操作」をご紹介します。"
],
"metadata": {
"id": "wE6z_wcfnQlq"
}
}
]
}