# Jupyter Notebook

## Jupyter Notebookとは

[Jupyter](https://jupyter.org/) Notebookは、プログラムとその実行結果、[Markdown](https://ja.wikipedia.org/wiki/Markdown)形式のドキュメント、[LaTeX](https://ja.wikipedia.org/wiki/LaTeX)形式([MathJax](https://www.mathjax.org/))の数式、図表などをまとめて記述・格納できるウェブアプリケーションである。データ分析や機械学習の実行過程の「ノート」をつける用途だけでなく、ブラウザ上でお手軽にプログラミングを体験する環境としても広く普及している。

例えば、物理の解説とその実験を行うプログラム、その実行結果をまとめたノートを作ることができる。

![Jupyter Notebookの例](assets/image/jupyter-notebook2.png)

Jupyterの前身である[IPython Notebook](https://ipython.org/notebook.html)は、[Python](https://www.python.org/)のインタラクティブなシェルである[IPython](https://ipython.org/)のプロジェクトとして開発が進められ、研究者や開発者から急速な支持を集めた。プログラミング言語に依存した部分(カーネルと呼ばれる)を分離し、Python以外の言語のサポートも進んだことから、IPython NotebookはJupyterプロジェクトにスピンオフされた。

## Google Colaboratory

[Google Colaboratory](https://colab.research.google.com/)はGoogleが提供するクラウド実行型のJupyter環境である。後述する制限はあるものの、Googleアカウントがあれば無料で利用できる。詳しくは、[Colaboratory へようこそ(公式ドキュメント)](https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja)を参照のこと。

### Google Colaboratoryを開始する

Googleアカウントにログインしたブラウザで、[https://colab.research.google.com/](https://colab.research.google.com/) にアクセスすればよい。以下の画面で「ノートブックを新規作成」を選ぶ。

![新しいノートブックの作成](assets/image/colab-new.png)

すると、以下の画面のように新しいノートブックが作成される。

![新しく作成されたノートブック](assets/image/colab-clean.png)

### セルの操作

ノートブックはプログラムやテキストを記述する**セル**と呼ばれるブロックの集まりで構成されている。セルはプログラムを記述し、その実行結果を保持する**コードセル**と、文章を記述する**テキストセル**の2種類に大別される。新しく作成されたセルはコードセルとして動作する。

Pythonのコードを実行するには、セルにプログラムを入力し、`⌘/Ctrl` + `Enter`キーを押す。すると、Googleのクラウドサーバ上でプログラムが実行され、その実行結果がブラウザに表示される。ここでは、以下のプログラムを入力・実行し、その出力が表示されている。

```
print('Hello, World!')
```

![コードを実行](assets/image/colab-code.png)

テキストセルを作成するには、「挿入」メニューからテキストセルを追加するか、いったん作成されたコードセルを選択して、`⌘/Ctrl` + `m` -> `m`を押す。

![テキストセルの挿入](assets/image/colab-insert-text.png)

テキストセルでは[Markdown記法](https://colab.research.google.com/notebooks/markdown_guide.ipynb)を用いることができるほか、LaTeX形式で数式を記述できる。

![テキストセルの編集](assets/image/colab-text.png)

セルの位置の移動や出力の消去などは、メニューから行える。その他、Google Colaboratoryで便利なキー操作を以下に挙げる。なお、このキー操作は「ツール」メニューの「キーボード ショートカット」から一覧を閲覧したり、キー割り当てを変更できる。

+ カーソル(十字)キー: 選択セルを変更
+ `⌘/Ctrl` + `Enter`: 実行(コードセル)、または確定(テキストセル)
+ `⌘/Ctrl` + `m` -> `i`: 実行を中断
+ `⌘/Ctrl` + `m` -> `a`: 上にコードセルを追加
+ `⌘/Ctrl` + `m` -> `b`: 下にコードセルを追加
+ `⌘/Ctrl` + `m` -> `d`: セルを削除
+ `⌘/Ctrl` + `m` -> `y`: コードセルに変更
+ `⌘/Ctrl` + `m` -> `m`: テキストセルに変更
+ `⌘/Ctrl` + `m` -> `k`: セルを一つ上に移動
+ `⌘/Ctrl` + `m` -> `j`: セルを一つ下に移動

### ノートブックの保存、ダウンロード、アップロード

左上の名前(デフォルトでは"Untitled?.ipynb"となっている)の部分をクリックすることで、保存するファイル名を変更できる。

![ファイル名の変更](assets/image/colab-rename.png)

作成したノートブックは「ファイル」->「.ipynb をダウンロード」をクリックすることで、ダウンロードできる。保存されるファイルの拡張子は".ipynb"である。

![ノートブックのダウンロード](assets/image/colab-save.png)

逆に、手元にある.ipynbファイルをアップロードして、Google Colaboratory上で閲覧したり、動かすこともできる。「ファイル」->「ノートブックをアップロード」をクリックし、以下の画面になったらアップロードしたいファイルをドラッグ・ドロップすればよい。

![ノートブックのアップロード](assets/image/colab-upload.png)


### 無料版Google Colaboratoryの制限

Google Colaboratoryで新しいノートブックを開くと、プログラムの実行環境であるインスタンスが立ち上がる。そのインスタンスは**立ち上げから12時間で強制終了**となる。また、Colaboratoryにアクセスしているブラウザを閉じるなど、インスタンスとのセッションが切れた状態が90分続いても、強制終了となる。ただ、ノートブックそのものはGoogle Drive上に保存され続けるので、新たにノートブックを開いてインスタンスを立ち上げ直せば、再度実行することができる。プログラミングや機械学習の勉強用途であれば、無料版のGoogle Colaboratoryで十分と思われる。

## 自分のパソコンにJupyterをインストールする

Jupyterを自分のパソコンにインストールして動作させることもできる。この場合、Google Colaboratoryでノートブックを実行するときのような時間制限はない。Windows 10の場合、以下の2つの方法が現実的と思われる。

1. [Windows Subsystem for Linux (WSL)](https://docs.microsoft.com/ja-jp/windows/wsl/about)上に[Ubuntu](https://ubuntu.com/)をインストールし、さらに[conda](https://www.anaconda.com/products/individual)をインストール
1. Windows版の[Anaconda](https://www.anaconda.com/)をインストールする

1.はインストールに手間がかかるが、Linux環境上でJupyterを動作させることができる。ネット上の多くの解説はLinux系の環境を前提としているため、こちらの方が環境の違いで悩まされずに済む。2.はお手軽にインストールできるが、コードセルでWindowsのコマンドしか実行できず、ネット上の解説の通りにならないことがある。また、デフォルトの文字コードが UTF-8 ではなく、Shift_JIS (CP932) になることにも注意が必要である。

自分のパソコンにJupyterをインストールした場合は、Jupyter Notebookの進化版であるJupyter Labを使うことができる。

![Jupyter Lab](assets/image/jupyter-lab.png)

## Jupyter (IPython) の便利機能

### 入力や出力の参照

In [1]:
x, y = 10, 5

In [2]:
x + y

15

In [3]:
x - y

5

In [4]:
x * y

50

In [5]:
x / y

2.0

In [6]:
_, __, ___

(2.0, 50, 5)

In [7]:
In[2]

'x + y'

In [8]:
Out[2]

15

### シェルコマンドの実行

In [9]:
!ls *.txt

prefecture.txt	 prefecture3.txt requirements.txt
prefecture2.txt prefecture4.txt tokyo-covid.txt


In [10]:
!cat prefecture.txt

東京 とうきょう Tokyo
神奈川 かながわ Kanagawa
千葉 ちば Chiba
埼玉 さいたま Saitama


In [11]:
!cut -f2 -d" " prefecture.txt

とうきょう
かながわ
ちば
さいたま


In [12]:
yomi = !cut -f2 -d" " prefecture.txt

In [13]:
yomi

['とうきょう', 'かながわ', 'ちば', 'さいたま']

### イントロスペクション

In [14]:
print?

[0;31mDocstring:[0m
print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)

Prints the values to a stream, or to sys.stdout by default.
Optional keyword arguments:
file: a file-like object (stream); defaults to the current sys.stdout.
sep: string inserted between values, default a space.
end: string appended after the last value, default a newline.
flush: whether to forcibly flush the stream.
[0;31mType:[0m builtin_function_or_method


In [15]:
str.format?

[0;31mDocstring:[0m
S.format(*args, **kwargs) -> str

Return a formatted version of S, using substitutions from args and kwargs.
The substitutions are identified by braces ('{' and '}').
[0;31mType:[0m method_descriptor


### 実行速度の計測

In [16]:
%timeit sum(range(1000))

11.1 µs ± 674 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [17]:
%timeit sum([x for x in range(1000)])

24.3 µs ± 1.01 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [18]:
%timeit sum(x for x in range(1000))

31 µs ± 298 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [19]:
%%timeit
s = 0
for i in range(1000):
 s += i

31.4 µs ± 288 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### デバッグ

In [20]:
def count_upper(s):
 n = 0
 for c in s:
 if c.isupper():
 ++n
 return n

In [21]:
count_upper('New York')

0

In [22]:
%pdb on

Automatic pdb calling has been turned ON


In [23]:
def count_upper(s):
 breakpoint()
 n = 0
 for c in s:
 if c.isupper():
 ++n
 return n

In [24]:
count_upper('New York')

> [0;32m[0m(3)[0;36mcount_upper[0;34m()[0m
[0;32m 1 [0;31m[0;32mdef[0m [0mcount_upper[0m[0;34m([0m[0ms[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 2 [0;31m [0mbreakpoint[0m[0;34m([0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 3 [0;31m [0mn[0m [0;34m=[0m [0;36m0[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 4 [0;31m [0;32mfor[0m [0mc[0m [0;32min[0m [0ms[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 5 [0;31m [0;32mif[0m [0mc[0m[0;34m.[0m[0misupper[0m[0;34m([0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb> n


> [0;32m[0m(4)[0;36mcount_upper[0;34m()[0m
[0;32m 2 [0;31m [0mbreakpoint[0m[0;34m([0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 3 [0;31m [0mn[0m [0;34m=[0m [0;36m0[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 4 [0;31m [0;32mfor[0m [0mc[0m [0;32min[0m [0ms[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 5 [0;31m [0;32mif[0m [0mc[0m[0;34m.[0m[0misupper[0m[0;34m([0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 6 [0;31m [0;34m+[0m[0;34m+[0m[0mn[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb> n


> [0;32m[0m(5)[0;36mcount_upper[0;34m()[0m
[0;32m 3 [0;31m [0mn[0m [0;34m=[0m [0;36m0[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 4 [0;31m [0;32mfor[0m [0mc[0m [0;32min[0m [0ms[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 5 [0;31m [0;32mif[0m [0mc[0m[0;34m.[0m[0misupper[0m[0;34m([0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 6 [0;31m [0;34m+[0m[0;34m+[0m[0mn[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 7 [0;31m [0;32mreturn[0m [0mn[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb> n


> [0;32m[0m(6)[0;36mcount_upper[0;34m()[0m
[0;32m 3 [0;31m [0mn[0m [0;34m=[0m [0;36m0[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 4 [0;31m [0;32mfor[0m [0mc[0m [0;32min[0m [0ms[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 5 [0;31m [0;32mif[0m [0mc[0m[0;34m.[0m[0misupper[0m[0;34m([0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 6 [0;31m [0;34m+[0m[0;34m+[0m[0mn[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 7 [0;31m [0;32mreturn[0m [0mn[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb> n


> [0;32m[0m(4)[0;36mcount_upper[0;34m()[0m
[0;32m 2 [0;31m [0mbreakpoint[0m[0;34m([0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 3 [0;31m [0mn[0m [0;34m=[0m [0;36m0[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 4 [0;31m [0;32mfor[0m [0mc[0m [0;32min[0m [0ms[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 5 [0;31m [0;32mif[0m [0mc[0m[0;34m.[0m[0misupper[0m[0;34m([0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 6 [0;31m [0;34m+[0m[0;34m+[0m[0mn[0m[0;34m[0m[0;34m[0m[0m
[0m


ipdb> p n


0


ipdb> quit


BdbQuit: 

> [0;32m/home/okazaki/anaconda3/lib/python3.8/bdb.py[0m(113)[0;36mdispatch_line[0;34m()[0m
[0;32m 111 [0;31m [0;32mif[0m [0mself[0m[0;34m.[0m[0mstop_here[0m[0;34m([0m[0mframe[0m[0;34m)[0m [0;32mor[0m [0mself[0m[0;34m.[0m[0mbreak_here[0m[0;34m([0m[0mframe[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 112 [0;31m [0mself[0m[0;34m.[0m[0muser_line[0m[0;34m([0m[0mframe[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m--> 113 [0;31m [0;32mif[0m [0mself[0m[0;34m.[0m[0mquitting[0m[0;34m:[0m [0;32mraise[0m [0mBdbQuit[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 114 [0;31m [0;32mreturn[0m [0mself[0m[0;34m.[0m[0mtrace_dispatch[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m 115 [0;31m[0;34m[0m[0m
[0m


ipdb> quit


In [25]:
sum(1 for c in 'New York' if c.isupper())

2

---

[Python早見帳](https://chokkan.github.io/python/) © Copyright 2020-2024 by [岡崎 直観 (Naoaki Okazaki)](https://www.chokkan.org/). この作品はクリエイティブ・コモンズ 表示 - 非営利 - 改変禁止 4.0 国際 ライセンスの下に提供されています。"クリエイティブ・コモンズ・ライセンス"