Jupyter NotebookをPresentationにする。
まずは機能の表示を確認しよう!
ここで、numpyとpandasを用いて適当なデータセットを作成する。 今回は単純に100名の生徒の数学・国語・英語・社会のテスト結果を作成する。
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('数国英社'))
display.display(df.head())
数 | 国 | 英 | 社 | |
---|---|---|---|---|
0 | 1 | 38 | 29 | 53 |
1 | 81 | 72 | 62 | 72 |
2 | 29 | 66 | 77 | 95 |
3 | 43 | 30 | 96 | 52 |
4 | 9 | 47 | 94 | 24 |
簡単にDataframeのShapeの出力する。
display.display(df.shape)
(100, 4)
以上の結果から100名生徒の4科目のデータセットが確認できる。
可視化する関数を適当に作りましょう。
show(df)
以上のプロットは100名生徒の4科目の点数の分布となる。
sklearnのdecompositionモジュールのPCA関数を使って、簡単に固有値ベクトルを計算し、 KMeans法を使ってクラスタリングをしてみよう!
from sklearn.decomposition import PCA
pca = PCA(n_components=3)
pca.fit(df.values)
PCA(n_components=3)
display.display(pca.components_)
array([[-0.67965175, 0.2263222 , 0.57204697, -0.39951723], [-0.40736818, -0.63057073, -0.51952202, -0.40807915], [ 0.54617152, -0.47324164, 0.51138521, -0.46499912]])
kmeans = KMeans(n_clusters=3, random_state=0).fit(df.values)
display.display(kmeans.cluster_centers_)
array([[21.32432432, 56.45945946, 54.21621622, 41.27027027], [71.64285714, 36.21428571, 71.85714286, 45.57142857], [70.14285714, 52.68571429, 21.88571429, 63.97142857]])
printすることは要注意! NotebookのプレゼンモードはHTML形式で行われるので、できればIPythonモジュールのdisplay関数を使いましょう!
display.display("What is this?")
'What is this?'
print("What is this?")
What is this?
画像を追加する時は普通のNotebookと全く一緒で、ただ表示すればよい。 ただし、実際のプレゼンの画面はサイズの制限があると感じるので、 そこは上手く調整しましょう!
display.display(display.Image("../input/image.jpg", width=200, height=200))
display.display(display.Image("../input/image.jpg", width=400, height=400))
display.display(display.Image("../input/image.jpg", width=640, height=480))