{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "CPython 3.6.8\n", "IPython 7.2.0\n", "\n", "numpy 1.15.4\n", "sklearn 0.20.2\n", "scipy 1.1.0\n", "matplotlib 3.0.2\n", "tensorflow 1.13.1\n" ] } ], "source": [ "%load_ext watermark\n", "%watermark -v -p numpy,sklearn,scipy,matplotlib,tensorflow" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**14장 – 순환 신경망**" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "_이 노트북은 14장에 있는 모든 샘플 코드와 연습문제 해답을 가지고 있습니다._" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 설정" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "파이썬 2와 3을 모두 지원합니다. 공통 모듈을 임포트하고 맷플롯립 그림이 노트북 안에 포함되도록 설정하고 생성한 그림을 저장하기 위한 함수를 준비합니다:" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "# 파이썬 2와 파이썬 3 지원\n", "from __future__ import division, print_function, unicode_literals\n", "\n", "# 공통\n", "import numpy as np\n", "import os\n", "\n", "# 일관된 출력을 위해 유사난수 초기화\n", "def reset_graph(seed=42):\n", " tf.reset_default_graph()\n", " tf.set_random_seed(seed)\n", " np.random.seed(seed)\n", "\n", "# 맷플롯립 설정\n", "%matplotlib inline\n", "import matplotlib\n", "import matplotlib.pyplot as plt\n", "plt.rcParams['axes.labelsize'] = 14\n", "plt.rcParams['xtick.labelsize'] = 12\n", "plt.rcParams['ytick.labelsize'] = 12\n", "\n", "# 한글출력\n", "plt.rcParams['font.family'] = 'NanumBarunGothic'\n", "plt.rcParams['axes.unicode_minus'] = False\n", "\n", "# 그림을 저장할 폴더\n", "PROJECT_ROOT_DIR = \".\"\n", "CHAPTER_ID = \"rnn\"\n", "\n", "def save_fig(fig_id, tight_layout=True):\n", " path = os.path.join(PROJECT_ROOT_DIR, \"images\", CHAPTER_ID, fig_id + \".png\")\n", " if tight_layout:\n", " plt.tight_layout()\n", " plt.savefig(path, format='png', dpi=300)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "텐서플로를 임포트합니다:" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "import tensorflow as tf" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 기본 RNN" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 수동으로 RNN 만들기" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From /home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py:263: colocate_with (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Colocations handled automatically by placer.\n" ] } ], "source": [ "reset_graph()\n", "\n", "n_inputs = 3\n", "n_neurons = 5\n", "\n", "X0 = tf.placeholder(tf.float32, [None, n_inputs])\n", "X1 = tf.placeholder(tf.float32, [None, n_inputs])\n", "\n", "Wx = tf.Variable(tf.random_normal(shape=[n_inputs, n_neurons],dtype=tf.float32))\n", "Wy = tf.Variable(tf.random_normal(shape=[n_neurons,n_neurons],dtype=tf.float32))\n", "b = tf.Variable(tf.zeros([1, n_neurons], dtype=tf.float32))\n", "\n", "Y0 = tf.tanh(tf.matmul(X0, Wx) + b)\n", "Y1 = tf.tanh(tf.matmul(Y0, Wy) + tf.matmul(X1, Wx) + b)\n", "\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "\n", "X0_batch = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 0, 1]]) # t = 0\n", "X1_batch = np.array([[9, 8, 7], [0, 0, 0], [6, 5, 4], [3, 2, 1]]) # t = 1\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " Y0_val, Y1_val = sess.run([Y0, Y1], feed_dict={X0: X0_batch, X1: X1_batch})" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[-0.0664006 0.9625767 0.68105793 0.7091854 -0.898216 ]\n", " [ 0.9977755 -0.719789 -0.9965761 0.9673924 -0.9998972 ]\n", " [ 0.99999774 -0.99898803 -0.9999989 0.9967762 -0.9999999 ]\n", " [ 1. -1. -1. -0.99818915 0.9995087 ]]\n" ] } ], "source": [ "print(Y0_val)" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[ 1. -1. -1. 0.4020025 -0.9999998 ]\n", " [-0.12210419 0.62805265 0.9671843 -0.9937122 -0.2583937 ]\n", " [ 0.9999983 -0.9999994 -0.9999975 -0.85943305 -0.9999881 ]\n", " [ 0.99928284 -0.99999815 -0.9999058 0.9857963 -0.92205757]]\n" ] } ], "source": [ "print(Y1_val)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `static_rnn()`을 사용하여 만들기" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [], "source": [ "n_inputs = 3\n", "n_neurons = 5" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "WARNING: The TensorFlow contrib module will not be included in TensorFlow 2.0.\n", "For more information, please see:\n", " * https://github.com/tensorflow/community/blob/master/rfcs/20180907-contrib-sunset.md\n", " * https://github.com/tensorflow/addons\n", "If you depend on functionality not listed there, please file an issue.\n", "\n", "WARNING:tensorflow:From :6: BasicRNNCell.__init__ (from tensorflow.python.ops.rnn_cell_impl) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "This class is equivalent as tf.keras.layers.SimpleRNNCell, and will be replaced by that in Tensorflow 2.0.\n", "WARNING:tensorflow:From :8: static_rnn (from tensorflow.python.ops.rnn) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Please use `keras.layers.RNN(cell, unroll=True)`, which is equivalent to this API\n" ] } ], "source": [ "reset_graph()\n", "\n", "X0 = tf.placeholder(tf.float32, [None, n_inputs])\n", "X1 = tf.placeholder(tf.float32, [None, n_inputs])\n", "\n", "basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", "output_seqs, states = tf.contrib.rnn.static_rnn(basic_cell, [X0, X1],\n", " dtype=tf.float32)\n", "Y0, Y1 = output_seqs" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [], "source": [ "X0_batch = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 0, 1]])\n", "X1_batch = np.array([[9, 8, 7], [0, 0, 0], [6, 5, 4], [3, 2, 1]])\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " Y0_val, Y1_val = sess.run([Y0, Y1], feed_dict={X0: X0_batch, X1: X1_batch})" ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0.30741334, -0.32884315, -0.6542847 , -0.9385059 , 0.52089024],\n", " [ 0.99122757, -0.9542541 , -0.7518079 , -0.9995208 , 0.9820235 ],\n", " [ 0.9999268 , -0.99783254, -0.8247353 , -0.9999963 , 0.99947774],\n", " [ 0.996771 , -0.68750614, 0.8419969 , 0.9303911 , 0.8120684 ]],\n", " dtype=float32)" ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "Y0_val" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0.99998885, -0.99976057, -0.0667929 , -0.9999803 , 0.99982214],\n", " [-0.6524943 , -0.51520866, -0.37968948, -0.5922594 , -0.08968379],\n", " [ 0.99862397, -0.99715203, -0.03308626, -0.9991566 , 0.9932902 ],\n", " [ 0.99681675, -0.9598194 , 0.39660627, -0.8307606 , 0.79671973]],\n", " dtype=float32)" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "Y1_val" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [], "source": [ "from tensorflow_graph_in_jupyter import show_graph" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", " \n", " " ], "text/plain": [ "" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "show_graph(tf.get_default_graph())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 시퀀스 패딩" ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [], "source": [ "n_steps = 2\n", "n_inputs = 3\n", "n_neurons = 5" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "X_seqs = tf.unstack(tf.transpose(X, perm=[1, 0, 2]))\n", "\n", "basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", "output_seqs, states = tf.contrib.rnn.static_rnn(basic_cell, X_seqs,\n", " dtype=tf.float32)\n", "outputs = tf.transpose(tf.stack(output_seqs), perm=[1, 0, 2])" ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [], "source": [ "X_batch = np.array([\n", " # t = 0 t = 1 \n", " [[0, 1, 2], [9, 8, 7]], # 샘플 1\n", " [[3, 4, 5], [0, 0, 0]], # 샘플 2\n", " [[6, 7, 8], [6, 5, 4]], # 샘플 3\n", " [[9, 0, 1], [3, 2, 1]], # 샘플 4\n", " ])\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " outputs_val = outputs.eval(feed_dict={X: X_batch})" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[[-0.45652324 -0.68064123 0.40938237 0.63104504 -0.45732826]\n", " [-0.9428799 -0.9998869 0.94055814 0.9999985 -0.9999997 ]]\n", "\n", " [[-0.8001535 -0.9921827 0.7817797 0.9971032 -0.9964609 ]\n", " [-0.637116 0.11300927 0.5798437 0.4310559 -0.6371699 ]]\n", "\n", " [[-0.93605185 -0.9998379 0.9308867 0.9999815 -0.99998295]\n", " [-0.9165386 -0.9945604 0.896054 0.99987197 -0.9999751 ]]\n", "\n", " [[ 0.9927369 -0.9981933 -0.55543643 0.9989031 -0.9953323 ]\n", " [-0.02746338 -0.73191994 0.7827872 0.9525682 -0.9781773 ]]]\n" ] } ], "source": [ "print(outputs_val)" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[-0.9428799 -0.9998869 0.94055814 0.9999985 -0.9999997 ]\n", " [-0.637116 0.11300927 0.5798437 0.4310559 -0.6371699 ]\n", " [-0.9165386 -0.9945604 0.896054 0.99987197 -0.9999751 ]\n", " [-0.02746338 -0.73191994 0.7827872 0.9525682 -0.9781773 ]]\n" ] } ], "source": [ "print(np.transpose(outputs_val, axes=[1, 0, 2])[1])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Using `dynamic_rnn()`" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [], "source": [ "n_steps = 2\n", "n_inputs = 3\n", "n_neurons = 5" ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :6: dynamic_rnn (from tensorflow.python.ops.rnn) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Please use `keras.layers.RNN(cell)`, which is equivalent to this API\n" ] } ], "source": [ "reset_graph()\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "\n", "basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", "outputs, states = tf.nn.dynamic_rnn(basic_cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [], "source": [ "X_batch = np.array([\n", " [[0, 1, 2], [9, 8, 7]], # instance 1\n", " [[3, 4, 5], [0, 0, 0]], # instance 2\n", " [[6, 7, 8], [6, 5, 4]], # instance 3\n", " [[9, 0, 1], [3, 2, 1]], # instance 4\n", " ])\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " outputs_val = outputs.eval(feed_dict={X: X_batch})" ] }, { "cell_type": "code", "execution_count": 26, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[[-0.85115266 0.87358344 0.5802911 0.8954789 -0.0557505 ]\n", " [-0.999996 0.99999577 0.9981815 1. 0.37679607]]\n", "\n", " [[-0.9983293 0.9992038 0.98071456 0.999985 0.25192663]\n", " [-0.7081804 -0.0772338 -0.85227895 0.5845349 -0.78780943]]\n", "\n", " [[-0.9999827 0.99999535 0.9992863 1. 0.5159072 ]\n", " [-0.9993956 0.9984095 0.83422637 0.99999976 -0.47325212]]\n", "\n", " [[ 0.87888587 0.07356028 0.97216916 0.9998546 -0.7351168 ]\n", " [-0.9134514 0.3600957 0.7624866 0.99817705 0.80142 ]]]\n" ] } ], "source": [ "print(outputs_val)" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", " \n", " " ], "text/plain": [ "" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "show_graph(tf.get_default_graph())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 시퀀스 길이 지정" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [], "source": [ "n_steps = 2\n", "n_inputs = 3\n", "n_neurons = 5\n", "\n", "reset_graph()\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)" ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From /home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/tensorflow/python/ops/rnn.py:626: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Use tf.cast instead.\n" ] } ], "source": [ "seq_length = tf.placeholder(tf.int32, [None])\n", "outputs, states = tf.nn.dynamic_rnn(basic_cell, X, dtype=tf.float32,\n", " sequence_length=seq_length)" ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 31, "metadata": {}, "outputs": [], "source": [ "X_batch = np.array([\n", " # 스텝 0 스텝 1\n", " [[0, 1, 2], [9, 8, 7]], # 샘플 1\n", " [[3, 4, 5], [0, 0, 0]], # 샘플 2 (0 벡터로 패딩)\n", " [[6, 7, 8], [6, 5, 4]], # 샘플 3\n", " [[9, 0, 1], [3, 2, 1]], # 샘플 4\n", " ])\n", "seq_length_batch = np.array([2, 1, 2, 2])" ] }, { "cell_type": "code", "execution_count": 32, "metadata": {}, "outputs": [], "source": [ "with tf.Session() as sess:\n", " init.run()\n", " outputs_val, states_val = sess.run(\n", " [outputs, states], feed_dict={X: X_batch, seq_length: seq_length_batch})" ] }, { "cell_type": "code", "execution_count": 33, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[[-0.9123188 0.16516446 0.5548655 -0.39159346 0.20846416]\n", " [-1. 0.956726 0.99831694 0.99970174 0.96518576]]\n", "\n", " [[-0.9998612 0.6702289 0.9723653 0.6631046 0.74457586]\n", " [ 0. 0. 0. 0. 0. ]]\n", "\n", " [[-0.99999976 0.8967997 0.9986295 0.9647514 0.93662 ]\n", " [-0.9999526 0.9681953 0.96002865 0.98706263 0.85459226]]\n", "\n", " [[-0.96435434 0.99501586 -0.36150697 0.9983378 0.999497 ]\n", " [-0.9613586 0.9568762 0.7132288 0.97729224 -0.0958299 ]]]\n" ] } ], "source": [ "print(outputs_val)" ] }, { "cell_type": "code", "execution_count": 34, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[-1. 0.956726 0.99831694 0.99970174 0.96518576]\n", " [-0.9998612 0.6702289 0.9723653 0.6631046 0.74457586]\n", " [-0.9999526 0.9681953 0.96002865 0.98706263 0.85459226]\n", " [-0.9613586 0.9568762 0.7132288 0.97729224 -0.0958299 ]]\n" ] } ], "source": [ "print(states_val)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 시퀀스 분류기 훈련하기" ] }, { "cell_type": "code", "execution_count": 35, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :16: dense (from tensorflow.python.layers.core) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Use keras.layers.dense instead.\n" ] } ], "source": [ "reset_graph()\n", "\n", "n_steps = 28\n", "n_inputs = 28\n", "n_neurons = 150\n", "n_outputs = 10\n", "\n", "learning_rate = 0.001\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.int32, [None])\n", "\n", "basic_cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", "outputs, states = tf.nn.dynamic_rnn(basic_cell, X, dtype=tf.float32)\n", "\n", "logits = tf.layers.dense(states, n_outputs)\n", "xentropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y,\n", " logits=logits)\n", "loss = tf.reduce_mean(xentropy)\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "correct = tf.nn.in_top_k(logits, y, 1)\n", "accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))\n", "\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "주의: `tf.examples.tutorials.mnist`은 삭제될 예정이므로 대신 `tf.keras.datasets.mnist`를 사용하겠습니다." ] }, { "cell_type": "code", "execution_count": 36, "metadata": { "scrolled": true }, "outputs": [], "source": [ "(X_train, y_train), (X_test, y_test) = tf.keras.datasets.mnist.load_data()\n", "X_train = X_train.astype(np.float32).reshape(-1, 28*28) / 255.0\n", "X_test = X_test.astype(np.float32).reshape(-1, 28*28) / 255.0\n", "y_train = y_train.astype(np.int32)\n", "y_test = y_test.astype(np.int32)\n", "X_valid, X_train = X_train[:5000], X_train[5000:]\n", "y_valid, y_train = y_train[:5000], y_train[5000:]\n", "X_test = X_test.reshape((-1, n_steps, n_inputs))\n", "X_valid = X_valid.reshape((-1, n_steps, n_inputs))" ] }, { "cell_type": "code", "execution_count": 37, "metadata": {}, "outputs": [], "source": [ "def shuffle_batch(X, y, batch_size):\n", " rnd_idx = np.random.permutation(len(X))\n", " n_batches = len(X) // batch_size\n", " for batch_idx in np.array_split(rnd_idx, n_batches):\n", " X_batch, y_batch = X[batch_idx], y[batch_idx]\n", " yield X_batch, y_batch" ] }, { "cell_type": "code", "execution_count": 38, "metadata": {}, "outputs": [], "source": [ "# from tensorflow.examples.tutorials.mnist import input_data\n", "# mnist = input_data.read_data_sets(\"/tmp/data/\")\n", "# X_test = mnist.test.images.reshape((-1, n_steps, n_inputs))\n", "# y_test = mnist.test.labels" ] }, { "cell_type": "code", "execution_count": 39, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 배치 데이터 정확도: 0.9533333 검증 세트 정확도: 0.9322\n", "1 배치 데이터 정확도: 0.96 검증 세트 정확도: 0.953\n", "2 배치 데이터 정확도: 0.96 검증 세트 정확도: 0.952\n", "3 배치 데이터 정확도: 0.96666664 검증 세트 정확도: 0.9616\n", "4 배치 데이터 정확도: 0.96 검증 세트 정확도: 0.9674\n", "5 배치 데이터 정확도: 0.9066667 검증 세트 정확도: 0.967\n", "6 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9748\n", "7 배치 데이터 정확도: 0.96 검증 세트 정확도: 0.9748\n", "8 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9726\n", "9 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9722\n", "10 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.973\n", "11 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9754\n", "12 배치 데이터 정확도: 0.94666666 검증 세트 정확도: 0.9754\n", "13 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9708\n", "14 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9832\n", "15 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9728\n", "16 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9794\n", "17 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9764\n", "18 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9786\n", "19 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.979\n", "20 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9756\n", "21 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.973\n", "22 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9756\n", "23 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9752\n", "24 배치 데이터 정확도: 0.97333336 검증 세트 정확도: 0.9826\n", "25 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.975\n", "26 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9794\n", "27 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.978\n", "28 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9738\n", "29 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.977\n", "30 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.979\n", "31 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9808\n", "32 배치 데이터 정확도: 0.96666664 검증 세트 정확도: 0.978\n", "33 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9834\n", "34 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9794\n", "35 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9798\n", "36 배치 데이터 정확도: 0.97333336 검증 세트 정확도: 0.9792\n", "37 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9812\n", "38 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.979\n", "39 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9796\n", "40 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.98\n", "41 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9812\n", "42 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9784\n", "43 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9804\n", "44 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9794\n", "45 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9824\n", "46 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9802\n", "47 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9816\n", "48 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.981\n", "49 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9806\n", "50 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9822\n", "51 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9786\n", "52 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9804\n", "53 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9818\n", "54 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9836\n", "55 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.974\n", "56 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.983\n", "57 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9818\n", "58 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9792\n", "59 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9838\n", "60 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9802\n", "61 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9796\n", "62 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9782\n", "63 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9806\n", "64 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9784\n", "65 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9824\n", "66 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9718\n", "67 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9832\n", "68 배치 데이터 정확도: 0.97333336 검증 세트 정확도: 0.9798\n", "69 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9808\n", "70 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9802\n", "71 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.978\n", "72 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9826\n", "73 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9814\n", "74 배치 데이터 정확도: 0.9533333 검증 세트 정확도: 0.9542\n", "75 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9826\n", "76 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9836\n", "77 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9784\n", "78 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9802\n", "79 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.979\n", "80 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9816\n", "81 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9824\n", "82 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9784\n", "83 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.981\n", "84 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9828\n", "85 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9818\n", "86 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9806\n", "87 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9786\n", "88 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9778\n", "89 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9824\n", "90 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9694\n", "91 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.98\n", "92 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9728\n", "93 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9798\n", "94 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9824\n", "95 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9808\n", "96 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9784\n", "97 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.98\n", "98 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9834\n", "99 배치 데이터 정확도: 0.9866667 검증 세트 정확도: 0.9832\n" ] } ], "source": [ "n_epochs = 100\n", "batch_size = 150\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for epoch in range(n_epochs):\n", " for X_batch, y_batch in shuffle_batch(X_train, y_train, batch_size):\n", " X_batch = X_batch.reshape((-1, n_steps, n_inputs))\n", " sess.run(training_op, feed_dict={X: X_batch, y: y_batch})\n", " acc_batch = accuracy.eval(feed_dict={X: X_batch, y: y_batch})\n", " acc_valid = accuracy.eval(feed_dict={X: X_valid, y: y_valid})\n", " print(epoch, \"배치 데이터 정확도:\", acc_batch, \"검증 세트 정확도:\", acc_valid)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 다층 RNN" ] }, { "cell_type": "code", "execution_count": 40, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_steps = 28\n", "n_inputs = 28\n", "n_outputs = 10\n", "\n", "learning_rate = 0.001\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.int32, [None])" ] }, { "cell_type": "code", "execution_count": 41, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :7: MultiRNNCell.__init__ (from tensorflow.python.ops.rnn_cell_impl) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "This class is equivalent as tf.keras.layers.StackedRNNCells, and will be replaced by that in Tensorflow 2.0.\n" ] } ], "source": [ "n_neurons = 100\n", "n_layers = 3\n", "\n", "layers = [tf.contrib.rnn.BasicRNNCell(num_units=n_neurons,\n", " activation=tf.nn.relu)\n", " for layer in range(n_layers)]\n", "multi_layer_cell = tf.contrib.rnn.MultiRNNCell(layers)\n", "outputs, states = tf.nn.dynamic_rnn(multi_layer_cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 42, "metadata": {}, "outputs": [], "source": [ "states_concat = tf.concat(axis=1, values=states)\n", "logits = tf.layers.dense(states_concat, n_outputs)\n", "xentropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=logits)\n", "loss = tf.reduce_mean(xentropy)\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "correct = tf.nn.in_top_k(logits, y, 1)\n", "accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))\n", "\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 43, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 배치 데이터 정확도: 0.92 검증 세트 정확도: 0.9438\n", "1 배치 데이터 정확도: 0.94 검증 세트 정확도: 0.958\n", "2 배치 데이터 정확도: 0.96 검증 세트 정확도: 0.9752\n", "3 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9772\n", "4 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9744\n", "5 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9734\n", "6 배치 데이터 정확도: 0.99333334 검증 세트 정확도: 0.9776\n", "7 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9792\n", "8 배치 데이터 정확도: 1.0 검증 세트 정확도: 0.9832\n", "9 배치 데이터 정확도: 0.98 검증 세트 정확도: 0.9776\n" ] } ], "source": [ "n_epochs = 10\n", "batch_size = 150\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for epoch in range(n_epochs):\n", " for X_batch, y_batch in shuffle_batch(X_train, y_train, batch_size):\n", " X_batch = X_batch.reshape((-1, n_steps, n_inputs))\n", " sess.run(training_op, feed_dict={X: X_batch, y: y_batch})\n", " acc_batch = accuracy.eval(feed_dict={X: X_batch, y: y_batch})\n", " acc_valid = accuracy.eval(feed_dict={X: X_valid, y: y_valid})\n", " print(epoch, \"배치 데이터 정확도:\", acc_batch, \"검증 세트 정확도:\", acc_valid)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 시계열" ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [], "source": [ "t_min, t_max = 0, 30\n", "resolution = 0.1\n", "\n", "def time_series(t):\n", " return t * np.sin(t) / 3 + 2 * np.sin(t*5)\n", "\n", "def next_batch(batch_size, n_steps):\n", " t0 = np.random.rand(batch_size, 1) * (t_max - t_min - n_steps * resolution)\n", " Ts = t0 + np.arange(0., n_steps + 1) * resolution\n", " ys = time_series(Ts)\n", " return ys[:, :-1].reshape(-1, n_steps, 1), ys[:, 1:].reshape(-1, n_steps, 1)" ] }, { "cell_type": "code", "execution_count": 45, "metadata": { "scrolled": true }, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "t = np.linspace(t_min, t_max, int((t_max - t_min) / resolution))\n", "\n", "n_steps = 20\n", "t_instance = np.linspace(12.2, 12.2 + resolution * (n_steps + 1), n_steps + 1)\n", "\n", "plt.figure(figsize=(11,4))\n", "plt.subplot(121)\n", "plt.title(\"시계열 데이터 (인공 생성)\", fontsize=14)\n", "plt.plot(t, time_series(t), label=r\"$t . \\sin(t) / 3 + 2 . \\sin(5t)$\")\n", "plt.plot(t_instance[:-1], time_series(t_instance[:-1]), \"b-\", linewidth=3, label=\"훈련 샘플\")\n", "plt.legend(loc=\"lower left\", fontsize=14)\n", "plt.axis([0, 30, -17, 13])\n", "plt.xlabel(\"시간\")\n", "plt.ylabel(\"값\", rotation=0)\n", "\n", "plt.subplot(122)\n", "plt.title(\"훈련 샘플\", fontsize=14)\n", "plt.plot(t_instance[:-1], time_series(t_instance[:-1]), \"bo\", markersize=12, label=\"샘플\")\n", "plt.plot(t_instance[1:], time_series(t_instance[1:]), \"w*\", markeredgewidth=0.5, markeredgecolor=\"b\", markersize=14, label=\"타깃\")\n", "plt.legend(loc=\"upper left\")\n", "plt.xlabel(\"시간\")\n", "\n", "\n", "save_fig(\"time_series_plot\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 46, "metadata": {}, "outputs": [], "source": [ "X_batch, y_batch = next_batch(1, n_steps)" ] }, { "cell_type": "code", "execution_count": 47, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1.38452097, 2.05081182],\n", " [ 2.05081182, 2.29742291],\n", " [ 2.29742291, 2.0465599 ],\n", " [ 2.0465599 , 1.34009916],\n", " [ 1.34009916, 0.32948704],\n", " [ 0.32948704, -0.76115235],\n", " [-0.76115235, -1.68967022],\n", " [-1.68967022, -2.25492776],\n", " [-2.25492776, -2.34576159],\n", " [-2.34576159, -1.96789418],\n", " [-1.96789418, -1.24220428],\n", " [-1.24220428, -0.37478448],\n", " [-0.37478448, 0.39387907],\n", " [ 0.39387907, 0.84815766],\n", " [ 0.84815766, 0.85045064],\n", " [ 0.85045064, 0.3752526 ],\n", " [ 0.3752526 , -0.48422846],\n", " [-0.48422846, -1.53852738],\n", " [-1.53852738, -2.54795941],\n", " [-2.54795941, -3.28097239]])" ] }, "execution_count": 47, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.c_[X_batch[0], y_batch[0]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `OuputProjectionWrapper` 사용하기" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "RNN 하나를 만들어 보겠습니다. 이 신경망은 100개의 순환 뉴런을 가지고 있고 각 훈련 샘플은 20개의 입력 길이로 구성되므로 20개의 타임 스텝에 펼칠 것입니다. 각 입력은 하나의 특성을 가집니다(각 시간에서의 값 하나). 타깃도 20개의 입력 시퀀스이고 하나의 값을 가집니다:" ] }, { "cell_type": "code", "execution_count": 48, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_steps = 20\n", "n_inputs = 1\n", "n_neurons = 100\n", "n_outputs = 1\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.float32, [None, n_steps, n_outputs])\n", "\n", "cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons, activation=tf.nn.relu)\n", "outputs, states = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "각 타임 스텝에서 크기가 100인 출력 벡터가 만들어 집니다. 하지만 각 타임 스텝에서 하나의 출력 값을 원합니다. 간단한 방법은 `OutputProjectionWrapper`로 셀을 감싸는 것입니다." ] }, { "cell_type": "code", "execution_count": 49, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_steps = 20\n", "n_inputs = 1\n", "n_neurons = 100\n", "n_outputs = 1\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.float32, [None, n_steps, n_outputs])" ] }, { "cell_type": "code", "execution_count": 50, "metadata": {}, "outputs": [], "source": [ "cell = tf.contrib.rnn.OutputProjectionWrapper(\n", " tf.contrib.rnn.BasicRNNCell(num_units=n_neurons, activation=tf.nn.relu),\n", " output_size=n_outputs)" ] }, { "cell_type": "code", "execution_count": 51, "metadata": {}, "outputs": [], "source": [ "outputs, states = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 52, "metadata": {}, "outputs": [], "source": [ "learning_rate = 0.001\n", "\n", "loss = tf.reduce_mean(tf.square(outputs - y)) # MSE\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 53, "metadata": {}, "outputs": [], "source": [ "saver = tf.train.Saver()" ] }, { "cell_type": "code", "execution_count": 54, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 \tMSE: 10.261381\n", "100 \tMSE: 0.38792896\n", "200 \tMSE: 0.10900874\n", "300 \tMSE: 0.061354414\n", "400 \tMSE: 0.059336416\n", "500 \tMSE: 0.058288667\n", "600 \tMSE: 0.052280974\n", "700 \tMSE: 0.047044784\n", "800 \tMSE: 0.049216457\n", "900 \tMSE: 0.0473833\n", "1000 \tMSE: 0.047798716\n", "1100 \tMSE: 0.047832422\n", "1200 \tMSE: 0.041717164\n", "1300 \tMSE: 0.046195257\n", "1400 \tMSE: 0.04128444\n" ] } ], "source": [ "n_iterations = 1500\n", "batch_size = 50\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for iteration in range(n_iterations):\n", " X_batch, y_batch = next_batch(batch_size, n_steps)\n", " sess.run(training_op, feed_dict={X: X_batch, y: y_batch})\n", " if iteration % 100 == 0:\n", " mse = loss.eval(feed_dict={X: X_batch, y: y_batch})\n", " print(iteration, \"\\tMSE:\", mse)\n", " \n", " saver.save(sess, \"./my_time_series_model\") # not shown in the book" ] }, { "cell_type": "code", "execution_count": 55, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From /home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/tensorflow/python/training/saver.py:1266: checkpoint_exists (from tensorflow.python.training.checkpoint_management) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Use standard file APIs to check for files with this prefix.\n", "INFO:tensorflow:Restoring parameters from ./my_time_series_model\n" ] } ], "source": [ "with tf.Session() as sess: # 책에는 없음\n", " saver.restore(sess, \"./my_time_series_model\") # 책에는 없음\n", "\n", " X_new = time_series(np.array(t_instance[:-1].reshape(-1, n_steps, n_inputs)))\n", " y_pred = sess.run(outputs, feed_dict={X: X_new})" ] }, { "cell_type": "code", "execution_count": 56, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([[[-3.398375 ],\n", " [-2.4517932],\n", " [-1.0338113],\n", " [ 0.7044598],\n", " [ 2.2053058],\n", " [ 3.181232 ],\n", " [ 3.525914 ],\n", " [ 3.391311 ],\n", " [ 2.857527 ],\n", " [ 2.2694187],\n", " [ 1.7152514],\n", " [ 1.5625854],\n", " [ 1.9287689],\n", " [ 2.783921 ],\n", " [ 3.8925717],\n", " [ 5.1402655],\n", " [ 6.1224003],\n", " [ 6.676544 ],\n", " [ 6.722065 ],\n", " [ 6.0950246]]], dtype=float32)" ] }, "execution_count": 56, "metadata": {}, "output_type": "execute_result" } ], "source": [ "y_pred" ] }, { "cell_type": "code", "execution_count": 57, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.title(\"모델 테스트\", fontsize=14)\n", "plt.plot(t_instance[:-1], time_series(t_instance[:-1]), \"bo\", markersize=12, label=\"샘플\")\n", "plt.plot(t_instance[1:], time_series(t_instance[1:]), \"w*\", markeredgewidth=0.5, markeredgecolor=\"b\", markersize=14, label=\"타깃\")\n", "plt.plot(t_instance[1:], y_pred[0,:,0], \"r.\", markersize=10, label=\"예측\")\n", "plt.legend(loc=\"upper left\")\n", "plt.xlabel(\"시간\")\n", "\n", "save_fig(\"time_series_pred_plot\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `OutputProjectionWrapper` 사용하지 않기" ] }, { "cell_type": "code", "execution_count": 58, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_steps = 20\n", "n_inputs = 1\n", "n_neurons = 100\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.float32, [None, n_steps, n_outputs])" ] }, { "cell_type": "code", "execution_count": 59, "metadata": {}, "outputs": [], "source": [ "cell = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons, activation=tf.nn.relu)\n", "rnn_outputs, states = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 60, "metadata": {}, "outputs": [], "source": [ "n_outputs = 1\n", "learning_rate = 0.001" ] }, { "cell_type": "code", "execution_count": 61, "metadata": {}, "outputs": [], "source": [ "stacked_rnn_outputs = tf.reshape(rnn_outputs, [-1, n_neurons])\n", "stacked_outputs = tf.layers.dense(stacked_rnn_outputs, n_outputs)\n", "outputs = tf.reshape(stacked_outputs, [-1, n_steps, n_outputs])" ] }, { "cell_type": "code", "execution_count": 62, "metadata": {}, "outputs": [], "source": [ "loss = tf.reduce_mean(tf.square(outputs - y))\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "\n", "init = tf.global_variables_initializer()\n", "saver = tf.train.Saver()" ] }, { "cell_type": "code", "execution_count": 63, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 \tMSE: 13.907029\n", "100 \tMSE: 0.5056698\n", "200 \tMSE: 0.19735886\n", "300 \tMSE: 0.101214476\n", "400 \tMSE: 0.06850145\n", "500 \tMSE: 0.06291986\n", "600 \tMSE: 0.055129297\n", "700 \tMSE: 0.049436502\n", "800 \tMSE: 0.050434686\n", "900 \tMSE: 0.0482007\n", "1000 \tMSE: 0.04809868\n", "1100 \tMSE: 0.04982501\n", "1200 \tMSE: 0.041912545\n", "1300 \tMSE: 0.049292978\n", "1400 \tMSE: 0.043140374\n" ] } ], "source": [ "n_iterations = 1500\n", "batch_size = 50\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for iteration in range(n_iterations):\n", " X_batch, y_batch = next_batch(batch_size, n_steps)\n", " sess.run(training_op, feed_dict={X: X_batch, y: y_batch})\n", " if iteration % 100 == 0:\n", " mse = loss.eval(feed_dict={X: X_batch, y: y_batch})\n", " print(iteration, \"\\tMSE:\", mse)\n", " \n", " X_new = time_series(np.array(t_instance[:-1].reshape(-1, n_steps, n_inputs)))\n", " y_pred = sess.run(outputs, feed_dict={X: X_new})\n", " \n", " saver.save(sess, \"./my_time_series_model\")" ] }, { "cell_type": "code", "execution_count": 64, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[-3.4332483],\n", " [-2.4594698],\n", " [-1.1081185],\n", " [ 0.6882153],\n", " [ 2.1105688],\n", " [ 3.0585155],\n", " [ 3.5144088],\n", " [ 3.3531117],\n", " [ 2.808016 ],\n", " [ 2.1606152],\n", " [ 1.662645 ],\n", " [ 1.5578941],\n", " [ 1.9173537],\n", " [ 2.7210245],\n", " [ 3.8667865],\n", " [ 5.100083 ],\n", " [ 6.099999 ],\n", " [ 6.6480975],\n", " [ 6.6147423],\n", " [ 6.022089 ]]], dtype=float32)" ] }, "execution_count": 64, "metadata": {}, "output_type": "execute_result" } ], "source": [ "y_pred" ] }, { "cell_type": "code", "execution_count": 65, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.title(\"모델 테스트\", fontsize=14)\n", "plt.plot(t_instance[:-1], time_series(t_instance[:-1]), \"bo\", markersize=10, label=\"instance\")\n", "plt.plot(t_instance[1:], time_series(t_instance[1:]), \"w*\", markersize=10, label=\"target\")\n", "plt.plot(t_instance[1:], y_pred[0,:,0], \"r.\", markersize=10, label=\"prediction\")\n", "plt.legend(loc=\"upper left\")\n", "plt.xlabel(\"시간\")\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 새로운 시퀀스 생성하기" ] }, { "cell_type": "code", "execution_count": 66, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "INFO:tensorflow:Restoring parameters from ./my_time_series_model\n" ] } ], "source": [ "with tf.Session() as sess: # 책에는 없음\n", " saver.restore(sess, \"./my_time_series_model\") # 책에는 없음\n", "\n", " sequence = [0.] * n_steps\n", " for iteration in range(300):\n", " X_batch = np.array(sequence[-n_steps:]).reshape(1, n_steps, 1)\n", " y_pred = sess.run(outputs, feed_dict={X: X_batch})\n", " sequence.append(y_pred[0, -1, 0])" ] }, { "cell_type": "code", "execution_count": 67, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.figure(figsize=(8,4))\n", "plt.plot(np.arange(len(sequence)), sequence, \"b-\")\n", "plt.plot(t[:n_steps], sequence[:n_steps], \"b-\", linewidth=3)\n", "plt.xlabel(\"시간\")\n", "plt.ylabel(\"값\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 68, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "INFO:tensorflow:Restoring parameters from ./my_time_series_model\n" ] }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "with tf.Session() as sess:\n", " saver.restore(sess, \"./my_time_series_model\")\n", "\n", " sequence1 = [0. for i in range(n_steps)]\n", " for iteration in range(len(t) - n_steps):\n", " X_batch = np.array(sequence1[-n_steps:]).reshape(1, n_steps, 1)\n", " y_pred = sess.run(outputs, feed_dict={X: X_batch})\n", " sequence1.append(y_pred[0, -1, 0])\n", "\n", " sequence2 = [time_series(i * resolution + t_min + (t_max-t_min/3)) for i in range(n_steps)]\n", " for iteration in range(len(t) - n_steps):\n", " X_batch = np.array(sequence2[-n_steps:]).reshape(1, n_steps, 1)\n", " y_pred = sess.run(outputs, feed_dict={X: X_batch})\n", " sequence2.append(y_pred[0, -1, 0])\n", "\n", "plt.figure(figsize=(11,4))\n", "plt.subplot(121)\n", "plt.plot(t, sequence1, \"b-\")\n", "plt.plot(t[:n_steps], sequence1[:n_steps], \"b-\", linewidth=3)\n", "plt.xlabel(\"시간\")\n", "plt.ylabel(\"값\", rotation=0)\n", "\n", "plt.subplot(122)\n", "plt.plot(t, sequence2, \"b-\")\n", "plt.plot(t[:n_steps], sequence2[:n_steps], \"b-\", linewidth=3)\n", "plt.xlabel(\"시간\")\n", "save_fig(\"creative_sequence_plot\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 심층 RNN" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## MultiRNNCell" ] }, { "cell_type": "code", "execution_count": 69, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_inputs = 2\n", "n_steps = 5\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])" ] }, { "cell_type": "code", "execution_count": 70, "metadata": {}, "outputs": [], "source": [ "n_neurons = 100\n", "n_layers = 3\n", "\n", "layers = [tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", " for layer in range(n_layers)]\n", "multi_layer_cell = tf.contrib.rnn.MultiRNNCell(layers)\n", "outputs, states = tf.nn.dynamic_rnn(multi_layer_cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 71, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 72, "metadata": {}, "outputs": [], "source": [ "X_batch = np.random.rand(2, n_steps, n_inputs)" ] }, { "cell_type": "code", "execution_count": 73, "metadata": {}, "outputs": [], "source": [ "with tf.Session() as sess:\n", " init.run()\n", " outputs_val, states_val = sess.run([outputs, states], feed_dict={X: X_batch})" ] }, { "cell_type": "code", "execution_count": 74, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2, 5, 100)" ] }, "execution_count": 74, "metadata": {}, "output_type": "execute_result" } ], "source": [ "outputs_val.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 여러 GPU에 심층 RNN 분산하기" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이렇게 사용해서는 **안됩니다**:" ] }, { "cell_type": "code", "execution_count": 75, "metadata": {}, "outputs": [], "source": [ "with tf.device(\"/gpu:0\"): # 이 할당은 무시됩니다\n", " layer1 = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", "\n", "with tf.device(\"/gpu:1\"): # 이 할당은 무시됩니다\n", " layer2 = tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "대신 `DeviceCellWrapper`를 사용합니다:" ] }, { "cell_type": "code", "execution_count": 76, "metadata": {}, "outputs": [], "source": [ "import tensorflow as tf\n", "\n", "class DeviceCellWrapper(tf.contrib.rnn.RNNCell):\n", " def __init__(self, device, cell):\n", " self._cell = cell\n", " self._device = device\n", "\n", " @property\n", " def state_size(self):\n", " return self._cell.state_size\n", "\n", " @property\n", " def output_size(self):\n", " return self._cell.output_size\n", "\n", " def __call__(self, inputs, state, scope=None):\n", " with tf.device(self._device):\n", " return self._cell(inputs, state, scope)" ] }, { "cell_type": "code", "execution_count": 77, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_inputs = 5\n", "n_steps = 20\n", "n_neurons = 100\n", "\n", "X = tf.placeholder(tf.float32, shape=[None, n_steps, n_inputs])" ] }, { "cell_type": "code", "execution_count": 78, "metadata": {}, "outputs": [], "source": [ "devices = [\"/cpu:0\", \"/cpu:0\", \"/cpu:0\"] # 만약 GPU가 세 개 있다면 [\"/gpu:0\", \"/gpu:1\", \"/gpu:2\"]로 바꿉니다\n", "cells = [DeviceCellWrapper(dev,tf.contrib.rnn.BasicRNNCell(num_units=n_neurons))\n", " for dev in devices]\n", "multi_layer_cell = tf.contrib.rnn.MultiRNNCell(cells)\n", "outputs, states = tf.nn.dynamic_rnn(multi_layer_cell, X, dtype=tf.float32)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "또 다른 방법으로 텐서플로 1.1부터 `tf.contrib.rnn.DeviceWrapper` 클래스를 사용할 수 있습니다(텐서플로 1.2부터는 `tf.nn.rnn_cell.DeviceWrapper`가 되었습니다)." ] }, { "cell_type": "code", "execution_count": 79, "metadata": {}, "outputs": [], "source": [ "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 80, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[[-4.64021787e-02 -1.09517150e-01 1.15719385e-01 ... -2.52173021e-02\n", " 1.18367776e-01 2.02370673e-01]\n", " [ 8.25041682e-02 -2.59060234e-01 1.70650616e-01 ... 1.27473488e-01\n", " 2.67642319e-01 5.00118062e-02]\n", " [-4.02192622e-01 -5.05355358e-01 9.59848985e-02 ... 2.13280991e-01\n", " 2.34671727e-01 4.09884870e-01]\n", " ...\n", " [-2.83994913e-01 -7.33134627e-01 3.17925662e-01 ... 3.41021568e-01\n", " 4.12627876e-01 -6.32287338e-02]\n", " [ 2.27203593e-01 -7.05208659e-01 1.00494951e-01 ... -1.41650185e-01\n", " 5.51966906e-01 5.99652976e-02]\n", " [-6.84828730e-03 -5.12680054e-01 -2.85934418e-01 ... -2.31354937e-01\n", " 2.07134634e-01 8.85492340e-02]]\n", "\n", " [[-5.23373596e-02 -8.67693499e-02 8.17485601e-02 ... -1.00591481e-01\n", " 1.27385423e-01 1.19344540e-01]\n", " [ 9.99869704e-02 -1.82395414e-01 2.22274512e-02 ... 1.32247999e-01\n", " 2.45662808e-01 1.98342823e-04]\n", " [-3.53575259e-01 -4.52652365e-01 1.14802383e-01 ... -7.28872195e-02\n", " 1.18325368e-01 2.53719836e-01]\n", " ...\n", " [-5.62218845e-01 -5.45640588e-01 3.24773520e-01 ... 3.96203876e-01\n", " 3.83510798e-01 -4.03708816e-02]\n", " [-4.31864500e-01 -6.10390902e-01 3.47339541e-01 ... 4.27990228e-01\n", " 5.83847225e-01 4.58722472e-01]\n", " [ 6.61748126e-02 -8.10620904e-01 -8.05550814e-02 ... -3.05715531e-01\n", " 2.64899582e-01 -1.17827579e-01]]]\n" ] } ], "source": [ "with tf.Session() as sess:\n", " init.run()\n", " print(sess.run(outputs, feed_dict={X: np.random.rand(2, n_steps, n_inputs)}))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 드롭아웃" ] }, { "cell_type": "code", "execution_count": 81, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "n_inputs = 1\n", "n_neurons = 100\n", "n_layers = 3\n", "n_steps = 20\n", "n_outputs = 1" ] }, { "cell_type": "code", "execution_count": 82, "metadata": {}, "outputs": [], "source": [ "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.float32, [None, n_steps, n_outputs])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "노트: `input_keep_prob` 매개변수는 플레이스홀더로 훈련하는 동안에는 어느 값이나 가능하고 테스트할 때는 1.0으로 지정합니다(드롭아웃을 끕니다)." ] }, { "cell_type": "code", "execution_count": 83, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From /home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/tensorflow/python/ops/rnn_cell_impl.py:1259: calling dropout (from tensorflow.python.ops.nn_ops) with keep_prob is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.\n" ] } ], "source": [ "keep_prob = tf.placeholder_with_default(1.0, shape=())\n", "cells = [tf.contrib.rnn.BasicRNNCell(num_units=n_neurons)\n", " for layer in range(n_layers)]\n", "cells_drop = [tf.contrib.rnn.DropoutWrapper(cell, input_keep_prob=keep_prob)\n", " for cell in cells]\n", "multi_layer_cell = tf.contrib.rnn.MultiRNNCell(cells_drop)\n", "rnn_outputs, states = tf.nn.dynamic_rnn(multi_layer_cell, X, dtype=tf.float32)" ] }, { "cell_type": "code", "execution_count": 84, "metadata": {}, "outputs": [], "source": [ "learning_rate = 0.01\n", "\n", "stacked_rnn_outputs = tf.reshape(rnn_outputs, [-1, n_neurons])\n", "stacked_outputs = tf.layers.dense(stacked_rnn_outputs, n_outputs)\n", "outputs = tf.reshape(stacked_outputs, [-1, n_steps, n_outputs])\n", "\n", "loss = tf.reduce_mean(tf.square(outputs - y))\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "\n", "init = tf.global_variables_initializer()\n", "saver = tf.train.Saver()" ] }, { "cell_type": "code", "execution_count": 85, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 훈련 MSE: 15.835779\n", "100 훈련 MSE: 4.6422505\n", "200 훈련 MSE: 6.8161483\n", "300 훈련 MSE: 4.562946\n", "400 훈련 MSE: 4.1560965\n", "500 훈련 MSE: 3.8629198\n", "600 훈련 MSE: 3.3836648\n", "700 훈련 MSE: 4.2098613\n", "800 훈련 MSE: 4.1579723\n", "900 훈련 MSE: 3.3742094\n", "1000 훈련 MSE: 3.285522\n", "1100 훈련 MSE: 3.7830932\n", "1200 훈련 MSE: 3.2817714\n", "1300 훈련 MSE: 3.1303678\n", "1400 훈련 MSE: 3.8150966\n" ] } ], "source": [ "n_iterations = 1500\n", "batch_size = 50\n", "train_keep_prob = 0.5\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for iteration in range(n_iterations):\n", " X_batch, y_batch = next_batch(batch_size, n_steps)\n", " _, mse = sess.run([training_op, loss],\n", " feed_dict={X: X_batch, y: y_batch,\n", " keep_prob: train_keep_prob})\n", " if iteration % 100 == 0: # not shown in the book\n", " print(iteration, \"훈련 MSE:\", mse) # not shown\n", " \n", " saver.save(sess, \"./my_dropout_time_series_model\")" ] }, { "cell_type": "code", "execution_count": 86, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "INFO:tensorflow:Restoring parameters from ./my_dropout_time_series_model\n" ] } ], "source": [ "with tf.Session() as sess:\n", " saver.restore(sess, \"./my_dropout_time_series_model\")\n", "\n", " X_new = time_series(np.array(t_instance[:-1].reshape(-1, n_steps, n_inputs)))\n", " y_pred = sess.run(outputs, feed_dict={X: X_new})" ] }, { "cell_type": "code", "execution_count": 87, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.title(\"모델 테스트\", fontsize=14)\n", "plt.plot(t_instance[:-1], time_series(t_instance[:-1]), \"bo\", markersize=10, label=\"instance\")\n", "plt.plot(t_instance[1:], time_series(t_instance[1:]), \"w*\", markersize=10, label=\"target\")\n", "plt.plot(t_instance[1:], y_pred[0,:,0], \"r.\", markersize=10, label=\"prediction\")\n", "plt.legend(loc=\"upper left\")\n", "plt.xlabel(\"시간\")\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이런 드롭아웃이 이 경우엔 크게 도움이 안되네요. :/" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# LSTM" ] }, { "cell_type": "code", "execution_count": 88, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :3: BasicLSTMCell.__init__ (from tensorflow.python.ops.rnn_cell_impl) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "This class is equivalent as tf.keras.layers.LSTMCell, and will be replaced by that in Tensorflow 2.0.\n" ] } ], "source": [ "reset_graph()\n", "\n", "lstm_cell = tf.contrib.rnn.BasicLSTMCell(num_units=n_neurons)" ] }, { "cell_type": "code", "execution_count": 89, "metadata": {}, "outputs": [], "source": [ "n_steps = 28\n", "n_inputs = 28\n", "n_neurons = 150\n", "n_outputs = 10\n", "n_layers = 3\n", "\n", "learning_rate = 0.001\n", "\n", "X = tf.placeholder(tf.float32, [None, n_steps, n_inputs])\n", "y = tf.placeholder(tf.int32, [None])\n", "\n", "lstm_cells = [tf.contrib.rnn.BasicLSTMCell(num_units=n_neurons)\n", " for layer in range(n_layers)]\n", "multi_cell = tf.contrib.rnn.MultiRNNCell(lstm_cells)\n", "outputs, states = tf.nn.dynamic_rnn(multi_cell, X, dtype=tf.float32)\n", "top_layer_h_state = states[-1][1]\n", "logits = tf.layers.dense(top_layer_h_state, n_outputs, name=\"softmax\")\n", "xentropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=logits)\n", "loss = tf.reduce_mean(xentropy, name=\"loss\")\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "correct = tf.nn.in_top_k(logits, y, 1)\n", "accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))\n", " \n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "code", "execution_count": 90, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(LSTMStateTuple(c=, h=),\n", " LSTMStateTuple(c=, h=),\n", " LSTMStateTuple(c=, h=))" ] }, "execution_count": 90, "metadata": {}, "output_type": "execute_result" } ], "source": [ "states" ] }, { "cell_type": "code", "execution_count": 91, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 91, "metadata": {}, "output_type": "execute_result" } ], "source": [ "top_layer_h_state" ] }, { "cell_type": "code", "execution_count": 92, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "에포크 0 배치 데이터 정확도 = 0.97333336 검증 세트 정확도 = 0.962\n", "에포크 1 배치 데이터 정확도 = 0.94666666 검증 세트 정확도 = 0.9792\n", "에포크 2 배치 데이터 정확도 = 0.96666664 검증 세트 정확도 = 0.97\n", "에포크 3 배치 데이터 정확도 = 0.99333334 검증 세트 정확도 = 0.9838\n", "에포크 4 배치 데이터 정확도 = 0.98 검증 세트 정확도 = 0.9876\n", "에포크 5 배치 데이터 정확도 = 0.99333334 검증 세트 정확도 = 0.9862\n", "에포크 6 배치 데이터 정확도 = 1.0 검증 세트 정확도 = 0.9876\n", "에포크 7 배치 데이터 정확도 = 0.99333334 검증 세트 정확도 = 0.9872\n", "에포크 8 배치 데이터 정확도 = 1.0 검증 세트 정확도 = 0.989\n", "에포크 9 배치 데이터 정확도 = 0.99333334 검증 세트 정확도 = 0.9892\n", "테스트 세트 정확도 = 0.9871\n" ] } ], "source": [ "n_epochs = 10\n", "batch_size = 150\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for epoch in range(n_epochs):\n", " for X_batch, y_batch in shuffle_batch(X_train, y_train, batch_size):\n", " X_batch = X_batch.reshape((-1, n_steps, n_inputs))\n", " sess.run(training_op, feed_dict={X: X_batch, y: y_batch})\n", " acc_batch = accuracy.eval(feed_dict={X: X_batch, y: y_batch})\n", " acc_valid = accuracy.eval(feed_dict={X: X_valid, y: y_valid})\n", " print(\"에포크\", epoch, \"배치 데이터 정확도 =\", acc_batch, \"검증 세트 정확도 =\", acc_valid)\n", " \n", " acc_test = accuracy.eval(feed_dict={X: X_test, y: y_test})\n", " print(\"테스트 세트 정확도 =\", acc_test)" ] }, { "cell_type": "code", "execution_count": 93, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :1: LSTMCell.__init__ (from tensorflow.python.ops.rnn_cell_impl) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "This class is equivalent as tf.keras.layers.LSTMCell, and will be replaced by that in Tensorflow 2.0.\n" ] } ], "source": [ "lstm_cell = tf.contrib.rnn.LSTMCell(num_units=n_neurons, use_peepholes=True)" ] }, { "cell_type": "code", "execution_count": 94, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "WARNING:tensorflow:From :1: GRUCell.__init__ (from tensorflow.python.ops.rnn_cell_impl) is deprecated and will be removed in a future version.\n", "Instructions for updating:\n", "This class is equivalent as tf.keras.layers.GRUCell, and will be replaced by that in Tensorflow 2.0.\n" ] } ], "source": [ "gru_cell = tf.contrib.rnn.GRUCell(num_units=n_neurons)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 임베딩" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 섹션은 텐서플로의 [Word2Vec 튜토리얼](https://www.tensorflow.org/versions/r0.11/tutorials/word2vec/index.html)을 기반으로 합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 데이터 추출" ] }, { "cell_type": "code", "execution_count": 95, "metadata": {}, "outputs": [], "source": [ "from six.moves import urllib\n", "\n", "import errno\n", "import os\n", "import zipfile\n", "\n", "WORDS_PATH = \"datasets/words\"\n", "WORDS_URL = 'http://mattmahoney.net/dc/text8.zip'\n", "\n", "def mkdir_p(path):\n", " \"\"\"디렉토리 생성, 이미 있다면 그냥 통과\n", " \n", " 이 함수는 파이썬 2 버전을 지원하기 위해서입니다.\n", " 파이썬 3.2 이상이면 다음과 같이 쓸 수 있습니다:\n", " >>> os.makedirs(path, exist_ok=True)\n", " \"\"\"\n", " try:\n", " os.makedirs(path)\n", " except OSError as exc:\n", " if exc.errno == errno.EEXIST and os.path.isdir(path):\n", " pass\n", " else:\n", " raise\n", "\n", "def fetch_words_data(words_url=WORDS_URL, words_path=WORDS_PATH):\n", " os.makedirs(words_path, exist_ok=True)\n", " zip_path = os.path.join(words_path, \"words.zip\")\n", " if not os.path.exists(zip_path):\n", " urllib.request.urlretrieve(words_url, zip_path)\n", " with zipfile.ZipFile(zip_path) as f:\n", " data = f.read(f.namelist()[0])\n", " return data.decode(\"ascii\").split()" ] }, { "cell_type": "code", "execution_count": 96, "metadata": {}, "outputs": [], "source": [ "words = fetch_words_data()" ] }, { "cell_type": "code", "execution_count": 97, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['anarchism', 'originated', 'as', 'a', 'term']" ] }, "execution_count": 97, "metadata": {}, "output_type": "execute_result" } ], "source": [ "words[:5]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 사전 구축" ] }, { "cell_type": "code", "execution_count": 98, "metadata": {}, "outputs": [], "source": [ "from collections import Counter\n", "\n", "vocabulary_size = 50000\n", "\n", "vocabulary = [(\"UNK\", None)] + Counter(words).most_common(vocabulary_size - 1)\n", "vocabulary = np.array([word for word, _ in vocabulary])\n", "dictionary = {word: code for code, word in enumerate(vocabulary)}\n", "data = np.array([dictionary.get(word, 0) for word in words])" ] }, { "cell_type": "code", "execution_count": 99, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "('anarchism originated as a term of abuse first used',\n", " array([5234, 3081, 12, 6, 195, 2, 3134, 46, 59]))" ] }, "execution_count": 99, "metadata": {}, "output_type": "execute_result" } ], "source": [ "\" \".join(words[:9]), data[:9]" ] }, { "cell_type": "code", "execution_count": 100, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "'cycles originated as a term of abuse first used'" ] }, "execution_count": 100, "metadata": {}, "output_type": "execute_result" } ], "source": [ "\" \".join([vocabulary[word_index] for word_index in [5241, 3081, 12, 6, 195, 2, 3134, 46, 59]])" ] }, { "cell_type": "code", "execution_count": 101, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "('culottes', 0)" ] }, "execution_count": 101, "metadata": {}, "output_type": "execute_result" } ], "source": [ "words[24], data[24]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 배치 생성" ] }, { "cell_type": "code", "execution_count": 102, "metadata": {}, "outputs": [], "source": [ "import random\n", "from collections import deque\n", "\n", "def generate_batch(batch_size, num_skips, skip_window):\n", " global data_index\n", " assert batch_size % num_skips == 0\n", " assert num_skips <= 2 * skip_window\n", " batch = np.ndarray(shape=(batch_size), dtype=np.int32)\n", " labels = np.ndarray(shape=(batch_size, 1), dtype=np.int32)\n", " span = 2 * skip_window + 1 # [ skip_window target skip_window ]\n", " buffer = deque(maxlen=span)\n", " for _ in range(span):\n", " buffer.append(data[data_index])\n", " data_index = (data_index + 1) % len(data)\n", " for i in range(batch_size // num_skips):\n", " target = skip_window # buffer 중간에 타깃 레이블을 둡니다\n", " targets_to_avoid = [ skip_window ]\n", " for j in range(num_skips):\n", " while target in targets_to_avoid:\n", " target = random.randint(0, span - 1)\n", " targets_to_avoid.append(target)\n", " batch[i * num_skips + j] = buffer[skip_window]\n", " labels[i * num_skips + j, 0] = buffer[target]\n", " buffer.append(data[data_index])\n", " data_index = (data_index + 1) % len(data)\n", " return batch, labels" ] }, { "cell_type": "code", "execution_count": 103, "metadata": {}, "outputs": [], "source": [ "data_index=0\n", "batch, labels = generate_batch(8, 2, 1)" ] }, { "cell_type": "code", "execution_count": 104, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([3081, 3081, 12, 12, 6, 6, 195, 195], dtype=int32),\n", " ['originated', 'originated', 'as', 'as', 'a', 'a', 'term', 'term'])" ] }, "execution_count": 104, "metadata": {}, "output_type": "execute_result" } ], "source": [ "batch, [vocabulary[word] for word in batch]" ] }, { "cell_type": "code", "execution_count": 105, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([[5234],\n", " [ 12],\n", " [ 6],\n", " [3081],\n", " [ 195],\n", " [ 12],\n", " [ 6],\n", " [ 2]], dtype=int32),\n", " ['anarchism', 'as', 'a', 'originated', 'term', 'as', 'a', 'of'])" ] }, "execution_count": 105, "metadata": {}, "output_type": "execute_result" } ], "source": [ "labels, [vocabulary[word] for word in labels[:, 0]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 모델 구성" ] }, { "cell_type": "code", "execution_count": 106, "metadata": {}, "outputs": [], "source": [ "batch_size = 128\n", "embedding_size = 128 # 임베딩 벡터 차원\n", "skip_window = 1 # 고려할 왼쪽과 오른쪽 단어의 개수\n", "num_skips = 2 # 레이블을 생성하기 위한 입력의 재사용 횟수\n", "\n", "# 가까운 이웃을 샘플링하기 위해 랜덤한 검증 세트를 만듭니다.\n", "# 검증 샘플은 가장 흔한 단어인 낮은 ID 번호를 가진 것으로 제한합니다.\n", "valid_size = 16 # 유사도를 평가하기 위해 랜덤하게 구성할 단어 세트 크기\n", "valid_window = 100 # 검증 샘플을 전체 샘플의 앞 부분에서만 선택합니다\n", "valid_examples = np.random.choice(valid_window, valid_size, replace=False)\n", "num_sampled = 64 # 부정 샘플링(negative sampling)의 수\n", "\n", "learning_rate = 0.01" ] }, { "cell_type": "code", "execution_count": 107, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "# 입력 데이터\n", "train_labels = tf.placeholder(tf.int32, shape=[batch_size, 1])\n", "valid_dataset = tf.constant(valid_examples, dtype=tf.int32)" ] }, { "cell_type": "code", "execution_count": 108, "metadata": {}, "outputs": [], "source": [ "vocabulary_size = 50000\n", "embedding_size = 150\n", "\n", "# 입력을 위해 임베딩을 조회합니다\n", "init_embeds = tf.random_uniform([vocabulary_size, embedding_size], -1.0, 1.0)\n", "embeddings = tf.Variable(init_embeds)" ] }, { "cell_type": "code", "execution_count": 109, "metadata": {}, "outputs": [], "source": [ "train_inputs = tf.placeholder(tf.int32, shape=[None])\n", "embed = tf.nn.embedding_lookup(embeddings, train_inputs)" ] }, { "cell_type": "code", "execution_count": 110, "metadata": {}, "outputs": [], "source": [ "# NCE 손실을 위한 변수를 만듭니다\n", "nce_weights = tf.Variable(\n", " tf.truncated_normal([vocabulary_size, embedding_size],\n", " stddev=1.0 / np.sqrt(embedding_size)))\n", "nce_biases = tf.Variable(tf.zeros([vocabulary_size]))\n", "\n", "# 배치에서 NCE 손실의 평균을 계산합니다.Compute the average NCE loss for the batch.\n", "# tf.nce_loss는 자동으로 손실을 평가할 때마다 음성 레이블에서 새로운 샘플을 뽑습니다.\n", "loss = tf.reduce_mean(\n", " tf.nn.nce_loss(nce_weights, nce_biases, train_labels, embed,\n", " num_sampled, vocabulary_size))\n", "\n", "# Adam 옵티마이저\n", "optimizer = tf.train.AdamOptimizer(learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "\n", "# 미니배치 샘플과 모든 임베딩 사이의 코사인 유사도를 계산합니다\n", "norm = tf.sqrt(tf.reduce_sum(tf.square(embeddings), axis=1, keepdims=True))\n", "normalized_embeddings = embeddings / norm\n", "valid_embeddings = tf.nn.embedding_lookup(normalized_embeddings, valid_dataset)\n", "similarity = tf.matmul(valid_embeddings, normalized_embeddings, transpose_b=True)\n", "\n", "# 초기화를 위한 연산\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 모델 훈련" ] }, { "cell_type": "code", "execution_count": 111, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "반복: 0\t스텝 0 에서의 평균 손실: 289.90948486328125\n", "would에 가장 가까운 단어: viewpoint, lured, rossini, vara, teflon, glaciation, losing, eurasia,\n", "on에 가장 가까운 단어: thatched, falsely, wi, vinegar, euskal, consequentialist, baroness, tallinn,\n", "four에 가장 가까운 단어: hom, rez, siege, translators, khalil, pegged, hellene, ynys,\n", "his에 가장 가까운 단어: pointers, ponty, charged, achieved, rk, blooming, value, juggernaut,\n", "often에 가장 가까운 단어: presses, convenience, arabidopsis, jewry, mapuche, guts, macrinus, implemented,\n", "in에 가장 가까운 단어: furnishing, qi, renderer, tuning, mckenna, illustrate, advances, parser,\n", "an에 가장 가까운 단어: gutierrez, dyess, privations, archaeological, bijection, kon, joh, insemination,\n", "eight에 가장 가까운 단어: malacca, liquidation, davidic, comical, ochre, wild, redman, unconditional,\n", "these에 가장 가까운 단어: pedro, condoned, neck, ssn, supervising, doug, thereto, melton,\n", "nine에 가장 가까운 단어: cocker, struck, dame, tensile, unifies, operetta, develop, opinions,\n", "called에 가장 가까운 단어: paradoxes, wings, krantz, consults, weblogs, supergirl, constitutionally, zoologists,\n", "about에 가장 가까운 단어: heavyweight, cisco, fatou, triphosphate, predecessors, abkhazia, swordsmanship, wexford,\n", "up에 가장 가까운 단어: clair, drives, steadfast, missed, nashville, kilowatts, anal, vinland,\n", "one에 가장 가까운 단어: imagines, tijuana, hindrance, motorcyclist, steadfastly, lords, letting, hutchinson,\n", "and에 가장 가까운 단어: pierre, savannah, fridays, laminated, reestablish, counters, asymmetric, unchecked,\n", "been에 가장 가까운 단어: powerpc, maccabean, precarious, hounds, gol, linear, hazael, schuster,\n", "반복: 2000\t스텝 2000 에서의 평균 손실: 132.04802500534058\n", "반복: 4000\t스텝 4000 에서의 평균 손실: 62.34032018876076\n", "반복: 6000\t스텝 6000 에서의 평균 손실: 41.11393726539612\n", "반복: 8000\t스텝 8000 에서의 평균 손실: 31.31713050496578\n", "반복: 10000\t스텝 10000 에서의 평균 손실: 25.686955342292787\n", "would에 가장 가까운 단어: can, tarski, unprotected, morpork, afc, hashes, cannot, mileva,\n", "on에 가장 가까운 단어: shrewsbury, in, hearing, actinium, ufos, doubleday, of, mosque,\n", "four에 가장 가까운 단어: nine, five, one, three, zero, two, eight, six,\n", "his에 가장 가까운 단어: the, nen, abscess, modeling, adobe, and, adherence, nhk,\n", "often에 가장 가까운 단어: ampere, baudot, scythian, are, and, canaris, it, breastfeeding,\n", "in에 가장 가까운 단어: of, and, altaic, romanus, buchan, nine, UNK, the,\n", "an에 가장 가까운 단어: a, is, this, beers, which, threw, achill, parsley,\n", "eight에 가장 가까운 단어: nine, zero, four, five, one, six, seven, two,\n", "these에 가장 가까운 단어: displaced, snowball, tuned, antigua, seceded, fallacy, or, kournikova,\n", "nine에 가장 가까운 단어: four, one, eight, six, zero, seven, two, three,\n", "called에 가장 가까운 단어: and, are, ampere, or, specifying, rhazes, gide, dissociation,\n", "about에 가장 가까운 단어: blankets, limiting, chung, argonauts, and, webster, in, ball,\n", "up에 가장 가까운 단어: integrity, a, flow, laughton, peake, rn, bodyguard, natively,\n", "one에 가장 가까운 단어: nine, four, five, three, two, seven, six, UNK,\n", "and에 가장 가까운 단어: of, in, the, which, as, or, ufos, UNK,\n", "been에 가장 가까운 단어: have, stopped, has, jealousy, essendon, nationally, had, a,\n" ] } ], "source": [ "num_steps = 10001\n", "\n", "with tf.Session() as session:\n", " init.run()\n", "\n", " average_loss = 0\n", " for step in range(num_steps):\n", " print(\"\\r반복: {}\".format(step), end=\"\\t\")\n", " batch_inputs, batch_labels = generate_batch(batch_size, num_skips, skip_window)\n", " feed_dict = {train_inputs : batch_inputs, train_labels : batch_labels}\n", "\n", " # 훈련 연산을 평가하여 스텝을 한 단계를 업데이트합니다(session.run()에서 반환된 값을 사용합니다)\n", " _, loss_val = session.run([training_op, loss], feed_dict=feed_dict)\n", " average_loss += loss_val\n", "\n", " if step % 2000 == 0:\n", " if step > 0:\n", " average_loss /= 2000\n", " # 평균 손실은 2000개 배치에 대한 손실의 추정입니다.\n", " print(\"스텝 \", step, \"에서의 평균 손실: \", average_loss)\n", " average_loss = 0\n", "\n", " # 이 코드는 비용이 많이 듭니다 (500 스텝마다 ~20%씩 느려집니다)\n", " if step % 10000 == 0:\n", " sim = similarity.eval()\n", " for i in range(valid_size):\n", " valid_word = vocabulary[valid_examples[i]]\n", " top_k = 8 # 가장 가까운 단어의 개수\n", " nearest = (-sim[i, :]).argsort()[1:top_k+1]\n", " log_str = \"%s에 가장 가까운 단어:\" % valid_word\n", " for k in range(top_k):\n", " close_word = vocabulary[nearest[k]]\n", " log_str = \"%s %s,\" % (log_str, close_word)\n", " print(log_str)\n", "\n", " final_embeddings = normalized_embeddings.eval()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "마지막 임베딩을 저장합니다(물론 텐서플로의 `Saver`를 사용해도 됩니다):" ] }, { "cell_type": "code", "execution_count": 112, "metadata": {}, "outputs": [], "source": [ "np.save(\"./my_final_embeddings.npy\", final_embeddings)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 임베딩 그래프" ] }, { "cell_type": "code", "execution_count": 113, "metadata": {}, "outputs": [], "source": [ "def plot_with_labels(low_dim_embs, labels):\n", " assert low_dim_embs.shape[0] >= len(labels), \"임베딩보다 레이블이 많습니다.\"\n", " plt.figure(figsize=(18, 18)) # 인치 크기\n", " for i, label in enumerate(labels):\n", " x, y = low_dim_embs[i,:]\n", " plt.scatter(x, y)\n", " plt.annotate(label,\n", " xy=(x, y),\n", " xytext=(5, 2),\n", " textcoords='offset points',\n", " ha='right',\n", " va='bottom')" ] }, { "cell_type": "code", "execution_count": 114, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "from sklearn.manifold import TSNE\n", "\n", "tsne = TSNE(perplexity=30, n_components=2, init='pca', n_iter=5000)\n", "plot_only = 500\n", "low_dim_embs = tsne.fit_transform(final_embeddings[:plot_only,:])\n", "labels = [vocabulary[i] for i in range(plot_only)]\n", "plot_with_labels(low_dim_embs, labels)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 기계 번역" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`basic_rnn_seq2seq()` 함수는 간단한 인코더/디코더 모델을 만듭니다. 먼저 `encoder_inputs`를 상태 벡터로 인코딩하는 RNN을 실행하고 그다음 `decoder_inputs`을 마지막 인코더 상태로 초기화시킨 디코더를 실행합니다. 인코더와 디코더는 같은 RNN 셀 타입을 사용하지만 파라미터를 공유하지는 않습니다." ] }, { "cell_type": "code", "execution_count": 115, "metadata": {}, "outputs": [], "source": [ "import tensorflow as tf\n", "reset_graph()\n", "\n", "n_steps = 50\n", "n_neurons = 200\n", "n_layers = 3\n", "num_encoder_symbols = 20000\n", "num_decoder_symbols = 20000\n", "embedding_size = 150\n", "learning_rate = 0.01\n", "\n", "X = tf.placeholder(tf.int32, [None, n_steps]) # 영어 문장\n", "Y = tf.placeholder(tf.int32, [None, n_steps]) # 프랑스어 번역\n", "W = tf.placeholder(tf.float32, [None, n_steps - 1, 1])\n", "Y_input = Y[:, :-1]\n", "Y_target = Y[:, 1:]\n", "\n", "encoder_inputs = tf.unstack(tf.transpose(X)) # 1D 텐서의 리스트\n", "decoder_inputs = tf.unstack(tf.transpose(Y_input)) # 1D 텐서의 리스트\n", "\n", "lstm_cells = [tf.contrib.rnn.BasicLSTMCell(num_units=n_neurons)\n", " for layer in range(n_layers)]\n", "cell = tf.contrib.rnn.MultiRNNCell(lstm_cells)\n", "\n", "output_seqs, states = tf.contrib.legacy_seq2seq.embedding_rnn_seq2seq(\n", " encoder_inputs,\n", " decoder_inputs,\n", " cell,\n", " num_encoder_symbols,\n", " num_decoder_symbols,\n", " embedding_size)\n", "\n", "logits = tf.transpose(tf.unstack(output_seqs), perm=[1, 0, 2])" ] }, { "cell_type": "code", "execution_count": 116, "metadata": {}, "outputs": [], "source": [ "logits_flat = tf.reshape(logits, [-1, num_decoder_symbols])\n", "Y_target_flat = tf.reshape(Y_target, [-1])\n", "W_flat = tf.reshape(W, [-1])\n", "xentropy = W_flat * tf.nn.sparse_softmax_cross_entropy_with_logits(labels=Y_target_flat, logits=logits_flat)\n", "loss = tf.reduce_mean(xentropy)\n", "optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)\n", "training_op = optimizer.minimize(loss)\n", "\n", "init = tf.global_variables_initializer()" ] }, { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "# 연습문제 해답" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 1. to 6." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "부록 A 참조." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 7. 임베딩된 레버(Reber) 문법" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "먼저 문법에 맞는 문자열을 생성하는 함수가 필요합니다. 이 문법은 각 상태에서 가능한 전이 상태의 리스트입니다. 하나의 전이는 출력할 문자열(또는 생성할 문법)과 다음 상태를 지정합니다." ] }, { "cell_type": "code", "execution_count": 117, "metadata": {}, "outputs": [], "source": [ "from random import choice, seed\n", "\n", "# 일관된 출력을 위한 유사난수 초기화\n", "seed(42)\n", "np.random.seed(42)\n", "\n", "default_reber_grammar = [\n", " [(\"B\", 1)], # (상태 0) =B=>(상태 1)\n", " [(\"T\", 2), (\"P\", 3)], # (상태 1) =T=>(상태 2) or =P=>(상태 3)\n", " [(\"S\", 2), (\"X\", 4)], # (상태 2) =S=>(상태 2) or =X=>(상태 4)\n", " [(\"T\", 3), (\"V\", 5)], # 등등..\n", " [(\"X\", 3), (\"S\", 6)],\n", " [(\"P\", 4), (\"V\", 6)],\n", " [(\"E\", None)]] # (상태 6) =E=>(종료 상태)\n", "\n", "embedded_reber_grammar = [\n", " [(\"B\", 1)],\n", " [(\"T\", 2), (\"P\", 3)],\n", " [(default_reber_grammar, 4)],\n", " [(default_reber_grammar, 5)],\n", " [(\"T\", 6)],\n", " [(\"P\", 6)],\n", " [(\"E\", None)]]\n", "\n", "def generate_string(grammar):\n", " state = 0\n", " output = []\n", " while state is not None:\n", " production, state = choice(grammar[state])\n", " if isinstance(production, list):\n", " production = generate_string(grammar=production)\n", " output.append(production)\n", " return \"\".join(output)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "기본 레버 문법에 맞는 문자열을 몇 개 만들어 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 118, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "BTXXTTTTVPXTTTTTVPSE BTXSE BTXXTVPSE BTXXVPSE BTSSXXTTVVE BTXSE BTSSSXSE BPTTTVVE BTXXVVE BPTTVVE BTSXXTTTTVPSE BPTTVVE BPTVPSE BPTTVPXVVE BPVPXTTTVPXTVPSE BTXSE BPTTTTVPXTTTTTTTVPXVVE BPTVVE BTXSE BPTTTVVE BTSXXVPSE BTXXTTTTTVVE BPTTVPSE BPVVE BPTTTVPXVPXTTTTTVPXTTVVE " ] } ], "source": [ "for _ in range(25):\n", " print(generate_string(default_reber_grammar), end=\" \")" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "좋습니다. 이제 임베딩된 레버 문법에 맞는 문자열을 몇 개 만들어 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 119, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "BPBPTVVEPE BTBPTVPXVVETE BPBPTTTVVEPE BPBTXSEPE BPBPTTTTTVPSEPE BTBTSXSETE BPBPVPSEPE BPBPVVEPE BPBTXSEPE BPBTSXSEPE BTBPTTVVETE BPBPVVEPE BTBTXSETE BPBPTTVVEPE BTBTSXXVVETE BTBTXXTVPXTVPSETE BTBPTVVETE BPBPVPXTTVPXTVVEPE BTBTXSETE BPBTXSEPE BPBTSXXTVPSEPE BPBPVVEPE BPBPTTTTTTTTTTVPXVVEPE BPBPVVEPE BPBPVVEPE " ] } ], "source": [ "for _ in range(25):\n", " print(generate_string(embedded_reber_grammar), end=\" \")" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "좋네요, 이제 이 문법을 따르지 않는 문자열을 생성할 함수를 만듭니다. 무작위하게 문자열을 만들 수 있지만 그렇게 하면 너무 문제가 쉬워지므로 대신 문법을 따르는 문자열을 만든 후 하나의 문자만 바꾸어 놓도록 하겠습니다:" ] }, { "cell_type": "code", "execution_count": 120, "metadata": {}, "outputs": [], "source": [ "def generate_corrupted_string(grammar, chars=\"BEPSTVX\"):\n", " good_string = generate_string(grammar)\n", " index = np.random.randint(len(good_string))\n", " good_char = good_string[index]\n", " bad_char = choice(list(set(chars) - set(good_char)))\n", " return good_string[:index] + bad_char + good_string[index + 1:]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "잘못된 문자열 몇 개를 만들어 보죠:" ] }, { "cell_type": "code", "execution_count": 121, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "BPBPVPEEPE BPBVXSEPE BPBPTVVPPE BTBPSPSETE BTBPVVTTE BPBTSSXXTVTVVEPE BPVTSXXTVPSEPE BPBTXSVPE BTBPTTTVPSPTE BPBTSXXTTTXTTVVEPE BPBBXXVPXTVPXTTVVEPE BPBPTTVXEPE BPBPVVESE BPEPTTVVEPE BPBPVSSEPE BPBTBXXVVEPE BEBPTTTVPXVVETE BPBTSSXVEPE BPBPVXEPE BVBTXSEPE BTBPTVPXVPXVVETT SPBTSXXTVPXVPSEPE BPBTSXXTTTVBSEPE BPBPVPXVVVPE BTBTSBSETE " ] } ], "source": [ "for _ in range(25):\n", " print(generate_corrupted_string(embedded_reber_grammar), end=\" \")" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "문자열을 바로 RNN에 주입할 수는 없습니다. 먼저 벡터의 연속으로 바꾸어야 합니다. 각 벡터는 원-핫 인코딩을 사용하여 하나의 문자를 나타냅니다. 예를 들어, 벡터 `[1, 0, 0, 0, 0, 0, 0]`는 문자 \"B\"를 나타내고 벡터 `[0, 1, 0, 0, 0, 0, 0]`는 문자 \"E\"를 나타내는 식입니다. 이런 원-핫 벡터의 연속으로 문자열을 바꾸는 함수를 작성해 보겠습니다. 문자열이 `n_steps`보다 짧으면 0 벡터로 패딩됩니다(나중에, 텐서플로에게 각 문자열의 실제 길이를 `sequence_length` 매개변수로 전달할 것입니다)." ] }, { "cell_type": "code", "execution_count": 122, "metadata": {}, "outputs": [], "source": [ "def string_to_one_hot_vectors(string, n_steps, chars=\"BEPSTVX\"):\n", " char_to_index = {char: index for index, char in enumerate(chars)}\n", " output = np.zeros((n_steps, len(chars)), dtype=np.int32)\n", " for index, char in enumerate(string):\n", " output[index, char_to_index[char]] = 1.\n", " return output" ] }, { "cell_type": "code", "execution_count": 123, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [1, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 1],\n", " [0, 0, 0, 1, 0, 0, 0],\n", " [0, 1, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [0, 1, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0]], dtype=int32)" ] }, "execution_count": 123, "metadata": {}, "output_type": "execute_result" } ], "source": [ "string_to_one_hot_vectors(\"BTBTXSETE\", 12)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이제 50%는 올바른 문자열 50%는 잘못된 문자열로 이루어진 데이터셋을 만듭니다:" ] }, { "cell_type": "code", "execution_count": 124, "metadata": {}, "outputs": [], "source": [ "def generate_dataset(size):\n", " good_strings = [generate_string(embedded_reber_grammar)\n", " for _ in range(size // 2)]\n", " bad_strings = [generate_corrupted_string(embedded_reber_grammar)\n", " for _ in range(size - size // 2)]\n", " all_strings = good_strings + bad_strings\n", " n_steps = max([len(string) for string in all_strings])\n", " X = np.array([string_to_one_hot_vectors(string, n_steps)\n", " for string in all_strings])\n", " seq_length = np.array([len(string) for string in all_strings])\n", " y = np.array([[1] for _ in range(len(good_strings))] +\n", " [[0] for _ in range(len(bad_strings))])\n", " rnd_idx = np.random.permutation(size)\n", " return X[rnd_idx], seq_length[rnd_idx], y[rnd_idx]" ] }, { "cell_type": "code", "execution_count": 125, "metadata": {}, "outputs": [], "source": [ "X_train, l_train, y_train = generate_dataset(10000)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "첫 번째 훈련 샘플을 확인해 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 126, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [1, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 1, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [0, 0, 0, 0, 0, 1, 0],\n", " [0, 0, 1, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 1],\n", " [0, 0, 0, 0, 0, 1, 0],\n", " [0, 0, 1, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 1],\n", " [0, 0, 0, 0, 0, 1, 0],\n", " [0, 0, 1, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 1],\n", " [0, 1, 0, 0, 0, 0, 0],\n", " [0, 0, 1, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 1],\n", " [0, 0, 0, 0, 0, 1, 0],\n", " [0, 0, 0, 0, 0, 1, 0],\n", " [0, 1, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 1, 0, 0],\n", " [0, 1, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0],\n", " [0, 0, 0, 0, 0, 0, 0]], dtype=int32)" ] }, "execution_count": 126, "metadata": {}, "output_type": "execute_result" } ], "source": [ "X_train[0]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "데이터셋에서 가장 긴 문자열 때문에 패딩된 0 벡터가 많습니다. 문자열 길이가 얼마나 될까요?" ] }, { "cell_type": "code", "execution_count": 127, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "23" ] }, "execution_count": 127, "metadata": {}, "output_type": "execute_result" } ], "source": [ "l_train[0]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "타깃 클래스는?" ] }, { "cell_type": "code", "execution_count": 128, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([0])" ] }, "execution_count": 128, "metadata": {}, "output_type": "execute_result" } ], "source": [ "y_train[0]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "아주 좋습니다! 올바른 문자열을 구분할 RNN을 만들 준비가 되었습니다. 앞서 MNIST 이미지를 분류하기 위해 만든 것과 매우 비슷한 시퀀스 분류기를 만듭니다. 차이점은 다음 두 가지입니다:\n", "* 첫째, 입력 문자열이 가변 길이이므로 `dynamic_rnn()` 함수를 호출할 때 `sequence_length`를 지정해야 합니다.\n", "* 둘째, 이진 분류기이므로 출력 뉴런은 하나만 필요합니다. 이 뉴런은 각 문자열에 대해 올바른 문자열일 추정 로그 확률을 출력할 것입니다. 다중 클래스 분류에서는 `sparse_softmax_cross_entropy_with_logits()`를 사용했지만 이진 분류에서는 `sigmoid_cross_entropy_with_logits()`를 사용합니다." ] }, { "cell_type": "code", "execution_count": 129, "metadata": {}, "outputs": [], "source": [ "reset_graph()\n", "\n", "possible_chars = \"BEPSTVX\"\n", "n_inputs = len(possible_chars)\n", "n_neurons = 30\n", "n_outputs = 1\n", "\n", "learning_rate = 0.02\n", "momentum = 0.95\n", "\n", "X = tf.placeholder(tf.float32, [None, None, n_inputs], name=\"X\")\n", "seq_length = tf.placeholder(tf.int32, [None], name=\"seq_length\")\n", "y = tf.placeholder(tf.float32, [None, 1], name=\"y\")\n", "\n", "gru_cell = tf.contrib.rnn.GRUCell(num_units=n_neurons)\n", "outputs, states = tf.nn.dynamic_rnn(gru_cell, X, dtype=tf.float32,\n", " sequence_length=seq_length)\n", "\n", "logits = tf.layers.dense(states, n_outputs, name=\"logits\")\n", "y_pred = tf.cast(tf.greater(logits, 0.), tf.float32, name=\"y_pred\")\n", "y_proba = tf.nn.sigmoid(logits, name=\"y_proba\")\n", "\n", "xentropy = tf.nn.sigmoid_cross_entropy_with_logits(labels=y, logits=logits)\n", "loss = tf.reduce_mean(xentropy, name=\"loss\")\n", "optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate,\n", " momentum=momentum,\n", " use_nesterov=True)\n", "training_op = optimizer.minimize(loss)\n", "\n", "correct = tf.equal(y_pred, y, name=\"correct\")\n", "accuracy = tf.reduce_mean(tf.cast(correct, tf.float32), name=\"accuracy\")\n", "\n", "init = tf.global_variables_initializer()\n", "saver = tf.train.Saver()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "훈련하는 동안 진척 상황을 확인할 수 있도록 검증 세트를 만듭니다:" ] }, { "cell_type": "code", "execution_count": 130, "metadata": {}, "outputs": [], "source": [ "X_val, l_val, y_val = generate_dataset(5000)" ] }, { "cell_type": "code", "execution_count": 131, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ " 0 훈련 손실: 0.6884, 정확도: 54.00% 검증 세트 정확도: 59.40%\n", " 1 훈련 손실: 0.6599, 정확도: 58.00% 검증 세트 정확도: 63.64%\n", " 2 훈련 손실: 0.6004, 정확도: 74.00% 검증 세트 정확도: 68.62%\n", " 3 훈련 손실: 0.6283, 정확도: 60.00% 검증 세트 정확도: 65.70%\n", " 4 훈련 손실: 0.4015, 정확도: 88.00% 검증 세트 정확도: 80.82%\n", " 5 훈련 손실: 0.3289, 정확도: 86.00% 검증 세트 정확도: 85.18%\n", " 6 훈련 손실: 0.2138, 정확도: 92.00% 검증 세트 정확도: 87.38%\n", " 7 훈련 손실: 2.9554, 정확도: 90.00% 검증 세트 정확도: 82.60%\n", " 8 훈련 손실: 0.0486, 정확도: 98.00% 검증 세트 정확도: 98.00%\n", " 9 훈련 손실: 0.0348, 정확도: 100.00% 검증 세트 정확도: 97.18%\n", " 10 훈련 손실: 0.0106, 정확도: 100.00% 검증 세트 정확도: 98.64%\n", " 11 훈련 손실: 0.0096, 정확도: 100.00% 검증 세트 정확도: 99.14%\n", " 12 훈련 손실: 0.0023, 정확도: 100.00% 검증 세트 정확도: 99.92%\n", " 13 훈련 손실: 0.0011, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 14 훈련 손실: 0.0008, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 15 훈련 손실: 0.0006, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 16 훈련 손실: 0.0005, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 17 훈련 손실: 0.0004, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 18 훈련 손실: 0.0003, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 19 훈련 손실: 0.0003, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 20 훈련 손실: 0.0003, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 21 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 22 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 23 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 24 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 25 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 26 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 27 훈련 손실: 0.0002, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 28 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 29 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 30 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 31 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 32 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 33 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 34 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 35 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 36 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 37 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 38 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 39 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 40 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 41 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 42 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 43 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 44 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 45 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 46 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 47 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 48 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n", " 49 훈련 손실: 0.0001, 정확도: 100.00% 검증 세트 정확도: 99.98%\n" ] } ], "source": [ "n_epochs = 50\n", "batch_size = 50\n", "\n", "with tf.Session() as sess:\n", " init.run()\n", " for epoch in range(n_epochs):\n", " X_batches = np.array_split(X_train, len(X_train) // batch_size)\n", " l_batches = np.array_split(l_train, len(l_train) // batch_size)\n", " y_batches = np.array_split(y_train, len(y_train) // batch_size)\n", " for X_batch, l_batch, y_batch in zip(X_batches, l_batches, y_batches):\n", " loss_val, _ = sess.run(\n", " [loss, training_op],\n", " feed_dict={X: X_batch, seq_length: l_batch, y: y_batch})\n", " acc_train = accuracy.eval(feed_dict={X: X_batch, seq_length: l_batch, y: y_batch})\n", " acc_val = accuracy.eval(feed_dict={X: X_val, seq_length: l_val, y: y_val})\n", " print(\"{:4d} 훈련 손실: {:.4f}, 정확도: {:.2f}% 검증 세트 정확도: {:.2f}%\".format(\n", " epoch, loss_val, 100 * acc_train, 100 * acc_val))\n", " saver.save(sess, \"./my_reber_classifier\")" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이제 두 개의 문자열에 이 RNN을 테스트해 보죠. 첫 번째는 잘못된 것이고 두 번째는 올바른 것입니다. 이 문자열은 마지막에서 두 번째 글자만 다릅니다. RNN이 이를 맞춘다면 두 번째 문자가 항상 끝에서 두 번째 문자와 같아야 한다는 패턴을 알게 됐다는 것을 의미합니다. 이렇게 하려면 꽤 긴 단기 기억(long short-term memory)이 필요합니다(그래서 GRU 셀을 사용했습니다)." ] }, { "cell_type": "code", "execution_count": 132, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "INFO:tensorflow:Restoring parameters from ./my_reber_classifier\n", "\n", "레버 문자열일 추정 확률:\n", "BPBTSSSSSSSSSSSSXXTTTTTVPXTTVPXTTTTTTTVPXVPXVPXTTTVVETE: 17.99%\n", "BPBTSSSSSSSSSSSSXXTTTTTVPXTTVPXTTTTTTTVPXVPXVPXTTTVVEPE: 99.90%\n" ] } ], "source": [ "test_strings = [\n", " \"BPBTSSSSSSSSSSSSXXTTTTTVPXTTVPXTTTTTTTVPXVPXVPXTTTVVETE\",\n", " \"BPBTSSSSSSSSSSSSXXTTTTTVPXTTVPXTTTTTTTVPXVPXVPXTTTVVEPE\"]\n", "l_test = np.array([len(s) for s in test_strings])\n", "max_length = l_test.max()\n", "X_test = [string_to_one_hot_vectors(s, n_steps=max_length)\n", " for s in test_strings]\n", "\n", "with tf.Session() as sess:\n", " saver.restore(sess, \"./my_reber_classifier\")\n", " y_proba_val = y_proba.eval(feed_dict={X: X_test, seq_length: l_test})\n", "\n", "print()\n", "print(\"레버 문자열일 추정 확률:\")\n", "for index, string in enumerate(test_strings):\n", " print(\"{}: {:.2f}%\".format(string, 100 * y_proba_val[index][0]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "쨘! 잘 작동하네요. 이 RNN이 완벽한 신뢰도로 정확한 답을 냈습니다. :)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 8. 과 9." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Coming soon..." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.8" }, "nav_menu": {}, "toc": { "navigate_menu": true, "number_sections": true, "sideBar": true, "threshold": 6, "toc_cell": false, "toc_section_display": "block", "toc_window_display": false } }, "nbformat": 4, "nbformat_minor": 1 }