{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Using TensorFlow backend.\n" ] }, { "data": { "text/plain": [ "'2.2.4'" ] }, "execution_count": 1, "metadata": {}, "output_type": "execute_result" } ], "source": [ "import keras\n", "keras.__version__" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 순환 신경망의 고급 사용법\n", "\n", "이 노트북은 [케라스 창시자에게 배우는 딥러닝](https://tensorflow.blog/케라스-창시자에게-배우는-딥러닝/) 책의 6장 3절의 코드 예제입니다. 책에는 더 많은 내용과 그림이 있습니다. 이 노트북에는 소스 코드에 관련된 설명만 포함합니다. 이 노트북의 설명은 케라스 버전 2.2.2에 맞추어져 있습니다. 케라스 최신 버전이 릴리스되면 노트북을 다시 테스트하기 때문에 설명과 코드의 결과가 조금 다를 수 있습니다.\n", "\n", "---\n", "\n", "이 절에서는 순환 신경망의 성능과 일반화 능력을 향상시키기 위한 세 가지의 고급 기술을 살펴보겠습니다. 이 절을 마칠 때면 케라스에서 순환 신경망을 사용하는 대부분의 방법을 알게 될 것입니다. 온도 예측 문제로 세 가지 개념을 모두 시연해 보겠습니다. 이 시계열 데이터는 건물 옥상에 설치된 센서에서 취득한 온도, 기압, 습도 같은 데이터입니다. 이 데이터를 사용하여 마지막 데이터 포인트에서부터 24시간 이후의 온도를 예측하겠습니다. 이 문제는 시계열 데이터에서 일반적으로 나타나는 여러 가지 어려운 점을 가지고 있습니다. 전형적이고 꽤 도전적인 문제입니다.\n", "\n", "다음 기법들을 적용하겠습니다.\n", "\n", "* 순환 드롭아웃 : 순환 층에서 과대적합을 방지하기 위해 케라스에 내장되어 있는 드롭아웃을 사용합니다.\n", "* 순환 층 스태킹 : 네트워크의 표현 능력을 증가시킵니다(대신 계산 비용이 많이 듭니다).\n", "* 양방향 순환 층 : 순환 네트워크에 같은 정보를 다른 방향으로 주입하여 정확도를 높이고 기억을 좀 더 오래 유지시킵니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 기온 예측 문제\n", "지금까지 다룬 시퀀스 데이터는 IMDB 데이터셋이나 로이터 데이터셋과 같은 텍스트 데이터입니다. 시퀀스 데이터는 이런 언어 처리 분야뿐만 아니라 훨씬 많은 문제에서 등장합니다. 이 절에 있는 모든 예제는 날씨 시계열 데이터셋을 사용합니다. 이 데이터는 독일 예나 시에 있는 막스 플랑크 생물지구화학 연구소( http://www.bgc-jena.mpg.de/wetter/ )의 지상 관측소에서 수집한 것입니다.\n", "\n", "이 데이터셋에는 수년간에 걸쳐 (기온, 기압, 습도, 풍향 등과 같은) 14개의 관측치가 10분마다 기록되어 있습니다. 원본 데이터는 2003년부터 기록되어 있지만 이 예제에서는 2009~2016년 사이의 데이터만 사용합니다. 이 데이터셋은 시계열 수치 데이터를 다루는 법을 익히는 데 안성맞춤입니다. 최근 데이터(몇 일치 데이터 포인트)를 입력으로 사용해 모델을 만들고 24시간 이후의 기온을 예측하겠습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "데이터를 살펴보죠:" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "['\"Date Time\"', '\"p (mbar)\"', '\"T (degC)\"', '\"Tpot (K)\"', '\"Tdew (degC)\"', '\"rh (%)\"', '\"VPmax (mbar)\"', '\"VPact (mbar)\"', '\"VPdef (mbar)\"', '\"sh (g/kg)\"', '\"H2OC (mmol/mol)\"', '\"rho (g/m**3)\"', '\"wv (m/s)\"', '\"max. wv (m/s)\"', '\"wd (deg)\"']\n", "420551\n" ] } ], "source": [ "import os\n", "\n", "data_dir = './datasets/jena_climate/'\n", "fname = os.path.join(data_dir, 'jena_climate_2009_2016.csv')\n", "\n", "f = open(fname)\n", "data = f.read()\n", "f.close()\n", "\n", "lines = data.split('\\n')\n", "header = lines[0].split(',')\n", "lines = lines[1:]\n", "\n", "print(header)\n", "print(len(lines))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "420,551개 데이터 전체를 넘파이 배열로 바꿉니다:" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "\n", "float_data = np.zeros((len(lines), len(header) - 1))\n", "for i, line in enumerate(lines):\n", " values = [float(x) for x in line.split(',')[1:]]\n", " float_data[i, :] = values" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "예를 들어 다음은 시간에 따른 기온(섭씨) 그래프입니다:" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [], "source": [ "from matplotlib import pyplot as plt" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "temp = float_data[:, 1] # 온도(섭씨)\n", "plt.plot(range(len(temp)), temp)\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 그래프에서 온도에 주기성이 있다는 것을 잘 볼 수 있습니다.\n", "\n", "다음은 기간을 좁혀서 처음 10일간의 온도 데이터를 나타낸 그래프입니다. 10분마다 데이터가 기록되므로 하루에 총 144개의 데이터 포인트가 있습니다:" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXwAAAD8CAYAAAB0IB+mAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4wLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvqOYd8AAAIABJREFUeJztnXecG+W193+P+korbe/e9a7ttY17xxhMNb0TSCC5BAJ5CaQn75sE4pt7Q0u4gRRCCpBAyKUmgZBCiQE7YKqNjcG9t117vb1JWvXn/WNmtCOtumZUz/fz8cfSzEhzPJZ+OnOeUxjnHARBEETho8m2AQRBEERmIMEnCIIoEkjwCYIgigQSfIIgiCKBBJ8gCKJIIMEnCIIoEkjwCYIgigQSfIIgiCKBBJ8gCKJI0GXbADnV1dW8tbU122YQBEHkFZs3b+7jnNfEO051wWeMXQDgQQBaAL/nnN8X7djW1lZs2rRJbZMIgiAKCsbYkUSOUzWkwxjTAvg1gAsBzAJwHWNslprnJAiCICKjdgx/GYD9nPODnHMPgOcAXK7yOQmCIIgIqC34TQA6ZM87xW0EQRBEhlFb8FmEbSH9mBljtzDGNjHGNvX29qpsDkEQRPGituB3AmiWPZ8E4Lj8AM75o5zzJZzzJTU1cReZCYIgiBRRW/A/BNDOGGtjjBkAXAvgHyqfkyAIgoiAqmmZnHMfY+yrANZASMt8nHO+Q81zEgRBEJFRPQ+fc/4KgFfUPg+Rn3xwsB8Wgw5zJ5Vl2xSCKHiotQKhGgd77Wi9/WVc++j7Effv6x7FtY9+gEt/9U6GLSOI4oQEn8B7B/rw1Wc+QiCg3EB7p8eHzzz6AQDgg4MD4Hz8vdfu6sbv3z6Ic3++PrjN4wsodm6CICKTU710iOzw2d9tAADce+VclJXoFXnP772wDb2j7uDz4TEvys0GDDo8uPmPE9tn7OwawYLmckXOTRBEZMjDJ4I4PT5F3sft82Ptrm40lJlw1+WzAQAH+xz486YO3P/anpBjf/bp+dAwYN2ubkXOTRBEdMjDJ4I43MoI/sZDA3B6/HjouoXQawWf4vt/3YbdJ0aDx1wyrwG3njEVc5rK8OKWY3jx42P41rnTwVikWj2CIJSAPHwiiMPtV+R91u3ugVGnwYqp1agvMwEAdp8YRZ3NCAC4YkEjfvXZRZjTJGTmXLmwCR0DY9h0ZFCR8xMEERny8IucDw8PBB8n4+G/va8XJr0WS1srg9s45/jHJ8fxv+8fwent1SgxaNFeWwq9lsHr57jvqnlYMa0KOk2on3HurDoAwDUPv4+nv3gyTp1WDUDI4qm1mfCVpz+C1aTD8ilV+PSSZpQYtACA7ceGMaXGArOBPsYEkQj0TSlyrnl4PGXSnqDgu7x+XP/YRgDA4fsuDm5/ccsxfPvPnwAAPn9KKwCAMYbHbliKnV0jOH16DbSaiSEbq0mPhS3l2HJ0CJ/7/QbcesZUWE063L8mNN7/6vYT+O9/7MCTNy/DoNOLrz+7BWfOqMETX1iW1L+ZIIoVEvwixuUNDeE4PYmFdN7c0zNhmz/Acec/dwIAHr1+Mc6aWRvcd/r0Gpw+PXafpGf/z3Ks292Du1/aiYffOhDcvnhyBdprS+H1c9hKdPjDu4eDPzaCLb346OggFrVUgHOOAEfEHxWCIEjwi5ohpzfkeaIe/vsH+oOPXV4/dBqGR9YfxPCYF6tOqsN5s+uTtsWk1+KiuQ04e2YtLnnoHezvseOpm0/Gae3VIcfdesZUvLqtC2t2dOP7F52Em/74IW54bCP+z+lT8KcPO+APcPzja6ei1mpK2gaCKHRI8IuYoTFPyPNEYvicc/xrx4ng81GXD//acSIYfvnVZxemZZNJr8Ub3z4j6v46mwk3ntqGG09tAwD833On4/a/bsPPXt8bPObfu3vwmaUtadlBEIUICX4RE+7hOxII6byxqwfdI260VplxuN8Ju9uHHceGAQDXL58Mk16riq3RuHZZC6bWlqLSYkBblQXz73oNWzuH8ZmlGTWDIPICSsvMEXz+ADYfGcSgwxP/YIWYIPgJePibxdTJ75w/EwBw1gNv4rkPO3ByWyXuvmKO8kYmwNLWSkytKYVGwzBvUhm2iT9ABEGEQoKfA2w/Noxpq1/Fp377Hr767EcZO++WjtC89z2ywqhoHB1wYEq1BdWlhpDtp02rjvKKzDK3qRy7ukbg9ilTU0AQqbK3O/73KdOQ4OcAlzw03i1yzwl7xs77yFsHQ56/s78P/jgN1I4OONFcaYbVFNpz55L5jYrblwrzJ5XB6+fBOxGCyAYvbunEeT9fj39HyGjLJiT4OYY/EAjpLJkpWirNAICeUVfUYwIBjkO9DrRVW9BYHpoF01plVtW+RDlzRi3KzXq8sPlYtk0hipiNhwSHo2PAmWVLQiHBzzLhnuig05sx79SkH//vv375ZACx2ysc7nfA4fFjVoMN5WYDXvraacF9udIDp8SgxawGGw72Ze5OiSDCkVKcSzKcxBAPEvws889Pxme611iN0DBg/b6+jJxb/mGsE3veRFu49Qc4vvP8VgAI9sCZ01SG/750Fm5c0aquoUnSUmnOOc+KKC6k71GixYyZgtIys8wnnUOY31yO65Y2Y2lbJb7x3BZ8cKAffBVX3WuWfxilRdhIgu/1B3DTEx9i85FBtFSacVKDNbjvC2I+fC7RXGlGn92DUZd3wloDQWSCgBiW3X1iJMuWhEIefhbpGXFhy9EhzG2yCfnkNaU4e0YtNh4ewMW/fAdev3pToAIBDrcvgIvnNuCeK+ag1Cj89kfKxX//QD/e3teHJZMr8MJtK3ImfBON2Y02AMBD6/Zn2RKiWJEmuO3tzq3QIgl+Fnlqw1EAwMVzxzNcvnp2O246tQ07u0Zw78u7VDv3mNhHZ+6kMvzH8skw6oTwTqRRg1K65sPXL0aN1aiaTUohddt8dP1BSs8ksoJb/B7lWmiRBD9L+AMcv1y7DwAwp8kW3G7QafD9i2ZixdQqPPHeYby3X514viT4ZrHVsEEnfBQ8/okCufnIIJorS1BdmvtiDwB6rQa//uwiAMD/vncky9YQxYjUmLBn1J1wj6pMQIKfJXYcH68GDY8z67Qa/O7zS2AxaPHYO4fAOYdP4fDOmBi6kVohGEXBd3tDz8M5x6Yjg1g6uRL5xKnTqgAA9/1rd8hsXYLIBPJOtI/Iur9mGxL8LPGO6Llv+s9VEfdbjDp8Y1U71u7uwcK7X8e01a/irb29ip0/uocfKviPv3sYfXY3Frbk14DxcrMBL355BfwBjqX3voGu4bFsm0QUEW5fABfNFbrGRgqTZgsS/Cyxu2sUTeWxwyQ3nzYFy6dUBnvefP+v2xCIUwmbKJKHXxLm4Yd/OD86KtQEnH1SnSLnzSQLWypw52XCEPWnPqDQDpE5XN4AykoMKCvRT5g7kU1I8LPErq6RkPTGSGg1DM98cTk2rj4H91wxB8eGxvCbN5XJPJE8fEnwJQ/fHSb4NpMe1aVGNJWXKHLeTHPDilYsba3AK9tO5NQXj8gMIy6vqtlu0XD7/DDqNDDpNXB5ycMvalxePw72OTCz3hb3WI2GodZqwudObsH0ulK8uUeZsE7Qw5dCOlophh8qiiNjXpSV5He5xg0rWnGoz4FLH3oHoy5v/BcQBcO8H76G//j9hoyf1+0NwKTXwqTXwpVDmWIk+Flgf48d/gDHSQ3xBV+CMYZTplRhV9eIImGdoIcvCj5jDDaTDsNjgiB2DDjRevvLeHlbV94XL10yrxE/vHQW9vXYsX5vZqqYidxhw6GBjJ5vxOWFxx+ASa+BSacNOle5AAl+hnn8nUP4f38RBn3PjBPSCWd2YxkcHj8O9zvStiM8hg8A1VYj+uweuH1+XP/YuFck/QjkM589eTJ0GhaSHUUUNkqtdyXLqp++BQAw6rRCSIcWbYuTruEx3PXSTuw+MYq5TWVoq7Ik9fpZYgXp9uPpl2s7wzx8AKguNaLP7sa/tp/A4f7xgpF7szTYREkMOg3aqi3Y15NblY+FjNcfQL89eymx4etRmaJHTAPWaxkMOg08FNLJf+xuX0IfZofbF+ynseGgcGt5wymT8diNS6DRJNeiYHqdFeVmPV6TzZRNFVckD7/UgD67G2t39aDKYsC/vrkSO+48HytyZLhJukytKcXrO7tp8TZDrH5xGxbf80bW0hKz8f8snycR4BxGnZbSMguBT/3mPSy+543g8yP9Dvzgb9snjCi87emPcMEv3sagw4NnNhxFS6UZ/33pbNRaTeFvGReDToOT2yoVGeHnjCD4NaVGHOh14NXtXThzRi1m1ttgMeb3gq2cxZMrAAC/+Tf12MkEL24RZhIc7ndg0+GBuMN1lCYbi6XyqlqDViN4+FnIEooGCX6K7BHHl1344NsYcnpwxv1v4skPjuDMB97EDY9vxKDDg0CAY71YLLXw7tex8fAAPndyS9KevZzqUiOO9Duxdld3WvaPef0waDXQacc/As3iEBSvn+OyBbkxwUpJbjqtDaVGHV7bmd61IxJD6s/0pw87cPXD7+MP7x7K6Pm3dWZ+veZdWSsUi1EHg1ZDHn6+s/nI+Kr/rq4RLLjr9eDz4TEv3trbi79uOYYPDvZPeO2Np7amde7rlrUAAO5fsyet93F5/SEDUABgsmxNQZqAVUhoNQzfOnc6dp8YxaG+9Be+idiUlQjZXY+9Iwj9kf7MNRLjnOPvH4/PmjjQm5m1my8/LcykNuk1uGReoxjDJ8HPa9btnjinstSowyf/dR6qLEJf+f099uDkqvduPxt3XDgTO+48P+j1pMqcpjLcdfls7D4xmlaPDqfHF7JgC4SOKay0GMJfUhBcNLceGga8sLkz26YUPLaS0HTeUlPmwoPrdvfg5W1dwefniJkzmeL3n1+KEoO2eASfMfZDxtgxxtjH4p+L1DpXptl8ZBDzJpVhzTdPD2575PrFKDPr8eZ3zsRJDTY8u/Eofvr6XgBAvc2EL50xVbF4+JULmwAAf9rUkfJ7jHkDMBtC7WmWefW2DH45M0lDWQlObqvKueHShciYJ7RLpF6bOf9yIGwtLdMYxbvnYovh/5xzvkD884rK51IVl9ePQIDjxS2d+ODgAOY2lWFGvRUv3LYCXzpjCk5uE7pJWk16fEE28q+t2pJWzD4SVpMeXz5zKo72O1MuGx/z+IOdMiVMei2uXjwJD1wzP+eHnKTDsrZK7OwaQc9I9IHtRPqEj/ezuzLXJtgYYZZsJrJ2pGLKRS1CgoBBq8laemgkCtONUxi3z4+zHngTXcPjAiHlxC+eXBHM/pBYNasOeEF4/MA181SxaVptKXwBjiP9TkyrLU369WNeX7BTppwHrpmvhHk5zfmz6/Hg2n14c08vPr20OdvmFCxOjz8kpNE94oLXH8iIpy81A5QTyclRmkqLHksmV0ArOnnGYgnpiHyVMbaVMfY4Y6wi/uG5ybf/9EmI2APAZfOjZ7FUWgzBZmPtdclV0yZKo/j+3Sl6qWMef0hKZjExo96KEr0Wu8VJXoTycM7h9PhQLVsLenlbF259cnNGzh/p/jQToRWXNxAM5wDjIR3Os1P1G05aHj5j7A0A9RF2rQbwWwB3A+Di3z8FcFOE97gFwC0A0NLSko45qtA56Awu/ly1sAktVWbcdFpb3P4yz92yHDotg02lPjTS4nB/irFKp8ePSkt+TLBSGq2GYUa9FZvF1s+E8rh9AQQ4UFVqxHGZs7Q2QsKDGnj9EwU2fLiPGrh9/mB2EiCEdDgHfAEOvTb7YdK0BJ9zHnl6RxiMsd8BeCnKezwK4FEAWLJkSW78DEJIt/zThx144r3DAIBL5zfi/mvmB2/V4tGsclqjlEXzzIYjuHhuQ8J2Sbi8/oghnWLhrBm1+PkbezHi8qr2o1zMSL2aqkqzk+0VaW0rE/ON3d5ASDjJIJszkclF62iomaXTIHt6JYDtap1LaR556wAufPDtoNhfvXgSHrpuYdKiqiblZuGL9MHBgaCdyTDmLd6QDgAsECd4bVegapmYiNSrqaEsO3MU5HFz6XubicVTty8Qsk5giDJYKFuo+ZPzE8bYNsbYVgBnAfiWiudSlB+/ujvkeS4uZMp/fA6nUETk9Pgn5OEXE3ObygAAW7NQjVkMOMUWA8unVOI/Lz4Jf7hxKQBgQXNmRmXK4/WPi+fOhIfv8voje/g5kpqpWpYO5/x6td5bTQ6KFXlVFgP++bXTMOjMbj5vLK5d2oznPuxAIIUFIZe3uAW/0mLAzHor/rblGL50+pSCTkPNBlJKpsWgw+UrhbqRk9sqkamYrTykY4wyzU0N3L6wkI62eDz8vMIntnL98yahAvN7F85EY3kJZjeWZdmy6Nz3qXmYUWfF/iRb/nr9AXj9vKhDOgDwqUWTsPvEaMoL30R0JME3G8c/Yya9dsJENbXInuCHpn5KxZbhNQnZgvLwRW7/6zY8L5bbT6oowRULmrJsUWKcMrUKz2w8ikCAJ1zgFT7PtliZN0n4MV+3q4fy8RVmzCuEdOTV3CZ95oqQJI+63mYKtjNRO0uHcy6kZco8/FJR8HNltCZ5+CLPy3qr/PGmZcHYW67TXlcKjy+AE0nk4w/YBY+2okD75STKsrZKWI06bD02lG1TCo6ghy8LGxp12oz1qPeIaZnvfO+s4HdZ7Ri+1KCtxjbe+txqkgQ/c1XGscgPVVOZ8KKIqTXJV65mi1axw+WK+9bhobX7EnpNrzi4pcZanHn4EowJ+fh7qABLcSLNWzDpNXBlIBceAHpHXdBqGHRaTcZCOieGhe/VDFmxpVSvM+omwc8ZRsRf36+f045DP86vHm+TZR0uf/r6Xvz63/vj3j72iSPYakqLW/ABYHFrBT46OoShHF6cz0fGonj4mciUsbt9eHZjR3DgilT5qrbgO8RmcRbZusW4h08hnZxBmlLVWmXOu2yN8Dzn+9fswR/ePRzzNZKHX20t7pAOAJwxvQb+AMcnlJ6pCGt3deOmJz4MTn6Sd4jNlIcfPnVOiuGrnSnjlARftm5BIZ0cZMCZvzHtSMVgkQavyOkbdUPDgKoiba0g56R6oQneXgrrKMLNf9yEdbt7cGxoDIyFNjEz6QUPX+2+MsNjod60MUMxfId74l1NiV4LrYZltFNoLEjwMe4RVJrzT/AjEW+yUK/djUqLIacqh7NFhcWAGqsxOLKSUIYj/Q6Y9dqQO2ajToMAj9znRklGogm+yncXkodvlt3VMMZQXqLPmdRfEnwAB3uFStWG8uQHi+cCK9urAQC3nD4Fnzu5BceHx2JmQ/SOelBN8fsgM+qs2EuCryjv7u+f0LZbyk9Xe7i4W8zBf/DaBQAE0TXo1E8JlTz88HTnpooSdA5mbrxjLEjwIYRAplRbUGvNT8F/5PrFePu7Z+H7F52EhS0V4BwT2jnLGXR6UFEgdzNKMKepDFs7h/FJB6VnpkMgEOq5y2ckA5nztL2isMt/cIxajeohHafHFwzhyGmuNKNzcEzVcydK0Qs+5xxbOoYmDDHJJ8wGXbA7Z7nYmjX8tlbOkNODCgt1iJT41CKhyO6hdfuzbEl+E+65h89FlqZQqZ2LL4WMDLLulMYMFH05PP6QDB2J5gozOgedwayhbFK0gi8tHHUOjmHA4cH8DDV1UhtpcPRIjDSwIac32G2TEIbULG2tQM8ojTxMh7Gw9gGnTasOeS6FdNQWXqmtgrwdsVGnVT9Lx+2bMCcaAJorS+D185SHFSlJUQo+5xzn/nw9TvnxWmwRb+PnTyoMwZeGLww5Iws+5xxDY15UmMnDl9NaZcmJL2Q+Mxbmua+aVRfyXArpqO3hS50p9Tq54Kvv4Q86I3+vmiuEu++OgezH8YtS8LtH3NjfY0fXsAt/2dQBg06DGfXqjCLMNNLC87GhyDHDEZcP/gBHeQl5+HJqrEb02T05M4ouH4kn5FK6otqNxMY9/PFYukGnUb1xW7/DjaoIyRBSuDUXEgOKUvCPyn5p397Xh+VTqvKmd048bCY9Ki0GHOmP3CN/WPT8y8nDD6GsRA9/gMORI10N85ExjyC0Z82owft3nD1hv9TKo1es9FYLadE2NIavVd3D77d7gqNH5UyuNKPOZsQHhwZUPX8iFIbKJcnxMO93TqMtS5aoQ0ulOWouvtTfn7J0QilLYLG7EOGcY8+JUUUWFKWQzs2nTYk46apOzIJTO3QmLdqGxvDVzdLhnAuCH8HD12gYWqss6MmBkGFRCv7HYtz+i6e1ARAEspBorUpA8ClLJwRpEbvfnhsFMpniu89vxfm/WI+Xth5P+72CbbejDNYpN+th0GlUF3xPxEVbjaqLtqNuHzz+AKqjzPCtLzMl1dFWLQpK8O/85w489s6hmMdsPzYcnAH73Qtm4r6r5uJTiydlwLrM0VxpxvHhsYiDnIeCIR3y8OVMqxVyxvf3Zj/OmilcXj/+IrYFP9Cb/JjMcMbEStNocxYYY6izGdUXfN/EGL7ai7ZSQ8JoQ9vrbSZ0j7izvkZUUIL/h3cP4+6XdsY8Rj4dyqDT4NplLTkxTV5JGspKwHnkWKnUFVLK1ycEJldZYNBqsLuIeur8/eNjir6f1CBMahgWiTqr+p6u1x+AXsvC2jqoG8OXWidE609VZzPB4wtgMEr2XKYoGKVLND4nVaA+dfPJapqTVRrKhFjps+IkLDnSB66MBD8EvVaDOU02bDiY/YW1TNEzMu4Q/HLtPjjS7NkudcgsNcYQ/DJTyHnVQBD8UGlTO4YfLxmiXvxOnohRAZ8JCkLw7W4f/r27N/g81m1Tx6AT5WY9TmuvjnpMviN9uB5atx+v7TwRsm/Q6YHNpIOuwO5qlGBlew0+6RyKWbRWSDz3YUfI842H0/uxkzz80jgefiYWbcMF32LUYWRMvY6VUpVxtHBWnS0zC9bxKIhv/f4eO259anPwebSe26MuL57ZcBRt1ZaI+wsFycMHgM1HBkP29dndqC7ySVfRWDRZ6EO0vUh640u1Gk9/Ubjb9aYZ8rC7fTDpNTFDpPVlRjg8flUHgngiePiN5SUYHvOmfRcTDanK2BRF8CUnjARfAWxhHsWoO/KHSVrQXdZaqbpN2UQerjkclq3TZ6dOmdGY1yQMNd/ZNZJlSzLHxXMbgllqQ2mmpI66fCg1xg4Vjnu66oV1vL4ADNrQBmZNFUKaaLSCxHSRis6iCX6t1YhSow6fdGa3QV9hCH5YPDradBlpwfabq6arblM2YYzh+uWTAUzMK++zu2m0YRQqLAaUGnU509lQTQbERcbZTbbx/ktpCr7d7Yu5YAuMC/7RgfSzgqLh9QdC2ioAwCRR8OPNikgVKaoQLSVVr9VgSo0lZhfbTFAQgh/+IYs2XWZftx3nzKyN+p9SSNx9xRysOqkuOK8XAPrtbhzsdURNHSOEcFjXcOEL/rWPvg9AGMdnNerAGPDEe4fT+rePurwxF2wBYEFzOUx6Ddbv7Uv5PPGIFMOfWW+FVsOwfm9vlFelh1SDYIpRsW8x6OB0Z7eSuyAEX5pZKWGPEKfz+QM42GdHe11h9MxJhHKzHgMO4dbZ4wtg8T1vABBuL4nINJaX4PhQ9gtk1CQQ4NjbLdztnj+7HhoNA+dC59jbX9iW8vvaXfE9fJNei2VtVXhtx4mYx6VDpBi+2aCDP8Dx5AdHcLhP+bsLp8cPg04TMxnCYtQGB51ni4IQfAB4/MYl+K9LZgEAfviPHRM60x0ZcMLr52gPm8JTyEyqKEH3iBtPfXAEQ2PjFaT/IYZ7iInU23KjIlJNpFqD//nU3OBiooQvkPrCrd3ti+vhA8Cy1gocH3ap1jXT658YwwfG17bUiOM7Pb6QWbaRMBt0qjeOi0fBCP7ZM+twrtiOdV+PHV955qOQ/dIYw6lFJPifWdoMANhxfCQYn/3ldQupyjYG1VYDBhyeCfULhYTUtXHx5PHkhRduWwEgeoZbIoy6fDFTMiUay4V4enhPK6WIlIcPjGcjDagwX9bh9sMSoRe+HItRGzH6kEkKRvCB8W58ALC1cxgPvrEv+HyNeAsZqZtdodJQVoKTGmzoHXVheIwKrhKhutQIf4AHew4VIn12Icwn/74snlyBC+fUp7VwO+rywpqAh99Urm7GjNc3MYYPjIcy081GikTCHj4JvnKY9Fp8ZklzcNLOz9/YC0Bolva82DPEksAHspCotRrRPeKGXVwsKo0wgo0YR0pZ7SvgJmq9o24YtJoJ6cxlJfqgY5AsLq8fIy5fQim/wRRJlbKhPBGydADAahKcHTVqABweP8xxtMVi1MHpFWoQUr3O6VJQgg8A/3P1PDx58zIsEWfUdgw4Q/6DI82cLGRqrUb0jLpkja2K6wcvWSTB6rerW/6fTXrtbtRYjSG9ZgAhvTnVKmOpoCh8TSASdTYTNExFDz9KDN+k10CnYVHTttPB6fbBEsfDtxi04Bw464E3Mf/O1xS3IREKTvABIQ999cUnAQB2dY2EpGmGZ/QUOnU2E3pHxz38eLedxU6NVQj59Raw4AvFdxNDm2Uleri8gZR6zhzoFbJ+ptTEr2LXazUoNxtUC5t5fJFj+IwxWE069Tz8ODF86Q5Aunv0RehmqzYFKfjA+OLsI+sPqhKzyxdqbUYE+Pg8TRL82BRLSCdS6EUK8Vz04NtJv6dUUNRUnthsCUF41YlnR1u0BYTmgU99cFTxJmZOjy9u9KAyLFkiG2GdghV8mxiv23xkEAd77XGOLlxqxSlDD64VFrCLoegsHcpKMjOkI1v02d3Y1TUSMuZTokT0UA/0OpLu2y6Jt60ksZChmoIfzcOXs3Z3t2Ln45zD7oq/aBte8JiNVskFK/hyfve20EPn55+Zn2VLMk+tLdSTi3fbWewwxtBcUTKhjqNQkNqLrGyvmbDPKFvoTLZ3/KjLC62GRe0WGU5ZiT44m0FJhse8ODHiiltNrmTWbdewC/0OD9prYxd1hofR1Pj3xyMtwWeMXcMY28EYCzDGloTtu4Mxtp8xtocxdn56ZqbGW985M+T5lQsLa7JVIki9SyS0momLWUQoLZXmiB5wIdAjDsW5dlnzhH0GmeAn21XS7hKKrsIXgqPRVF6iSs+iPrsbAQ7MjjKn+jvnzwCQ/L/ypCPLAAAgAElEQVQvFtIUucby2AvWlWHDUYby0MPfDuAqAOvlGxljswBcC2A2gAsA/IYxlvFYwuQqSzDXONoHoNChRmnJ01JpxtF+Z9bH0amBNEhbGiguRy74iVaE+gMcIy4vRhNoqyCnoawEPaPuiGM408EeZ+rWbWdMBQBFq3yldgnxUr7Dp8xlo9YjLcHnnO/inO+JsOtyAM9xzt2c80MA9gNYls65UmWu2PL2K2dNy8bps44hRjMnIjLNlWaMun1Z8cDUpmfUDaNOEzHWLg/pJNrz5cn3D2PeD1/DtmPDwTz3RJBmMgwqXPUqVbJGq3rVaBgMWk1aFcXRzhkvXKrRMPz1yyuw/jtnASisRdsmAPJxOp3itoxz6xlT0VJpLloPHwBe+9bp2TYhr5D6wxdiWOeZDUfBGCKGXkIEP8Gujmt39wAQ2pnokggXVosV70pnQwXHLMa42zDpNYp6+FIHzERqfBa1VAQLz174SNmZwokQ9x6MMfYGgPoIu1Zzzv8e7WURtkW8P2aM3QLgFgBoaWmJZ07SLGurxPrvnqX4++YT0+us+O4FMzClwCd9KUVLlSD4h/sdmN9cnmVrlMPu9sXs5aLVyEM6iXn48swUTRKCXyUVuDmUrXeQQjqxmriZ9FpF59tKrZHNCRY1Sutou7pGcKjPkdEJfHEt5JyvSuF9OwHIV4UmATge5f0fBfAoACxZsqTwgqY5wpfPLM6QVipMrSmFQafBts5hXL4gKzemqiC1BV4ZZZ5ze20pGstMOD7sStjDH3R6sbClHItaKnDlwsSvlZRF06+Whx9D8EsMWkW7Vkp3C0Z98gGTvd2jGRV8tUI6/wBwLWPMyBhrA9AOYKNK5yIIRdFrNZjTaMv6ODqlkVJNb79wZsT9FqMOz96yHEDiHn6f3Y2GMhN+cMkszBHXyxKh2iIVuCns4bvjL6CWl+gVzYEPjjdMoYo/0+m/6aZlXskY6wRwCoCXGWNrAIBzvgPAnwHsBPAvAF/hnGe3ETRBJMHClgp80jkczFsvBKQ0yEkV0athpYVHR4IecF+Uqt142EqEKVvPbDgKv4JJ8Xa3D3otC1mPCKfSYggOBlICqWYhGQ9fWlfrHBzDC5s7sfxHazPSkjvdLJ0XOeeTOOdGznkd5/x82b57OedTOeczOOevpm8qQWSOm09rg1Gnwa/W7Yt/cJ7QOeiEzaSL2SJbWnj86Mggbn7iw5hN5Ny+xDtkhsOYMGXrYJ8Dr27vSvr10XC449cDVJgNimZgubx+MIaYPzLhTK+zYma9FR0DTvzfv3yCEyMu2DMwDYty9ggiAo3lJThlShW2dg5n2xTF6LN7QnrgR0IKS7y45RjW7u7BOT97K+qx0iCRVAQfACaLi+NvKzjf1u7yxc2Ht4iD6pUahOLy+mHUaRIuOpNoLC8JGWqu9HpGJEjwCSIKc5rKcLDPoWhVZjYZdfvi5sqHZ9rE8oT7RiXBT22o0MtfX4mT2yrx/sH+lF4fidEExixKPwin/HitIud0eQMwJdhSQk6dzRisfAaAm574UBF7YkGCTxBRkFr9KpGP//ePj2Hx3a+rNsc1Eewub1LVsAAwqyF6/Yq04Fod564hGqVGHeY3l+PEiEuxqmZHAoIvDQFKtl9QNFxef0oLtlaTHnb3+A/qjLrYvXiUgASfIKIwuVIQ/CP96Qv+N577GP0OD/aIA8SzQaJDxu+7am7wsSaGQkgzA6otqbfvqCk1wuMLKBZTt7vjz9VNNvQSD5cvAFMKKZlmgzak4veuy2craVZESPAJIgpSAdbRAYdi73nLk5sUe69kkRqcxeOqRZPwk0/Nw4Vz6qPmq3PO8d3ntwIQBr+nilTYtuHQQMrvISeRf2OFWdm51i6vP6WQjtzO65dPRq0t/rSwdCHBJ4golJXoUWrU4fiQcr3xu0eyN0lr1B1/QRMQ+i99emkzrCZdsG1AOIf6xn8E02m5PW9SGRiDYnc+idzFXLNE6Jpbr5DAurx+GFMQfPl1SybDJx1I8AkiBg1lJnQNqzN7NZNwzmF3J9fR0mzQRS3AWr+3FwBwxYLGtOwy6bUoL9Gj167Mj2oigq/XanDdsmb4FVo3cHsDMKUg2FJPHQBQOMoUFRJ8gohBQ1jqXL7i9PjBeeyWA+GUGLTBPjESXn8AHl8AXSMu6LUMP/v0grRtqyo1onc0/Tsff4DD6fEndBdj0mvhUqi9gsuXWkhnwaTxPk0lGRpMRIJPEDFosJkUEXx5/5pMVFSGk0gXyXAsBi28fo5+uzuYkXP2T9/E3B+uQfewC7VWU1IN06LhdPuwZkc3frf+YFrvI7V0TuQuxmzQYtTtU6RFsdub2qJtmVmPD1evwpdOn4IvrmxL245EIMEniBg0lJvQZ3fDk2YKX0AWPnAp2KkxUUYT6CIZjuR1Lr7nDSy55w0AQMfAGNy+ALpH3KgvUyYGfuflcwAAv3hjb1rpmVKnzEQ8fGkU4/w7X0t7fnGqHj4A1FiNuOOik4IzuNWGBJ8gYtBQZgLnSFsUfP5xIVOyU2OiSB5+MjH8cPGVP+8ecSm26HnurDrcceFMODz+tK6NI4FOmRJygV4n9vRPlVTz8LMBCT5BxKChTFhYSzesI28Q9rctxzI+PvFvW4RhG6XGxD3J08LaKI+4xhdwD/Y5JsxLTgcp1BSrX388RpMIW5XI+vi/uacnrf8PV4ohnWyQH1YSRJaQBlOnm6njkwn+PS/vwt8+zty0o02HB/DEe4cBCOX8iTKzPrTKdiQs3l1fpty8ZMkrH3WlLviJDD+RaCofz5BZs6Mba3acSOmcHl8AIy5vyiGdTEOCTxAxqBc9/HRz8X2BAOTrm0pU7ybKYdm5pDuWRLHIPOERV6jgK+nhSzHsUVfqi6hD4g9SIoJ/6rRqfGvV9ODz3SnWAew5MQrOgfYMtEVQAhJ8gohBqVGHKosBh/rS64vv83PYZG2J9drMffXkvd+THWr/0tdX4urFQqHSoCNUjCdVJPfjEQslQjofiE3YKi3xK2n1Wg2+sao9+PxEiiE7yd5GhRaw1YYEnyDiMKvRhh3HR9J6D3+AhyyYjmVw4XZAFOobV7Qm/dq2akvwdZ2Dwp2ClOEyoz56Y7Vkka5NOiEdjy8Am0mX0p3HsaHUQnZjXsFe+ZpALkOCTxBxmNVow75ue1qpmb4AR42sb7wjA8MuJFxeP8pK9PjhZak155IGpkhhj3uvnINtPzwvqRTPeEjvZU9D8F1ef9K9+T97cgsA4O19ffhXCoNYpKyidNpLZBISfIKIw5zGMnj8Aew+kbqX7/b6MaWmFD+5eh6AzHr4bp8/rV4tUihKWvgtN+vj9tVPlnKxodmAM/UhIKk0MfvRlXPx/YuEGb+3PvVR0uccF3zy8AmiIFjaWglAGPuXKm5fAEadBp9e0oy2akvCM2OVwO0LJB27lxM+ErGsRNluk4Dg4ZsN2pRj6UDq6ZGfP6U1+PhwX3KdUaUfbgrpEESBUGczwmbSYV8aA80FwRdEwWzQwpnBKVrSj006fGZJc/BxrJm46TC70YaXtnbB608tdDY8llp6pEmvxZM3LwMAfPvPHyf1WvLwCaLAYIxhep0V+7rTEXw/jKL3aTHoMlpt6/aO/9ikSqMsb73crI7gX7VoEvrs7pS8/C1HB7Ht2DA2p3gXNq9JaGT20dGhpF43Jq7FUKUtQRQQ7XVW7O0ZTaki0x/g8Pp50Ms2G7VR2w6rgdvnTyukAwh96yXU8vClYqgTKbSxeHufMAg91bGFZbIfsWT+j50eP0r0WkWayGUCEnyCSICFzeUYcnpTSs+UsnskL9tm0qe1OJnK+dMN6Zw5oyb4WK0agoYyqao5ecF3K9CQ7geXzAIQe3B7OE6vP2/COQAJPkEkxKpZddBqGP61PfkSfMmbLxFDOpOrzOgYGEs5/JAsbl8gpYlMchhj2Lj6HLxw2ykKWTURqfvm8RRy4qWQivyHKVmkH5zjSbTRGPP482bBFiDBJ4iEqLQYcHJbJV5NIVd7vFOlEDa4ZrGwALpud7dyBsbA7QvAoIBXXms1YfHkSgUsiozVpEedzYi9KbQ5kFoV/eZzi9I4v5BLn8z6itPjgyVPcvABEnyCSJiL5jbgQK8DO44PJ/U6qXpUEpSWKjPqbSb0ZGi+rUe2YJzrzGqwYWdXCmEzvx8all4BlFRBnJzgk4dPEAXJebPrAACPv3M4qYW94PARWWuFSosBA47MxPHdvgCMGezdkw6zGm3Y32NPOibvSbPWABjPpf/gYH/C/79jHorhE0RBUms14ZbTp+CFjzqxpSPx9L1gSEfWi77UpEurUVgyCDH8/Piqz2oogy/Ak06B9fp52mErycP/7ZsH8PePjyf0GicJPkEULl89exoMOg0ee/tQwl6g1PJX3jzNasyc4Ht86efhZ4pZjUJDtm3HkgubCdXE6f0b5eGgb/7p44T+f8e8/owNIFcCEnyCSAKbSY8vnNqKl7d1JZxlE2mAeCY9fJc3/Tz8TDG50oxysx6vJpkNpUTqaVVpaMuIDYcG4r7G6fHBnCfDTwASfIJImltPnwpgvP96PMIXbQGhd0w6nSETxecPwO0L5E3YQaNhOGdmHXYluXDr8Qeg16ZX/BReX3CwN35fHVq0JYgCp8JiwMx6K9aL1Z3xGHX5YNBqQsIqmfLwpSZtSrYyVpvpdaXoHXVjeCzxAiiPAtXEwPggE8YSq/ilRVuCKAIaykzYeGgAb+3tjXus3e2dMFjbatTB7Quk1WM/ERzuxOe85grTaksBAPuTaFbn9XNFBP/1b5+BLT84FzaTHr9cuw93/XNn1GM9vgB8AU6CTxCFztfOEcbjvbI1fiHWW3t7gxkgEsGBHyp7+ZLgW/JI8GfUC/NhX9mWeJGbR6HiMotRhwqLIXh38fi7h3DWA2/CF6GD53hr5Py5tiT4BJECi1oqsLK9GlvjZJN0DDjRMTA2YYSeNPBjUOWeOvY89PAnVZhx3bJm/OHdQ+hKsM2BEnn40TjU50Dn4EQ7nOJ4Q/LwCaIIWNhcjj0nRoJedCQ+FvP1v7Vqesh2aRRf36i61bb2PPTwAeCW06ciwIE1CWbruP0BRZu6PXjtgpDnuyO0e3C486sXPpCm4DPGrmGM7WCMBRhjS2TbWxljY4yxj8U/D6dvKkHkFgtbKhDgsXPGv/bsFgDAF1e2hWyvtgoefp9dXQ9/PKSTP6IEAK1VQnrm3gTj+F4F0jLlXL6gCRtXn4P/vPgkAMCtT21GIBCalx8M6RRRWuZ2AFcBWB9h3wHO+QLxz61pnocgco6ZDUKsOdokLJdXEISm8pIJHrbk4d/3r10qWgjY3fmXpQMI3Tmn1ZQmvHDr8Ssf0qm1mvDFlVOCz/+9pwe/f/sgAGDI6cGlv3oHQP4MMAfSFHzO+S7O+R6ljCGIfKLeZoLZoMXB3sii1CuGa247c+qEfRViDL9jIPlWwMkw4BBsqLAoP4dWbVqqzNh4aABbjsYvcHN5/apNnfrxVXMBADf/cRPueXkXnB4fjg44g/spD1+gjTG2hTH2FmNsZbSDGGO3MMY2McY29fbGT3EjiFyBMYa2asuEiluX14/pq1/Fyp/8G0DkkYBaDcPK9moAmBAqUJKeETdK9FpY88zDB8avyxee+DDusUNOb8jUKiWZP6k85Pn+HntIz/58iuHH/RQwxt4AUB9h12rO+d+jvKwLQAvnvJ8xthjA3xhjsznnE8rnOOePAngUAJYsWaLeJ58gVGDI6cWxoTEc7nOgtdoCQPDsPbI0vnDBkFjZXo239/VhzOtXbVG1e9SNWpsRjOXHCD45Wo3gj/rj/CB6fAHY3T5UmtW5iwlvuXDZr94NeZ5Pgh/Xw+ecr+Kcz4nwJ5rYg3Pu5pz3i483AzgAYHq04wkiX/nuBTMAAJ9/fGNw25h3vLXv+u+cheZKc8TXSvnbDhXn2/aMuFBnNan2/mry5bOEUNhssaFaNEbE5nQ2lWbtVsT5ISn6kA5jrIYxphUfTwHQDuCgGuciiGxy+YImGHUaHB1wBqtmR2U9clqqIos9gGDTrbEkBm4kS8+oGzU2o2rvryZTa0px3qw6DDpit1iQrp9ad0nxFoPzaUE83bTMKxljnQBOAfAyY2yNuOt0AFsZY58AeB7ArZzz+K3nCCIPeeCa+QCAvd1CrraU+37p/MaYr5NCAclMWEqWfPbwAaDWZkSvPXatgnSHpGZo5bMnt6DWGvmHM5+ydNKylHP+IoAXI2x/AcAL6bw3QeQLUsime8SFOU1lONwndFn87vkzYr6uJCj46oR0XF4/HB7/hBh0PmEz6THg8KBz0IlJFZHvlpzBFgfqCf6PrpyLaxZPwpW/eS+47blblqOpvES1c6oBVdoSRJpInl+PmIb55p4eVJj1ccVACkGo5eHnY+O0cKT12nteil6v4BRrDdQeJi735F/62mlYPqUq6vpMrkKCTxBpIi0WSpOtDvc7sWJqNTSa2JkxUoVmsuP8EkX6IcmnLJJwvnb2NACx/w3ODIR0gNCK2jlNZaqeSy1I8AkiTaTFV7vbj44BJw71OYKj+mIhDUS566XoLXjTwanyYmYmsBh1aKu24K9bjuG1HSfQb3fj0fUHQmoXpKwo1QU/j384JUjwCSJNNBoGs0ELp9uHv398DIwBVyxsivu6Flk4INH5uMmQicXMTNAgDiX5/TuHcMuTm/GjV3bjgFjd/OzGo/jGcx8DUH/xVPqB/uaqdlXPoyYk+AShABajDg6PD7u6RtFaZUloMU9eDOVWYRBKMLadxx4+ADx03UIAQHttKToHhZYGXcMuuLx+/OfftgePU9sDN+m12H/vhfjGOST4BFHUlBp1sLv96BoeQ2N54mmQd18xBwAwksQ4v0QpFA+/qtSIJZMr8HHHEHRi9e3nH9+Izz++MaQoKxP/Tp1Wk5dVyxIk+AShABajENIZ8waSCi2UiQu+UrWokkiLmWpnr2SCRZMrJnQl3XhoAHW28R9XJfvhFyp0hQhCAcwGYSi5y+uHKYn+6FJ8emfXxAEb6RIc0JFnvfAjMa22FB5fYMLksDiJUEQYJPgEoQClRh26R1xim97Ev1aLWypQZzPitR2JTXZKhkLy8NvFwebhuLzC2se7t5+dSXPyFhJ8glCA6XVWHO53omvYldTioUbDMLuxLOFBH8kgefj5NJEpGu111ojb39rbi/ba0ryreM0WJPgEoQCnTqsKPk4mpAMI4YqDfY64bYCTxenxwWzQxi0AywdKjTpsXH1OxH3RJo4REyHBJwgFWNZWmfJrp9UI8ekO2RQlJXB4/HmfoSOn1mrCoR9fNGH7tCjhHmIiJPgEoQBGnRaf/Nd5uGx+I25c0ZrUa6eKgqV0WMfh9hVEdaicSCmRL355RRYsyU9I8AlCIcrMevzyuoVoTDKeLHmoB6LMxk2VY4NjaLAVXmz77Jm1AIAbV7Tiz186BVaTOoNPCpH8X74niDynrESPcrMeHYPKhnQ6B8dwmjg3t5D4zecWYcDhSfqHlSAPnyByguYKMzoGxuIfmAQjLi/KVRr7l01Mei2JfYqQ4BNEDjCpoiTYJ0YJvP4AnB6/anNeifyEBJ8gcgBB8McU65opzdWVOjwSBECCTxA5waQKM9y+AH70yq6QXu+pUgjTrgjlIcEniByguVKISf/u7UN4fVd32u8ndcokwSfkkOATRA4gH9A9psCM2/HGaST4xDgk+ASRA8h7wSjRYkEK6VgKrPCKSA8SfILIAeRTqZQQ/GCnTPLwCRkk+ASRYxwZcKT1eo8vgONDLgCF0RqZUA4SfILIEV647RQAwPZjI2m9z21PbcZdL+0EUBjDTwjlIMEniBxh8eRKXL14EnYcH04rH3/t7p7gY8rSIeSQ4BNEDtFeW4o+uwd2cdE1XYxJTN8iCh/6NBBEDlFrMwIAukdcKb+HQRR5q1EXsZ0wUbyQ4BNEDtFYJqRnrpOFZZJlZr0wDnBUobsEonAgwSeIHEKanDXo9Kb8HrVWEwCgACYbEgpDgk8QOQRjDDVWIwbsnpTfIyAu+L789ZVKmUUUCCT4BJFjVFkM6HekLvhefwCLWspxUoNNQauIQoAEnyByjH09dryxqzvloeZuXwB6LX21iYnQp4IgcgyptcK2Y8Mpvd7rDwQzdQhCDn0qCCLH+POXhIrbVHPxvf4ADOThExFI61PBGLufMbabMbaVMfYiY6xctu8Oxth+xtgextj56ZtKEMVBe20pAMDuSlHwfZxCOkRE0v1UvA5gDud8HoC9AO4AAMbYLADXApgN4AIAv2GMUVMPgkiAUnEsYToevp5COkQE0vpUcM5f45xLn8oPAEwSH18O4DnOuZtzfgjAfgDL0jkXQRQLeq0GJr0Go67UcvE9/gD0WkrCJyaipBtwE4BXxcdNADpk+zrFbRNgjN3CGNvEGNvU29uroDkEkb9YTXqK4ROKE/dTwRh7gzG2PcKfy2XHrAbgA/C0tCnCW0Vs/8c5f5RzvoRzvqSmpiaVfwNBFBxWow6jYgzf5w8kNdjcQ2mZRBTi9k7lnK+KtZ8xdgOASwCcw8d7unYCaJYdNgnA8VSNJIhio9Q0LvjTVr+KBc3l+NtXTk3otV4/LdoSkUk3S+cCAN8DcBnnXF4l8g8A1zLGjIyxNgDtADamcy6CKCasJh3sbh8GxIrbjzuGEn6th/LwiSikOx3hVwCMAF4X27B+wDm/lXO+gzH2ZwA7IYR6vsI596d5LoIoGkqNOry7vxuL7n49qddxzsUYPi3aEhNJS/A559Ni7LsXwL3pvD9BFCtWkz6l1/kDHJyDQjpEROhTQRA5SIU5NcH3+oVlNMrDJyJBnwqCyEEmV1kmbNt+bDhmLN/rD2DlT9YBIA+fiAx9KggiB7l0XuOEbZc89A6u+PW7UV/TZ3ejT+yjTzF8IhIk+ASRg5SlENIZkPXQJw+fiAR9KggiR/njTcl1I/nVuv3Bx5SWSUSCPhUEkaOcMb0GzZUlCR/fbycPn4gNfSoIIod58qaTJ3jrXn8g5PnqF7fh0fUH0Gt3B7eR4BORSLfwiiAIFWmttuDb507Hfa/uDm4b8/qDgu71B/D0hqMAhGItCSOFdIgI0KeCIHKcEn3oKAmXZ7xo3SHrqCnvrmnU01ebmAh9Kggix/nM0mZ86Ywp+MElswAATo8fz208CpfXH7WFcviPBEEAFNIhiJzHpNfijgtPwivbugAAL2/rwv1r9uCTziEsnlwZ9TUEEQ4JPkHkCZLX3jU8BgB4dmMHnt3YEfFYEnwiEhTSIYg8QRJxhzt+41kTxfCJCJCHTxB5QolBEPwXtxyLeszK9mp0DbtQZzVlyiwijyDBJ4g8IZGF2NvOnIoVU6szYA2Rj9B9H0HkCYkIPuXfE7GgTwdB5AkmQ+Sva1v1eCtlo44Wa4noUEiHIPKE8hJD8PFvP7cIF85tAOfCwJO2O14BAMxqsGXFNiI/IMEniDxB3lOn1iYsyoqzpLHx++cgwAGNhvrgE9EhwSeIPKS+LDQLR/oBIIhYUAyfIPKQOqsx2yYQeQh5+ASRRzx188k4PjQGHbU/JlKABJ8g8ojT2inHnkgdchMIgiCKBBJ8giCIIoEEnyAIokggwScIgigSSPAJgiCKBBJ8giCIIoEEnyAIokggwScIgigSmNRtLxdgjPUCOJLGW1QD6FPIHDUhO5UlX+wE8sdWslN51LR1Mue8Jt5BOSX46cIY28Q5X5JtO+JBdipLvtgJ5I+tZKfy5IKtFNIhCIIoEkjwCYIgioRCE/xHs21AgpCdypIvdgL5YyvZqTxZt7WgYvgEQRBEdArNwycIgiCiUBCCzxi7gDG2hzG2nzF2e5ZtaWaM/ZsxtosxtoMx9g1xeyVj7HXG2D7x7wpxO2OM/VK0fStjbFGG7dUyxrYwxl4Sn7cxxjaIdv6JMWYQtxvF5/vF/a0ZtrOcMfY8Y2y3eG1PycVryhj7lvj/vp0x9ixjzJQr15Qx9jhjrIcxtl22LelryBi7QTx+H2PshgzZeb/4f7+VMfYiY6xctu8O0c49jLHzZdtV1YVIdsr2/T/GGGeMVYvPs3Y9Q+Cc5/UfAFoABwBMAWAA8AmAWVm0pwHAIvGxFcBeALMA/ATA7eL22wH8j/j4IgCvAmAAlgPYkGF7vw3gGQAvic//DOBa8fHDAG4TH38ZwMPi42sB/CnDdv4RwBfFxwYA5bl2TQE0ATgEoER2LW/MlWsK4HQAiwBsl21L6hoCqARwUPy7QnxckQE7zwOgEx//j8zOWeJ33gigTdQCbSZ0IZKd4vZmAGsg1BRVZ/t6htiWiS+Cyh/iUwCskT2/A8Ad2bZLZs/fAZwLYA+ABnFbA4A94uNHAFwnOz54XAZsmwRgLYCzAbwkfhj7ZF+s4LUVP8CniI914nEsQ3baRCFlYdtz6ppCEPwO8curE6/p+bl0TQG0hglpUtcQwHUAHpFtDzlOLTvD9l0J4Gnxccj3XbqmmdKFSHYCeB7AfACHMS74Wb2e0p9CCOlIXzKJTnFb1hFv0RcC2ACgjnPeBQDi37XiYdm0/xcAvgsgID6vAjDEOfdFsCVop7h/WDw+E0wB0AvgD2L46feMMQty7Jpyzo8BeADAUQBdEK7RZuTmNZVI9hrmwvftJgjeMmLYkxU7GWOXATjGOf8kbFdO2FkIgs8ibMt66hFjrBTACwC+yTkfiXVohG2q288YuwRAD+d8c4K2ZPM66yDcOv+Wc74QgANC+CEa2bqmFQAuhxBaaARgAXBhDFty8rMrEs22rNrMGFsNwAfgaWlTFHsybidjzAxgNYD/irQ7ij0ZtbMQBL8TQsxMYhKA41myBQDAGNNDEPunOed/FTd3M8YaxP0NAHrE7dmy/1QAlzHGDgN4DkJY5xcAyhlj0nB7uS1BO8X9ZQAGMmCndO5OzvkG8fnzEH4Acu2argJwiHPeyzn3AvgrgBXIzd1jTDYAAAHDSURBVGsqkew1zNr3TVzQvATA57gY/8gxO6dC+LH/RPxeTQLwEWOsPlfsLATB/xBAu5gJYYCw+PWPbBnDGGMAHgOwi3P+M9mufwCQVuBvgBDbl7Z/XlzFXw5gWLrFVhPO+R2c80mc81YI12wd5/xzAP4N4Ooodkr2Xy0enxHPjnN+AkAHY2yGuOkcADuRY9cUQihnOWPMLH4OJDtz7prKSPYargFwHmOsQryjOU/cpiqMsQsAfA/AZZxzZ5j914oZT20A2gFsRBZ0gXO+jXNeyzlvFb9XnRASOE4gV66nWosDmfwDYQV8L4RV+dVZtuU0CLdkWwF8LP65CEJsdi2AfeLfleLxDMCvRdu3AViSBZvPxHiWzhQIX5j9AP4CwChuN4nP94v7p2TYxgUANonX9W8QMhpy7poCuBPAbgDbATwJIXskJ64pgGchrC14IYjRzalcQwgx9P3iny9kyM79EGLd0nfqYdnxq0U79wC4ULZdVV2IZGfY/sMYX7TN2vWU/6FKW4IgiCKhEEI6BEEQRAKQ4BMEQRQJJPgEQRBFAgk+QRBEkUCCTxAEUSSQ4BMEQRQJJPgEQRBFAgk+QRBEkfD/ATyGJJoJE7qrAAAAAElFTkSuQmCC\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "plt.plot(range(1440), temp[:1440])\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 그래프에서 일별 주기성을 볼 수 있습니다. 특히 마지막 4일간을 보면 확실합니다. 이 데이터는 아주 추운 겨울 중 10일입니다.\n", "\n", "지난 몇 달간의 데이터를 사용해 다음 달의 평균 온도를 예측하는 문제는 쉬운 편입니다. 연간 데이터 주기성은 안정적이기 때문입니다. 하지만 하루 하루 데이터를 살펴보면 온도 변화는 매우 불안정합니다. 일자별 수준의 시계열 데이터를 예측할 수 있을까요? 직접 확인해 보겠습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Preparing the data\n", "\n", "이 문제의 정확한 정의는 다음과 같습니다. `lookback` 타임스텝(하나의 타임스텝은 10분입니다)만큼 이전으로 돌아가서 매 `steps` 타임스텝마다 샘플링합니다. 이 데이터를 바탕으로 `delay` 타임스텝 이후의 온도를 예측할 수 있을까요? 사용할 변수는 다음과 같습니다.\n", "\n", "* `lookback = 1440` : 10일 전 데이터로 돌아갑니다.\n", "* `steps = 6` : 한 시간마다 데이터 포인트 하나를 샘플링합니다.\n", "* `delay = 144` : 24시간이 지난 데이터가 타깃이 됩니다.\n", "\n", "시작하기 전에 두 가지 작업을 처리해야 합니다:\n", "\n", "* 신경망에 주입할 수 있는 형태로 데이터를 전처리합니다. 데이터가 이미 수치형이므로 추가적인 벡터화가 필요하지 않습니다. 하지만 데이터에 있는 각 시계열 특성의 범위가 서로 다릅니다(예를 들어 온도는 일반적으로 -20도에서 +30도 사이이고, 밀리바(mb)로 측정된 기압은 1,000 근처의 값입니다). 각 시계열 특성을 개별적으로 정규화하여 비슷한 범위를 가진 작은 값으로 바꾸겠습니다.\n", "* float_data 배열을 받아 과거 데이터의 배치와 미래 타깃 온도를 추출하는 파이썬 제너레이터를 만듭니다. 이 데이터셋에 있는 샘플은 중복이 많습니다(샘플 `N`과 샘플 `N + 1`은 대부분 타임스텝이 비슷합니다). 모든 샘플을 각기 메모리에 적재하는 것은 낭비가 심하므로 대신에 원본 데이터를 사용해 그때 그때 배치를 만들겠습니다.\n", "\n", "각 시계열 특성에 대해 평균을 빼고 표준 편차로 나누어 전처리합니다. 처음 200,000개 타임스텝을 훈련 데이터로 사용할 것이므로 전체 데이터에서 200,000개만 사용하여 평균과 표준 편차를 계산합니다:" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [], "source": [ "mean = float_data[:200000].mean(axis=0)\n", "float_data -= mean\n", "std = float_data[:200000].std(axis=0)\n", "float_data /= std" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "다음은 여기서 사용할 제너레이터입니다. 이 제너레이터 함수는 `(samples, targets)` 튜플을 반복적으로 반환합니다. `samples`는 입력 데이터로 사용할 배치이고 `targets`은 이에 대응되는 타깃 온도의 배열입니다. 이 제너레이터 함수는 다음과 같은 매개변수가 있습니다:\n", "\n", "* `data` : 코드 6-32에서 정규화한 부동 소수 데이터로 이루어진 원본 배열\n", "* `lookback` : 입력으로 사용하기 위해 거슬러 올라갈 타임스텝\n", "* `delay` : 타깃으로 사용할 미래의 타임스텝\n", "* `min_index`와 `max_index` : 추출할 타임스텝의 범위를 지정하기 위한 `data` 배열의 인덱스. 검증 데이터와 테스트 데이터를 분리하는 데 사용합니다.\n", "* `shuffle` : 샘플을 섞을지 시간 순서대로 추출할지 결정합니다.\n", "* `batch_size` : 배치의 샘플 수\n", "* `step` : 데이터를 샘플링할 타임스텝 간격. 한 시간에 하나의 데이터 포인트를 추출하기 위해 6으로 지정하겠습니다." ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [], "source": [ "def generator(data, lookback, delay, min_index, max_index,\n", " shuffle=False, batch_size=128, step=6):\n", " if max_index is None:\n", " max_index = len(data) - delay - 1\n", " i = min_index + lookback\n", " while 1:\n", " if shuffle:\n", " rows = np.random.randint(\n", " min_index + lookback, max_index, size=batch_size)\n", " else:\n", " if i + batch_size >= max_index:\n", " i = min_index + lookback\n", " rows = np.arange(i, min(i + batch_size, max_index))\n", " i += len(rows)\n", "\n", " samples = np.zeros((len(rows),\n", " lookback // step,\n", " data.shape[-1]))\n", " targets = np.zeros((len(rows),))\n", " for j, row in enumerate(rows):\n", " indices = range(rows[j] - lookback, rows[j], step)\n", " samples[j] = data[indices]\n", " targets[j] = data[rows[j] + delay][1]\n", " yield samples, targets" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이제 generator 함수를 사용해 훈련용, 검증용, 테스트용으로 세 개의 제너레이터를 만들어 보죠. 각 제너레이터는 원본 데이터에서 다른 시간대를 사용합니다. 훈련 제너레이터는 처음 200,000개 타임스텝을 사용하고 검증 제너레이터는 그 다음 100,000개를 사용하고 테스트 제너레이터는 나머지를 사용합니다." ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [], "source": [ "lookback = 1440\n", "step = 6\n", "delay = 144\n", "batch_size = 128\n", "\n", "train_gen = generator(float_data,\n", " lookback=lookback,\n", " delay=delay,\n", " min_index=0,\n", " max_index=200000,\n", " shuffle=True,\n", " step=step, \n", " batch_size=batch_size)\n", "val_gen = generator(float_data,\n", " lookback=lookback,\n", " delay=delay,\n", " min_index=200001,\n", " max_index=300000,\n", " step=step,\n", " batch_size=batch_size)\n", "test_gen = generator(float_data,\n", " lookback=lookback,\n", " delay=delay,\n", " min_index=300001,\n", " max_index=None,\n", " step=step,\n", " batch_size=batch_size)\n", "\n", "# 전체 검증 세트를 순회하기 위해 val_gen에서 추출할 횟수\n", "val_steps = (300000 - 200001 - lookback) // batch_size\n", "\n", "# 전체 테스트 세트를 순회하기 위해 test_gen에서 추출할 횟수\n", "test_steps = (len(float_data) - 300001 - lookback) // batch_size" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 상식 수준의 기준점\n", "\n", "블랙 박스 같은 딥러닝 모델을 사용해 온도 예측 문제를 풀기 전에 간단한 상식 수준의 해법을 시도해 보겠습니다. 이는 정상 여부 확인을 위한 용도이고 고수준 머신 러닝 모델이라면 뛰어 넘어야 할 기준점을 만듭니다. 이런 상식 수준의 해법은 알려진 해결책이 없는 새로운 문제를 다루어야 할 때 유용합니다. 일부 클래스가 월등히 많아 불균형한 분류 문제가 고전적인 예입니다. 데이터셋에 클래스 A의 샘플이 90%, 클래스 B의 샘플이 10%가 있다면, 이 분류 문제에 대한 상식 수준의 접근법은 새로운 샘플을 항상 클래스 'A'라고 예측하는 것입니다. 이 분류기는 전반적으로 90%의 정확도를 낼 것입니다. 머신 러닝 기반의 모델이라면 90% 이상을 달성해야 유용하다고 볼 수 있습니다. 이따금 이런 기본적인 기준점을 넘어서기가 아주 어려운 경우가 있습니다.\n", "\n", "이 경우 온도 시계열 데이터는 연속성이 있고 일자별로 주기성을 가진다고 가정할 수 있습니다(오늘 온도는 내일 온도와 비슷할 가능성이 높습니다). 그렇기 때문에 상식 수준의 해결책은 지금으로부터 24시간 후의 온도는 지금과 동일하다고 예측하는 것입니다. 이 방법을 평균 절댓값 오차(MAE)로 평가해 보겠습니다:" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "```python\n", "np.mean(np.abs(preds - targets))\n", "```" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "다음은 평가를 위한 반복 루프입니다:" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0.2897359729905486\n" ] } ], "source": [ "def evaluate_naive_method():\n", " batch_maes = []\n", " for step in range(val_steps):\n", " samples, targets = next(val_gen)\n", " preds = samples[:, -1, 1]\n", " mae = np.mean(np.abs(preds - targets))\n", " batch_maes.append(mae)\n", " print(np.mean(batch_maes))\n", " \n", "evaluate_naive_method()" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "2.5672247338393395" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "0.29 * std[1]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "출력된 MAE는 0.29입니다. 이 온도 데이터는 평균이 0이고 표준 편차가 1이므로 결괏값이 바로 와 닿지는 않습니다. 평균 절댓값 오차 0.29에 표준 편차를 곱하면 섭씨 2.57°C가 됩니다. 평균 절댓값 오차가 상당히 크네요. 이제 딥러닝 모델이 더 나은지 시도해 봅시다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 기본적인 머신 러닝 방법\n", "\n", "머신 러닝 모델을 시도하기 전에 상식 수준의 기준점을 세워 놓았습니다. 비슷하게 RNN처럼 복잡하고 연산 비용이 많이 드는 모델을 시도하기 전에 간단하고 손쉽게 만들 수 있는 머신 러닝 모델(예를 들면 소규모의 완전 연결 네트워크)을 먼저 만드는 것이 좋습니다. 이를 바탕으로 더 복잡한 방법을 도입하는 근거가 마련되고 실제적인 이득도 얻게 될 것입니다.\n", "\n", "다음 코드는 데이터를 펼쳐서 두 개의 `Dense` 층을 통과시키는 완전 연결 네트워크를 보여줍니다. 전형적인 회귀 문제이므로 마지막 `Dense` 층에 활성화 함수를 두지 않았습니다. 손실 함수는 MAE입니다. 상식 수준의 방법에서 사용한 것과 동일한 데이터와 지표를 사용했으므로 결과를 바로 비교해볼 수 있습니다." ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/20\n", "500/500 [==============================] - 7s 14ms/step - loss: 1.5177 - val_loss: 0.7086\n", "Epoch 2/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.4895 - val_loss: 0.4523\n", "Epoch 3/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.3034 - val_loss: 0.3101\n", "Epoch 4/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2717 - val_loss: 0.3208\n", "Epoch 5/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2583 - val_loss: 0.3127\n", "Epoch 6/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2476 - val_loss: 0.3118\n", "Epoch 7/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2404 - val_loss: 0.3217\n", "Epoch 8/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2357 - val_loss: 0.3160\n", "Epoch 9/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2285 - val_loss: 0.3320\n", "Epoch 10/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2263 - val_loss: 0.3452\n", "Epoch 11/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2216 - val_loss: 0.3388\n", "Epoch 12/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2189 - val_loss: 0.3429\n", "Epoch 13/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2148 - val_loss: 0.3640\n", "Epoch 14/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2122 - val_loss: 0.3490\n", "Epoch 15/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2091 - val_loss: 0.3400\n", "Epoch 16/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2069 - val_loss: 0.3536\n", "Epoch 17/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2039 - val_loss: 0.3348\n", "Epoch 18/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2040 - val_loss: 0.3511\n", "Epoch 19/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.2008 - val_loss: 0.3419\n", "Epoch 20/20\n", "500/500 [==============================] - 6s 13ms/step - loss: 0.1991 - val_loss: 0.3359\n" ] } ], "source": [ "from keras.models import Sequential\n", "from keras import layers\n", "from keras.optimizers import RMSprop\n", "\n", "model = Sequential()\n", "model.add(layers.Flatten(input_shape=(lookback // step, float_data.shape[-1])))\n", "model.add(layers.Dense(32, activation='relu'))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen,\n", " steps_per_epoch=500,\n", " epochs=20,\n", " validation_data=val_gen,\n", " validation_steps=val_steps)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "훈련 손실과 검증 손실의 그래프를 그려 보죠:" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "import matplotlib.pyplot as plt\n", "\n", "loss = history.history['loss']\n", "val_loss = history.history['val_loss']\n", "\n", "epochs = range(1, len(loss) + 1)\n", "\n", "plt.figure()\n", "\n", "plt.plot(epochs, loss, 'bo', label='Training loss')\n", "plt.plot(epochs, val_loss, 'b', label='Validation loss')\n", "plt.title('Training and validation loss')\n", "plt.legend()\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "일부 검증 손실은 학습을 사용하지 않은 기준점에 가깝지만 안정적이지 못합니다. 앞서 기준 모델을 만든 것이 도움이 됩니다. 이 문제는 기준 모델의 성능을 앞지르기가 쉽지 않습니다. 우리가 적용한 상식에는 머신 러닝 모델이 찾지 못한 핵심 정보가 많이 포함되어 있습니다.\n", "\n", "간단하고 괜찮은 성능을 내는 모델(상식 수준의 기준 모델)이 데이터와 타깃을 매핑할 수 있다면 왜 훈련한 모델은 이를 찾지 못하고 성능이 낮을까요? 훈련 과정이 찾는 것은 간단한 이 모델이 아니기 때문입니다. 문제 해결을 위해 탐색하는 모델의 공간, 즉 가설 공간은 우리가 매개변수로 설정한 두 개 층을 가진 네트워크의 모든 가능한 가중치의 조합입니다. 이 네트워크는 이미 매우 복잡합니다. 복잡한 모델 공간에서 해결책을 탐색할 때 간단하고 괜찮은 성능을 내는 모델은 찾지 못할 수 있습니다. 심지어 기술적으로 봤을 때 이 가설 공간에 포함되어 있을 때 조차도 말이죠. 이것이 일반적으로 머신 러닝이 가진 심각한 제약 사항입니다. 학습 알고리즘이 특정한 종류의 간단한 모델을 찾도록 하드코딩되지 않았다면, 모델 파라미터를 학습하는 방법은 간단한 문제를 위한 간단한 해결책을 찾지 못할 수 있습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 첫 번째 순환 신경망\n", "\n", "첫 번째 완전 연결 네트워크는 잘 작동하지 않았습니다. 그렇다고 이 문제에 머신 러닝이 적합하지 않다는 뜻은 아닙니다. 앞선 모델은 시계열 데이터를 펼쳤기 때문에 입력 데이터에서 시간 개념을 잃어버렸습니다. 대신 인과 관계와 순서가 의미가 있는 시퀀스 데이터 그대로 사용해 보겠습니다. 이런 시퀀스 데이터에 아주 잘 들어맞는 순환 시퀀스 처리 모델을 시도해 보겠습니다. 이 모델은 앞선 모델과 달리 데이터 포인터의 시간 순서를 사용합니다.\n", "\n", "이전 절에서 소개한 `LSTM` 층 대신에 2014년에 정준영 등이 개발한 `GRU` 층을 사용하겠습니다. GRU 층은 LSTM과 같은 원리로 작동하지만 조금 더 간결하고 그래서 계산 비용이 덜 듭니다(LSTM 만큼 표현 학습 능력이 높지는 않을 수 있습니다). 계산 비용과 표현 학습 능력 사이의 트레이드오프(trade-off)는 머신 러닝 어디에서나 등장합니다." ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/20\n", "500/500 [==============================] - 109s 219ms/step - loss: 0.3072 - val_loss: 0.2738\n", "Epoch 2/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2878 - val_loss: 0.2662\n", "Epoch 3/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2810 - val_loss: 0.2681\n", "Epoch 4/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2762 - val_loss: 0.2658\n", "Epoch 5/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2709 - val_loss: 0.2635\n", "Epoch 6/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2667 - val_loss: 0.2639\n", "Epoch 7/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2602 - val_loss: 0.2644\n", "Epoch 8/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2570 - val_loss: 0.2690\n", "Epoch 9/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2515 - val_loss: 0.2736\n", "Epoch 10/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2486 - val_loss: 0.2758\n", "Epoch 11/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2431 - val_loss: 0.2727\n", "Epoch 12/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2395 - val_loss: 0.2744\n", "Epoch 13/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2358 - val_loss: 0.2775\n", "Epoch 14/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2322 - val_loss: 0.2841\n", "Epoch 15/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2281 - val_loss: 0.2844\n", "Epoch 16/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2253 - val_loss: 0.2841\n", "Epoch 17/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2227 - val_loss: 0.2905\n", "Epoch 18/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2181 - val_loss: 0.2945\n", "Epoch 19/20\n", "500/500 [==============================] - 109s 217ms/step - loss: 0.2145 - val_loss: 0.2959\n", "Epoch 20/20\n", "500/500 [==============================] - 109s 218ms/step - loss: 0.2114 - val_loss: 0.2976\n" ] } ], "source": [ "from keras.models import Sequential\n", "from keras import layers\n", "from keras.optimizers import RMSprop\n", "\n", "model = Sequential()\n", "model.add(layers.GRU(32, input_shape=(None, float_data.shape[-1])))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen,\n", " steps_per_epoch=500,\n", " epochs=20,\n", " validation_data=val_gen,\n", " validation_steps=val_steps)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "결과를 확인해 보죠:" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX0AAAEICAYAAACzliQjAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4wLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvqOYd8AAAIABJREFUeJzt3XmcVOWV//HPYRNZBATiArIZY1iFtkM0oqASB1SWKEYR4hIdgtFEB83ICEmUxN+omGhwGBUdjEYiMTomaFR0gBEdBW0Qm00ECWgLgRZlR6Dh/P54bkPRVHdX0921ft+vV7266t6nbp263X3qqeee+1xzd0REJDfUSXUAIiKSPEr6IiI5RElfRCSHKOmLiOQQJX0RkRyipC8ikkOU9KVKzKyumW03s3Y12TaVzOzrZlbjtctm1t/M1sQ8XmFmZyfS9ghe63Ezu+NIn1/Bdn9tZr+v6e1K6tRLdQBSu8xse8zDRsBuYF/0+EfuPq0q23P3fUCTmm6bC9z91JrYjpldD4x0934x276+JrYt2U9JP8u5+4GkG/Ukr3f3/ymvvZnVc/eSZMQmIsmn4Z0cF319/5OZPWNm24CRZnammc0zs81mtt7MJplZ/ah9PTNzM+sQPX46Wv+KmW0zs3fMrGNV20brB5rZR2a2xcweMrP/M7Nryok7kRh/ZGarzOxLM5sU89y6ZvaAmW0ys4+BARXsn/FmNr3Msslm9tvo/vVmtjx6Px9HvfDytlVkZv2i+43M7A9RbEuB0+O87upou0vNbHC0vDvwH8DZ0dDZ5zH79s6Y54+O3vsmM/uLmZ2QyL6pjJkNjeLZbGazzezUmHV3mNk6M9tqZh/GvNczzGxhtHyDmU1M9PWkFri7bjlyA9YA/css+zWwBxhE6AQcDXwL+Dbhm2An4CPgpqh9PcCBDtHjp4HPgXygPvAn4OkjaPs1YBswJFo3BtgLXFPOe0kkxr8CzYAOwBel7x24CVgKtAVaAnPDv0Lc1+kEbAcax2x7I5AfPR4UtTHgPGAX0CNa1x9YE7OtIqBfdP9+4H+BFkB7YFmZtt8HToh+J1dGMRwXrbse+N8ycT4N3BndvyCKsSfQEPhPYHYi+ybO+/818PvofucojvOi39Ed0X6vD3QF1gLHR207Ap2i++8Bw6P7TYFvp/p/IZdv6ukLwFvu/qK773f3Xe7+nrvPd/cSd18NTAH6VvD859y9wN33AtMIyaaqbS8GFrn7X6N1DxA+IOJKMMZ/d/ct7r6GkGBLX+v7wAPuXuTum4B7Knid1cASwocRwHeBze5eEK1/0d1XezAbmAXEPVhbxveBX7v7l+6+ltB7j33dZ919ffQ7+SPhAzs/ge0CjAAed/dF7v4VMBboa2ZtY9qUt28qcgUww91nR7+je4BjCB++JYQPmK7REOHfo30H4cP7FDNr6e7b3H1+gu9DaoGSvgB8GvvAzL5pZn8zs3+Y2VZgAtCqguf/I+b+Tio+eFte2xNj43B3J/SM40owxoRei9BDrcgfgeHR/SsJH1alcVxsZvPN7Asz20zoZVe0r0qdUFEMZnaNmX0QDaNsBr6Z4HYhvL8D23P3rcCXQJuYNlX5nZW33f2E31Ebd18B3Er4PWyMhguPj5peC3QBVpjZu2Z2YYLvQ2qBkr5A+Lof61FC7/br7n4M8AvC8EVtWk8YbgHAzIxDk1RZ1YlxPXBSzOPKSkr/BPSPespDCB8CmNnRwHPAvxOGXpoDryUYxz/Ki8HMOgEPAzcALaPtfhiz3crKS9cRhoxKt9eUMIz0WQJxVWW7dQi/s88A3P1pdz+LMLRTl7BfcPcV7n4FYQjvN8DzZtawmrHIEVLSl3iaAluAHWbWGfhREl7zJSDPzAaZWT3gZqB1LcX4LHCLmbUxs5bA7RU1dvcNwFvAE8AKd18ZrToKaAAUA/vM7GLg/CrEcIeZNbdwHsNNMeuaEBJ7MeHz73pCT7/UBqBt6YHrOJ4BrjOzHmZ2FCH5vunu5X5zqkLMg82sX/TaPyMch5lvZp3N7Nzo9XZFt32EN/ADM2sVfTPYEr23/dWMRY6Qkr7EcytwNeEf+lFCT7dWRYn1cuC3wCbgZOB9wnkFNR3jw4Sx98WEg4zPJfCcPxIOzP4xJubNwL8ALxAOhg4jfHgl4peEbxxrgFeAp2K2WwhMAt6N2nwTiB0Hfx1YCWwws9hhmtLnv0oYZnkhen47wjh/tbj7UsI+f5jwgTQAGByN7x8F3Ec4DvMPwjeL8dFTLwSWW6gOux+43N33VDceOTIWhk5F0ouZ1SUMJwxz9zdTHY9ItlBPX9KGmQ0ws2bREMHPCRUh76Y4LJGsoqQv6aQPsJowRDAAGOru5Q3viMgR0PCOiEgOUU9fRCSHpN2Ea61atfIOHTqkOgwRkYyyYMGCz929ojJnIA2TfocOHSgoKEh1GCIiGcXMKjuzHNDwjohITlHSFxHJIUr6IiI5RElfRCSHKOmLiOSQrEn606ZBhw5Qp074Oa1Kl/sWEckNaVeyeSSmTYNRo2DnzvB47drwGGBEtecWFBHJHlnR0x837mDCL7VzZ1guIiIHZUXS/+STqi0XEclVWZH025VzsbvylouI5KqsSPp33w2NGh26rFGjsFxERA7KiqQ/YgRMmQLt24NZ+Dllig7iioiUlRXVOxASvJK8iEjFsqKnLyIiiVHSFxHJIUr6IiI5RElfRCSHKOmLiOQQJX0RkRyipC8ikkMSSvpmNsDMVpjZKjMbG2f9aDNbbGaLzOwtM+sSs+7fouetMLN/qsngRUSkaipN+mZWF5gMDAS6AMNjk3rkj+7e3d17AvcBv42e2wW4AugKDAD+M9qeiIikQCI9/d7AKndf7e57gOnAkNgG7r415mFjwKP7Q4Dp7r7b3f8OrIq2JyIiKZDINAxtgE9jHhcB3y7byMxuBMYADYDzYp47r8xz28R57ihgFEA7TY0pIlJrEunpW5xlftgC98nufjJwOzC+is+d4u757p7funXrBEISEZEjkUjSLwJOinncFlhXQfvpwNAjfK6IiNSiRJL+e8ApZtbRzBoQDszOiG1gZqfEPLwIWBndnwFcYWZHmVlH4BTg3eqHLSIiR6LSMX13LzGzm4CZQF1gqrsvNbMJQIG7zwBuMrP+wF7gS+Dq6LlLzexZYBlQAtzo7vtq6b2IiGSczz6Dd96Bt9+Gxo3hV7+q3dcz98OG2FMqPz/fCwoKUh2GiEiN27sXFi06mOTfeefgtbwbNoRBg+DZZ49s22a2wN3zK2uXNRdRERFJNxs3hsRemuQLCmDXrrDupJPgO9+BMWPCz9NOgwYNaj8mJX0RkRqwbx8sWXKwB//22/Dxx2Fd/fqQlwejR8OZZ4Zb27apiVNJX0SkCtxh/XpYvPjQ27JlsHt3aHP88SGxlyb5008PwzfpQElfRKQcW7bA0qWHJvclS+CLLw62OfFE6N4dzj8fevUKSb5DB7B4ZymlASV9ERFCFc0bbxya4EsPsgI0bRqS+2WXQbdu4X63btCyZepiPhJK+iKS09atg7vvhsceC9U19evDN78JffocTO7du0O7dunbe68KJX0RyUkbN8I998DDD0NJCVx3HdxwA3TunJwqmlRR0heRnPLFFzBxIjz0UCifvOoq+PnPoVOnVEeWHEr6IpITtmyBBx4It23b4Ior4Je/hFNPTXVkyaWkLyJZbfv20KufOBG+/BIuuQTuuiuM1+ciJX0RyUq7doXx+nvugeJiuOgimDAhnCSVy3RhdBHJKrt3w+TJcPLJcOutYXqDd96Bl15Swgf19EUkS+zdC08+GWap/OQTOPtseOYZ6Ns31ZGlFyV9Ecl4a9fC0KFhBsveveHxx6F//+yoq69pSvoiktHefhu+970wrPPcc+FArZJ9+TSmLyIZ68kn4dxz4ZhjYN48uPRSJfzKKOlHpk0LkyTVqRN+TpuW6ohEpDz79sG//itcc02YLmH+/DB1glROwzuEBD9qFOzcGR6vXRseA4wYkbq4RORwW7eG/8uXXoIf/xgefDDMlyOJUU8fGDfuYMIvtXNnWC4i6WP16nCVqVdeCWWZkycr4VeVevocOn1qIstFJPneeCOM2e/fDzNnhvnrperU0ydMmVqV5SKSXKUlmK1ahfF7Jfwjp6RPmEu7UaNDlzVqFJaLSOqUlMAtt8A//3NI9PPmwSmnpDqqzKakTzgoNGUKtG8fyr3atw+PdRBXJHU2b4aLL4bf/Q5uvjkcuG3ePNVRZT6N6UdGjFCSF0kXK1fCoEHw8cehA/bP/5zqiLKHkr6IpJXZs2HYsHDOzP/8j+bOqWlK+iJSIXfYswd27Ahz01f00wyaNIHGjQ//GXu/vMsRPvww/OQn4USrGTNy52pWyaSkLyLs2QO/+EWYxyZeMi8pqdnXq1//8A8GMygoCPPe//GPYWoFqXlK+iI57ssvQ/37nDlw1llwwgnl99Yr++l++AdGIt8QSu/feSeMHw9166Z6r2QvJX2RHLZqVehZr1kDTz0FP/hB9bfZqlX1tyG1R0lfJEfNnRumJDYLB0zPPjvVEUkyqE6/hmiWTskkTz0VznBt3Tqc8KSEnzuU9GtA6Syda9eGMc3SWTqV+CXd7N8fxsyvvjok+nfega9/PdVRSTIllPTNbICZrTCzVWY2Ns76MWa2zMwKzWyWmbWPWXefmS01s+VmNsks+y5xoFk6JRPs2gXDh4fpRa6/Hl59FVq0SHVUkmyVJn0zqwtMBgYCXYDhZtalTLP3gXx37wE8B9wXPfc7wFlAD6Ab8C0g60610Cydku42bAhXmPrzn2HixHCWq6Ykzk2J9PR7A6vcfbW77wGmA0NiG7j7HHcv7evOA9qWrgIaAg2Ao4D6wIaaCDydaJZOSWeLF4eLhS9eDP/933DbbbqkYC5LJOm3AT6NeVwULSvPdcArAO7+DjAHWB/dZrr78rJPMLNRZlZgZgXFxcWJxp42NEunpKtXXw219yUl8OabMHRoqiOSVEsk6cfrE3jchmYjgXxgYvT460BnQs+/DXCemZ1z2Mbcp7h7vrvnt27dOtHY04Zm6ZR0NHlyqME/+eQwB31eXqojknSQSJ1+EXBSzOO2wLqyjcysPzAO6Ovuu6PF3wPmufv2qM0rwBnA3OoEnY40S6eki5ISGDMGHnoIBg8OVWRNmqQ6KkkXifT03wNOMbOOZtYAuAKYEdvAzHoBjwKD3X1jzKpPgL5mVs/M6hMO4h42vCMiNWPbNhgyJCT8MWPCGL4SvsSqtKfv7iVmdhMwE6gLTHX3pWY2AShw9xmE4ZwmwJ+jisxP3H0woZLnPGAxYUjoVXd/sXbeikhu++STcNGRZcvg0UfDuSIiZZl73OH5lMnPz/eCgoJUh5F006aFuv5PPglVP3ffreEiqZw7/N//wWOPhXLMBg3Cz+9+N9WRSbKZ2QJ3z6+snebeSQOlZ/SWnuBVekYvKPFLfJs2hakUHnsMli+Hpk3DWba33qozbKVimoYhDeiMXkmEe5j+ePhwOPHEMGbfvDlMnQrr14cLkCjhS2XU008DOqM3tTZtgtdeg1mzQrntddeFpJouNmyA3/8eHn88TIXcogWMHh2uG9utW6qjk0yjpJ8G2rULQzrxlkvN278/XKHplVfC7d13Qy+6eXPYvBnuuitUwNxwA5x3Xpg5NRUxvv56ON9jxoxQhnnOOfDLX4YLnhx9dPJjkuyg4Z00oDN6a19xMTz9dDhGctxx8O1vh+QOIZHOnw+ffx560rfeGuaa/+534dRT4f77w7pk+Owz+NWvwrVhBwwIcdx8cxi3f+MNGDlSCV+qR9U7aULVOzVr377Qg3/11dCbLygIvfnWrUMyHTgQLrgAWraM//zdu+H558M4+VtvwVFHwWWXhWGV73yn5uau2bo1fOC8/XZ4ndmzQy+/f/8wfDNkSHhtkcokWr2TNUnfHf7938N47HHH1UJgkvaKiw8O2bz2GnzxRRiaOeOMkOQHDAhTEVR1uGbJklD3/tRTIUl37x6S/8iRVbt4tzt8/HFI8KW3JUvCcrOw3YsuCn/DJ59ctRhFci7pr1gR/qFPOikckGtT0ZRwklW++ioMwfy//xfmjD/uuIO9+e9+F449tmZeZ8cOeOaZ0PtfuDBcCPzKK8PYf69eh7fftSt8wyhN8O+8Ez6YIHxYnHlm+Nbwne+EWTCr8gEiUlbOJX0IswheeGH4p589WwdCc8HLL8NPfxp60JdeCnfcAT171v7B14KCkPyfeSYk99694Uc/ClMelCb4hQvDAViAb3zjYII/80zo0iU1B4gle+Vk0odwvc8BA0IlxuzZ4YCYZJ/Vq+GWW+DFF8PB1oceSs1ZqJs3wx/+AI88EqY/gHCgtXfvgz35M84IxxJEalOiST/r+hpnnBGGd7ZtCyVuH32U6oiSI1cuzL5rF9x5Z+gpz54N994LhYWpm3ageXP4yU/C2Py8eeHg8ZYt8L//G44xDRqkhC/pJeuSPsDpp4czF/fsgb59D/bAslUuXJjdPdSrd+0aSi2HDoUPP4R//dcw30yqmYUy0G99S5chlPSWlUkfoEeP0NuCkPg/+CCl4dSqbJ/GYdWqUNUyZEgYOpk9G6ZPh7ZtK3+uiBwqa5M+hCGAuXOhYcNwUegFC1IdUe3I1mkcduyA8eND7/6tt+A3v4FFi8LvUkSOTFYnfYBTTgmJv1kzOP/8MO6abbLtwuzu4cSozp3DSWrf/34oyR0zRkMnItWV9UkfoGPHcAp7q1bhgN+bb6Y6opqVTdM4fPgh/NM/wbBh4SDp3LmhOuaEE1IdmUh2yImkD6HXO3duGAceMCBU+GSLbLgw+/btcPvt4VjM/Pnwu9+FOvezz051ZCLZJevq9CuzYUOY12TVKnjhhfABIKnjHk5w+tnPYN26cCGQe+/VVBoiVZWzdfqVOe64UM7ZuXOoBpkxo/LnVGTXrjB09KtfhZrsW28NVUN799ZIuFmtsBD69QvfSE44IZzJ+vvfK+GL1KacS/oQxvZnzQqn6196KTz3XOLP3bo1zNx4xx3Qp08Yd+7XL0zP+9FH8B//EapLvva1MC/LM8/Al1/W2lupMck8uevLL8MJTb16wdKlYTKz+fPDGawiUsvcPa1up59+uifLli3uZ53lXqeO+9NPx2+zcaP788+733KLe15eaAvu9eq5f/vb7j/7mfuLL7p/8UVov3VraH/NNe6tW4e2deu69+vn/pvfuH/0UdLeXsKeftq9UaMQa+mtUaPy98mRKilxnzLFvVWrsB9vvNF906aafQ2RXAUUeAI5NufG9Mvavj0My7zxBvzXf4Xx/rlzQ4XP3Lnh4hUQav3PPDMcWDznnDDdQ+PGFW+7dE73F18MtyVLwvJTTw2vOWhQmJulXoqvX9ahQ/wrd7VvD2vW1MxrzJ8PN90UJirr0yfMldOzZ81sW0RyeMK1I7FzZzit//XXDy475piQnM45JyT6/Pzqn+7/97/DSy+FD4DScf9jjw1TAA8aFA4qN2tWvdc4EnXqhP59WWbhgh7VsWED/Nu/wRNPhHH7iRPDsFdNXYRERAIl/Sr66it44IHQez/77FA6WLdu7b3e1q3hQh8vvgh/+1u4OHe9euFD5uKLw+2UU2rv9WPVRk9/7174z/+EX/wiHOy+5Rb4+c+hadPqRCoi5VHSzyD79oUzhV98MXwTWLo0LP/GNw5+APTpU3tno5ZO2BY7f0+jRkde6z9nTjhQu3RpuCThpElhSEtEao9KNjNI3bpw1llwzz1h3H/16jDm3alTqAY677xQcXT55eHs1Jq+SHdNnNz11Veheunyy0O8O3aE8yBefVUJXySdqKef5rZvD+WlL70Ubv/4R0jMZ5558FtAt27VHyN3D8MwmzeHksqq3r76KmynYcMwhv+zn4UZMUUkOTS8k4X274f33z/4AVC6m9q1C1MPX3QRtGgRjhds3RouJFN6P/ZW3vJ9+yp+/WbNwvZLb82bH/q49KB0+/a1vy9E5FBK+jlg/fpwjdiXXgqVRzt2lN+2ceNQkRTv1rTpwZ+xSTz21qxZ7R7YFpHqUdLPMbt3h2kM9uw5PKk3aaKELZLtEk36KT4tSGrKUUfp4iIiUjlV74iI5BAlfakRyZywTUSOXEJJ38wGmNkKM1tlZmPjrB9jZsvMrNDMZplZ+5h17czsNTNbHrXpUHPhSzooPblr7dpQ+rl2bXisxC+SfipN+mZWF5gMDAS6AMPNrEuZZu8D+e7eA3gOuC9m3VPARHfvDPQGNtZE4JI+xo079GxeCI/HjUtNPCJSvkR6+r2BVe6+2t33ANOBIbEN3H2Ou5f+288D2gJEHw713P31qN32mHaSJT75pGrLRSR1Ekn6bYBPYx4XRcvKcx3wSnT/G8BmM/tvM3vfzCZG3xwOYWajzKzAzAqKi4sTjV3SRLt2VVsuIqmTSNKPd4J/3OJ+MxsJ5AMTo0X1gLOB24BvAZ2Aaw7bmPsUd8939/zWrVsnEJKkk7vvDhO0xWrUKCwXkfSSSNIvAk6KedwWWFe2kZn1B8YBg919d8xz34+GhkqAvwB51QtZ0k1NTNgmIsmRSNJ/DzjFzDqaWQPgCuCQy4mbWS/gUULC31jmuS3MrLT7fh6wrPphS7oZMSLMvb9/f/hZ1YSvkk+R5Kj0jFx3LzGzm4CZQF1gqrsvNbMJhGsyziAM5zQB/mxhusdP3H2wu+8zs9uAWRZWLAAeq603I5mp7Hz+pSWfoG8LIjVNc+9IyiXjGr0i2U4XUZGMoZJPkeRR0peUU8mnSPIo6UvKqeRTJHmU9CXlVPIpkjyaT1/SwogRSvIiyaCevohIDlHSFxHJIUr6IiI5RElfsoKmcRBJjA7kSsbTNA4iiVNPXzKertwlkjglfcl4msZBJHFK+pLxNI2DSOKU9CXjaRoHkcQp6UvGq4lpHFT9I7lC1TuSFaozjYOqfySXqKcvOU/VP5JLlPQl56n6R3KJkr7kPFX/SC5R0pecp+ofySVK+pLzdBEXySWq3hFBF3GR3KGevohIDlHSFxHJIUr6IiI5RElfRCSHKOmL1ADN3SOZQtU7ItWkuXskk6inL1JNmrtHMomSvkg1ae4eySRK+iLVpLl7JJMo6YtUk+bukUySUNI3swFmtsLMVpnZ2Djrx5jZMjMrNLNZZta+zPpjzOwzM/uPmgpcJF1o7h7JJJUmfTOrC0wGBgJdgOFm1qVMs/eBfHfvATwH3Fdm/a+AN6ofrkh6GjEC1qyB/fvDz6omfJV8SrIk0tPvDaxy99XuvgeYDgyJbeDuc9y9tH5hHtC2dJ2ZnQ4cB7xWMyGLZJfSks+1a8H9YMmnEr/UhkSSfhvg05jHRdGy8lwHvAJgZnWA3wA/q+gFzGyUmRWYWUFxcXECIYlkD5V8SjIlkvQtzjKP29BsJJAPTIwW/Rh42d0/jdf+wMbcp7h7vrvnt27dOoGQRLKHSj4lmRI5I7cIOCnmcVtgXdlGZtYfGAf0dffd0eIzgbPN7MdAE6CBmW1398MOBovkqnbtwpBOvOUiNS2Rnv57wClm1tHMGgBXADNiG5hZL+BRYLC7byxd7u4j3L2du3cAbgOeUsIXOZRKPiWZKk367l4C3ATMBJYDz7r7UjObYGaDo2YTCT35P5vZIjObUc7mRKQMlXxKMpl73OH5lMnPz/eCgoJUhyEiklHMbIG751fWTmfkimQB1flLojS1skiG09TOUhXq6YtkONX5S1Uo6YtkONX5S1Uo6YtkOE3tLFWhpC+S4VTnL1WhpC+S4VTnL1WhpC+SBTS1syRKJZsiOU4ln7lFPX2RHKeSz9yipC+S41TymVuU9EVynEo+c4uSvkiOU8lnblHSF8lxKvnMLareERFGjFCSzxXq6YtItanOP3Oopy8i1aI6/8yinr6IVIvq/DOLkr6IVIvq/DOLkr6IVIvq/DOLkr6IVIvq/DOLkr6IVEtN1Pmr+id5VL0jItVWnTp/Vf8kl3r6IpJSqv5JLiV9EUkpVf8kV0YM7+zdu5eioiK++uqrVIciCWjYsCFt27alfv36qQ5FMkC7dmFIJ95yqXkZkfSLiopo2rQpHTp0wMxSHY5UwN3ZtGkTRUVFdOzYMdXhSAa4++5Dx/RB1T+1KSOGd7766itatmyphJ8BzIyWLVvqW5kkTNU/yZURPX1ACT+D6HclVaXqn+TJiJ6+iEh5VP1TNVmZ9Gv6q96mTZvo2bMnPXv25Pjjj6dNmzYHHu/ZsyehbVx77bWsWLGiwjaTJ09mWg19L+3Tpw+LFi2qkW2JpDNV/1RNxgzvJKo2vuq1bNnyQAK98847adKkCbfddtshbdwdd6dOnfifo0888USlr3PjjTceWYAiOUzVP1WTUE/fzAaY2QozW2VmY+OsH2Nmy8ys0MxmmVn7aHlPM3vHzJZG6y6v6TdQVjK/6q1atYpu3boxevRo8vLyWL9+PaNGjSI/P5+uXbsyYcKEA21Le94lJSU0b96csWPHctppp3HmmWeyceNGAMaPH8+DDz54oP3YsWPp3bs3p556Km+//TYAO3bs4NJLL+W0005j+PDh5OfnV9qjf/rpp+nevTvdunXjjjvuAKCkpIQf/OAHB5ZPmjQJgAceeIAuXbpw2mmnMXLkyBrfZyI1TXP/VE2lPX0zqwtMBr4LFAHvmdkMd18W0+x9IN/dd5rZDcB9wOXATuAqd19pZicCC8xsprtvrvF3Ekn2V71ly5bxxBNP8MgjjwBwzz33cOyxx1JSUsK5557LsGHD6NKlyyHP2bJlC3379uWee+5hzJgxTJ06lbFjD/ssxd159913mTFjBhMmTODVV1/loYce4vjjj+f555/ngw8+IC8vr8L4ioqKGD9+PAUFBTRr1oz+/fvz0ksv0bp1az7//HMWL14MwObN4Vdy3333sXbtWho0aHBgmUg6K/0GP25c+D9v1y4kfB3EjS+Rnn5vYJW7r3b3PcB0YEhsA3ef4+6l/et5QNto+UfuvjK6vw7YCLSuqeDjSfY0ryeffDLf+ta3Djx+5plnyMvLIy8vj+XLl7Ns2bLDnnP00UczcOBAAE4//XTWrFkTd9uXXHLJYW3eeustrrjiCgBOO+00unbtWmEVkkItAAANZUlEQVR88+fP57zzzqNVq1bUr1+fK6+8krlz5/L1r3+dFStWcPPNNzNz5kyaNWsGQNeuXRk5ciTTpk3TyVWSMUaMgDVrYP/+8FMJv3yJJP02wKcxj4uiZeW5Dnil7EIz6w00AD6Os26UmRWYWUFxcXECIZUv2V/1GjdufOD+ypUr+d3vfsfs2bMpLCxkwIABcevVGzRocOB+3bp1KSkpibvto4466rA27l6l+Mpr37JlSwoLC+nTpw+TJk3iRz/6EQAzZ85k9OjRvPvuu+Tn57Nv374qvZ6IpLdEkn68ouu4mcTMRgL5wMQyy08A/gBc6+77D9uY+xR3z3f3/Natq/dFoCZO9DhSW7dupWnTphxzzDGsX7+emTNn1vhr9OnTh2effRaAxYsXx/0mEeuMM85gzpw5bNq0iZKSEqZPn07fvn0pLi7G3bnsssu46667WLhwIfv27aOoqIjzzjuPiRMnUlxczM6yB0hEslAundyVSPVOEXBSzOO2wLqyjcysPzAO6Ovuu2OWHwP8DRjv7vOqF25iqnOiR3Xk5eXRpUsXunXrRqdOnTjrrLNq/DV+8pOfcNVVV9GjRw/y8vLo1q3bgaGZeNq2bcuECRPo168f7s6gQYO46KKLWLhwIddddx3ujplx7733UlJSwpVXXsm2bdvYv38/t99+O02bNq3x9yCSTnLt5C6rbLjAzOoBHwHnA58B7wFXuvvSmDa9gOeAAaVj+NHyBoShnhfd/cFEAsrPz/eCgoJDli1fvpzOnTsn9IayXUlJCSUlJTRs2JCVK1dywQUXsHLlSurVS6/qW/3OJFN06BC/5LN9+3B8IFOY2QJ3z6+sXaWZwt1LzOwmYCZQF5jq7kvNbAJQ4O4zCMM5TYA/R6fgf+Lug4HvA+cALc3smmiT17i7zho6Qtu3b+f888+npKQEd+fRRx9Nu4Qvkkly7eSuhLKFu78MvFxm2S9i7vcv53lPA09XJ0A5VPPmzVmwYEGqwxDJGrl2cldWTsMgIpKoXDu5S0lfRHJaKiv+UkGDwSKS81JV8ZcK6umLiFRTJtX5K+knoF+/foedaPXggw/y4x//uMLnNWnSBIB169YxbNiwcrddtkS1rAcffPCQk6QuvPDCGpkX58477+T++++v9nZEcllpnf/ateB+sM4/XRO/kn4Chg8fzvTp0w9ZNn36dIYPH57Q80888USee+65I379skn/5Zdfpnnz5ke8PRGpOZl2EZeMG9O/5Rao6WuD9OwJD1Zw6tiwYcMYP348u3fv5qijjmLNmjWsW7eOPn36sH37doYMGcKXX37J3r17+fWvf82QIYfMR8eaNWu4+OKLWbJkCbt27eLaa69l2bJldO7cmV27dh1od8MNN/Dee++xa9cuhg0bxl133cWkSZNYt24d5557Lq1atWLOnDl06NCBgoICWrVqxW9/+1umTp0KwPXXX88tt9zCmjVrGDhwIH369OHtt9+mTZs2/PWvf+Xoo48u9z0uWrSI0aNHs3PnTk4++WSmTp1KixYtmDRpEo888gj16tWjS5cuTJ8+nTfeeIObb74ZCJdGnDt3rs7clZyVaXX+6uknoGXLlvTu3ZtXX30VCL38yy+/HDOjYcOGvPDCCyxcuJA5c+Zw6623Vjgp2sMPP0yjRo0oLCxk3Lhxh9Tc33333RQUFFBYWMgbb7xBYWEhP/3pTznxxBOZM2cOc+bMOWRbCxYs4IknnmD+/PnMmzePxx57jPfffx8Ik7/deOONLF26lObNm/P8889X+B6vuuoq7r33XgoLC+nevTt33XUXEKaKfv/99yksLDwwffT999/P5MmTWbRoEW+++WaFHyYi2S7ZM/tWV8b19Cvqkdem0iGeIUOGMH369AO9a3fnjjvuYO7cudSpU4fPPvuMDRs2cPzxx8fdzty5c/npT38KQI8ePejRo8eBdc8++yxTpkyhpKSE9evXs2zZskPWl/XWW2/xve9978BMn5dccglvvvkmgwcPpmPHjvTs2ROoePpmCPP7b968mb59+wJw9dVXc9lllx2IccSIEQwdOpShQ4cCcNZZZzFmzBhGjBjBJZdcQtu2bRPZhSJZ6e67D527B9K7zl89/QQNHTqUWbNmsXDhQnbt2nXg4iXTpk2juLiYBQsWsGjRIo477ri40ynHiqaqOMTf//537r//fmbNmkVhYSEXXXRRpdup6BtF6bTMUPH0zZX529/+xo033siCBQs4/fTTKSkpYezYsTz++OPs2rWLM844gw8//PCIti2SDWqizj+Z1T9K+glq0qQJ/fr144c//OEhB3C3bNnC1772NerXr8+cOXNYG+987hjnnHPOgYufL1myhMLCQiBMy9y4cWOaNWvGhg0beOWVg5ckaNq0Kdu2bYu7rb/85S/s3LmTHTt28MILL3D22WdX+b01a9aMFi1a8OabbwLwhz/8gb59+7J//34+/fRTzj33XO677z42b97M9u3b+fjjj+nevTu33347+fn5SvqS86pzEZdkV/9k3PBOKg0fPpxLLrnkkEqeESNGMGjQIPLz8+nZsyff/OY3K9zGDTfcwLXXXkuPHj3o2bMnvXv3BsJVsHr16kXXrl0Pm5Z51KhRDBw4kBNOOOGQcf28vDyuueaaA9u4/vrr6dWrV4VDOeV58sknDxzI7dSpE0888QT79u1j5MiRbNmyBXfnX/7lX2jevDk///nPmTNnDnXr1qVLly4HrgImIlVXUfVPbZwwVunUysmmqZWzg35nIompUyf08MsyC98cEpXo1Moa3hERSaFkV/8o6YuIpFCyZ/nMmKSfbsNQUj79rkQSl+xZPjPiQG7Dhg3ZtGkTLVu2jFvuKOnD3dm0aRMNGzZMdSgiGSOZs3xmRNJv27YtRUVFFBcXpzoUSUDDhg11wpZImsqIpF+/fn06duyY6jBERDJexozpi4hI9Snpi4jkECV9EZEcknZn5JpZMVDxBDap1Qr4PNVBVEDxVY/iqx7FVz3Via+9u7eurFHaJf10Z2YFiZzqnCqKr3oUX/UovupJRnwa3hERySFK+iIiOURJv+qmpDqASii+6lF81aP4qqfW49OYvohIDlFPX0Qkhyjpi4jkECX9MszsJDObY2bLzWypmd0cp00/M9tiZoui2y9SEOcaM1scvX5BnPVmZpPMbJWZFZpZXhJjOzVm3ywys61mdkuZNkndh2Y21cw2mtmSmGXHmtnrZrYy+tminOdeHbVZaWZXJzG+iWb2YfT7e8HMmpfz3Ar/FmoxvjvN7LOY3+GF5Tx3gJmtiP4WxyYxvj/FxLbGzBaV89xk7L+4eSUlf4PurlvMDTgByIvuNwU+ArqUadMPeCnFca4BWlWw/kLgFcCAM4D5KYqzLvAPwokjKduHwDlAHrAkZtl9wNjo/ljg3jjPOxZYHf1sEd1vkaT4LgDqRffvjRdfIn8LtRjfncBtCfz+PwY6AQ2AD8r+P9VWfGXW/wb4RQr3X9y8koq/QfX0y3D39e6+MLq/DVgOtEltVEdkCPCUB/OA5mZ2QgriOB/42N1Tepa1u88FviizeAjwZHT/SWBonKf+E/C6u3/h7l8CrwMDkhGfu7/m7iXRw3lAyuarLmf/JaI3sMrdV7v7HmA6Yb/XqIris3ARju8Dz9T06yaqgryS9L9BJf0KmFkHoBcwP87qM83sAzN7xcy6JjWwwIHXzGyBmY2Ks74N8GnM4yJS8+F1BeX/s6V6Hx7n7ush/FMCX4vTJl324w8J39ziqexvoTbdFA0/TS1naCId9t/ZwAZ3X1nO+qTuvzJ5Jel/g0r65TCzJsDzwC3uvrXM6oWE4YrTgIeAvyQ7PuAsd88DBgI3mtk5ZdbHu8RYUutzzawBMBj4c5zV6bAPE5EO+3EcUAJMK6dJZX8LteVh4GSgJ7CeMIRSVsr3HzCcinv5Sdt/leSVcp8WZ9kR70Ml/TjMrD7hFzPN3f+77Hp33+ru26P7LwP1zaxVMmN093XRz43AC4Sv0bGKgJNiHrcF1iUnugMGAgvdfUPZFemwD4ENpUNe0c+NcdqkdD9GB+0uBkZ4NMBbVgJ/C7XC3Te4+z533w88Vs7rpnr/1QMuAf5UXptk7b9y8krS/waV9MuIxv/+C1ju7r8tp83xUTvMrDdhP25KYoyNzaxp6X3CAb8lZZrNAK6KqnjOALaUfo1MonJ7WKneh5EZQGklxNXAX+O0mQlcYGYtouGLC6Jltc7MBgC3A4PdfWc5bRL5W6it+GKPEX2vnNd9DzjFzDpG3/yuIOz3ZOkPfOjuRfFWJmv/VZBXkv83WJtHrDPxBvQhfHUqBBZFtwuB0cDoqM1NwFJCJcI84DtJjrFT9NofRHGMi5bHxmjAZELlxGIgP8kxNiIk8WYxy1K2DwkfPuuBvYSe03VAS2AWsDL6eWzUNh94POa5PwRWRbdrkxjfKsJYbunf4SNR2xOBlyv6W0hSfH+I/rYKCcnrhLLxRY8vJFSrfJzM+KLlvy/9m4tpm4r9V15eSfrfoKZhEBHJIRreERHJIUr6IiI5RElfRCSHKOmLiOQQJX0RkRyipC8ikkOU9EVEcsj/B+9M3ub4HHM+AAAAAElFTkSuQmCC\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "loss = history.history['loss']\n", "val_loss = history.history['val_loss']\n", "\n", "epochs = range(1, len(loss) + 1)\n", "\n", "plt.figure()\n", "\n", "plt.plot(epochs, loss, 'bo', label='Training loss')\n", "plt.plot(epochs, val_loss, 'b', label='Validation loss')\n", "plt.title('Training and validation loss')\n", "plt.legend()\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "훨씬 좋군요! 상식 수준의 모델을 크게 앞질렀습니다. 이 그림은 시퀀스를 펼쳐서 처리하는 완전 연결 네트워크에 비해서 순환 네트워크가 이런 종류의 작업에 훨씬 뛰어나다는 것과 머신 러닝의 가치를 보여줍니다.\n", "\n", "새로운 검증 MAE는 0.265 이하(크게 과대적합되기 시작하는 곳)이고 정규화되기 전인 섭씨로 복원하면 MAE는 2.35°C입니다. 초기 에러 2.57°C보다는 확실히 낫지만 더 개선할 수 있을 것 같습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 과대적합을 감소하기 위해 순환 드롭아웃 사용하기\n", "\n", "훈련 손실과 검증 손실 곡선을 보면 모델이 과대적합인지 알 수 있습니다. 몇 번의 에포크 이후에 훈련 손실과 검증 손실이 현저하게 벌어지기 시작합니다. 이런 현상을 해결하기 위해 잘 알려진 드롭아웃 기법을 이미 보았습니다. 훈련 데이터를 층에 주입할 때 데이터에 있는 우연한 상관 관계를 깨뜨리기 위해 입력 층의 유닛을 랜덤하게 끄는 기법입니다. 순환 신경망에 드롭아웃을 올바르게 적용하는 방법은 간단하지 않습니다. 순환 층 이전에 드롭아웃을 적용하면 규제에 도움이 되는 것보다 학습에 더 방해되는 것으로 오랫동안 알려졌습니다. 2015년 야린 갈이 베이지안 딥러닝에 관한 박사 논문에서 순환 네트워크에 적절하게 드롭아웃을 사용하는 방법을 알아 내었습니다. 타임스텝마다 랜덤하게 드롭아웃 마스크를 바꾸는 것이 아니라 동일한 드롭아웃 마스크(동일한 유닛의 드롭 패턴)를 모든 타임스텝에 적용해야 합니다. GRU이나 LSTM 같은 순환 게이트에 의해 만들어지는 표현을 규제하려면 순환 층 내부 계산에 사용된 활성화 함수에 타임스텝마다 동일한 드롭아웃 마스크를 적용해야 합니다(순환 드롭 아웃 마스크). 모든 타임스텝에 동일한 드롭아웃 마스크를 적용하면 네트워크가 학습 오차를 타임스템에 걸쳐 적절하게 전파시킬 것입니다. 타임스텝마다 랜덤한 드롭아웃 마스크를 적용하면 오차 신호가 전파되는 것을 방해하고 학습 과정에 해를 끼칩니다.\n", "\n", "야린 갈은 케라스를 사용해 연구를 하였고 케라스 순환 층에 이 기능을 구현하는 데 도움을 주었습니다. 케라스에 있는 모든 순환 층은 두 개의 드롭아웃 매개변수를 가지고 있습니다. `dropout`은 층의 입력에 대한 드롭아웃 비율을 정하는 부동 소수 값입니다. `recurrent_dropout`은 순환 상태의 드롭아웃 비율을 정합니다. GRU 층에 드롭아웃과 순환 드롭아웃을 적용해 과대적합에 어떤 영향을 미치는지 살펴보겠습니다. 드롭아웃으로 규제된 네트워크는 언제나 완전히 수렴하는 데 더 오래 걸립니다. 에포크를 두 배 더 늘려 네트워크를 훈련하겠습니다." ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/40\n", "500/500 [==============================] - 124s 248ms/step - loss: 0.3395 - val_loss: 0.2812\n", "Epoch 2/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.3138 - val_loss: 0.2721\n", "Epoch 3/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.3080 - val_loss: 0.2682\n", "Epoch 4/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.3045 - val_loss: 0.2670\n", "Epoch 5/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.3012 - val_loss: 0.2713\n", "Epoch 6/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.3007 - val_loss: 0.2689\n", "Epoch 7/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2968 - val_loss: 0.2657\n", "Epoch 8/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2953 - val_loss: 0.2677\n", "Epoch 9/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2909 - val_loss: 0.2628\n", "Epoch 10/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2918 - val_loss: 0.2626\n", "Epoch 11/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2885 - val_loss: 0.2714\n", "Epoch 12/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2882 - val_loss: 0.2623\n", "Epoch 13/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2874 - val_loss: 0.2679\n", "Epoch 14/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2872 - val_loss: 0.2615\n", "Epoch 15/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2853 - val_loss: 0.2636\n", "Epoch 16/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2845 - val_loss: 0.2660\n", "Epoch 17/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2840 - val_loss: 0.2667\n", "Epoch 18/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2825 - val_loss: 0.2617\n", "Epoch 19/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2809 - val_loss: 0.2633\n", "Epoch 20/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2808 - val_loss: 0.2666\n", "Epoch 21/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2793 - val_loss: 0.2652\n", "Epoch 22/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2788 - val_loss: 0.2660\n", "Epoch 23/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2770 - val_loss: 0.2661\n", "Epoch 24/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2768 - val_loss: 0.2635\n", "Epoch 25/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2769 - val_loss: 0.2649\n", "Epoch 26/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2772 - val_loss: 0.2647\n", "Epoch 27/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2753 - val_loss: 0.2647\n", "Epoch 28/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2755 - val_loss: 0.2648\n", "Epoch 29/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2733 - val_loss: 0.2642\n", "Epoch 30/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2743 - val_loss: 0.2656\n", "Epoch 31/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2734 - val_loss: 0.2666\n", "Epoch 32/40\n", "500/500 [==============================] - 123s 247ms/step - loss: 0.2720 - val_loss: 0.2674\n", "Epoch 33/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2722 - val_loss: 0.2670\n", "Epoch 34/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2742 - val_loss: 0.2648\n", "Epoch 35/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2711 - val_loss: 0.2656\n", "Epoch 36/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2689 - val_loss: 0.2613\n", "Epoch 37/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2712 - val_loss: 0.2678\n", "Epoch 38/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2703 - val_loss: 0.2667\n", "Epoch 39/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2696 - val_loss: 0.2691\n", "Epoch 40/40\n", "500/500 [==============================] - 124s 247ms/step - loss: 0.2689 - val_loss: 0.2658\n" ] } ], "source": [ "from keras.models import Sequential\n", "from keras import layers\n", "from keras.optimizers import RMSprop\n", "\n", "model = Sequential()\n", "model.add(layers.GRU(32,\n", " dropout=0.2,\n", " recurrent_dropout=0.2,\n", " input_shape=(None, float_data.shape[-1])))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen,\n", " steps_per_epoch=500,\n", " epochs=40,\n", " validation_data=val_gen,\n", " validation_steps=val_steps)" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "loss = history.history['loss']\n", "val_loss = history.history['val_loss']\n", "\n", "epochs = range(1, len(loss) + 1)\n", "\n", "plt.figure()\n", "\n", "plt.plot(epochs, loss, 'bo', label='Training loss')\n", "plt.plot(epochs, val_loss, 'b', label='Validation loss')\n", "plt.title('Training and validation loss')\n", "plt.legend()\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "성공이네요! 30번째 에포크까지 과대적합이 일어나지 않았습니다. 평가 점수는 안정적이지만 이전보다 더 나아지진 않았습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 스태킹 순환 층\n", "\n", "과대적합은 더 이상 없지만 성능상의 병목이 있는 것 같으므로 네트워크의 용량을 늘려야 합니다. 일반적인 머신 러닝 작업 흐름을 기억하세요. (드롭아웃 등을 사용하여 과대적합을 줄이는 기본 단계를 거쳤다고 가정하고) 과대적합이 일어날 때까지 네트워크의 용량을 늘리는 것이 좋습니다. 너무 많이 과대적합되지 않는 한 아직 충분한 용량에 도달한 것이 아닙니다.\n", "\n", "네트워크의 용량을 늘리려면 일반적으로 층에 있는 유닛의 수를 늘리거나 층을 더 많이 추가합니다. 순환 층 스태킹은 더 강력한 순환 네트워크를 만드는 고전적인 방법입니다. 예를 들어 구글 번역 알고리즘의 현재 성능은 7개의 대규모 LSTM 층을 쌓은 대규모 모델에서 나온 것입니다.\n", "\n", "케라스에서 순환 층을 차례대로 쌓으려면 모든 중간 층은 마지막 타임스텝 출력만이 아니고 전체 시퀀스(3D 텐서)를 출력해야 합니다. `return_sequences=True`로 지정하면 됩니다: " ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/40\n", "500/500 [==============================] - 250s 499ms/step - loss: 0.3360 - val_loss: 0.2779\n", "Epoch 2/40\n", "500/500 [==============================] - 248s 497ms/step - loss: 0.3140 - val_loss: 0.2765\n", "Epoch 3/40\n", "500/500 [==============================] - 248s 497ms/step - loss: 0.3067 - val_loss: 0.2697\n", "Epoch 4/40\n", "500/500 [==============================] - 248s 497ms/step - loss: 0.3032 - val_loss: 0.2728\n", "Epoch 5/40\n", "500/500 [==============================] - 248s 497ms/step - loss: 0.2981 - val_loss: 0.2650\n", "Epoch 6/40\n", "500/500 [==============================] - 248s 497ms/step - loss: 0.2964 - val_loss: 0.2705\n", "Epoch 7/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2911 - val_loss: 0.2655\n", "Epoch 8/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2896 - val_loss: 0.2690\n", "Epoch 9/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2866 - val_loss: 0.2664\n", "Epoch 10/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2850 - val_loss: 0.2669\n", "Epoch 11/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2827 - val_loss: 0.2700\n", "Epoch 12/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2803 - val_loss: 0.2678\n", "Epoch 13/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2803 - val_loss: 0.2651\n", "Epoch 14/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2789 - val_loss: 0.2651\n", "Epoch 15/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2782 - val_loss: 0.2730\n", "Epoch 16/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2757 - val_loss: 0.2692\n", "Epoch 17/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2749 - val_loss: 0.2660\n", "Epoch 18/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2739 - val_loss: 0.2608\n", "Epoch 19/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2731 - val_loss: 0.2681\n", "Epoch 20/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2710 - val_loss: 0.2643\n", "Epoch 21/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2701 - val_loss: 0.2699\n", "Epoch 22/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2707 - val_loss: 0.2651\n", "Epoch 23/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2692 - val_loss: 0.2672\n", "Epoch 24/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2684 - val_loss: 0.2654\n", "Epoch 25/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2662 - val_loss: 0.2689\n", "Epoch 26/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2650 - val_loss: 0.2734\n", "Epoch 27/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2646 - val_loss: 0.2661\n", "Epoch 28/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2642 - val_loss: 0.2642\n", "Epoch 29/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2628 - val_loss: 0.2667\n", "Epoch 30/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2621 - val_loss: 0.2818\n", "Epoch 31/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2625 - val_loss: 0.2683\n", "Epoch 32/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2615 - val_loss: 0.2690\n", "Epoch 33/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2601 - val_loss: 0.2710\n", "Epoch 34/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2605 - val_loss: 0.2693\n", "Epoch 35/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2577 - val_loss: 0.2735\n", "Epoch 36/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2577 - val_loss: 0.2720\n", "Epoch 37/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2580 - val_loss: 0.2706\n", "Epoch 38/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2575 - val_loss: 0.2720\n", "Epoch 39/40\n", "500/500 [==============================] - 249s 497ms/step - loss: 0.2556 - val_loss: 0.2730\n", "Epoch 40/40\n", "500/500 [==============================] - 249s 498ms/step - loss: 0.2560 - val_loss: 0.2739\n" ] } ], "source": [ "from keras.models import Sequential\n", "from keras import layers\n", "from keras.optimizers import RMSprop\n", "\n", "model = Sequential()\n", "model.add(layers.GRU(32,\n", " dropout=0.1,\n", " recurrent_dropout=0.5,\n", " return_sequences=True,\n", " input_shape=(None, float_data.shape[-1])))\n", "model.add(layers.GRU(64, activation='relu',\n", " dropout=0.1, \n", " recurrent_dropout=0.5))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen,\n", " steps_per_epoch=500,\n", " epochs=40,\n", " validation_data=val_gen,\n", " validation_steps=val_steps)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "결과를 확인해 보죠:" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "loss = history.history['loss']\n", "val_loss = history.history['val_loss']\n", "\n", "epochs = range(1, len(loss) + 1)\n", "\n", "plt.figure()\n", "\n", "plt.plot(epochs, loss, 'bo', label='Training loss')\n", "plt.plot(epochs, val_loss, 'b', label='Validation loss')\n", "plt.title('Training and validation loss')\n", "plt.legend()\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "층을 추가하여 성능을 조금 향상시켰지만 크지는 않습니다. 여기서 두 가지 결론을 얻을 수 있습니다:\n", "\n", "* 아직 충분히 과대적합을 만들지 못했기 때문에 검증 손실을 향상하기 위해서 층의 크기를 늘릴 수 있습니다. 하지만 적지 않은 계산 비용이 추가됩니다.\n", "* 층을 추가한 만큼 도움이 되지 않았으므로 여기서는 네트워크의 용량을 늘리는 것이 도움이 되지 않는다고 볼 수 있습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 양방향 RNN 사용하기\n", "\n", "이 절에서 소개할 마지막 기법은 양방향 RNN입니다. 양방향 RNN은 RNN의 한 변종이고 특정 작업에서 기본 RNN 보다 훨씬 좋은 성능을 냅니다. 자연어 처리에서는 맥가이버 칼이라고 할 정도로 즐겨 사용됩니다.\n", "\n", "RNN은 특히 순서 또는 시간에 민감합니다. 즉, 입력 시퀀스의 타입스텝 순서대로 처리합니다. 타입스텝을 섞거나 거꾸로 하면 RNN이 시퀀스에서 학습하는 표현을 완전히 바꾸어 버립니다. 이는 온도 예측과 같이 순서에 의미가 있는 문제에 잘 맞는 이유이기도 합니다. 양방향 RNN은 RNN이 순서에 민감하다는 성질을 사용합니다. 앞서 보았던 GRU나 LSTM 같은 RNN 두 개를 사용합니다. 각 RNN은 입력 시퀀스를 한 방향(시간의 순서나 반대 순서)으로 처리한 다음 각 표현을 합칩니다. 시퀀스를 양쪽 방향으로 처리하기 때문에 양방향 RNN은 단방향 RNN이 놓치기 쉬운 패턴을 감지할 수 있습니다.\n", "\n", "놀랍게도 이 절에 있는 RNN 층이 시간의 순서대로 (오래된 타임스텝이 먼저 나오도록) 시퀀스를 처리하는 것은 근거 없는 결정입니다. 적어도 이 결정을 궁금해하지 않았습니다. 시간의 반대 방향으로 (최근 타임스텝이 먼저 나오도록) 입력 시퀀스를 처리하면 만족할만한 RNN 성능을 낼 수 있을까요? 실제 이렇게 해 보고 결과가 어떤지 확인해 보죠. 해야 할 일은 입력 시퀀스를 시간 차원을 따라 거꾸로 생성하는 데이터 제너레이터 만드는 것 뿐입니다(제너레이터 함수의 마지막 줄을 `yield samples[:, ::-1, :], targets`로 바꿉니다). 이 절의 첫 번째 예제와 동일하게 하나의 GRU 층을 가진 네트워크를 훈련합니다:" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [], "source": [ "def reverse_order_generator(data, lookback, delay, min_index, max_index,\n", " shuffle=False, batch_size=128, step=6):\n", " if max_index is None:\n", " max_index = len(data) - delay - 1\n", " i = min_index + lookback\n", " while 1:\n", " if shuffle:\n", " rows = np.random.randint(\n", " min_index + lookback, max_index, size=batch_size)\n", " else:\n", " if i + batch_size >= max_index:\n", " i = min_index + lookback\n", " rows = np.arange(i, min(i + batch_size, max_index))\n", " i += len(rows)\n", "\n", " samples = np.zeros((len(rows),\n", " lookback // step,\n", " data.shape[-1]))\n", " targets = np.zeros((len(rows),))\n", " for j, row in enumerate(rows):\n", " indices = range(rows[j] - lookback, rows[j], step)\n", " samples[j] = data[indices]\n", " targets[j] = data[rows[j] + delay][1]\n", " yield samples[:, ::-1, :], targets\n", " \n", "train_gen_reverse = reverse_order_generator(\n", " float_data,\n", " lookback=lookback,\n", " delay=delay,\n", " min_index=0,\n", " max_index=200000,\n", " shuffle=True,\n", " step=step, \n", " batch_size=batch_size)\n", "val_gen_reverse = reverse_order_generator(\n", " float_data,\n", " lookback=lookback,\n", " delay=delay,\n", " min_index=200001,\n", " max_index=300000,\n", " step=step,\n", " batch_size=batch_size)" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/20\n", "500/500 [==============================] - 112s 224ms/step - loss: 0.4750 - val_loss: 0.4889\n", "Epoch 2/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.4524 - val_loss: 0.4769\n", "Epoch 3/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.4186 - val_loss: 0.4593\n", "Epoch 4/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.3778 - val_loss: 0.4280\n", "Epoch 5/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.3553 - val_loss: 0.4672\n", "Epoch 6/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.3386 - val_loss: 0.4349\n", "Epoch 7/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.3224 - val_loss: 0.4291\n", "Epoch 8/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.3109 - val_loss: 0.4187\n", "Epoch 9/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2995 - val_loss: 0.4242\n", "Epoch 10/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2899 - val_loss: 0.4294\n", "Epoch 11/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2809 - val_loss: 0.4371\n", "Epoch 12/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2734 - val_loss: 0.4408\n", "Epoch 13/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2665 - val_loss: 0.4509\n", "Epoch 14/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2598 - val_loss: 0.4555\n", "Epoch 15/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2554 - val_loss: 0.4587\n", "Epoch 16/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2503 - val_loss: 0.4498\n", "Epoch 17/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2465 - val_loss: 0.4415\n", "Epoch 18/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2408 - val_loss: 0.4556\n", "Epoch 19/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2374 - val_loss: 0.4519\n", "Epoch 20/20\n", "500/500 [==============================] - 111s 223ms/step - loss: 0.2341 - val_loss: 0.4727\n" ] } ], "source": [ "model = Sequential()\n", "model.add(layers.GRU(32, input_shape=(None, float_data.shape[-1])))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen_reverse,\n", " steps_per_epoch=500,\n", " epochs=20,\n", " validation_data=val_gen_reverse,\n", " validation_steps=val_steps)" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "loss = history.history['loss']\n", "val_loss = history.history['val_loss']\n", "\n", "epochs = range(1, len(loss) + 1)\n", "\n", "plt.figure()\n", "\n", "plt.plot(epochs, loss, 'bo', label='Training loss')\n", "plt.plot(epochs, val_loss, 'b', label='Validation loss')\n", "plt.title('Training and validation loss')\n", "plt.legend()\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "순서를 뒤집은 GRU는 상식 수준의 기준점보다도 성능이 낮습니다. 이 경우에는 시간 순서대로 처리하는 것이 중요한 역할을 합니다. 사실 이는 당연합니다. 기본적인 GRU 층은 먼 과거보다 최근 내용을 잘 기억합니다. 또한, 최근에 가까운 날씨 데이터 포인트일수록 오래된 데이터 포인트보다 예측에 유용합니다(상식 수준의 기준점이 꽤 강력한 이유입니다). 시간 순서대로 처리하는 네트워크가 거꾸로 처리하는 것보다 성능이 높아야만 합니다. 하지만 자연어 처리를 포함하여 다른 많은 문제에서는 그렇지 않습니다. 문장을 이해하는데 있어서 단어의 중요성은 단어가 문장 어디에 놓여 있는지에 따라 결정되지 않습니다. 같은 기법을 이전 절의 LSTM IMDB 예제에 적용해 보죠:" ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Train on 20000 samples, validate on 5000 samples\n", "Epoch 1/10\n", "20000/20000 [==============================] - 76s 4ms/step - loss: 0.4841 - acc: 0.7701 - val_loss: 0.3777 - val_acc: 0.8588\n", "Epoch 2/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.3136 - acc: 0.8791 - val_loss: 0.6957 - val_acc: 0.7904\n", "Epoch 3/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.2685 - acc: 0.9016 - val_loss: 0.3353 - val_acc: 0.8630\n", "Epoch 4/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.2195 - acc: 0.9195 - val_loss: 0.5092 - val_acc: 0.8182\n", "Epoch 5/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1973 - acc: 0.9317 - val_loss: 0.3785 - val_acc: 0.8692\n", "Epoch 6/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1733 - acc: 0.9383 - val_loss: 0.3698 - val_acc: 0.8780\n", "Epoch 7/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1595 - acc: 0.9451 - val_loss: 0.4101 - val_acc: 0.8754\n", "Epoch 8/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1450 - acc: 0.9508 - val_loss: 0.3898 - val_acc: 0.8564\n", "Epoch 9/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1362 - acc: 0.9556 - val_loss: 0.3874 - val_acc: 0.8628\n", "Epoch 10/10\n", "20000/20000 [==============================] - 75s 4ms/step - loss: 0.1230 - acc: 0.9575 - val_loss: 0.4713 - val_acc: 0.8704\n" ] } ], "source": [ "from keras.datasets import imdb\n", "from keras.preprocessing import sequence\n", "from keras import layers\n", "from keras.models import Sequential\n", "\n", "# 특성으로 사용할 단어의 수\n", "max_features = 10000\n", "# 사용할 텍스트의 길이(가장 빈번한 max_features 개의 단어만 사용합니다)\n", "maxlen = 500\n", "\n", "# 데이터 로드\n", "(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)\n", "\n", "# 시퀀스를 뒤집습니다\n", "x_train = [x[::-1] for x in x_train]\n", "x_test = [x[::-1] for x in x_test]\n", "\n", "# 시퀀스에 패딩을 추가합니다\n", "x_train = sequence.pad_sequences(x_train, maxlen=maxlen)\n", "x_test = sequence.pad_sequences(x_test, maxlen=maxlen)\n", "\n", "model = Sequential()\n", "model.add(layers.Embedding(max_features, 128))\n", "model.add(layers.LSTM(32))\n", "model.add(layers.Dense(1, activation='sigmoid'))\n", "\n", "model.compile(optimizer='rmsprop',\n", " loss='binary_crossentropy',\n", " metrics=['acc'])\n", "history = model.fit(x_train, y_train,\n", " epochs=10,\n", " batch_size=128,\n", " validation_split=0.2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "시간 순서로 훈련한 LSTM과 거의 동일한 성능을 얻을 수 있습니다. 놀랍게도 이런 텍스트 데이터셋에는 순서를 뒤집어 처리하는 것이 시간 순서대로 처리하는 것과 거의 동일하게 잘 작동합니다. 이는 언어를 이해하는 데 단어의 순서가 중요하지만 결정적이지는 않다는 가정을 뒷받침합니다. 거꾸로 된 시퀀스에서 훈련한 RNN은 원래 시퀀스에서 훈련한 것과는 다른 표현을 학습합니다. 이와 비슷하게 시작할 때 죽고 마지막 날 태어나는 삶처럼 실제 세상의 시간이 거꾸로 흘러간다면 우리의 정신 세계가 달라질 것입니다. 머신 러닝에서 다른 표현이 유용하다면 항상 사용할 가치가 있습니다. 이 표현이 많이 다를수록 더 좋습니다. 이 표현이 데이터를 바라보는 새로운 시각을 제공하고 다른 방식에서는 놓칠 수 있는 데이터의 특징을 잡아냅니다. 이런 표현은 작업의 성능을 올리는 데 도움을 줍니다. 이것이 다음 장에서 살펴볼 앙상블의 개념입니다.\n", "\n", "양방향 RNN은 이 아이디어를 사용하여 시간 순서대로 처리하는 RNN의 성능을 향상시킵니다. 입력 시퀀스를 양쪽 방향으로 바라보기 때문에, 드러나지 않은 다양한 표현을 얻어 시간 순서대로 처리할 때 놓칠 수 있는 패턴을 잡아 냅니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![bidirectional rnn](https://s3.amazonaws.com/book.keras.io/img/ch6/bidirectional_rnn.png)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "케라스에서는 `Bidirectional` 층을 사용하여 양방향 RNN을 만듭니다. 이 클래스는 첫 번째 매개변수로 순환 층의 객체를 전달받습니다. `Bidirectional` 클래스는 전달받은 순환 층으로 새로운 두 번째 객체를 만듭니다. 하나는 시간 순서대로 입력 시퀀스를 처리하고 다른 하나는 반대 순서로 입력 시퀀스를 처리합니다. IMDB 감성 분석 문제에 이를 적용해 보죠:" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [], "source": [ "from keras import backend as K\n", "K.clear_session()" ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Train on 20000 samples, validate on 5000 samples\n", "Epoch 1/10\n", "20000/20000 [==============================] - 137s 7ms/step - loss: 0.5601 - acc: 0.7167 - val_loss: 0.3782 - val_acc: 0.8538\n", "Epoch 2/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.3297 - acc: 0.8728 - val_loss: 0.4579 - val_acc: 0.8104\n", "Epoch 3/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.2649 - acc: 0.9032 - val_loss: 0.5085 - val_acc: 0.8412\n", "Epoch 4/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.2348 - acc: 0.9154 - val_loss: 0.3106 - val_acc: 0.8798\n", "Epoch 5/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.2058 - acc: 0.9269 - val_loss: 0.3287 - val_acc: 0.8838\n", "Epoch 6/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.1828 - acc: 0.9372 - val_loss: 0.3816 - val_acc: 0.8766\n", "Epoch 7/10\n", "20000/20000 [==============================] - 137s 7ms/step - loss: 0.1686 - acc: 0.9405 - val_loss: 0.3666 - val_acc: 0.8774\n", "Epoch 8/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.1593 - acc: 0.9461 - val_loss: 0.3750 - val_acc: 0.8418\n", "Epoch 9/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.1416 - acc: 0.9536 - val_loss: 0.3840 - val_acc: 0.8548\n", "Epoch 10/10\n", "20000/20000 [==============================] - 136s 7ms/step - loss: 0.1269 - acc: 0.9592 - val_loss: 0.3876 - val_acc: 0.8784\n" ] } ], "source": [ "model = Sequential()\n", "model.add(layers.Embedding(max_features, 32))\n", "model.add(layers.Bidirectional(layers.LSTM(32)))\n", "model.add(layers.Dense(1, activation='sigmoid'))\n", "\n", "model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])\n", "history = model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여기서 얻은 검증 정확도는 88% 정도로 이전 절에서 사용했던 일반 LSTM보다 조금 더 성능이 높습니다. 이 모델은 조금 더 일찍 과대적합되는 것 같습니다. 양방향 순환 층이 단방향 LSTM보다 모델 파라미터가 두 배 많기 때문에 놀라운 일은 아닙니다. 규제를 조금 추가한다면 양항뱡 순환 층을 사용하는 것이 이 작업에 더 적합해 보입니다.\n", "\n", "이제 동일한 방식을 온도 예측 문제에 적용해 보죠:" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Epoch 1/40\n", "500/500 [==============================] - 205s 411ms/step - loss: 0.2930 - val_loss: 0.2739\n", "Epoch 2/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.2743 - val_loss: 0.2716\n", "Epoch 3/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.2666 - val_loss: 0.2689\n", "Epoch 4/40\n", "500/500 [==============================] - 204s 409ms/step - loss: 0.2628 - val_loss: 0.2705\n", "Epoch 5/40\n", "500/500 [==============================] - 204s 409ms/step - loss: 0.2553 - val_loss: 0.2730\n", "Epoch 6/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2488 - val_loss: 0.2715\n", "Epoch 7/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.2448 - val_loss: 0.2799\n", "Epoch 8/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2399 - val_loss: 0.2820\n", "Epoch 9/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2334 - val_loss: 0.2822\n", "Epoch 10/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.2282 - val_loss: 0.2832\n", "Epoch 11/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.2226 - val_loss: 0.2878\n", "Epoch 12/40\n", "500/500 [==============================] - 204s 409ms/step - loss: 0.2163 - val_loss: 0.2893\n", "Epoch 13/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2099 - val_loss: 0.2917\n", "Epoch 14/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2065 - val_loss: 0.2999\n", "Epoch 15/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.2009 - val_loss: 0.3017\n", "Epoch 16/40\n", "500/500 [==============================] - 204s 409ms/step - loss: 0.1969 - val_loss: 0.3040\n", "Epoch 17/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1914 - val_loss: 0.3053\n", "Epoch 18/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1899 - val_loss: 0.3080\n", "Epoch 19/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.1850 - val_loss: 0.3129\n", "Epoch 20/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.1807 - val_loss: 0.3135\n", "Epoch 21/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1766 - val_loss: 0.3119\n", "Epoch 22/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1734 - val_loss: 0.3178\n", "Epoch 23/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1694 - val_loss: 0.3176\n", "Epoch 24/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1659 - val_loss: 0.3228\n", "Epoch 25/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1640 - val_loss: 0.3193\n", "Epoch 26/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1612 - val_loss: 0.3236\n", "Epoch 27/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.1587 - val_loss: 0.3241\n", "Epoch 28/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1548 - val_loss: 0.3214\n", "Epoch 29/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1533 - val_loss: 0.3263\n", "Epoch 30/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1523 - val_loss: 0.3303\n", "Epoch 31/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1501 - val_loss: 0.3229\n", "Epoch 32/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1482 - val_loss: 0.3286\n", "Epoch 33/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1451 - val_loss: 0.3310\n", "Epoch 34/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1445 - val_loss: 0.3332\n", "Epoch 35/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1429 - val_loss: 0.3343\n", "Epoch 36/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1422 - val_loss: 0.3372\n", "Epoch 37/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1407 - val_loss: 0.3314\n", "Epoch 38/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.1394 - val_loss: 0.3357\n", "Epoch 39/40\n", "500/500 [==============================] - 205s 410ms/step - loss: 0.1371 - val_loss: 0.3326\n", "Epoch 40/40\n", "500/500 [==============================] - 205s 409ms/step - loss: 0.1363 - val_loss: 0.3369\n" ] } ], "source": [ "from keras.models import Sequential\n", "from keras import layers\n", "from keras.optimizers import RMSprop\n", "\n", "model = Sequential()\n", "model.add(layers.Bidirectional(\n", " layers.GRU(32), input_shape=(None, float_data.shape[-1])))\n", "model.add(layers.Dense(1))\n", "\n", "model.compile(optimizer=RMSprop(), loss='mae')\n", "history = model.fit_generator(train_gen,\n", " steps_per_epoch=500,\n", " epochs=40,\n", " validation_data=val_gen,\n", " validation_steps=val_steps)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 네트워크는 일반 GRU 층과 비슷한 성능을 냅니다. 이유는 쉽게 이해할 수 있습니다. 모든 예측 성능은 시간 순서대로 처리하는 네트워크의 절반에서 옵니다. 시간 반대 순서로 처리하는 절반은 이런 작업에 성능이 매우 좋지 않기 때문입니다(최근의 정보가 오래 전의 정보보다 훨씬 더 중요합니다)." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 더 나아가서\n", "\n", "온도 예측 문제의 성능을 향상하기 위해 시도해 볼 수 있는 것들이 많이 있습니다.\n", "\n", "* 스태킹한 각 순환 층의 유닛 수를 조정합니다. 지금 설정은 대부분 임의로 한 것이라 최적화가 덜 되었을 것입니다.\n", "* `RMSprop` 옵티마이저가 사용한 학습률을 조정합니다.\n", "* `GRU` 대신 `LSTM` 층을 사용합니다.\n", "* 순환 층 위에 용량이 큰 완전 연결된 회귀 층을 사용합니다. 즉 유닛 수가 많은 `Dense` 층이나 `Dense` 층을 스태킹합니다.\n", "* 최종적으로 (검증 MAE 기준으로 봤을 때) 최선의 모델을 테스트 세트에서 확인해야 합니다. 이를 잊으면 검증 세트에 과대적합된 네트워크 구조를 만들게 될 것입니다.\n", "\n", "늘 그렇듯이 딥러닝은 과학보다는 예술에 가깝습니다. 어떤 문제에 적합하거나 그렇지 않은 가이드라인은 제시할 수 있지만 결국 모든 문제는 다릅니다. 경험을 바탕으로 다른 전략들을 시도해 봐야 합니다. 현재는 문제를 해결하는 최선의 방법을 미리 알 수 있는 이론이 없습니다. 반복해서 시도해야 합니다.\n", "\n", "## 요약\n", "\n", "다음은 이번 절에서 배운 것들입니다.\n", "\n", "* 4장에서 처음 배웠던 것처럼 새로운 문제를 해결할 때는 선택한 지표에서 상식 수준의 기준점을 설정하는 것이 좋습니다. 기준점을 가지고 있지 않으면 실제 향상이 되었는지 알 수 없습니다.\n", "* 계산 비용을 추가할지 판단하기 위해서 비용이 비싼 모델 전에 간단한 모델을 시도합니다.\n", "* 시간 순서가 중요한 데이터가 있다면 순환 층이 적합합니다. 시계열 데이터를 펼쳐서 처리하는 모델의 성능을 쉽게 앞지를 것입니다.\n", "* 순환 네트워크에 드롭아웃을 사용하려면 타임스텝 동안 일정한 드롭아웃 마스크와 순환 드롭아웃 마스크를 사용해야 합니다. 둘 다 케라스 순환 층에 포함되어 있습니다. 순환 층에 있는 `dropout`과 `recurrent_dropout` 매개변수를 사용하면 됩니다.\n", "* 스태킹 RNN은 단일 RNN 층보다 더 강력한 표현 능력을 제공합니다. 하지만 계산 비용이 많이 들기 때문에 항상 시도할 가치가 있지는 않습니다. (기계 번역 같은) 복잡한 문제에서 확실히 도움이 되지만 작고 간단한 문제에서는 항상 그렇지 않습니다.\n", "* 양쪽 방향으로 시퀀스를 바라보는 양방향 RNN은 자연어 처리 문제에 유용합니다. 하지만 최근의 정보가 오래된 것보다 훨씬 의미 있는 시퀀스 데이터에는 잘 작동하지 않습니다.\n", "\n", "여기서 자세히 다루지 않은 두 가지 중요한 개념이 있습니다. 순환 어텐션과 시퀀스 마스킹입니다. 둘 다 자연어 처리에 깊게 관련되어 있고 온도 예측 문제에는 적합하지 않습니다. 이 책을 끝내고 앞으로 공부할 목록으로 남겨 두겠습니다." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.6" } }, "nbformat": 4, "nbformat_minor": 2 }