{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "**도구 - 넘파이(NumPy)**\n", "\n", "*넘파이(NumPy)는 파이썬의 과학 컴퓨팅을 위한 기본 라이브러리입니다. 넘파이의 핵심은 강력한 N-차원 배열 객체입니다. 또한 선형 대수, 푸리에(Fourier) 변환, 유사 난수 생성과 같은 유용한 함수들도 제공합니다.\"\n", "\n", "# 배열 생성\n", "\n", "먼저 파이썬 2와 3에 모두 호환되도록 필요한 모듈을 임포트합니다:" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "from __future__ import division, print_function, unicode_literals" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`numpy`를 임포트해 보죠. 대부분의 사람들이 `np`로 알리아싱하여 임포트합니다:" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "import numpy as np" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.zeros`" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`zeros` 함수는 0으로 채워진 배열을 만듭니다:" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([0., 0., 0., 0., 0.])" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.zeros(5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "2D 배열(즉, 행렬)을 만들려면 원하는 행과 열의 크기를 튜플로 전달합니다. 예를 들어 다음은 $3 \\times 4$ 크기의 행렬입니다:" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0., 0., 0., 0.],\n", " [0., 0., 0., 0.],\n", " [0., 0., 0., 0.]])" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.zeros((3,4))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 용어\n", "\n", "* 넘파이에서 각 차원을 **축**(axis) 이라고 합니다\n", "* 축의 개수를 **랭크**(rank) 라고 합니다.\n", " * 예를 들어, 위의 $3 \\times 4$ 행렬은 랭크 2인 배열입니다(즉 2차원입니다).\n", " * 첫 번째 축의 길이는 3이고 두 번째 축의 길이는 4입니다.\n", "* 배열의 축 길이를 배열의 **크기**(shape)라고 합니다.\n", " * 예를 들어, 위 행렬의 크기는 `(3, 4)`입니다.\n", " * 랭크는 크기의 길이와 같습니다.\n", "* 배열의 **사이즈**(size)는 전체 원소의 개수입니다. 축의 길이를 모두 곱해서 구할 수 있습니다(가령, $3 \\times 4=12$)." ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0., 0., 0., 0.],\n", " [0., 0., 0., 0.],\n", " [0., 0., 0., 0.]])" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a = np.zeros((3,4))\n", "a" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(3, 4)" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a.shape" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "2" ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a.ndim # len(a.shape)와 같습니다" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "12" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a.size" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## N-차원 배열\n", "임의의 랭크 수를 가진 N-차원 배열을 만들 수 있습니다. 예를 들어, 다음은 크기가 `(2,3,4)`인 3D 배열(랭크=3)입니다:" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[0., 0., 0., 0.],\n", " [0., 0., 0., 0.],\n", " [0., 0., 0., 0.]],\n", "\n", " [[0., 0., 0., 0.],\n", " [0., 0., 0., 0.],\n", " [0., 0., 0., 0.]]])" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.zeros((2,3,4))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 배열 타입\n", "넘파이 배열의 타입은 `ndarray`입니다:" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "numpy.ndarray" ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(np.zeros((3,4)))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.ones`\n", "`ndarray`를 만들 수 있는 넘파이 함수가 많습니다.\n", "\n", "다음은 1로 채워진 $3 \\times 4$ 크기의 행렬입니다:" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [1., 1., 1., 1.]])" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.ones((3,4))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.full`\n", "주어진 값으로 지정된 크기의 배열을 초기화합니다. 다음은 `π`로 채워진 $3 \\times 4$ 크기의 행렬입니다." ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[3.14159265, 3.14159265, 3.14159265, 3.14159265],\n", " [3.14159265, 3.14159265, 3.14159265, 3.14159265],\n", " [3.14159265, 3.14159265, 3.14159265, 3.14159265]])" ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.full((3,4), np.pi)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.empty`\n", "초기화되지 않은 $2 \\times 3$ 크기의 배열을 만듭니다(배열의 내용은 예측이 불가능하며 메모리 상황에 따라 달라집니다):" ] }, { "cell_type": "code", "execution_count": 13, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([[1.16318369e-028, 5.30276956e+180, 5.05117710e-038],\n", " [4.57045791e-071, 4.46470455e-086, 3.36009604e-143]])" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.empty((2,3))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## np.array\n", "`array` 함수는 파이썬 리스트를 사용하여 `ndarray`를 초기화합니다:" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1, 2, 3, 4],\n", " [10, 20, 30, 40]])" ] }, "execution_count": 14, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.array([[1,2,3,4], [10, 20, 30, 40]])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.arange`\n", "파이썬의 기본 `range` 함수와 비슷한 넘파이 `range` 함수를 사용하여 `ndarray`를 만들 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 15, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([1, 2, 3, 4])" ] }, "execution_count": 15, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(1, 5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "부동 소수도 가능합니다:" ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1., 2., 3., 4.])" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(1.0, 5.0)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "파이썬의 기본 `range` 함수처럼 건너 뛰는 정도를 지정할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5])" ] }, "execution_count": 17, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.arange(1, 5, 0.5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "부동 소수를 사용하면 원소의 개수가 일정하지 않을 수 있습니다. 예를 들면 다음과 같습니다:" ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[0. 0.33333333 0.66666667 1. 1.33333333 1.66666667]\n", "[0. 0.33333333 0.66666667 1. 1.33333333 1.66666667]\n", "[0. 0.33333333 0.66666667 1. 1.33333334]\n" ] } ], "source": [ "print(np.arange(0, 5/3, 1/3)) # 부동 소수 오차 때문에, 최댓값은 4/3 또는 5/3이 됩니다.\n", "print(np.arange(0, 5/3, 0.333333333))\n", "print(np.arange(0, 5/3, 0.333333334))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.linspace`\n", "이런 이유로 부동 소수를 사용할 땐 `arange` 대신에 `linspace` 함수를 사용하는 것이 좋습니다. `linspace` 함수는 지정된 개수만큼 두 값 사이를 나눈 배열을 반환합니다(`arange`와는 다르게 최댓값이 **포함**됩니다):" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[0. 0.33333333 0.66666667 1. 1.33333333 1.66666667]\n" ] } ], "source": [ "print(np.linspace(0, 5/3, 6))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.rand`와 `np.randn`\n", "넘파이의 `random` 모듈에는 `ndarray`를 랜덤한 값으로 초기화할 수 있는 함수들이 많이 있습니다.\n", "예를 들어, 다음은 (균등 분포인) 0과 1사이의 랜덤한 부동 소수로 $3 \\times 4$ 행렬을 초기화합니다:" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0.26272018, 0.93881917, 0.93207489, 0.01658648],\n", " [0.02431461, 0.62299001, 0.71867234, 0.85509338],\n", " [0.27360841, 0.95553865, 0.41186574, 0.30810366]])" ] }, "execution_count": 20, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.rand(3,4)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "다음은 평균이 0이고 분산이 1인 일변량 [정규 분포](https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%EB%B6%84%ED%8F%AC)(가우시안 분포)에서 샘플링한 랜덤한 부동 소수를 담은 $3 \\times 4$ 행렬입니다:" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-0.32054258, -1.93692499, 0.21501349, 1.11438429],\n", " [ 0.70528145, -0.09409769, -1.02990618, 0.43173201],\n", " [-1.03069971, -0.09908788, 1.16040291, -0.08943257]])" ] }, "execution_count": 21, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.random.randn(3,4)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 분포의 모양을 알려면 맷플롯립을 사용해 그려보는 것이 좋습니다(더 자세한 것은 [맷플롯립 튜토리얼](tools_matplotlib.ipynb)을 참고하세요):" ] }, { "cell_type": "code", "execution_count": 22, "metadata": { "scrolled": false }, "outputs": [], "source": [ "%matplotlib inline\n", "import matplotlib.pyplot as plt" ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/matplotlib/axes/_axes.py:6571: UserWarning: The 'normed' kwarg is deprecated, and has been replaced by the 'density' kwarg.\n", " warnings.warn(\"The 'normed' kwarg is deprecated, and has been \"\n" ] }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "plt.hist(np.random.rand(100000), normed=True, bins=100, histtype=\"step\", color=\"blue\", label=\"rand\")\n", "plt.hist(np.random.randn(100000), normed=True, bins=100, histtype=\"step\", color=\"red\", label=\"randn\")\n", "plt.axis([-2.5, 2.5, 0, 1.1])\n", "plt.legend(loc = \"upper left\")\n", "plt.title(\"Random distributions\")\n", "plt.xlabel(\"Value\")\n", "plt.ylabel(\"Density\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## np.fromfunction\n", "함수를 사용하여 `ndarray`를 초기화할 수도 있습니다:" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],\n", " [ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.]],\n", "\n", " [[ 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],\n", " [ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.]],\n", "\n", " [[ 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],\n", " [ 2., 3., 4., 5., 6., 7., 8., 9., 10., 11.]]])" ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" } ], "source": [ "def my_function(z, y, x):\n", " return x * y + z\n", "\n", "np.fromfunction(my_function, (3, 2, 10))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "넘파이는 먼저 크기가 `(3, 2, 10)`인 세 개의 `ndarray`(차원마다 하나씩)를 만듭니다. 각 배열은 축을 따라 좌표 값과 같은 값을 가집니다. 예를 들어, `z` 축에 있는 배열의 모든 원소는 z-축의 값과 같습니다:\n", "\n", " [[[ 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]\n", " [ 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]]\n", " \n", " [[ 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]\n", " [ 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]]\n", " \n", " [[ 2. 2. 2. 2. 2. 2. 2. 2. 2. 2.]\n", " [ 2. 2. 2. 2. 2. 2. 2. 2. 2. 2.]]]\n", "\n", "위의 식 `x * y + z`에서 x, y, z는 사실 `ndarray`입니다(배열의 산술 연산에 대해서는 아래에서 설명합니다). 중요한 점은 함수 `my_function`이 원소마다 호출되는 것이 아니고 딱 **한 번** 호출된다는 점입니다. 그래서 매우 효율적으로 초기화할 수 있습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 데이터\n", "## `dtype`\n", "넘파이의 `ndarray`는 모든 원소가 동일한 타입(보통 숫자)을 가지기 때문에 효율적입니다. `dtype` 속성으로 쉽게 데이터 타입을 확인할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 25, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "int64 [1 2 3 4]\n" ] } ], "source": [ "c = np.arange(1, 5)\n", "print(c.dtype, c)" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "float64 [1. 2. 3. 4.]\n" ] } ], "source": [ "c = np.arange(1.0, 5.0)\n", "print(c.dtype, c)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "넘파이가 데이터 타입을 결정하도록 내버려 두는 대신 `dtype` 매개변수를 사용해서 배열을 만들 때 명시적으로 지정할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "complex64 [1.+0.j 2.+0.j 3.+0.j 4.+0.j]\n" ] } ], "source": [ "d = np.arange(1, 5, dtype=np.complex64)\n", "print(d.dtype, d)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "가능한 데이터 타입은 `int8`, `int16`, `int32`, `int64`, `uint8`|`16`|`32`|`64`, `float16`|`32`|`64`, `complex64`|`128`가 있습니다. 전체 리스트는 [온라인 문서](http://docs.scipy.org/doc/numpy/user/basics.types.html)를 참고하세요.\n", "\n", "## `itemsize`\n", "`itemsize` 속성은 각 아이템의 크기(바이트)를 반환합니다:" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "8" ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" } ], "source": [ "e = np.arange(1, 5, dtype=np.complex64)\n", "e.itemsize" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `data` 버퍼\n", "배열의 데이터는 1차원 바이트 버퍼로 메모리에 저장됩니다. `data` 속성을 사용해 참조할 수 있습니다(사용할 일은 거의 없겠지만요)." ] }, { "cell_type": "code", "execution_count": 29, "metadata": { "scrolled": false }, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "f = np.array([[1,2],[1000, 2000]], dtype=np.int32)\n", "f.data" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "파이썬 2에서는 `f.data`가 버퍼이고 파이썬 3에서는 memoryview입니다." ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "b'\\x01\\x00\\x00\\x00\\x02\\x00\\x00\\x00\\xe8\\x03\\x00\\x00\\xd0\\x07\\x00\\x00'" ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" } ], "source": [ "if (hasattr(f.data, \"tobytes\")):\n", " data_bytes = f.data.tobytes() # python 3\n", "else:\n", " data_bytes = memoryview(f.data).tobytes() # python 2\n", "\n", "data_bytes" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여러 개의 `ndarray`가 데이터 버퍼를 공유할 수 있습니다. 하나를 수정하면 다른 것도 바뀝니다. 잠시 후에 예를 살펴 보겠습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 크기 변경\n", "\n", "## 자신을 변경\n", "\n", "`ndarray`의 `shape` 속성을 지정하면 간단히 크기를 바꿀 수 있습니다. 배열의 원소 개수는 동일하게 유지됩니다." ] }, { "cell_type": "code", "execution_count": 31, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]\n", "랭크: 1\n" ] } ], "source": [ "g = np.arange(24)\n", "print(g)\n", "print(\"랭크:\", g.ndim)" ] }, { "cell_type": "code", "execution_count": 32, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[ 0 1 2 3]\n", " [ 4 5 6 7]\n", " [ 8 9 10 11]\n", " [12 13 14 15]\n", " [16 17 18 19]\n", " [20 21 22 23]]\n", "랭크: 2\n" ] } ], "source": [ "g.shape = (6, 4)\n", "print(g)\n", "print(\"랭크:\", g.ndim)" ] }, { "cell_type": "code", "execution_count": 33, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[[ 0 1 2 3]\n", " [ 4 5 6 7]\n", " [ 8 9 10 11]]\n", "\n", " [[12 13 14 15]\n", " [16 17 18 19]\n", " [20 21 22 23]]]\n", "랭크: 3\n" ] } ], "source": [ "g.shape = (2, 3, 4)\n", "print(g)\n", "print(\"랭크:\", g.ndim)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `reshape`\n", "\n", "`reshape` 함수는 동일한 데이터를 가리키는 새로운 `ndarray` 객체를 반환합니다. 한 배열을 수정하면 다른 것도 함께 바뀝니다." ] }, { "cell_type": "code", "execution_count": 34, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[ 0 1 2 3 4 5]\n", " [ 6 7 8 9 10 11]\n", " [12 13 14 15 16 17]\n", " [18 19 20 21 22 23]]\n", "랭크: 2\n" ] } ], "source": [ "g2 = g.reshape(4,6)\n", "print(g2)\n", "print(\"랭크:\", g2.ndim)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "행 1, 열 2의 원소를 999로 설정합니다(인덱싱 방식은 아래를 참고하세요)." ] }, { "cell_type": "code", "execution_count": 35, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, 3, 4, 5],\n", " [ 6, 7, 999, 9, 10, 11],\n", " [ 12, 13, 14, 15, 16, 17],\n", " [ 18, 19, 20, 21, 22, 23]])" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "g2[1, 2] = 999\n", "g2" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이에 상응하는 `g`의 원소도 수정됩니다." ] }, { "cell_type": "code", "execution_count": 36, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2, 3],\n", " [ 4, 5, 6, 7],\n", " [999, 9, 10, 11]],\n", "\n", " [[ 12, 13, 14, 15],\n", " [ 16, 17, 18, 19],\n", " [ 20, 21, 22, 23]]])" ] }, "execution_count": 36, "metadata": {}, "output_type": "execute_result" } ], "source": [ "g" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `ravel`\n", "\n", "마지막으로 `ravel` 함수는 동일한 데이터를 가리키는 새로운 1차원 `ndarray`를 반환합니다:" ] }, { "cell_type": "code", "execution_count": 37, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 0, 1, 2, 3, 4, 5, 6, 7, 999, 9, 10, 11, 12,\n", " 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23])" ] }, "execution_count": 37, "metadata": {}, "output_type": "execute_result" } ], "source": [ "g.ravel()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 산술 연산\n", "\n", "일반적인 산술 연산자(`+`, `-`, `*`, `/`, `//`, `**` 등)는 모두 `ndarray`와 사용할 수 있습니다. 이 연산자는 원소별로 적용됩니다:" ] }, { "cell_type": "code", "execution_count": 38, "metadata": { "scrolled": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "a + b = [19 27 35 43]\n", "a - b = [ 9 19 29 39]\n", "a * b = [70 92 96 82]\n", "a / b = [ 2.8 5.75 10.66666667 20.5 ]\n", "a // b = [ 2 5 10 20]\n", "a % b = [4 3 2 1]\n", "a ** b = [537824 279841 32768 1681]\n" ] } ], "source": [ "a = np.array([14, 23, 32, 41])\n", "b = np.array([5, 4, 3, 2])\n", "print(\"a + b =\", a + b)\n", "print(\"a - b =\", a - b)\n", "print(\"a * b =\", a * b)\n", "print(\"a / b =\", a / b)\n", "print(\"a // b =\", a // b)\n", "print(\"a % b =\", a % b)\n", "print(\"a ** b =\", a ** b)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여기 곱셈은 행렬 곱셈이 아닙니다. 행렬 연산은 아래에서 설명합니다.\n", "\n", "배열의 크기는 같아야 합니다. 그렇지 않으면 넘파이가 브로드캐스팅 규칙을 적용합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 브로드캐스팅" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "일반적으로 넘파이는 동일한 크기의 배열을 기대합니다. 그렇지 않은 상황에는 브로드캐시틍 규칙을 적용합니다:\n", "\n", "## 규칙 1\n", "\n", "배열의 랭크가 동일하지 않으면 랭크가 맞을 때까지 랭크가 작은 배열 앞에 1을 추가합니다." ] }, { "cell_type": "code", "execution_count": 39, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[0, 1, 2, 3, 4]]])" ] }, "execution_count": 39, "metadata": {}, "output_type": "execute_result" } ], "source": [ "h = np.arange(5).reshape(1, 1, 5)\n", "h" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여기에 `(1,1,5)` 크기의 3D 배열에 `(5,)` 크기의 1D 배열을 더해 보죠. 브로드캐스팅의 규칙 1이 적용됩니다!" ] }, { "cell_type": "code", "execution_count": 40, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[10, 21, 32, 43, 54]]])" ] }, "execution_count": 40, "metadata": {}, "output_type": "execute_result" } ], "source": [ "h + [10, 20, 30, 40, 50] # 다음과 동일합니다: h + [[[10, 20, 30, 40, 50]]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 규칙 2\n", "\n", "특정 차원이 1인 배열은 그 차원에서 크기가 가장 큰 배열의 크기에 맞춰 동작합니다. 배열의 원소가 차원을 따라 반복됩니다." ] }, { "cell_type": "code", "execution_count": 41, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 1, 2],\n", " [3, 4, 5]])" ] }, "execution_count": 41, "metadata": {}, "output_type": "execute_result" } ], "source": [ "k = np.arange(6).reshape(2, 3)\n", "k" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`(2,3)` 크기의 2D `ndarray`에 `(2,1)` 크기의 2D 배열을 더해 보죠. 넘파이는 브로드캐스팅 규칙 2를 적용합니다:" ] }, { "cell_type": "code", "execution_count": 42, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[100, 101, 102],\n", " [203, 204, 205]])" ] }, "execution_count": 42, "metadata": {}, "output_type": "execute_result" } ], "source": [ "k + [[100], [200]] # 다음과 같습니다: k + [[100, 100, 100], [200, 200, 200]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "규칙 1과 2를 합치면 다음과 같이 동작합니다:" ] }, { "cell_type": "code", "execution_count": 43, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[100, 201, 302],\n", " [103, 204, 305]])" ] }, "execution_count": 43, "metadata": {}, "output_type": "execute_result" } ], "source": [ "k + [100, 200, 300] # 규칙 1 적용: [[100, 200, 300]], 규칙 2 적용: [[100, 200, 300], [100, 200, 300]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "또 매우 간단히 다음 처럼 해도 됩니다:" ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1000, 1001, 1002],\n", " [1003, 1004, 1005]])" ] }, "execution_count": 44, "metadata": {}, "output_type": "execute_result" } ], "source": [ "k + 1000 # 다음과 같습니다: k + [[1000, 1000, 1000], [1000, 1000, 1000]]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 규칙 3\n", "\n", "규칙 1 & 2을 적용했을 때 모든 배열의 크기가 맞아야 합니다." ] }, { "cell_type": "code", "execution_count": 45, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "operands could not be broadcast together with shapes (2,3) (2,) \n" ] } ], "source": [ "try:\n", " k + [33, 44]\n", "except ValueError as e:\n", " print(e)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "브로드캐스팅 규칙은 산술 연산 뿐만 아니라 넘파이 연산에서 많이 사용됩니다. 아래에서 더 보도록 하죠. 브로드캐스팅에 관한 더 자세한 정보는 [온라인 문서](https://docs.scipy.org/doc/numpy-dev/user/basics.broadcasting.html)를 참고하세요." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 업캐스팅\n", "\n", "`dtype`이 다른 배열을 합칠 때 넘파이는 (실제 값에 상관없이) 모든 값을 다룰 수 있는 타입으로 업캐스팅합니다." ] }, { "cell_type": "code", "execution_count": 46, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "uint8 [0 1 2 3 4]\n" ] } ], "source": [ "k1 = np.arange(0, 5, dtype=np.uint8)\n", "print(k1.dtype, k1)" ] }, { "cell_type": "code", "execution_count": 47, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "int16 [ 5 7 9 11 13]\n" ] } ], "source": [ "k2 = k1 + np.array([5, 6, 7, 8, 9], dtype=np.int8)\n", "print(k2.dtype, k2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "모든 `int8`과 `uint8` 값(-128에서 255까지)을 표현하기 위해 `int16`이 필요합니다. 이 코드에서는 `uint8`이면 충분하지만 업캐스팅되었습니다." ] }, { "cell_type": "code", "execution_count": 48, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "float64 [1.5 2.5 3.5 4.5 5.5]\n" ] } ], "source": [ "k3 = k1 + 1.5\n", "print(k3.dtype, k3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 조건 연산자" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "조건 연산자도 원소별로 적용됩니다:" ] }, { "cell_type": "code", "execution_count": 49, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([False, True, True, False])" ] }, "execution_count": 49, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m = np.array([20, -5, 30, 40])\n", "m < [15, 16, 35, 36]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "브로드캐스팅을 사용합니다:" ] }, { "cell_type": "code", "execution_count": 50, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ True, True, False, False])" ] }, "execution_count": 50, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m < 25 # m < [25, 25, 25, 25] 와 동일" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "불리언 인덱싱과 함께 사용하면 아주 유용합니다(아래에서 설명하겠습니다)." ] }, { "cell_type": "code", "execution_count": 51, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([20, -5])" ] }, "execution_count": 51, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m[m < 25]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 수학 함수와 통계 함수" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`ndarray`에서 사용할 수 있는 수학 함수와 통계 함수가 많습니다.\n", "\n", "## `ndarray` 메서드\n", "\n", "일부 함수는 `ndarray` 메서드로 제공됩니다. 예를 들면:" ] }, { "cell_type": "code", "execution_count": 52, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[-2.5 3.1 7. ]\n", " [10. 11. 12. ]]\n", "평균 = 6.766666666666667\n" ] } ], "source": [ "a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])\n", "print(a)\n", "print(\"평균 =\", a.mean())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 명령은 크기에 상관없이 `ndarray`에 있는 모든 원소의 평균을 계산합니다.\n", "\n", "다음은 유용한 `ndarray` 메서드입니다:" ] }, { "cell_type": "code", "execution_count": 53, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "min = -2.5\n", "max = 12.0\n", "sum = 40.6\n", "prod = -71610.0\n", "std = 5.084835843520964\n", "var = 25.855555555555554\n" ] } ], "source": [ "for func in (a.min, a.max, a.sum, a.prod, a.std, a.var):\n", " print(func.__name__, \"=\", func())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "이 함수들은 선택적으로 매개변수 `axis`를 사용합니다. 지정된 축을 따라 원소에 연산을 적용하는데 사용합니다. 예를 들면:" ] }, { "cell_type": "code", "execution_count": 54, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2, 3],\n", " [ 4, 5, 6, 7],\n", " [ 8, 9, 10, 11]],\n", "\n", " [[12, 13, 14, 15],\n", " [16, 17, 18, 19],\n", " [20, 21, 22, 23]]])" ] }, "execution_count": 54, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c=np.arange(24).reshape(2,3,4)\n", "c" ] }, { "cell_type": "code", "execution_count": 55, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[12, 14, 16, 18],\n", " [20, 22, 24, 26],\n", " [28, 30, 32, 34]])" ] }, "execution_count": 55, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c.sum(axis=0) # 첫 번째 축을 따라 더함, 결과는 3x4 배열" ] }, { "cell_type": "code", "execution_count": 56, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[12, 15, 18, 21],\n", " [48, 51, 54, 57]])" ] }, "execution_count": 56, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c.sum(axis=1) # 두 번째 축을 따라 더함, 결과는 2x4 배열" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여러 축에 대해서 더할 수도 있습니다:" ] }, { "cell_type": "code", "execution_count": 57, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 60, 92, 124])" ] }, "execution_count": 57, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c.sum(axis=(0,2)) # 첫 번째 축과 세 번째 축을 따라 더함, 결과는 (3,) 배열" ] }, { "cell_type": "code", "execution_count": 58, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(60, 92, 124)" ] }, "execution_count": 58, "metadata": {}, "output_type": "execute_result" } ], "source": [ "0+1+2+3 + 12+13+14+15, 4+5+6+7 + 16+17+18+19, 8+9+10+11 + 20+21+22+23" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 일반 함수\n", "\n", "넘파이는 일반 함수(universal function) 또는 **ufunc**라고 부르는 원소별 함수를 제공합니다. 예를 들면 `square` 함수는 원본 `ndarray`를 복사하여 각 원소를 제곱한 새로운 `ndarray` 객체를 반환합니다:" ] }, { "cell_type": "code", "execution_count": 59, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 6.25, 9.61, 49. ],\n", " [100. , 121. , 144. ]])" ] }, "execution_count": 59, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a = np.array([[-2.5, 3.1, 7], [10, 11, 12]])\n", "np.square(a)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "다음은 유용한 단항 일반 함수들입니다:" ] }, { "cell_type": "code", "execution_count": 60, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "원본 ndarray\n", "[[-2.5 3.1 7. ]\n", " [10. 11. 12. ]]\n", "\n", " absolute\n", "[[ 2.5 3.1 7. ]\n", " [10. 11. 12. ]]\n", "\n", " sqrt\n", "[[ nan 1.76068169 2.64575131]\n", " [3.16227766 3.31662479 3.46410162]]\n", "\n", " exp\n", "[[8.20849986e-02 2.21979513e+01 1.09663316e+03]\n", " [2.20264658e+04 5.98741417e+04 1.62754791e+05]]\n", "\n", " log\n", "[[ nan 1.13140211 1.94591015]\n", " [2.30258509 2.39789527 2.48490665]]\n", "\n", " sign\n", "[[-1. 1. 1.]\n", " [ 1. 1. 1.]]\n", "\n", " ceil\n", "[[-2. 4. 7.]\n", " [10. 11. 12.]]\n", "\n", " modf\n", "(array([[-0.5, 0.1, 0. ],\n", " [ 0. , 0. , 0. ]]), array([[-2., 3., 7.],\n", " [10., 11., 12.]]))\n", "\n", " isnan\n", "[[False False False]\n", " [False False False]]\n", "\n", " cos\n", "[[-0.80114362 -0.99913515 0.75390225]\n", " [-0.83907153 0.0044257 0.84385396]]\n" ] }, { "name": "stderr", "output_type": "stream", "text": [ "/home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/ipykernel_launcher.py:5: RuntimeWarning: invalid value encountered in sqrt\n", " \"\"\"\n", "/home/haesun/anaconda3/envs/handson-ml/lib/python3.6/site-packages/ipykernel_launcher.py:5: RuntimeWarning: invalid value encountered in log\n", " \"\"\"\n" ] } ], "source": [ "print(\"원본 ndarray\")\n", "print(a)\n", "for func in (np.abs, np.sqrt, np.exp, np.log, np.sign, np.ceil, np.modf, np.isnan, np.cos):\n", " print(\"\\n\", func.__name__)\n", " print(func(a))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 이항 일반 함수\n", "\n", "두 개의 `ndarray`에 원소별로 적용되는 이항 함수도 많습니다. 두 배열이 동일한 크기가 아니면 브로드캐스팅 규칙이 적용됩니다:" ] }, { "cell_type": "code", "execution_count": 61, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 6, 2, 11])" ] }, "execution_count": 61, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a = np.array([1, -2, 3, 4])\n", "b = np.array([2, 8, -1, 7])\n", "np.add(a, b) # a + b 와 동일" ] }, { "cell_type": "code", "execution_count": 62, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([False, False, True, False])" ] }, "execution_count": 62, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.greater(a, b) # a > b 와 동일" ] }, { "cell_type": "code", "execution_count": 63, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([2, 8, 3, 7])" ] }, "execution_count": 63, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.maximum(a, b)" ] }, { "cell_type": "code", "execution_count": 64, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1., 2., -3., 4.])" ] }, "execution_count": 64, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.copysign(a, b)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 인덱싱\n", "\n", "## 1차원 배열\n", "\n", "1차원 넘파이 배열은 보통의 파이썬 배열과 비슷하게 사용할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 65, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "19" ] }, "execution_count": 65, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a = np.array([1, 5, 3, 19, 13, 7, 3])\n", "a[3]" ] }, { "cell_type": "code", "execution_count": 66, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 19, 13])" ] }, "execution_count": 66, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[2:5]" ] }, { "cell_type": "code", "execution_count": 67, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 19, 13, 7])" ] }, "execution_count": 67, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[2:-1]" ] }, { "cell_type": "code", "execution_count": 68, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1, 5])" ] }, "execution_count": 68, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[:2]" ] }, { "cell_type": "code", "execution_count": 69, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 13, 3])" ] }, "execution_count": 69, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[2::2]" ] }, { "cell_type": "code", "execution_count": 70, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 3, 7, 13, 19, 3, 5, 1])" ] }, "execution_count": 70, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[::-1]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "물론 원소를 수정할 수 있죠:" ] }, { "cell_type": "code", "execution_count": 71, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 5, 3, 999, 13, 7, 3])" ] }, "execution_count": 71, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[3]=999\n", "a" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "슬라이싱을 사용해 `ndarray`를 수정할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 72, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 5, 997, 998, 999, 7, 3])" ] }, "execution_count": 72, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[2:5] = [997, 998, 999]\n", "a" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 보통의 파이썬 배열과 차이점\n", "\n", "보통의 파이썬 배열과 대조적으로 `ndarray` 슬라이싱에 하나의 값을 할당하면 슬라이싱 전체에 복사됩니다. 위에서 언급한 브로드캐스팅 덕택입니다." ] }, { "cell_type": "code", "execution_count": 73, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 5, -1, -1, -1, 7, 3])" ] }, "execution_count": 73, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[2:5] = -1\n", "a" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "또한 이런 식으로 `ndarray` 크기를 늘리거나 줄일 수 없습니다:" ] }, { "cell_type": "code", "execution_count": 74, "metadata": { "scrolled": false }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "cannot copy sequence with size 6 to array axis with dimension 3\n" ] } ], "source": [ "try:\n", " a[2:5] = [1,2,3,4,5,6] # 너무 길어요\n", "except ValueError as e:\n", " print(e)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "원소를 삭제할 수도 없습니다:" ] }, { "cell_type": "code", "execution_count": 75, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "cannot delete array elements\n" ] } ], "source": [ "try:\n", " del a[2:5]\n", "except ValueError as e:\n", " print(e)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "중요한 점은 `ndarray`의 슬라이싱은 같은 데이터 버퍼를 바라보는 뷰(view)입니다. 슬라이싱된 객체를 수정하면 실제 원본 `ndarray`가 수정됩니다!" ] }, { "cell_type": "code", "execution_count": 76, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 5, -1, 1000, -1, 7, 3])" ] }, "execution_count": 76, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a_slice = a[2:6]\n", "a_slice[1] = 1000\n", "a # 원본 배열이 수정됩니다!" ] }, { "cell_type": "code", "execution_count": 77, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ -1, 2000, -1, 7])" ] }, "execution_count": 77, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[3] = 2000\n", "a_slice # 비슷하게 원본 배열을 수정하면 슬라이싱 객체에도 반영됩니다!" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "데이터를 복사하려면 `copy` 메서드를 사용해야 합니다:" ] }, { "cell_type": "code", "execution_count": 78, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 5, -1, 2000, -1, 7, 3])" ] }, "execution_count": 78, "metadata": {}, "output_type": "execute_result" } ], "source": [ "another_slice = a[2:6].copy()\n", "another_slice[1] = 3000\n", "a # 원본 배열이 수정되지 않습니다" ] }, { "cell_type": "code", "execution_count": 79, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ -1, 3000, -1, 7])" ] }, "execution_count": 79, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a[3] = 4000\n", "another_slice # 마찬가지로 원본 배열을 수정해도 복사된 배열은 바뀌지 않습니다" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 다차원 배열\n", "\n", "다차원 배열은 비슷한 방식으로 각 축을 따라 인덱싱 또는 슬라이싱해서 사용합니다. 콤마로 구분합니다:" ] }, { "cell_type": "code", "execution_count": 80, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],\n", " [12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23],\n", " [24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35],\n", " [36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47]])" ] }, "execution_count": 80, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b = np.arange(48).reshape(4, 12)\n", "b" ] }, { "cell_type": "code", "execution_count": 81, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "14" ] }, "execution_count": 81, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[1, 2] # 행 1, 열 2" ] }, { "cell_type": "code", "execution_count": 82, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23])" ] }, "execution_count": 82, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[1, :] # 행 1, 모든 열" ] }, { "cell_type": "code", "execution_count": 83, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 13, 25, 37])" ] }, "execution_count": 83, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[:, 1] # 모든 행, 열 1" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**주의**: 다음 두 표현에는 미묘한 차이가 있습니다: " ] }, { "cell_type": "code", "execution_count": 84, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23])" ] }, "execution_count": 84, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[1, :]" ] }, { "cell_type": "code", "execution_count": 85, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23]])" ] }, "execution_count": 85, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[1:2, :]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "첫 번째 표현식은 `(12,)` 크기인 1D 배열로 행이 하나입니다. 두 번째는 `(1, 12)` 크기인 2D 배열로 같은 행을 반환합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 팬시 인덱싱(Fancy indexing)\n", "\n", "관심 대상의 인덱스 리스트를 지정할 수도 있습니다. 이를 팬시 인덱싱이라고 부릅니다." ] }, { "cell_type": "code", "execution_count": 86, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([[ 2, 3, 4],\n", " [26, 27, 28]])" ] }, "execution_count": 86, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[(0,2), 2:5] # 행 0과 2, 열 2에서 4(5-1)까지" ] }, { "cell_type": "code", "execution_count": 87, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[11, 2, 11],\n", " [23, 14, 23],\n", " [35, 26, 35],\n", " [47, 38, 47]])" ] }, "execution_count": 87, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[:, (-1, 2, -1)] # 모든 행, 열 -1 (마지막), 2와 -1 (다시 반대 방향으로)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여러 개의 인덱스 리스트를 지정하면 인덱스에 맞는 값이 포함된 1D `ndarray`를 반환됩니다." ] }, { "cell_type": "code", "execution_count": 88, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([41, 33, 37, 33])" ] }, "execution_count": 88, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[(-1, 2, -1, 2), (5, 9, 1, 9)] # returns a 1D array with b[-1, 5], b[2, 9], b[-1, 1] and b[2, 9] (again)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 고차원\n", "\n", "고차원에서도 동일한 방식이 적용됩니다. 몇 가지 예를 살펴 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 89, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2, 3, 4, 5],\n", " [ 6, 7, 8, 9, 10, 11]],\n", "\n", " [[12, 13, 14, 15, 16, 17],\n", " [18, 19, 20, 21, 22, 23]],\n", "\n", " [[24, 25, 26, 27, 28, 29],\n", " [30, 31, 32, 33, 34, 35]],\n", "\n", " [[36, 37, 38, 39, 40, 41],\n", " [42, 43, 44, 45, 46, 47]]])" ] }, "execution_count": 89, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c = b.reshape(4,2,6)\n", "c" ] }, { "cell_type": "code", "execution_count": 90, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "34" ] }, "execution_count": 90, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, 1, 4] # 행렬 2, 행 1, 열 4" ] }, { "cell_type": "code", "execution_count": 91, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([27, 33])" ] }, "execution_count": 91, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, :, 3] # 행렬 2, 모든 행, 열 3" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "어떤 축에 대한 인덱스를 지정하지 않으면 이 축의 모든 원소가 반환됩니다:" ] }, { "cell_type": "code", "execution_count": 92, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([30, 31, 32, 33, 34, 35])" ] }, "execution_count": 92, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, 1] # 행렬 2, 행 1, 모든 열이 반환됩니다. c[2, 1, :]와 동일합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 생략 부호 (`...`)\n", "\n", "생략 부호(`...`)를 쓰면 모든 지정하지 않은 축의 원소를 포함합니다." ] }, { "cell_type": "code", "execution_count": 93, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[24, 25, 26, 27, 28, 29],\n", " [30, 31, 32, 33, 34, 35]])" ] }, "execution_count": 93, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, ...] # 행렬 2, 모든 행, 모든 열. c[2, :, :]와 동일" ] }, { "cell_type": "code", "execution_count": 94, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([30, 31, 32, 33, 34, 35])" ] }, "execution_count": 94, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, 1, ...] # 행렬 2, 행 1, 모든 열. c[2, 1, :]와 동일" ] }, { "cell_type": "code", "execution_count": 95, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([27, 33])" ] }, "execution_count": 95, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[2, ..., 3] # 행렬 2, 모든 행, 열 3. c[2, :, 3]와 동일" ] }, { "cell_type": "code", "execution_count": 96, "metadata": { "scrolled": false }, "outputs": [ { "data": { "text/plain": [ "array([[ 3, 9],\n", " [15, 21],\n", " [27, 33],\n", " [39, 45]])" ] }, "execution_count": 96, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c[..., 3] # 모든 행렬, 모든 행, 열 3. c[:, :, 3]와 동일" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 불리언 인덱싱\n", "\n", "불리언 값을 가진 `ndarray`를 사용해 축의 인덱스를 지정할 수 있습니다." ] }, { "cell_type": "code", "execution_count": 97, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],\n", " [12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23],\n", " [24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35],\n", " [36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47]])" ] }, "execution_count": 97, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b = np.arange(48).reshape(4, 12)\n", "b" ] }, { "cell_type": "code", "execution_count": 98, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],\n", " [24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35]])" ] }, "execution_count": 98, "metadata": {}, "output_type": "execute_result" } ], "source": [ "rows_on = np.array([True, False, True, False])\n", "b[rows_on, :] # 행 0과 2, 모든 열. b[(0, 2), :]와 동일" ] }, { "cell_type": "code", "execution_count": 99, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1, 4, 7, 10],\n", " [13, 16, 19, 22],\n", " [25, 28, 31, 34],\n", " [37, 40, 43, 46]])" ] }, "execution_count": 99, "metadata": {}, "output_type": "execute_result" } ], "source": [ "cols_on = np.array([False, True, False] * 4)\n", "b[:, cols_on] # 모든 행, 열 1, 4, 7, 10" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `np.ix_`\n", "\n", "여러 축에 걸쳐서는 불리언 인덱싱을 사용할 수 없고 `ix_` 함수를 사용합니다:" ] }, { "cell_type": "code", "execution_count": 100, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1, 4, 7, 10],\n", " [25, 28, 31, 34]])" ] }, "execution_count": 100, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[np.ix_(rows_on, cols_on)]" ] }, { "cell_type": "code", "execution_count": 101, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([[0],\n", " [2]]), array([[ 1, 4, 7, 10]]))" ] }, "execution_count": 101, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.ix_(rows_on, cols_on)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`ndarray`와 같은 크기의 불리언 배열을 사용하면 해당 위치가 `True`인 모든 원소를 담은 1D 배열이 반환됩니다. 일반적으로 조건 연산자와 함께 사용합니다:" ] }, { "cell_type": "code", "execution_count": 102, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 4, 7, 10, 13, 16, 19, 22, 25, 28, 31, 34, 37, 40, 43, 46])" ] }, "execution_count": 102, "metadata": {}, "output_type": "execute_result" } ], "source": [ "b[b % 3 == 1]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 반복\n", "\n", "`ndarray`를 반복하는 것은 일반적인 파이썬 배열을 반복한는 것과 매우 유사합니다. 다차원 배열을 반복하면 첫 번째 축에 대해서 수행됩니다." ] }, { "cell_type": "code", "execution_count": 103, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2, 3],\n", " [ 4, 5, 6, 7],\n", " [ 8, 9, 10, 11]],\n", "\n", " [[12, 13, 14, 15],\n", " [16, 17, 18, 19],\n", " [20, 21, 22, 23]]])" ] }, "execution_count": 103, "metadata": {}, "output_type": "execute_result" } ], "source": [ "c = np.arange(24).reshape(2, 3, 4) # 3D 배열 (두 개의 3x4 행렬로 구성됨)\n", "c" ] }, { "cell_type": "code", "execution_count": 104, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "아이템:\n", "[[ 0 1 2 3]\n", " [ 4 5 6 7]\n", " [ 8 9 10 11]]\n", "아이템:\n", "[[12 13 14 15]\n", " [16 17 18 19]\n", " [20 21 22 23]]\n" ] } ], "source": [ "for m in c:\n", " print(\"아이템:\")\n", " print(m)" ] }, { "cell_type": "code", "execution_count": 105, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "아이템:\n", "[[ 0 1 2 3]\n", " [ 4 5 6 7]\n", " [ 8 9 10 11]]\n", "아이템:\n", "[[12 13 14 15]\n", " [16 17 18 19]\n", " [20 21 22 23]]\n" ] } ], "source": [ "for i in range(len(c)): # len(c) == c.shape[0]\n", " print(\"아이템:\")\n", " print(c[i])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`ndarray`에 있는 모든 원소를 반복하려면 `flat` 속성을 사용합니다:" ] }, { "cell_type": "code", "execution_count": 106, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "아이템: 0\n", "아이템: 1\n", "아이템: 2\n", "아이템: 3\n", "아이템: 4\n", "아이템: 5\n", "아이템: 6\n", "아이템: 7\n", "아이템: 8\n", "아이템: 9\n", "아이템: 10\n", "아이템: 11\n", "아이템: 12\n", "아이템: 13\n", "아이템: 14\n", "아이템: 15\n", "아이템: 16\n", "아이템: 17\n", "아이템: 18\n", "아이템: 19\n", "아이템: 20\n", "아이템: 21\n", "아이템: 22\n", "아이템: 23\n" ] } ], "source": [ "for i in c.flat:\n", " print(\"아이템:\", i)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 쌓기\n", "\n", "종종 다른 배열을 쌓아야 할 때가 있습니다. 넘파이는 이를 위해 몇 개의 함수를 제공합니다. 먼저 배열 몇 개를 만들어 보죠." ] }, { "cell_type": "code", "execution_count": 107, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [1., 1., 1., 1.]])" ] }, "execution_count": 107, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q1 = np.full((3,4), 1.0)\n", "q1" ] }, { "cell_type": "code", "execution_count": 108, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.]])" ] }, "execution_count": 108, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q2 = np.full((4,4), 2.0)\n", "q2" ] }, { "cell_type": "code", "execution_count": 109, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[3., 3., 3., 3.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.]])" ] }, "execution_count": 109, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q3 = np.full((3,4), 3.0)\n", "q3" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `vstack`\n", "\n", "`vstack` 함수를 사용하여 수직으로 쌓아보죠:" ] }, { "cell_type": "code", "execution_count": 110, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.]])" ] }, "execution_count": 110, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q4 = np.vstack((q1, q2, q3))\n", "q4" ] }, { "cell_type": "code", "execution_count": 111, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(10, 4)" ] }, "execution_count": 111, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q4.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "q1, q2, q3가 모두 같은 크기이므로 가능합니다(수직으로 쌓기 때문에 수직 축은 크기가 달라도 됩니다).\n", "\n", "## `hstack`\n", "\n", "`hstack`을 사용해 수평으로도 쌓을 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 112, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1., 3., 3., 3., 3.],\n", " [1., 1., 1., 1., 3., 3., 3., 3.],\n", " [1., 1., 1., 1., 3., 3., 3., 3.]])" ] }, "execution_count": 112, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q5 = np.hstack((q1, q3))\n", "q5" ] }, { "cell_type": "code", "execution_count": 113, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(3, 8)" ] }, "execution_count": 113, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q5.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "q1과 q3가 모두 3개의 행을 가지고 있기 때문에 가능합니다. q2는 4개의 행을 가지고 있기 때문에 q1, q3와 수평으로 쌓을 수 없습니다:" ] }, { "cell_type": "code", "execution_count": 114, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "all the input array dimensions except for the concatenation axis must match exactly\n" ] } ], "source": [ "try:\n", " q5 = np.hstack((q1, q2, q3))\n", "except ValueError as e:\n", " print(e)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `concatenate`\n", "\n", "`concatenate` 함수는 지정한 축으로도 배열을 쌓습니다." ] }, { "cell_type": "code", "execution_count": 115, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [2., 2., 2., 2.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.]])" ] }, "execution_count": 115, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q7 = np.concatenate((q1, q2, q3), axis=0) # vstack과 동일\n", "q7" ] }, { "cell_type": "code", "execution_count": 116, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(10, 4)" ] }, "execution_count": 116, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q7.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "예상했겠지만 `hstack`은 `axis=1`으로 `concatenate`를 호출하는 것과 같습니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `stack`\n", "\n", "`stack` 함수는 새로운 축을 따라 배열을 쌓습니다. 모든 배열은 같은 크기를 가져야 합니다." ] }, { "cell_type": "code", "execution_count": 117, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[1., 1., 1., 1.],\n", " [1., 1., 1., 1.],\n", " [1., 1., 1., 1.]],\n", "\n", " [[3., 3., 3., 3.],\n", " [3., 3., 3., 3.],\n", " [3., 3., 3., 3.]]])" ] }, "execution_count": 117, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q8 = np.stack((q1, q3))\n", "q8" ] }, { "cell_type": "code", "execution_count": 118, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2, 3, 4)" ] }, "execution_count": 118, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q8.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 분할\n", "\n", "분할은 쌓기의 반대입니다. 예를 들어 `vsplit` 함수는 행렬을 수직으로 분할합니다.\n", "\n", "먼저 6x4 행렬을 만들어 보죠:" ] }, { "cell_type": "code", "execution_count": 119, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, 3],\n", " [ 4, 5, 6, 7],\n", " [ 8, 9, 10, 11],\n", " [12, 13, 14, 15],\n", " [16, 17, 18, 19],\n", " [20, 21, 22, 23]])" ] }, "execution_count": 119, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r = np.arange(24).reshape(6,4)\n", "r" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "수직으로 동일한 크기로 나누어 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 120, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 1, 2, 3],\n", " [4, 5, 6, 7]])" ] }, "execution_count": 120, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r1, r2, r3 = np.vsplit(r, 3)\n", "r1" ] }, { "cell_type": "code", "execution_count": 121, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 8, 9, 10, 11],\n", " [12, 13, 14, 15]])" ] }, "execution_count": 121, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r2" ] }, { "cell_type": "code", "execution_count": 122, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[16, 17, 18, 19],\n", " [20, 21, 22, 23]])" ] }, "execution_count": 122, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r3" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`split` 함수는 주어진 축을 따라 배열을 분할합니다. `vsplit`는 `axis=0`으로 `split`를 호출하는 것과 같습니다. `hsplit` 함수는 `axis=1`로 `split`를 호출하는 것과 같습니다:" ] }, { "cell_type": "code", "execution_count": 123, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1],\n", " [ 4, 5],\n", " [ 8, 9],\n", " [12, 13],\n", " [16, 17],\n", " [20, 21]])" ] }, "execution_count": 123, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r4, r5 = np.hsplit(r, 2)\n", "r4" ] }, { "cell_type": "code", "execution_count": 124, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 2, 3],\n", " [ 6, 7],\n", " [10, 11],\n", " [14, 15],\n", " [18, 19],\n", " [22, 23]])" ] }, "execution_count": 124, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r5" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 배열 전치\n", "\n", "`transpose` 메서드는 주어진 순서대로 축을 뒤바꾸어 `ndarray` 데이터에 대한 새로운 뷰를 만듭니다.\n", "\n", "예를 위해 3D 배열을 만들어 보죠:" ] }, { "cell_type": "code", "execution_count": 125, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2],\n", " [ 3, 4, 5]],\n", "\n", " [[ 6, 7, 8],\n", " [ 9, 10, 11]],\n", "\n", " [[12, 13, 14],\n", " [15, 16, 17]],\n", "\n", " [[18, 19, 20],\n", " [21, 22, 23]]])" ] }, "execution_count": 125, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t = np.arange(24).reshape(4,2,3)\n", "t" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`0, 1, 2`(깊이, 높이, 너비) 축을 `1, 2, 0` (깊이→너비, 높이→깊이, 너비→높이) 순서로 바꾼 `ndarray`를 만들어 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 126, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 6, 12, 18],\n", " [ 1, 7, 13, 19],\n", " [ 2, 8, 14, 20]],\n", "\n", " [[ 3, 9, 15, 21],\n", " [ 4, 10, 16, 22],\n", " [ 5, 11, 17, 23]]])" ] }, "execution_count": 126, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t1 = t.transpose((1,2,0))\n", "t1" ] }, { "cell_type": "code", "execution_count": 127, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2, 3, 4)" ] }, "execution_count": 127, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t1.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`transpose` 기본값은 차원의 순서를 역전시킵니다:" ] }, { "cell_type": "code", "execution_count": 128, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 6, 12, 18],\n", " [ 3, 9, 15, 21]],\n", "\n", " [[ 1, 7, 13, 19],\n", " [ 4, 10, 16, 22]],\n", "\n", " [[ 2, 8, 14, 20],\n", " [ 5, 11, 17, 23]]])" ] }, "execution_count": 128, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t2 = t.transpose() # t.transpose((2, 1, 0))와 동일\n", "t2" ] }, { "cell_type": "code", "execution_count": 129, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(3, 2, 4)" ] }, "execution_count": 129, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t2.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "넘파이는 두 축을 바꾸는 `swapaxes` 함수를 제공합니다. 예를 들어 깊이와 높이를 뒤바꾸어 `t`의 새로운 뷰를 만들어 보죠:" ] }, { "cell_type": "code", "execution_count": 130, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[[ 0, 1, 2],\n", " [ 6, 7, 8],\n", " [12, 13, 14],\n", " [18, 19, 20]],\n", "\n", " [[ 3, 4, 5],\n", " [ 9, 10, 11],\n", " [15, 16, 17],\n", " [21, 22, 23]]])" ] }, "execution_count": 130, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t3 = t.swapaxes(0,1) # t.transpose((1, 0, 2))와 동일\n", "t3" ] }, { "cell_type": "code", "execution_count": 131, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2, 4, 3)" ] }, "execution_count": 131, "metadata": {}, "output_type": "execute_result" } ], "source": [ "t3.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 선형 대수학\n", "\n", "넘파이 2D 배열을 사용하면 파이썬에서 행렬을 효율적으로 표현할 수 있습니다. 주요 행렬 연산을 간단히 둘러 보겠습니다. 선형 대수학, 벡터와 행렬에 관한 자세한 내용은 [Linear Algebra tutorial](math_linear_algebra.ipynb)를 참고하세요.\n", "\n", "## 행렬 전치\n", "\n", "`T` 속성은 랭크가 2보다 크거나 같을 때 `transpose()`를 호출하는 것과 같습니다:" ] }, { "cell_type": "code", "execution_count": 132, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 1, 2, 3, 4],\n", " [5, 6, 7, 8, 9]])" ] }, "execution_count": 132, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m1 = np.arange(10).reshape(2,5)\n", "m1" ] }, { "cell_type": "code", "execution_count": 133, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 5],\n", " [1, 6],\n", " [2, 7],\n", " [3, 8],\n", " [4, 9]])" ] }, "execution_count": 133, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m1.T" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`T` 속성은 랭크가 0이거나 1인 배열에는 아무런 영향을 미치지 않습니다:" ] }, { "cell_type": "code", "execution_count": 134, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([0, 1, 2, 3, 4])" ] }, "execution_count": 134, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m2 = np.arange(5)\n", "m2" ] }, { "cell_type": "code", "execution_count": 135, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([0, 1, 2, 3, 4])" ] }, "execution_count": 135, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m2.T" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "먼저 1D 배열을 하나의 행이 있는 행렬(2D)로 바꾼다음 전치를 수행할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 136, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 1, 2, 3, 4]])" ] }, "execution_count": 136, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m2r = m2.reshape(1,5)\n", "m2r" ] }, { "cell_type": "code", "execution_count": 137, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0],\n", " [1],\n", " [2],\n", " [3],\n", " [4]])" ] }, "execution_count": 137, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m2r.T" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 행렬 점곱\n", "\n", "두 개의 행렬을 만들어 `dot` 메서드로 행렬 [점곱](https://en.wikipedia.org/wiki/Dot_product)을 실행해 보죠." ] }, { "cell_type": "code", "execution_count": 138, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0, 1, 2, 3, 4],\n", " [5, 6, 7, 8, 9]])" ] }, "execution_count": 138, "metadata": {}, "output_type": "execute_result" } ], "source": [ "n1 = np.arange(10).reshape(2, 5)\n", "n1" ] }, { "cell_type": "code", "execution_count": 139, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2],\n", " [ 3, 4, 5],\n", " [ 6, 7, 8],\n", " [ 9, 10, 11],\n", " [12, 13, 14]])" ] }, "execution_count": 139, "metadata": {}, "output_type": "execute_result" } ], "source": [ "n2 = np.arange(15).reshape(5,3)\n", "n2" ] }, { "cell_type": "code", "execution_count": 140, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 90, 100, 110],\n", " [240, 275, 310]])" ] }, "execution_count": 140, "metadata": {}, "output_type": "execute_result" } ], "source": [ "n1.dot(n2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**주의**: 앞서 언급한 것처럼 `n1*n2`는 점곱이 아니라 원소별 곱셈입니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 역행렬과 유사 역행렬\n", "\n", "`numpy.linalg` 모듈 안에 많은 선형 대수 함수들이 있습니다. 특히 `inv` 함수는 정방 행렬의 역행렬을 계산합니다:" ] }, { "cell_type": "code", "execution_count": 141, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1, 2, 3],\n", " [ 5, 7, 11],\n", " [21, 29, 31]])" ] }, "execution_count": 141, "metadata": {}, "output_type": "execute_result" } ], "source": [ "import numpy.linalg as linalg\n", "\n", "m3 = np.array([[1,2,3],[5,7,11],[21,29,31]])\n", "m3" ] }, { "cell_type": "code", "execution_count": 142, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-2.31818182, 0.56818182, 0.02272727],\n", " [ 1.72727273, -0.72727273, 0.09090909],\n", " [-0.04545455, 0.29545455, -0.06818182]])" ] }, "execution_count": 142, "metadata": {}, "output_type": "execute_result" } ], "source": [ "linalg.inv(m3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`pinv` 함수를 사용하여 [유사 역행렬](https://en.wikipedia.org/wiki/Moore%E2%80%93Penrose_pseudoinverse)을 계산할 수도 있습니다:" ] }, { "cell_type": "code", "execution_count": 143, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-2.31818182, 0.56818182, 0.02272727],\n", " [ 1.72727273, -0.72727273, 0.09090909],\n", " [-0.04545455, 0.29545455, -0.06818182]])" ] }, "execution_count": 143, "metadata": {}, "output_type": "execute_result" } ], "source": [ "linalg.pinv(m3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 단위 행렬\n", "\n", "행렬과 그 행렬의 역행렬을 곱하면 단위 행렬이 됩니다(작은 소숫점 오차가 있습니다):" ] }, { "cell_type": "code", "execution_count": 144, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1.00000000e+00, -5.55111512e-17, 0.00000000e+00],\n", " [-2.98372438e-16, 1.00000000e+00, -5.55111512e-17],\n", " [ 5.78009862e-15, 1.27675648e-15, 1.00000000e+00]])" ] }, "execution_count": 144, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m3.dot(linalg.inv(m3))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`eye` 함수는 NxN 크기의 단위 행렬을 만듭니다:" ] }, { "cell_type": "code", "execution_count": 145, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 0., 0.],\n", " [0., 1., 0.],\n", " [0., 0., 1.]])" ] }, "execution_count": 145, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.eye(3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## QR 분해\n", "\n", "`qr` 함수는 행렬을 [QR 분해](https://en.wikipedia.org/wiki/QR_decomposition)합니다:" ] }, { "cell_type": "code", "execution_count": 146, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-0.04627448, 0.98786672, 0.14824986],\n", " [-0.23137241, 0.13377362, -0.96362411],\n", " [-0.97176411, -0.07889213, 0.22237479]])" ] }, "execution_count": 146, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q, r = linalg.qr(m3)\n", "q" ] }, { "cell_type": "code", "execution_count": 147, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-21.61018278, -29.89331494, -32.80860727],\n", " [ 0. , 0.62427688, 1.9894538 ],\n", " [ 0. , 0. , -3.26149699]])" ] }, "execution_count": 147, "metadata": {}, "output_type": "execute_result" } ], "source": [ "r" ] }, { "cell_type": "code", "execution_count": 148, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 1., 2., 3.],\n", " [ 5., 7., 11.],\n", " [21., 29., 31.]])" ] }, "execution_count": 148, "metadata": {}, "output_type": "execute_result" } ], "source": [ "q.dot(r) # q.r는 m3와 같습니다" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 행렬식\n", "\n", "`det` 함수는 [행렬식](https://en.wikipedia.org/wiki/Determinant)을 계산합니다:" ] }, { "cell_type": "code", "execution_count": 149, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "43.99999999999999" ] }, "execution_count": 149, "metadata": {}, "output_type": "execute_result" } ], "source": [ "linalg.det(m3) # 행렬식 계산" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 고윳값과 고유벡터\n", "\n", "`eig` 함수는 정방 행렬의 [고윳값과 고유벡터](https://en.wikipedia.org/wiki/Eigenvalues_and_eigenvectors)를 계산합니다:" ] }, { "cell_type": "code", "execution_count": 150, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([42.26600592, -0.35798416, -2.90802176])" ] }, "execution_count": 150, "metadata": {}, "output_type": "execute_result" } ], "source": [ "eigenvalues, eigenvectors = linalg.eig(m3)\n", "eigenvalues # λ" ] }, { "cell_type": "code", "execution_count": 151, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-0.08381182, -0.76283526, -0.18913107],\n", " [-0.3075286 , 0.64133975, -0.6853186 ],\n", " [-0.94784057, -0.08225377, 0.70325518]])" ] }, "execution_count": 151, "metadata": {}, "output_type": "execute_result" } ], "source": [ "eigenvectors # v" ] }, { "cell_type": "code", "execution_count": 152, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 9.76996262e-15, 2.22044605e-16, -3.10862447e-15],\n", " [ 7.10542736e-15, 2.02615702e-15, -1.11022302e-15],\n", " [ 2.84217094e-14, 5.11049536e-15, -4.88498131e-15]])" ] }, "execution_count": 152, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m3.dot(eigenvectors) - eigenvalues * eigenvectors # m3.v - λ*v = 0" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 특잇값 분해\n", "\n", "`svd` 함수는 행렬을 입력으로 받아 그 행렬의 [특잇값 분해](https://en.wikipedia.org/wiki/Singular_value_decomposition)를 반환합니다:" ] }, { "cell_type": "code", "execution_count": 153, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1, 0, 0, 0, 2],\n", " [0, 0, 3, 0, 0],\n", " [0, 0, 0, 0, 0],\n", " [0, 2, 0, 0, 0]])" ] }, "execution_count": 153, "metadata": {}, "output_type": "execute_result" } ], "source": [ "m4 = np.array([[1,0,0,0,2], [0,0,3,0,0], [0,0,0,0,0], [0,2,0,0,0]])\n", "m4" ] }, { "cell_type": "code", "execution_count": 154, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0., 1., 0., 0.],\n", " [ 1., 0., 0., 0.],\n", " [ 0., 0., 0., -1.],\n", " [ 0., 0., 1., 0.]])" ] }, "execution_count": 154, "metadata": {}, "output_type": "execute_result" } ], "source": [ "U, S_diag, V = linalg.svd(m4)\n", "U" ] }, { "cell_type": "code", "execution_count": 155, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([3. , 2.23606798, 2. , 0. ])" ] }, "execution_count": 155, "metadata": {}, "output_type": "execute_result" } ], "source": [ "S_diag" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`svd` 함수는 Σ의 대각 원소 값만 반환합니다. 전체 Σ 행렬은 다음과 같이 만듭니다:" ] }, { "cell_type": "code", "execution_count": 156, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[3. , 0. , 0. , 0. , 0. ],\n", " [0. , 2.23606798, 0. , 0. , 0. ],\n", " [0. , 0. , 2. , 0. , 0. ],\n", " [0. , 0. , 0. , 0. , 0. ]])" ] }, "execution_count": 156, "metadata": {}, "output_type": "execute_result" } ], "source": [ "S = np.zeros((4, 5))\n", "S[np.diag_indices(4)] = S_diag\n", "S # Σ" ] }, { "cell_type": "code", "execution_count": 157, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[-0. , 0. , 1. , 0. , 0. ],\n", " [ 0.4472136 , 0. , 0. , 0. , 0.89442719],\n", " [-0. , 1. , 0. , 0. , 0. ],\n", " [ 0. , 0. , 0. , 1. , 0. ],\n", " [-0.89442719, 0. , 0. , 0. , 0.4472136 ]])" ] }, "execution_count": 157, "metadata": {}, "output_type": "execute_result" } ], "source": [ "V" ] }, { "cell_type": "code", "execution_count": 158, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[1., 0., 0., 0., 2.],\n", " [0., 0., 3., 0., 0.],\n", " [0., 0., 0., 0., 0.],\n", " [0., 2., 0., 0., 0.]])" ] }, "execution_count": 158, "metadata": {}, "output_type": "execute_result" } ], "source": [ "U.dot(S).dot(V) # U.Σ.V == m4" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 대각원소와 대각합" ] }, { "cell_type": "code", "execution_count": 159, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 1, 7, 31])" ] }, "execution_count": 159, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.diag(m3) # m3의 대각 원소입니다(왼쪽 위에서 오른쪽 아래)" ] }, { "cell_type": "code", "execution_count": 160, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "39" ] }, "execution_count": 160, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.trace(m3) # np.diag(m3).sum()와 같습니다" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## 선형 방정식 풀기" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "`solve` 함수는 다음과 같은 선형 방정식을 풉니다:\n", "\n", "* $2x + 6y = 6$\n", "* $5x + 3y = -9$" ] }, { "cell_type": "code", "execution_count": 161, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([-3., 2.])" ] }, "execution_count": 161, "metadata": {}, "output_type": "execute_result" } ], "source": [ "coeffs = np.array([[2, 6], [5, 3]])\n", "depvars = np.array([6, -9])\n", "solution = linalg.solve(coeffs, depvars)\n", "solution" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "solution을 확인해 보죠:" ] }, { "cell_type": "code", "execution_count": 162, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([ 6., -9.]), array([ 6, -9]))" ] }, "execution_count": 162, "metadata": {}, "output_type": "execute_result" } ], "source": [ "coeffs.dot(solution), depvars # 네 같네요" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "좋습니다! 다른 방식으로도 solution을 확인해 보죠:" ] }, { "cell_type": "code", "execution_count": 163, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "True" ] }, "execution_count": 163, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.allclose(coeffs.dot(solution), depvars)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 벡터화\n", "\n", "한 번에 하나씩 개별 배열 원소에 대해 연산을 실행하는 대신 배열 연산을 사용하면 훨씬 효율적인 코드를 만들 수 있습니다. 이를 벡터화라고 합니다. 이를 사용하여 넘파이의 최적화된 성능을 활용할 수 있습니다.\n", "\n", "예를 들어, $sin(xy/40.5)$ 식을 기반으로 768x1024 크기 배열을 생성하려고 합니다. 중첩 반복문 안에 파이썬의 math 함수를 사용하는 것은 **나쁜** 방법입니다:" ] }, { "cell_type": "code", "execution_count": 164, "metadata": {}, "outputs": [], "source": [ "import math\n", "data = np.empty((768, 1024))\n", "for y in range(768):\n", " for x in range(1024):\n", " data[y, x] = math.sin(x*y/40.5) # 매우 비효율적입니다!" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "작동은 하지만 순수한 파이썬 코드로 반복문이 진행되기 때문에 아주 비효율적입니다. 이 알고리즘을 벡터화해 보죠. 먼저 넘파이 `meshgrid` 함수로 좌표 벡터를 사용해 행렬을 만듭니다." ] }, { "cell_type": "code", "execution_count": 165, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 1, 2, ..., 1021, 1022, 1023],\n", " [ 0, 1, 2, ..., 1021, 1022, 1023],\n", " [ 0, 1, 2, ..., 1021, 1022, 1023],\n", " ...,\n", " [ 0, 1, 2, ..., 1021, 1022, 1023],\n", " [ 0, 1, 2, ..., 1021, 1022, 1023],\n", " [ 0, 1, 2, ..., 1021, 1022, 1023]])" ] }, "execution_count": 165, "metadata": {}, "output_type": "execute_result" } ], "source": [ "x_coords = np.arange(0, 1024) # [0, 1, 2, ..., 1023]\n", "y_coords = np.arange(0, 768) # [0, 1, 2, ..., 767]\n", "X, Y = np.meshgrid(x_coords, y_coords)\n", "X" ] }, { "cell_type": "code", "execution_count": 166, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0, 0, 0, ..., 0, 0, 0],\n", " [ 1, 1, 1, ..., 1, 1, 1],\n", " [ 2, 2, 2, ..., 2, 2, 2],\n", " ...,\n", " [765, 765, 765, ..., 765, 765, 765],\n", " [766, 766, 766, ..., 766, 766, 766],\n", " [767, 767, 767, ..., 767, 767, 767]])" ] }, "execution_count": 166, "metadata": {}, "output_type": "execute_result" } ], "source": [ "Y" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "여기서 볼 수 있듯이 `X`와 `Y` 모두 768x1024 배열입니다. `X`에 있는 모든 값은 수평 좌표에 해당합니다. `Y`에 있는 모든 값은 수직 좌표에 해당합니다.\n", "\n", "이제 간단히 배열 연산을 사용해 계산할 수 있습니다:" ] }, { "cell_type": "code", "execution_count": 167, "metadata": {}, "outputs": [], "source": [ "data = np.sin(X*Y/40.5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "맷플롯립의 `imshow` 함수를 사용해 이 데이터를 그려보죠([matplotlib tutorial](tools_matplotlib.ipynb)을 참조하세요)." ] }, { "cell_type": "code", "execution_count": 168, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import matplotlib.pyplot as plt\n", "import matplotlib.cm as cm\n", "fig = plt.figure(1, figsize=(7, 6))\n", "plt.imshow(data, cmap=cm.hot)\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 저장과 로딩\n", "\n", "넘파이는 `ndarray`를 바이너리 또는 텍스트 포맷으로 손쉽게 저장하고 로드할 수 있습니다.\n", "\n", "## 바이너리 `.npy` 포맷\n", "\n", "랜덤 배열을 만들고 저장해 보죠." ] }, { "cell_type": "code", "execution_count": 169, "metadata": { "scrolled": true }, "outputs": [ { "data": { "text/plain": [ "array([[3.61301393e-04, 4.46564139e-01, 8.68544670e-02],\n", " [6.04807233e-01, 2.77666582e-01, 3.42502021e-01]])" ] }, "execution_count": 169, "metadata": {}, "output_type": "execute_result" } ], "source": [ "a = np.random.rand(2,3)\n", "a" ] }, { "cell_type": "code", "execution_count": 170, "metadata": {}, "outputs": [], "source": [ "np.save(\"my_array\", a)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "끝입니다! 파일 이름의 확장자를 지정하지 않았기 때문에 넘파이는 자동으로 `.npy`를 붙입니다. 파일 내용을 확인해 보겠습니다:" ] }, { "cell_type": "code", "execution_count": 171, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "b'\\x93NUMPY\\x01\\x00v\\x00{\\'descr\\': \\'" ] }, "execution_count": 180, "metadata": {}, "output_type": "execute_result" } ], "source": [ "my_arrays = np.load(\"my_arrays.npz\")\n", "my_arrays" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "게으른 로딩을 수행하는 딕셔너리와 유사한 객체입니다:" ] }, { "cell_type": "code", "execution_count": 181, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "KeysView()" ] }, "execution_count": 181, "metadata": {}, "output_type": "execute_result" } ], "source": [ "my_arrays.keys()" ] }, { "cell_type": "code", "execution_count": 182, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[3.61301393e-04, 4.46564139e-01, 8.68544670e-02],\n", " [6.04807233e-01, 2.77666582e-01, 3.42502021e-01]])" ] }, "execution_count": 182, "metadata": {}, "output_type": "execute_result" } ], "source": [ "my_arrays[\"my_a\"]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# 그 다음은?\n", "\n", "넘파이 기본 요소를 모두 배웠지만 훨씬 더 많은 기능이 있습니다. 이를 배우는 가장 좋은 방법은 넘파이를 직접 실습해 보고 훌륭한 [넘파이 문서](http://docs.scipy.org/doc/numpy/reference/index.html)에서 필요한 함수와 기능을 찾아 보세요." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.6" }, "toc": { "toc_cell": false, "toc_number_sections": true, "toc_section_display": "block", "toc_threshold": 6, "toc_window_display": false }, "toc_position": { "height": "677px", "left": "1195.02px", "right": "20px", "top": "78px", "width": "238px" } }, "nbformat": 4, "nbformat_minor": 1 }