{ "cells": [ { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "# Chapter 1. 한눈에 보는 머신러닝" ] }, { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "---\n", "## 1.1 머신러닝이란?" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "▷ 머신러닝 애플리케이션 - 광학 문자 판독기(Optical Character Recognition, OCR), 스팸 필터(spam filter), etc." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "▶**일반적인 정의:** 머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다. **_아서 사무엘(Arthur Samuel, 1959)**" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "▶**공학적인 정의:** 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, \n", " 이 컴퓨터 프로그램은 **작업 T**와 **성능 측정 P**에 대해 **경험 E**로 학습한 것이다. **_톰 미첼(Tom Mitchell, 1997)**" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- **훈련 세트**(Training set) - 학습하는 데 사용하는 샘플세트\n", "- **훈련 사례**(Training instance) - 각 훈련 데이터(샘플)\n", "- **훈련 데이터**(Training data) - 훈련에 사용된 데이터(경험 E)\n", "\n", "\n", "+ **작업 T** - e.g. 새로운 메일이 스팸인지 구분하는 것\n", "+ **경험 E** - 훈련 데이터\n", "+ **성능 측정 P** - **정확도**(accuracy) e.g. 정확히 분류된 메일의 비율" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "---\n", "## 1.2 왜 머신러닝을 사용하는가? (in the spam filter)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "![Figure1-1](./images/Figure1-1.png)\n", "**