{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Майнор по Анализу Данных, Группа ИАД-4\n", "## 05/10/2017 Бустинг" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Table of Contents\n", "
" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "import os\n", "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "\n", "%matplotlib inline\n", "\n", "plt.style.use('ggplot')\n", "plt.rcParams['figure.figsize'] = (8, 8)\n", "\n", "# Для кириллицы на графиках\n", "font = {'family': 'Verdana',\n", " 'weight': 'normal'}\n", "plt.rc('font', **font)\n", "\n", "try:\n", " from ipywidgets import interact, IntSlider, fixed, FloatSlider\n", "except ImportError:\n", " print u'Так надо'" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Алгоритм Ada-boost" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Повторяем теорию" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Boosting, в отличие от bagging'а - это последовательный способ построения композиции базовых моделей.\n", "\n", "Мы постоянно работаем с одним и тем же набором данных, **но** на каждом шаге строим новую базовую модель, которая учитывает ошибки предыдущей модели.