{ "cells": [ { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "# Домашняя работа №5\n", "Шестаков А.В. Майнор по анализу данных 2016" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "\n", "**Общая информация**\n", "\n", "**Срок сдачи:** 8 июня 2016, 23:59 \n", "**Штраф за опоздание:** -0.5 за каждый день\n", "**Работы принимаются до зачетной недели**\n", "\n", "При отправлении ДЗ на почту указывайте фамилию в названии файла, а тему письма оформляйте в следующем виде:\n", "** [Майнор ИАД 2016] *{Фамилия}* *{Имя}* ДЗ*{Номер}* **\n", "\n", "\n", "**Векторизуйте ваш код! Если в решениях будут присутствовать ненужные циклы - оценка за задачу будет равна 0!**\n", "\n", "Сопровождайте ваш код изображеними, комментариями и выводами. \n", "Иммейте ввиду, что на некоторые задачи нет единственного верного и полного ответа. Чем больше информации вы сможете извлечь, аргументированных выводов сформулировать, тем лучше.\n", "\n", "Используйте данный Ipython Notebook при оформлении домашнего задания.\n", "" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Кластеризация" ] }, { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "### Задача 1 (1 балла)\n", "Выберите любую (желательно красочную) картинку, подгузите её с помощью `image = plt.imread(path_to_image)` и выведите на экран с помощью `plt.imshow(image)`" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# Your code here" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Задача 2 (2 балла)\n", "Выполните компрессию изображения с помощью метода k-means, т.е. \n", "* Зафиксируйте число кластеров `k` \n", "* Выполните кластеризацию\n", "* Замените цветовые характеристики пикселей на соответствующие значения центройдов\n", "* Выведите результат с помощью `plt.imshow`" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# Your code here" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Случайный лес и KNN" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Задача 3 (1 балл)\n", "Загрузите [данные](https://www.dropbox.com/s/47x4eyxxzkfwcjf/student-mat.csv?dl=0) об оценках студентов по математике. Изучите [описанием полей](https://www.dropbox.com/s/xg0z11c2n4m70h3/student.txt?dl=0) данных. \n", "\n", "Предлагается предсказать одно из полей G1-G3 (на ваш выбор). Соответственно, выберите любое поле, а остальные 2 удалите." ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# Your code here" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Задача 4 (3 балла)\n", "Обучите на данных случайный лес. Для этого\n", "* В соответствии с описанием полей, выполните необходимые преобразования признаков\n", "* Разбейте данные на обучение и контроль в пропорции 80/20\n", "* С помощью метода скользящего контроля подберите оптимальное количество деревьев в лесу (ошибка измеряется как mean absolute error (MAE)). Скользящий контроль выполняется на обучающей подвыборке\n", "* Выведите 10 признаков с наибольшей значимостью.\n", "* Примените лучшие настройки алгоритма на тестовой выборке и выведите результат" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# Your code here" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Задача 5 (3 балла)\n", "Обучите на данных метод ближайшего соседа. Для этого\n", "* В соответствии с описанием полей и особенностями алгоритма, выполните необходимые преобразования признаков\n", "* Разбейте данные на обучение и контроль в пропорции 80/20 (ровно так же, как в задаче 4)\n", "* С помощью метода скользящего контроля подберите оптимальное число ближайших соседей и функцию взвешивания (`uniform` или `distance`)\n", "* Примените лучшие настройки алгоритма на тестовой выборке и выведите результат." ] }, { "cell_type": "code", "execution_count": null, "metadata": { "collapsed": true }, "outputs": [], "source": [ "# Your code here" ] } ], "metadata": { "kernelspec": { "display_name": "Python 2", "language": "python", "name": "python2" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 2 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython2", "version": "2.7.11" } }, "nbformat": 4, "nbformat_minor": 0 }