{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {
    "collapsed": true
   },
   "source": [
    "# Домашнее задание VIII\n",
    "\n",
    "**Составил:** Шабанова П.А. в рамках курса [Python дайджест](https://github.com/whitehorn/Python_Digest)\n",
    "\n",
    "**E-mail:** pa.shabanov@gmail.com\n",
    "\n",
    "**URL:** [Заметки по программированию в науках о Земле](http://progeoru.blogspot.ru/)\n",
    "\n",
    "### Справочный материал\n",
    "\n",
    "+ [Обзор модулей xlrd/xlwt](http://progeoru.blogspot.ru/search/label/excel)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Задачи\n",
    "\n",
    "### Задание 1\n",
    "\n",
    "Чтение данных их текстовых файлов - одна из самых распространённых задач при работе с данными наблюдений.\n",
    "\n",
    "1. Скачайте файл \"6742900.day\" из [архива по ссылке](https://yadi.sk/d/cyCvKQoqqhvLB). Это данные суточных расходов р. Дунай.\n",
    "\n",
    "2. С помощью функции numpy.genfromtxt() считайте численные данные из 6 столбцов, отделённых разделителем \";\". Воспользуйтесь синтаксисом Листинга-подсказки 1, а также из практических примеров занятия N6. Если есть силы - воспользуйтесь Листингом-подсказкой 2.\n",
    "\n",
    "3. Рассчитайте месячные расходы реки Дунай за 1931 год (воспользуйтесь срезом для данных 1931 года). Месячный расход рассчиать как сумму суточных расходов за соответствующий месяц. Для месячных величин также воспользуйтесь срезом (для массива A \"1янв1931-31дек1931\" длины 365 январские значения будут A[0:31]). Для суммирование можно воспользоваться либо функцией sum(), либо np.sum(), либо методом массивов A.sum()\n",
    "\n",
    "### Задание 2\n",
    "\n",
    "Запишите полученный массив месячных расходов р. Дунай за 1931 год в excel файл в виде двух столбцов: номер месяца (январь - 1) и значение. Для этого воспользуйтесь примерами из практических примеров L8 (см. Листинги 2 и 3.5) и модулем xlwt или методом таблиц A.to_excel() из модуля pandas ().\n",
    "\n",
    "#### Пример выполнения задания:\n",
    "\n",
    "1 186000.0\n",
    "\n",
    "2 194320.0\n",
    "\n",
    "### Присылайте ваши программы на адрес pa.shabanov@gmail.com с обязательным указанием имени, фамилии и номера занятия (N8)!"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {
    "collapsed": false,
    "scrolled": true
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "(29220L, 5L)\n",
      "(365L, 5L) [['1931-01-01' '--:--' '   6570.000' '   6570.000' ' -999']\n",
      " ['1931-01-02' '--:--' '   6480.000' '   6480.000' ' -999']\n",
      " ['1931-01-03' '--:--' '   6320.000' '   6320.000' ' -999']\n",
      " ..., \n",
      " ['1931-12-29' '--:--' '   4790.000' '   4790.000' ' -999']\n",
      " ['1931-12-30' '--:--' '   4540.000' '   4540.000' ' -999']\n",
      " ['1931-12-31' '--:--' '   4300.000' '   4300.000' ' -999']]\n",
      "После метода np.genfromtxt тип данных объекта a будет <type 'numpy.ndarray'>:\n",
      "<class 'pandas.core.frame.DataFrame'>\n"
     ]
    }
   ],
   "source": [
    "# ЛИСТИНГ-ПОДСКАЗКА 1\n",
    "\n",
    "import numpy as np\n",
    "import pandas as pd\n",
    "\n",
    "filename='6742900.day'\n",
    "\n",
    "# Для подсказок-описаний атрибутов функции genfromtxt() воспользуйтесь методом .__doc__\n",
    "#print np.genfromtxt.__doc__\n",
    "'''\n",
    "dtype - определяет тип считаных данных(int, float, str);\n",
    "skip_header=41 - пропускает 41 строчку сверху файла;\n",
    "delimiter - тип разделителя.\n",
    "'''\n",
    "a = np.genfromtxt(filename, delimiter=';', skip_header=41, dtype='str')\n",
    "print a.shape\n",
    "a = a[:365,:]\n",
    "print a.shape, a\n",
    "print 'После метода np.genfromtxt тип данных объекта a будет %s:' % type(a)\n",
    "# Преобразование к другому типу данных\n",
    "pda = pd.DataFrame(a)\n",
    "print type(pda)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "С помощью модуля pandas"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "metadata": {
    "collapsed": false
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "(29220, 5)\n",
      "<bound method DataFrame.head of        YYYY-MM-DD  hh:mm   Original   Calculated   Flag\n",
      "0      1931-01-01  --:--       6570         6570   -999\n",
      "1      1931-01-02  --:--       6480         6480   -999\n",
      "2      1931-01-03  --:--       6320         6320   -999\n",
      "3      1931-01-04  --:--       5930         5930   -999\n",
      "4      1931-01-05  --:--       5750         5750   -999\n",
      "5      1931-01-06  --:--       5680         5680   -999\n",
      "6      1931-01-07  --:--       5530         5530   -999\n",
      "7      1931-01-08  --:--       5500         5500   -999\n",
      "8      1931-01-09  --:--       5530         5530   -999\n",
      "9      1931-01-10  --:--       5510         5510   -999\n",
      "10     1931-01-11  --:--       5580         5580   -999\n",
      "11     1931-01-12  --:--       5650         5650   -999\n",
      "12     1931-01-13  --:--       5850         5850   -999\n",
      "13     1931-01-14  --:--       6030         6030   -999\n",
      "14     1931-01-15  --:--       6200         6200   -999\n",
      "15     1931-01-16  --:--       6280         6280   -999\n",
      "16     1931-01-17  --:--       6340         6340   -999\n",
      "17     1931-01-18  --:--       6380         6380   -999\n",
      "18     1931-01-19  --:--       6530         6530   -999\n",
      "19     1931-01-20  --:--       6380         6380   -999\n",
      "20     1931-01-21  --:--       6500         6500   -999\n",
      "21     1931-01-22  --:--       6500         6500   -999\n",
      "22     1931-01-23  --:--       6380         6380   -999\n",
      "23     1931-01-24  --:--       6280         6280   -999\n",
      "24     1931-01-25  --:--       6280         6280   -999\n",
      "25     1931-01-26  --:--       6230         6230   -999\n",
      "26     1931-01-27  --:--       6180         6180   -999\n",
      "27     1931-01-28  --:--       6080         6080   -999\n",
      "28     1931-01-29  --:--       6030         6030   -999\n",
      "29     1931-01-30  --:--       5880         5880   -999\n",
      "...           ...    ...        ...          ...    ...\n",
      "29190  2010-12-02  --:--       8030         8030   -999\n",
      "29191  2010-12-03  --:--       8180         8180   -999\n",
      "29192  2010-12-04  --:--       8400         8400   -999\n",
      "29193  2010-12-05  --:--       8650         8650   -999\n",
      "29194  2010-12-06  --:--       9030         9030   -999\n",
      "29195  2010-12-07  --:--       9380         9380   -999\n",
      "29196  2010-12-08  --:--       9700         9700   -999\n",
      "29197  2010-12-09  --:--       9930         9930   -999\n",
      "29198  2010-12-10  --:--      10200        10200   -999\n",
      "29199  2010-12-11  --:--      10360        10360   -999\n",
      "29200  2010-12-12  --:--      10680        10680   -999\n",
      "29201  2010-12-13  --:--      10840        10840   -999\n",
      "29202  2010-12-14  --:--      11000        11000   -999\n",
      "29203  2010-12-15  --:--      11160        11160   -999\n",
      "29204  2010-12-16  --:--      11160        11160   -999\n",
      "29205  2010-12-17  --:--      11360        11360   -999\n",
      "29206  2010-12-18  --:--      11530        11530   -999\n",
      "29207  2010-12-19  --:--      11490        11490   -999\n",
      "29208  2010-12-20  --:--      11490        11490   -999\n",
      "29209  2010-12-21  --:--      11530        11530   -999\n",
      "29210  2010-12-22  --:--      11530        11530   -999\n",
      "29211  2010-12-23  --:--      11570        11570   -999\n",
      "29212  2010-12-24  --:--      11610        11610   -999\n",
      "29213  2010-12-25  --:--      11700        11700   -999\n",
      "29214  2010-12-26  --:--      11610        11610   -999\n",
      "29215  2010-12-27  --:--      11490        11490   -999\n",
      "29216  2010-12-28  --:--      11570        11570   -999\n",
      "29217  2010-12-29  --:--      11490        11490   -999\n",
      "29218  2010-12-30  --:--      11490        11490   -999\n",
      "29219  2010-12-31  --:--      11490        11490   -999\n",
      "\n",
      "[29220 rows x 5 columns]>\n",
      "После метода pd.read_csv тип данных объекта a будет <class 'pandas.core.frame.DataFrame'>:\n",
      "<type 'numpy.ndarray'>\n"
     ]
    }
   ],
   "source": [
    "# ЛИСТИНГ-ПОДСКАЗКА 2\n",
    "\n",
    "# Для подсказок-описаний атрибутов функции read_csv() воспользуйтесь методом .__doc__\n",
    "#print pd.read_csv.__doc__\n",
    "'''\n",
    "header=40 - пропускает 39 строчек, а 40 использует для названия столбцов таблицы (DataFrame);\n",
    "sep - тип разделителя.\n",
    "'''\n",
    "a = pd.read_csv(filename, sep=';', header=40)\n",
    "print a.shape\n",
    "print a.head   # верх таблицы\n",
    "\n",
    "print 'После метода pd.read_csv тип данных объекта a будет %s:' % type(a)\n",
    "\n",
    "# Преобразование к другому типу данных\n",
    "npa = np.array(a)\n",
    "print type(npa)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 2",
   "language": "python",
   "name": "python2"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 2
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython2",
   "version": "2.7.11"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 0
}