# Tutorial `hidrokit.prep.excel`

- **Kategori**: _data preparation_
- __Tujuan__: Memperoleh dataframe dari _excel file_.
- __Dokumentasi__: [readthedocs](https://github.com/taruma/hidrokit-nb/blob/master/notebook/taruma_hidrokit_prep_timeseries.ipynb)

## Informasi notebook

- __notebook name__: `taruma_hidrokit_prep_excel`
- __notebook version/date__: `1.0.2`/`20190713`
- __notebook server__: Google Colab
- __hidrokit version__: `0.2.0`
- **python version**: `3.7`


## CATATAN

Modul `.prep.excel` masih dalam tahap pengembangan sehingga fungsi yang akan ditampilkan pada tutorial ini adalah _private function_ yang ditandai dengan diawali `_` pada setiap fungsinya. Fungsi tersebut seharusnya tidak digunakan oleh _users_ dan hanya bertugas sebagai fungsi di balik layar. Notebook ini hanya melengkapi tutorial hidrokit. 

**Disarankan tidak menggunakan _private function_, karena _private function_ akan mengalami perubahan signifikan selama pengembangan.**

## Instalasi hidrokit

In [0]:
### Instalasi melalui PyPI
!pip install hidrokit[excel] # Digunakan [excel] karena membutuhkan paket xlrd

### Instalasi melalui Github
# !pip install git+https://github.com/taruma/hidrokit.git

### Instalasi melalui Github (Latest)
# !pip install git+https://github.com/taruma/hidrokit.git@latest



## Import Library

In [0]:
import numpy as np
import pandas as pd


## Dataset

In [0]:
# Ambil dataset dari data test hidrokit
!wget -O '2006 data hujan stasiun A.xls' "https://github.com/taruma/hidrokit/blob/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls?raw=true"

--2019-07-13 02:17:07--  https://github.com/taruma/hidrokit/blob/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls?raw=true
Resolving github.com (github.com)... 140.82.114.3
Connecting to github.com (github.com)|140.82.114.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://github.com/taruma/hidrokit/raw/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls [following]
--2019-07-13 02:17:08--  https://github.com/taruma/hidrokit/raw/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls
Reusing existing connection to github.com:443.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/taruma/hidrokit/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls [following]
--2019-07-13 02:17:08--  https://raw.githubusercontent.com/taruma/hidrokit/master/tests/data/excel/2006%20HUJAN%20DISNEY%20LAND.xls
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 151.101.0.133, 151.101.64.133, 151.

In [0]:
# Menampilkan file excel dalam bentuk dataframe
filepath = '2006 data hujan stasiun A.xls'
year = 2006
pd.read_excel(filepath)

Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13
0,,DATA CURAH HUJAN BIASA DALAM MILIMETER,,,,,,,,,,,,
1,,,,,,,,,,,,,,
2,,NO. POS HUJAN,,,,,,,,,,,,
3,,NAMA POS HUJAN,,,,,,,,,,,,
4,,NO. KADASTER,,,,,,,,,,,,
5,,DAERAH ALIRAN SUNGAI,,,,,,,,,,,,
6,,LOKASI GEOGRAFI,,,,,,,,,,,,
7,,KECAMATAN,,,,,,,,,,,,
8,,DESA,,,,,,,,,,,,
9,,TINGGI DARI PERMUKAAN LAUT (m),,,,,,,,,,,,


# Fungsi _private_ `prep.excel()`

- __Tujuan__: Memperoleh data dari _excel file_.
- __Dokumentasi__: [readthedocs](https://hidrokit.readthedocs.io/en/stable/prep.html#module-prep.excel)

In [0]:
from hidrokit.prep import excel

## `_file_single_pivot()`

Memperoleh tabel pivot dari _excel file_

In [0]:
tabel_pivot = excel._file_single_pivot(filepath)
tabel_pivot

Unnamed: 0,2,3,4,5,6,7,8,9,10,11,12,13
19,-,28.3,28.3,8.4,-,-,-,-,-,-,-,159
20,9.8,16.2,-,-,-,29,-,0.7,-,-,63.4,52.5
21,-,9.3,16.5,13.9,-,-,-,-,-,0.3,-,11.6
22,66.3,-,11.3,-,-,13.2,-,-,-,-,-,12.3
23,2.7,-,-,-,-,-,-,-,-,0.6,-,-
24,-,11.8,-,-,-,-,-,-,-,-,27.5,0.6
25,-,15.2,-,-,-,-,-,-,-,-,-,4.3
26,31.4,-,32.8,-,-,12.8,-,-,-,-,-,0.8
27,-,-,-,-,-,-,88.5,-,-,-,38.6,-
28,-,-,17.2,0.7,92.6,-,-,-,-,11.6,-,-


## `_dataframe_table()`

Mengubah tabel pivot ke dataframe kolom tunggal.

In [0]:
tabel_tunggal = excel._dataframe_table(tabel_pivot, year, name='sta_a')
tabel_tunggal

Unnamed: 0,sta_a
2006-01-01,-
2006-01-02,9.8
2006-01-03,-
2006-01-04,66.3
2006-01-05,2.7
2006-01-06,-
2006-01-07,-
2006-01-08,31.4
2006-01-09,-
2006-01-10,-


# Changelog

```
- 20190713 - 1.0.2 - Informasi notebook
- 20190713 - 1.0.1 - Fix typo
- 20190713 - 1.0.0 - Initial
```

#### Copyright © 2019 [Taruma Sakti Megariansyah](https://taruma.github.io)

Source code in this notebook is licensed under a [MIT License](https://opensource.org/licenses/MIT). Data in this notebook is licensed under a [Creative Common Attribution 4.0 International](https://choosealicense.com/licenses/cc-by-4.0/). 