{
"metadata": {
"name": "",
"signature": "sha256:e3006728d3d1b159e2a1eb136fff6d49097979220c733b1e548a985a23b850eb"
},
"nbformat": 3,
"nbformat_minor": 0,
"worksheets": [
{
"cells": [
{
"cell_type": "code",
"collapsed": false,
"input": [
"#create DataFrame\n",
"import pandas as pd\n",
"import numpy as np\n",
"from pandas import DataFrame, Series\n",
"df = DataFrame(\n",
" {'integer':[1,2,3,6,7,23,8,3],\n",
" 'float':[2,3.4,5,6,2,4.7,4,8],\n",
" 'string':['saya',None,'aku','cinta','kamu','a','b','jika']}\n",
")"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 5
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#show data in DataFrame\n",
"df"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" string | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2.0 | \n",
" 1 | \n",
" saya | \n",
"
\n",
" \n",
" 1 | \n",
" 3.4 | \n",
" 2 | \n",
" None | \n",
"
\n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
"
\n",
" \n",
" 4 | \n",
" 2.0 | \n",
" 7 | \n",
" kamu | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
"
\n",
" \n",
" 6 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 6,
"text": [
" float integer string\n",
"0 2.0 1 saya\n",
"1 3.4 2 None\n",
"2 5.0 3 aku\n",
"3 6.0 6 cinta\n",
"4 2.0 7 kamu\n",
"5 4.7 23 a\n",
"6 4.0 8 b\n",
"7 8.0 3 jika"
]
}
],
"prompt_number": 6
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#Show data based on columns selected by index\n",
"df.ix[:,['string','float']]"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" string | \n",
" float | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" saya | \n",
" 2.0 | \n",
"
\n",
" \n",
" 1 | \n",
" None | \n",
" 3.4 | \n",
"
\n",
" \n",
" 2 | \n",
" aku | \n",
" 5.0 | \n",
"
\n",
" \n",
" 3 | \n",
" cinta | \n",
" 6.0 | \n",
"
\n",
" \n",
" 4 | \n",
" kamu | \n",
" 2.0 | \n",
"
\n",
" \n",
" 5 | \n",
" a | \n",
" 4.7 | \n",
"
\n",
" \n",
" 6 | \n",
" b | \n",
" 4.0 | \n",
"
\n",
" \n",
" 7 | \n",
" jika | \n",
" 8.0 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 7,
"text": [
" string float\n",
"0 saya 2.0\n",
"1 None 3.4\n",
"2 aku 5.0\n",
"3 cinta 6.0\n",
"4 kamu 2.0\n",
"5 a 4.7\n",
"6 b 4.0\n",
"7 jika 8.0"
]
}
],
"prompt_number": 7
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#show data based columns selected\n",
"df[['string','float']]"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" string | \n",
" float | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" saya | \n",
" 2.0 | \n",
"
\n",
" \n",
" 1 | \n",
" None | \n",
" 3.4 | \n",
"
\n",
" \n",
" 2 | \n",
" aku | \n",
" 5.0 | \n",
"
\n",
" \n",
" 3 | \n",
" cinta | \n",
" 6.0 | \n",
"
\n",
" \n",
" 4 | \n",
" kamu | \n",
" 2.0 | \n",
"
\n",
" \n",
" 5 | \n",
" a | \n",
" 4.7 | \n",
"
\n",
" \n",
" 6 | \n",
" b | \n",
" 4.0 | \n",
"
\n",
" \n",
" 7 | \n",
" jika | \n",
" 8.0 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 8,
"text": [
" string float\n",
"0 saya 2.0\n",
"1 None 3.4\n",
"2 aku 5.0\n",
"3 cinta 6.0\n",
"4 kamu 2.0\n",
"5 a 4.7\n",
"6 b 4.0\n",
"7 jika 8.0"
]
}
],
"prompt_number": 8
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#show data with condition\n",
"df[df['float']>4]"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" string | \n",
"
\n",
" \n",
" \n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 9,
"text": [
" float integer string\n",
"2 5.0 3 aku\n",
"3 6.0 6 cinta\n",
"5 4.7 23 a\n",
"7 8.0 3 jika"
]
}
],
"prompt_number": 9
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#rename columns in DataFrame\n",
"df2 = df.rename(columns={'string':'characters'})"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 10
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#Show DataFrame after rename column\n",
"df2"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" characters | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2.0 | \n",
" 1 | \n",
" saya | \n",
"
\n",
" \n",
" 1 | \n",
" 3.4 | \n",
" 2 | \n",
" None | \n",
"
\n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
"
\n",
" \n",
" 4 | \n",
" 2.0 | \n",
" 7 | \n",
" kamu | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
"
\n",
" \n",
" 6 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 11,
"text": [
" float integer characters\n",
"0 2.0 1 saya\n",
"1 3.4 2 None\n",
"2 5.0 3 aku\n",
"3 6.0 6 cinta\n",
"4 2.0 7 kamu\n",
"5 4.7 23 a\n",
"6 4.0 8 b\n",
"7 8.0 3 jika"
]
}
],
"prompt_number": 11
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#Drop NA value in DataFrame\n",
"df2.dropna()"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" characters | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2.0 | \n",
" 1 | \n",
" saya | \n",
"
\n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
"
\n",
" \n",
" 4 | \n",
" 2.0 | \n",
" 7 | \n",
" kamu | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
"
\n",
" \n",
" 6 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 12,
"text": [
" float integer characters\n",
"0 2.0 1 saya\n",
"2 5.0 3 aku\n",
"3 6.0 6 cinta\n",
"4 2.0 7 kamu\n",
"5 4.7 23 a\n",
"6 4.0 8 b\n",
"7 8.0 3 jika"
]
}
],
"prompt_number": 12
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"#Show mean, median, and maximum column in Data Frame\n",
"mean = df2['float'].mean()\n",
"print \"mean %f\" % mean\n",
"median = df2['float'].median()\n",
"print \"median %f\" %median\n",
"max = df2['float'].max()\n",
"print \"max %f\" % max"
],
"language": "python",
"metadata": {},
"outputs": [
{
"output_type": "stream",
"stream": "stdout",
"text": [
"mean 4.387500\n",
"median 4.350000\n",
"max 8.000000\n"
]
}
],
"prompt_number": 13
},
{
"cell_type": "code",
"collapsed": false,
"input": [],
"language": "python",
"metadata": {},
"outputs": []
}
],
"metadata": {}
}
]
}