{ "metadata": { "name": "", "signature": "sha256:e3006728d3d1b159e2a1eb136fff6d49097979220c733b1e548a985a23b850eb" }, "nbformat": 3, "nbformat_minor": 0, "worksheets": [ { "cells": [ { "cell_type": "code", "collapsed": false, "input": [ "#create DataFrame\n", "import pandas as pd\n", "import numpy as np\n", "from pandas import DataFrame, Series\n", "df = DataFrame(\n", " {'integer':[1,2,3,6,7,23,8,3],\n", " 'float':[2,3.4,5,6,2,4.7,4,8],\n", " 'string':['saya',None,'aku','cinta','kamu','a','b','jika']}\n", ")" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 5 }, { "cell_type": "code", "collapsed": false, "input": [ "#show data in DataFrame\n", "df" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
floatintegerstring
0 2.0 1 saya
1 3.4 2 None
2 5.0 3 aku
3 6.0 6 cinta
4 2.0 7 kamu
5 4.7 23 a
6 4.0 8 b
7 8.0 3 jika
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 6, "text": [ " float integer string\n", "0 2.0 1 saya\n", "1 3.4 2 None\n", "2 5.0 3 aku\n", "3 6.0 6 cinta\n", "4 2.0 7 kamu\n", "5 4.7 23 a\n", "6 4.0 8 b\n", "7 8.0 3 jika" ] } ], "prompt_number": 6 }, { "cell_type": "code", "collapsed": false, "input": [ "#Show data based on columns selected by index\n", "df.ix[:,['string','float']]" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
stringfloat
0 saya 2.0
1 None 3.4
2 aku 5.0
3 cinta 6.0
4 kamu 2.0
5 a 4.7
6 b 4.0
7 jika 8.0
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 7, "text": [ " string float\n", "0 saya 2.0\n", "1 None 3.4\n", "2 aku 5.0\n", "3 cinta 6.0\n", "4 kamu 2.0\n", "5 a 4.7\n", "6 b 4.0\n", "7 jika 8.0" ] } ], "prompt_number": 7 }, { "cell_type": "code", "collapsed": false, "input": [ "#show data based columns selected\n", "df[['string','float']]" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
stringfloat
0 saya 2.0
1 None 3.4
2 aku 5.0
3 cinta 6.0
4 kamu 2.0
5 a 4.7
6 b 4.0
7 jika 8.0
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 8, "text": [ " string float\n", "0 saya 2.0\n", "1 None 3.4\n", "2 aku 5.0\n", "3 cinta 6.0\n", "4 kamu 2.0\n", "5 a 4.7\n", "6 b 4.0\n", "7 jika 8.0" ] } ], "prompt_number": 8 }, { "cell_type": "code", "collapsed": false, "input": [ "#show data with condition\n", "df[df['float']>4]" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
floatintegerstring
2 5.0 3 aku
3 6.0 6 cinta
5 4.7 23 a
7 8.0 3 jika
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 9, "text": [ " float integer string\n", "2 5.0 3 aku\n", "3 6.0 6 cinta\n", "5 4.7 23 a\n", "7 8.0 3 jika" ] } ], "prompt_number": 9 }, { "cell_type": "code", "collapsed": false, "input": [ "#rename columns in DataFrame\n", "df2 = df.rename(columns={'string':'characters'})" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 10 }, { "cell_type": "code", "collapsed": false, "input": [ "#Show DataFrame after rename column\n", "df2" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
floatintegercharacters
0 2.0 1 saya
1 3.4 2 None
2 5.0 3 aku
3 6.0 6 cinta
4 2.0 7 kamu
5 4.7 23 a
6 4.0 8 b
7 8.0 3 jika
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 11, "text": [ " float integer characters\n", "0 2.0 1 saya\n", "1 3.4 2 None\n", "2 5.0 3 aku\n", "3 6.0 6 cinta\n", "4 2.0 7 kamu\n", "5 4.7 23 a\n", "6 4.0 8 b\n", "7 8.0 3 jika" ] } ], "prompt_number": 11 }, { "cell_type": "code", "collapsed": false, "input": [ "#Drop NA value in DataFrame\n", "df2.dropna()" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
floatintegercharacters
0 2.0 1 saya
2 5.0 3 aku
3 6.0 6 cinta
4 2.0 7 kamu
5 4.7 23 a
6 4.0 8 b
7 8.0 3 jika
\n", "
" ], "metadata": {}, "output_type": "pyout", "prompt_number": 12, "text": [ " float integer characters\n", "0 2.0 1 saya\n", "2 5.0 3 aku\n", "3 6.0 6 cinta\n", "4 2.0 7 kamu\n", "5 4.7 23 a\n", "6 4.0 8 b\n", "7 8.0 3 jika" ] } ], "prompt_number": 12 }, { "cell_type": "code", "collapsed": false, "input": [ "#Show mean, median, and maximum column in Data Frame\n", "mean = df2['float'].mean()\n", "print \"mean %f\" % mean\n", "median = df2['float'].median()\n", "print \"median %f\" %median\n", "max = df2['float'].max()\n", "print \"max %f\" % max" ], "language": "python", "metadata": {}, "outputs": [ { "output_type": "stream", "stream": "stdout", "text": [ "mean 4.387500\n", "median 4.350000\n", "max 8.000000\n" ] } ], "prompt_number": 13 }, { "cell_type": "code", "collapsed": false, "input": [], "language": "python", "metadata": {}, "outputs": [] } ], "metadata": {} } ] }