{
"metadata": {
"name": "",
"signature": "sha256:f365cdf1a100daa1313310f875668bc67cdedeae3075b707532407d3898c99d5"
},
"nbformat": 3,
"nbformat_minor": 0,
"worksheets": [
{
"cells": [
{
"cell_type": "code",
"collapsed": false,
"input": [
"import pandas as pd\n",
"import numpy as np\n",
"from pandas import DataFrame, Series\n",
"df = DataFrame(\n",
" {'integer':[1,2,3,6,7,23,8,3],\n",
" 'float':[2,3.4,5,6,2,4.7,4,8],\n",
" 'string':['saya',None,'aku','cinta','kamu','a','b','jika']}\n",
")\n",
"df"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" string | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2.0 | \n",
" 1 | \n",
" saya | \n",
"
\n",
" \n",
" 1 | \n",
" 3.4 | \n",
" 2 | \n",
" None | \n",
"
\n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
"
\n",
" \n",
" 4 | \n",
" 2.0 | \n",
" 7 | \n",
" kamu | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
"
\n",
" \n",
" 6 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 2,
"text": [
" float integer string\n",
"0 2.0 1 saya\n",
"1 3.4 2 None\n",
"2 5.0 3 aku\n",
"3 6.0 6 cinta\n",
"4 2.0 7 kamu\n",
"5 4.7 23 a\n",
"6 4.0 8 b\n",
"7 8.0 3 jika"
]
}
],
"prompt_number": 2
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"df_new = DataFrame(\n",
"{'string':['a','b'],\n",
" 'str_value':[2,4]}\n",
")\n",
"df_new"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" str_value | \n",
" string | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2 | \n",
" a | \n",
"
\n",
" \n",
" 1 | \n",
" 4 | \n",
" b | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 5,
"text": [
" str_value string\n",
"0 2 a\n",
"1 4 b"
]
}
],
"prompt_number": 5
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"df_merge_inner = pd.merge(df,df_new,on='string',how='inner')\n",
"print df_merge_inner"
],
"language": "python",
"metadata": {},
"outputs": [
{
"output_type": "stream",
"stream": "stdout",
"text": [
" float integer string str_value\n",
"0 4.7 23 a 2\n",
"1 4.0 8 b 4\n"
]
}
],
"prompt_number": 6
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"df_merge_outer = pd.merge(df,df_new,on='string',how='outer')\n",
"print df_merge_outer"
],
"language": "python",
"metadata": {},
"outputs": [
{
"output_type": "stream",
"stream": "stdout",
"text": [
" float integer string str_value\n",
"0 2.0 1 saya NaN\n",
"1 3.4 2 None NaN\n",
"2 5.0 3 aku NaN\n",
"3 6.0 6 cinta NaN\n",
"4 2.0 7 kamu NaN\n",
"5 4.7 23 a 2\n",
"6 4.0 8 b 4\n",
"7 8.0 3 jika NaN\n"
]
}
],
"prompt_number": 8
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"df_merge_left = pd.merge(df,df_new,on='string',how='left')\n",
"df_merge_left"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" string | \n",
" str_value | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 2.0 | \n",
" 1 | \n",
" saya | \n",
" NaN | \n",
"
\n",
" \n",
" 1 | \n",
" 3.4 | \n",
" 2 | \n",
" None | \n",
" NaN | \n",
"
\n",
" \n",
" 2 | \n",
" 5.0 | \n",
" 3 | \n",
" aku | \n",
" NaN | \n",
"
\n",
" \n",
" 3 | \n",
" 6.0 | \n",
" 6 | \n",
" cinta | \n",
" NaN | \n",
"
\n",
" \n",
" 4 | \n",
" 2.0 | \n",
" 7 | \n",
" kamu | \n",
" NaN | \n",
"
\n",
" \n",
" 5 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
" 2 | \n",
"
\n",
" \n",
" 6 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
" 4 | \n",
"
\n",
" \n",
" 7 | \n",
" 8.0 | \n",
" 3 | \n",
" jika | \n",
" NaN | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 9,
"text": [
" float integer string str_value\n",
"0 2.0 1 saya NaN\n",
"1 3.4 2 None NaN\n",
"2 5.0 3 aku NaN\n",
"3 6.0 6 cinta NaN\n",
"4 2.0 7 kamu NaN\n",
"5 4.7 23 a 2\n",
"6 4.0 8 b 4\n",
"7 8.0 3 jika NaN"
]
}
],
"prompt_number": 9
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"df_merge_right = pd.merge(df,df_new,on='string',how='right')\n",
"df_merge_right"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" float | \n",
" integer | \n",
" string | \n",
" str_value | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 4.7 | \n",
" 23 | \n",
" a | \n",
" 2 | \n",
"
\n",
" \n",
" 1 | \n",
" 4.0 | \n",
" 8 | \n",
" b | \n",
" 4 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 10,
"text": [
" float integer string str_value\n",
"0 4.7 23 a 2\n",
"1 4.0 8 b 4"
]
}
],
"prompt_number": 10
}
],
"metadata": {}
}
]
}