{
"metadata": {
"name": "",
"signature": "sha256:7c290f8b798370c424c6e3feccbf4dbef8c7884f2c5403d2f420eff968cf4d98"
},
"nbformat": 3,
"nbformat_minor": 0,
"worksheets": [
{
"cells": [
{
"cell_type": "code",
"collapsed": false,
"input": [
"%matplotlib inline\n",
"\n",
"import numpy as np\n",
"import pandas as pd\n",
"import matplotlib.pyplot as plt\n",
"import seaborn as sns\n",
"from sklearn.ensemble import RandomForestClassifier\n",
"pd.set_option('display.max_columns', 50)\n",
"\n",
"train = pd.DataFrame.from_csv('train.csv')\n"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 1
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"train.head()"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" Hazard | \n",
" T1_V1 | \n",
" T1_V2 | \n",
" T1_V3 | \n",
" T1_V4 | \n",
" T1_V5 | \n",
" T1_V6 | \n",
" T1_V7 | \n",
" T1_V8 | \n",
" T1_V9 | \n",
" T1_V10 | \n",
" T1_V11 | \n",
" T1_V12 | \n",
" T1_V13 | \n",
" T1_V14 | \n",
" T1_V15 | \n",
" T1_V16 | \n",
" T1_V17 | \n",
" T2_V1 | \n",
" T2_V2 | \n",
" T2_V3 | \n",
" T2_V4 | \n",
" T2_V5 | \n",
" T2_V6 | \n",
" T2_V7 | \n",
" T2_V8 | \n",
" T2_V9 | \n",
" T2_V10 | \n",
" T2_V11 | \n",
" T2_V12 | \n",
" T2_V13 | \n",
" T2_V14 | \n",
" T2_V15 | \n",
"
\n",
" \n",
" Id | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 1 | \n",
" 1 | \n",
" 15 | \n",
" 3 | \n",
" 2 | \n",
" N | \n",
" B | \n",
" N | \n",
" B | \n",
" B | \n",
" D | \n",
" 7 | \n",
" B | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" B | \n",
" N | \n",
" 36 | \n",
" 11 | \n",
" N | \n",
" 10 | \n",
" B | \n",
" 2 | \n",
" 37 | \n",
" 1 | \n",
" 11 | \n",
" 6 | \n",
" Y | \n",
" N | \n",
" E | \n",
" 2 | \n",
" 2 | \n",
"
\n",
" \n",
" 2 | \n",
" 4 | \n",
" 16 | \n",
" 14 | \n",
" 5 | \n",
" H | \n",
" B | \n",
" N | \n",
" B | \n",
" B | \n",
" C | \n",
" 12 | \n",
" B | \n",
" B | \n",
" 10 | \n",
" 3 | \n",
" A | \n",
" B | \n",
" Y | \n",
" 78 | \n",
" 10 | \n",
" Y | \n",
" 17 | \n",
" C | \n",
" 2 | \n",
" 22 | \n",
" 1 | \n",
" 18 | \n",
" 5 | \n",
" Y | \n",
" Y | \n",
" E | \n",
" 2 | \n",
" 1 | \n",
"
\n",
" \n",
" 3 | \n",
" 1 | \n",
" 10 | \n",
" 10 | \n",
" 5 | \n",
" N | \n",
" K | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 12 | \n",
" H | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" R | \n",
" Y | \n",
" 71 | \n",
" 21 | \n",
" Y | \n",
" 13 | \n",
" C | \n",
" 6 | \n",
" 37 | \n",
" 2 | \n",
" 14 | \n",
" 6 | \n",
" Y | \n",
" Y | \n",
" E | \n",
" 6 | \n",
" 1 | \n",
"
\n",
" \n",
" 4 | \n",
" 1 | \n",
" 18 | \n",
" 18 | \n",
" 5 | \n",
" N | \n",
" K | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 3 | \n",
" H | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" R | \n",
" N | \n",
" 71 | \n",
" 13 | \n",
" N | \n",
" 15 | \n",
" A | \n",
" 2 | \n",
" 25 | \n",
" 1 | \n",
" 1 | \n",
" 6 | \n",
" Y | \n",
" N | \n",
" C | \n",
" 2 | \n",
" 6 | \n",
"
\n",
" \n",
" 5 | \n",
" 1 | \n",
" 13 | \n",
" 19 | \n",
" 5 | \n",
" N | \n",
" H | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 7 | \n",
" H | \n",
" B | \n",
" 10 | \n",
" 1 | \n",
" A | \n",
" J | \n",
" N | \n",
" 75 | \n",
" 10 | \n",
" Y | \n",
" 11 | \n",
" B | \n",
" 1 | \n",
" 22 | \n",
" 1 | \n",
" 2 | \n",
" 7 | \n",
" N | \n",
" N | \n",
" E | \n",
" 1 | \n",
" 1 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 35,
"text": [
" Hazard T1_V1 T1_V2 T1_V3 T1_V4 T1_V5 T1_V6 T1_V7 T1_V8 T1_V9 T1_V10 \\\n",
"Id \n",
"1 1 15 3 2 N B N B B D 7 \n",
"2 4 16 14 5 H B N B B C 12 \n",
"3 1 10 10 5 N K N B B E 12 \n",
"4 1 18 18 5 N K N B B E 3 \n",
"5 1 13 19 5 N H N B B E 7 \n",
"\n",
" T1_V11 T1_V12 T1_V13 T1_V14 T1_V15 T1_V16 T1_V17 T2_V1 T2_V2 T2_V3 \\\n",
"Id \n",
"1 B B 15 1 A B N 36 11 N \n",
"2 B B 10 3 A B Y 78 10 Y \n",
"3 H B 15 1 A R Y 71 21 Y \n",
"4 H B 15 1 A R N 71 13 N \n",
"5 H B 10 1 A J N 75 10 Y \n",
"\n",
" T2_V4 T2_V5 T2_V6 T2_V7 T2_V8 T2_V9 T2_V10 T2_V11 T2_V12 T2_V13 \\\n",
"Id \n",
"1 10 B 2 37 1 11 6 Y N E \n",
"2 17 C 2 22 1 18 5 Y Y E \n",
"3 13 C 6 37 2 14 6 Y Y E \n",
"4 15 A 2 25 1 1 6 Y N C \n",
"5 11 B 1 22 1 2 7 N N E \n",
"\n",
" T2_V14 T2_V15 \n",
"Id \n",
"1 2 2 \n",
"2 2 1 \n",
"3 6 1 \n",
"4 2 6 \n",
"5 1 1 "
]
}
],
"prompt_number": 35
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"# Gonna go ahead and make some training data for almost all of the columns\n",
"\n",
"def makeNumerical(input_df):\n",
" \n",
" output_df = input_df.copy()\n",
" non_numeric_cols = [col for col in output_df.columns\\\n",
" if output_df[col].dtype != 'int64']\n",
" for col in non_numeric_cols:\n",
" vals = pd.unique(output_df[col])\n",
" for i in xrange(len(vals)):\n",
" output_df.loc[(output_df[col] == vals[i]), col] = i \n",
"\n",
" return output_df"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 2
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"train_numeric = makeNumerical(train)"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 5
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"train_numeric.head(5)"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Hazard | \n",
" T1_V1 | \n",
" T1_V2 | \n",
" T1_V3 | \n",
" T1_V4 | \n",
" T1_V5 | \n",
" T1_V6 | \n",
" T1_V7 | \n",
" T1_V8 | \n",
" T1_V9 | \n",
" T1_V10 | \n",
" T1_V11 | \n",
" T1_V12 | \n",
" T1_V13 | \n",
" T1_V14 | \n",
" T1_V15 | \n",
" T1_V16 | \n",
" T1_V17 | \n",
" T2_V1 | \n",
" T2_V2 | \n",
" T2_V3 | \n",
" T2_V4 | \n",
" T2_V5 | \n",
" T2_V6 | \n",
" T2_V7 | \n",
" T2_V8 | \n",
" T2_V9 | \n",
" T2_V10 | \n",
" T2_V11 | \n",
" T2_V12 | \n",
" T2_V13 | \n",
" T2_V14 | \n",
" T2_V15 | \n",
"
\n",
" \n",
" Id | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 1 | \n",
" 1 | \n",
" 15 | \n",
" 3 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 15 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 36 | \n",
" 11 | \n",
" 0 | \n",
" 10 | \n",
" 0 | \n",
" 2 | \n",
" 37 | \n",
" 1 | \n",
" 11 | \n",
" 6 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 2 | \n",
" 2 | \n",
"
\n",
" \n",
" 2 | \n",
" 4 | \n",
" 16 | \n",
" 14 | \n",
" 5 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 12 | \n",
" 0 | \n",
" 0 | \n",
" 10 | \n",
" 3 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 78 | \n",
" 10 | \n",
" 1 | \n",
" 17 | \n",
" 1 | \n",
" 2 | \n",
" 22 | \n",
" 1 | \n",
" 18 | \n",
" 5 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
"
\n",
" \n",
" 3 | \n",
" 1 | \n",
" 10 | \n",
" 10 | \n",
" 5 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 2 | \n",
" 12 | \n",
" 1 | \n",
" 0 | \n",
" 15 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" 71 | \n",
" 21 | \n",
" 1 | \n",
" 13 | \n",
" 1 | \n",
" 6 | \n",
" 37 | \n",
" 2 | \n",
" 14 | \n",
" 6 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 6 | \n",
" 1 | \n",
"
\n",
" \n",
" 4 | \n",
" 1 | \n",
" 18 | \n",
" 18 | \n",
" 5 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 2 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 15 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 71 | \n",
" 13 | \n",
" 0 | \n",
" 15 | \n",
" 2 | \n",
" 2 | \n",
" 25 | \n",
" 1 | \n",
" 1 | \n",
" 6 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 2 | \n",
" 6 | \n",
"
\n",
" \n",
" 5 | \n",
" 1 | \n",
" 13 | \n",
" 19 | \n",
" 5 | \n",
" 0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 2 | \n",
" 7 | \n",
" 1 | \n",
" 0 | \n",
" 10 | \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 0 | \n",
" 75 | \n",
" 10 | \n",
" 1 | \n",
" 11 | \n",
" 0 | \n",
" 1 | \n",
" 22 | \n",
" 1 | \n",
" 2 | \n",
" 7 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 4,
"text": [
" Hazard T1_V1 T1_V2 T1_V3 T1_V4 T1_V5 T1_V6 T1_V7 T1_V8 T1_V9 T1_V10 \\\n",
"Id \n",
"1 1 15 3 2 0 0 0 0 0 0 7 \n",
"2 4 16 14 5 1 0 0 0 0 1 12 \n",
"3 1 10 10 5 0 1 0 0 0 2 12 \n",
"4 1 18 18 5 0 1 0 0 0 2 3 \n",
"5 1 13 19 5 0 2 0 0 0 2 7 \n",
"\n",
" T1_V11 T1_V12 T1_V13 T1_V14 T1_V15 T1_V16 T1_V17 T2_V1 T2_V2 T2_V3 \\\n",
"Id \n",
"1 0 0 15 1 0 0 0 36 11 0 \n",
"2 0 0 10 3 0 0 1 78 10 1 \n",
"3 1 0 15 1 0 1 1 71 21 1 \n",
"4 1 0 15 1 0 1 0 71 13 0 \n",
"5 1 0 10 1 0 2 0 75 10 1 \n",
"\n",
" T2_V4 T2_V5 T2_V6 T2_V7 T2_V8 T2_V9 T2_V10 T2_V11 T2_V12 T2_V13 \\\n",
"Id \n",
"1 10 0 2 37 1 11 6 0 0 0 \n",
"2 17 1 2 22 1 18 5 0 1 0 \n",
"3 13 1 6 37 2 14 6 0 1 0 \n",
"4 15 2 2 25 1 1 6 0 0 1 \n",
"5 11 0 1 22 1 2 7 1 0 0 \n",
"\n",
" T2_V14 T2_V15 \n",
"Id \n",
"1 2 2 \n",
"2 2 1 \n",
"3 6 1 \n",
"4 2 6 \n",
"5 1 1 "
]
}
],
"prompt_number": 4
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"train.head()"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Hazard | \n",
" T1_V1 | \n",
" T1_V2 | \n",
" T1_V3 | \n",
" T1_V4 | \n",
" T1_V5 | \n",
" T1_V6 | \n",
" T1_V7 | \n",
" T1_V8 | \n",
" T1_V9 | \n",
" T1_V10 | \n",
" T1_V11 | \n",
" T1_V12 | \n",
" T1_V13 | \n",
" T1_V14 | \n",
" T1_V15 | \n",
" T1_V16 | \n",
" T1_V17 | \n",
" T2_V1 | \n",
" T2_V2 | \n",
" T2_V3 | \n",
" T2_V4 | \n",
" T2_V5 | \n",
" T2_V6 | \n",
" T2_V7 | \n",
" T2_V8 | \n",
" T2_V9 | \n",
" T2_V10 | \n",
" T2_V11 | \n",
" T2_V12 | \n",
" T2_V13 | \n",
" T2_V14 | \n",
" T2_V15 | \n",
"
\n",
" \n",
" Id | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 1 | \n",
" 1 | \n",
" 15 | \n",
" 3 | \n",
" 2 | \n",
" N | \n",
" B | \n",
" N | \n",
" B | \n",
" B | \n",
" D | \n",
" 7 | \n",
" B | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" B | \n",
" N | \n",
" 36 | \n",
" 11 | \n",
" N | \n",
" 10 | \n",
" B | \n",
" 2 | \n",
" 37 | \n",
" 1 | \n",
" 11 | \n",
" 6 | \n",
" Y | \n",
" N | \n",
" E | \n",
" 2 | \n",
" 2 | \n",
"
\n",
" \n",
" 2 | \n",
" 4 | \n",
" 16 | \n",
" 14 | \n",
" 5 | \n",
" H | \n",
" B | \n",
" N | \n",
" B | \n",
" B | \n",
" C | \n",
" 12 | \n",
" B | \n",
" B | \n",
" 10 | \n",
" 3 | \n",
" A | \n",
" B | \n",
" Y | \n",
" 78 | \n",
" 10 | \n",
" Y | \n",
" 17 | \n",
" C | \n",
" 2 | \n",
" 22 | \n",
" 1 | \n",
" 18 | \n",
" 5 | \n",
" Y | \n",
" Y | \n",
" E | \n",
" 2 | \n",
" 1 | \n",
"
\n",
" \n",
" 3 | \n",
" 1 | \n",
" 10 | \n",
" 10 | \n",
" 5 | \n",
" N | \n",
" K | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 12 | \n",
" H | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" R | \n",
" Y | \n",
" 71 | \n",
" 21 | \n",
" Y | \n",
" 13 | \n",
" C | \n",
" 6 | \n",
" 37 | \n",
" 2 | \n",
" 14 | \n",
" 6 | \n",
" Y | \n",
" Y | \n",
" E | \n",
" 6 | \n",
" 1 | \n",
"
\n",
" \n",
" 4 | \n",
" 1 | \n",
" 18 | \n",
" 18 | \n",
" 5 | \n",
" N | \n",
" K | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 3 | \n",
" H | \n",
" B | \n",
" 15 | \n",
" 1 | \n",
" A | \n",
" R | \n",
" N | \n",
" 71 | \n",
" 13 | \n",
" N | \n",
" 15 | \n",
" A | \n",
" 2 | \n",
" 25 | \n",
" 1 | \n",
" 1 | \n",
" 6 | \n",
" Y | \n",
" N | \n",
" C | \n",
" 2 | \n",
" 6 | \n",
"
\n",
" \n",
" 5 | \n",
" 1 | \n",
" 13 | \n",
" 19 | \n",
" 5 | \n",
" N | \n",
" H | \n",
" N | \n",
" B | \n",
" B | \n",
" E | \n",
" 7 | \n",
" H | \n",
" B | \n",
" 10 | \n",
" 1 | \n",
" A | \n",
" J | \n",
" N | \n",
" 75 | \n",
" 10 | \n",
" Y | \n",
" 11 | \n",
" B | \n",
" 1 | \n",
" 22 | \n",
" 1 | \n",
" 2 | \n",
" 7 | \n",
" N | \n",
" N | \n",
" E | \n",
" 1 | \n",
" 1 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 39,
"text": [
" Hazard T1_V1 T1_V2 T1_V3 T1_V4 T1_V5 T1_V6 T1_V7 T1_V8 T1_V9 T1_V10 \\\n",
"Id \n",
"1 1 15 3 2 N B N B B D 7 \n",
"2 4 16 14 5 H B N B B C 12 \n",
"3 1 10 10 5 N K N B B E 12 \n",
"4 1 18 18 5 N K N B B E 3 \n",
"5 1 13 19 5 N H N B B E 7 \n",
"\n",
" T1_V11 T1_V12 T1_V13 T1_V14 T1_V15 T1_V16 T1_V17 T2_V1 T2_V2 T2_V3 \\\n",
"Id \n",
"1 B B 15 1 A B N 36 11 N \n",
"2 B B 10 3 A B Y 78 10 Y \n",
"3 H B 15 1 A R Y 71 21 Y \n",
"4 H B 15 1 A R N 71 13 N \n",
"5 H B 10 1 A J N 75 10 Y \n",
"\n",
" T2_V4 T2_V5 T2_V6 T2_V7 T2_V8 T2_V9 T2_V10 T2_V11 T2_V12 T2_V13 \\\n",
"Id \n",
"1 10 B 2 37 1 11 6 Y N E \n",
"2 17 C 2 22 1 18 5 Y Y E \n",
"3 13 C 6 37 2 14 6 Y Y E \n",
"4 15 A 2 25 1 1 6 Y N C \n",
"5 11 B 1 22 1 2 7 N N E \n",
"\n",
" T2_V14 T2_V15 \n",
"Id \n",
"1 2 2 \n",
"2 2 1 \n",
"3 6 1 \n",
"4 2 6 \n",
"5 1 1 "
]
}
],
"prompt_number": 39
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"from sklearn import metrics\n",
"\n",
"features = train_numeric.columns[1:]\n",
"y = train_numeric['Hazard']\n",
"\n",
"clf = RandomForestClassifier()\n",
"clf.fit(train_numeric[features], y)\n",
"\n",
"test = makeNumerical(pd.DataFrame.from_csv('test.csv'))\n",
"test[features].head()\n",
"preds = clf.predict(test[features])\n",
"\n",
"Id = test.index\n",
"\n",
"out_df = pd.DataFrame(data=preds, index = Id, columns = ['Hazard'])\n"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 8
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"out_df.head()"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Hazard | \n",
"
\n",
" \n",
" Id | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 6 | \n",
" 1 | \n",
"
\n",
" \n",
" 7 | \n",
" 1 | \n",
"
\n",
" \n",
" 8 | \n",
" 4 | \n",
"
\n",
" \n",
" 9 | \n",
" 1 | \n",
"
\n",
" \n",
" 10 | \n",
" 1 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 9,
"text": [
" Hazard\n",
"Id \n",
"6 1\n",
"7 1\n",
"8 4\n",
"9 1\n",
"10 1"
]
}
],
"prompt_number": 9
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"out_df.to_csv(\"submission_2.csv\", index=True)"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 57
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"sub_1 = pd.DataFrame.from_csv('submission_1.csv')\n",
"sub_2 = pd.DataFrame.from_csv('submission_2.csv')"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 46
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"sub_2.columns = ['Hazard']"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 54
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"sub_2.head()"
],
"language": "python",
"metadata": {},
"outputs": [
{
"html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" Hazard | \n",
"
\n",
" \n",
" Id | \n",
" | \n",
"
\n",
" \n",
" \n",
" \n",
" 6 | \n",
" 1 | \n",
"
\n",
" \n",
" 7 | \n",
" 2 | \n",
"
\n",
" \n",
" 8 | \n",
" 1 | \n",
"
\n",
" \n",
" 9 | \n",
" 1 | \n",
"
\n",
" \n",
" 10 | \n",
" 1 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"metadata": {},
"output_type": "pyout",
"prompt_number": 60,
"text": [
" Hazard\n",
"Id \n",
"6 1\n",
"7 2\n",
"8 1\n",
"9 1\n",
"10 1"
]
}
],
"prompt_number": 60
},
{
"cell_type": "code",
"collapsed": false,
"input": [
"sub_2.to_csv(\"submission_2.csv\", index=True)"
],
"language": "python",
"metadata": {},
"outputs": [],
"prompt_number": 61
},
{
"cell_type": "code",
"collapsed": false,
"input": [],
"language": "python",
"metadata": {},
"outputs": []
}
],
"metadata": {}
}
]
}