{ "metadata": { "name": "", "signature": "sha256:9c2fef5e95af3d01ba9c70e4a1a2a6ca123d92fbb3235622cef321b24938f581" }, "nbformat": 3, "nbformat_minor": 0, "worksheets": [ { "cells": [ { "cell_type": "code", "collapsed": false, "input": [ "%matplotlib inline\n", "\n", "import numpy as np\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns\n", "from sklearn.ensemble import RandomForestClassifier\n", "pd.set_option('display.max_columns', 50)\n", "\n", "df = pd.DataFrame.from_csv('train.csv')" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 36 }, { "cell_type": "code", "collapsed": false, "input": [ "train_df = df[]\n", "#train_dat = df[['T1_V1','T1_V2']].as_matrix()" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 24 }, { "cell_type": "code", "collapsed": false, "input": [ "train_dat = df[['Hazard','T1_V1','T1_V2', 'T1_V3', 'T1_V10', 'T1_V13', 'T1_V14', 'T2_V1', 'T2_V2', 'T2_V4']]" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 33 }, { "cell_type": "code", "collapsed": false, "input": [ "train_dat['Id'] = train_dat.index\n", "train_dat1 = train_dat[['Id', 'Hazard', 'T1_V1','T1_V2', 'T1_V3', 'T1_V10', 'T1_V13', 'T1_V14', 'T2_V1', 'T2_V2', 'T2_V4']]" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 34 }, { "cell_type": "code", "collapsed": false, "input": [ "train_dat1" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
| \n", " | Id | \n", "Hazard | \n", "T1_V1 | \n", "T1_V2 | \n", "T1_V3 | \n", "T1_V10 | \n", "T1_V13 | \n", "T1_V14 | \n", "T2_V1 | \n", "T2_V2 | \n", "T2_V4 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|
| Id | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
| 1 | \n", "1 | \n", "1 | \n", "15 | \n", "3 | \n", "2 | \n", "7 | \n", "15 | \n", "1 | \n", "36 | \n", "11 | \n", "10 | \n", "
| 2 | \n", "2 | \n", "4 | \n", "16 | \n", "14 | \n", "5 | \n", "12 | \n", "10 | \n", "3 | \n", "78 | \n", "10 | \n", "17 | \n", "
| 3 | \n", "3 | \n", "1 | \n", "10 | \n", "10 | \n", "5 | \n", "12 | \n", "15 | \n", "1 | \n", "71 | \n", "21 | \n", "13 | \n", "
| 4 | \n", "4 | \n", "1 | \n", "18 | \n", "18 | \n", "5 | \n", "3 | \n", "15 | \n", "1 | \n", "71 | \n", "13 | \n", "15 | \n", "
| 5 | \n", "5 | \n", "1 | \n", "13 | \n", "19 | \n", "5 | \n", "7 | \n", "10 | \n", "1 | \n", "75 | \n", "10 | \n", "11 | \n", "
| 12 | \n", "12 | \n", "1 | \n", "14 | \n", "12 | \n", "2 | \n", "12 | \n", "15 | \n", "1 | \n", "65 | \n", "10 | \n", "14 | \n", "
| 15 | \n", "15 | \n", "5 | \n", "8 | \n", "17 | \n", "1 | \n", "8 | \n", "20 | \n", "1 | \n", "100 | \n", "14 | \n", "16 | \n", "
| 19 | \n", "19 | \n", "1 | \n", "14 | \n", "20 | \n", "4 | \n", "3 | \n", "15 | \n", "1 | \n", "83 | \n", "13 | \n", "5 | \n", "
| 21 | \n", "21 | \n", "1 | \n", "8 | \n", "2 | \n", "2 | \n", "8 | \n", "5 | \n", "1 | \n", "20 | \n", "12 | \n", "4 | \n", "
| 22 | \n", "22 | \n", "1 | \n", "5 | \n", "4 | \n", "3 | \n", "8 | \n", "20 | \n", "3 | \n", "88 | \n", "7 | \n", "14 | \n", "
| 23 | \n", "23 | \n", "7 | \n", "4 | \n", "7 | \n", "5 | \n", "7 | \n", "10 | \n", "2 | \n", "86 | \n", "7 | \n", "10 | \n", "
| 24 | \n", "24 | \n", "15 | \n", "18 | \n", "15 | \n", "4 | \n", "3 | \n", "15 | \n", "1 | \n", "23 | \n", "7 | \n", "5 | \n", "
| 25 | \n", "25 | \n", "1 | \n", "3 | \n", "20 | \n", "5 | \n", "3 | \n", "15 | \n", "1 | \n", "49 | \n", "15 | \n", "12 | \n", "
| 26 | \n", "26 | \n", "4 | \n", "14 | \n", "18 | \n", "6 | \n", "7 | \n", "15 | \n", "1 | \n", "92 | \n", "10 | \n", "16 | \n", "
| 31 | \n", "31 | \n", "14 | \n", "11 | \n", "23 | \n", "2 | \n", "3 | \n", "20 | \n", "1 | \n", "41 | \n", "11 | \n", "15 | \n", "
| 32 | \n", "32 | \n", "1 | \n", "9 | \n", "20 | \n", "5 | \n", "7 | \n", "10 | \n", "1 | \n", "33 | \n", "10 | \n", "3 | \n", "
| 33 | \n", "33 | \n", "1 | \n", "3 | \n", "7 | \n", "5 | \n", "7 | \n", "10 | \n", "1 | \n", "81 | \n", "14 | \n", "19 | \n", "
| 39 | \n", "39 | \n", "1 | \n", "4 | \n", "6 | \n", "4 | \n", "2 | \n", "10 | \n", "2 | \n", "81 | \n", "8 | \n", "9 | \n", "
| 41 | \n", "41 | \n", "4 | \n", "3 | \n", "13 | \n", "4 | \n", "3 | \n", "10 | \n", "2 | \n", "75 | \n", "13 | \n", "3 | \n", "
| 43 | \n", "43 | \n", "1 | \n", "7 | \n", "7 | \n", "5 | \n", "12 | \n", "20 | \n", "2 | \n", "72 | \n", "6 | \n", "4 | \n", "
| 44 | \n", "44 | \n", "4 | \n", "11 | \n", "18 | \n", "5 | \n", "8 | \n", "15 | \n", "1 | \n", "77 | \n", "16 | \n", "3 | \n", "
| 45 | \n", "45 | \n", "4 | \n", "15 | \n", "19 | \n", "2 | \n", "8 | \n", "10 | \n", "1 | \n", "61 | \n", "18 | \n", "18 | \n", "
| 50 | \n", "50 | \n", "8 | \n", "12 | \n", "12 | \n", "5 | \n", "12 | \n", "15 | \n", "1 | \n", "38 | \n", "15 | \n", "13 | \n", "
| 58 | \n", "58 | \n", "16 | \n", "9 | \n", "5 | \n", "2 | \n", "8 | \n", "15 | \n", "3 | \n", "18 | \n", "14 | \n", "13 | \n", "
| 59 | \n", "59 | \n", "5 | \n", "14 | \n", "17 | \n", "5 | \n", "3 | \n", "10 | \n", "1 | \n", "92 | \n", "12 | \n", "7 | \n", "
| 62 | \n", "62 | \n", "1 | \n", "6 | \n", "15 | \n", "2 | \n", "8 | \n", "10 | \n", "3 | \n", "23 | \n", "7 | \n", "12 | \n", "
| 63 | \n", "63 | \n", "6 | \n", "9 | \n", "21 | \n", "2 | \n", "8 | \n", "10 | \n", "3 | \n", "32 | \n", "15 | \n", "10 | \n", "
| 67 | \n", "67 | \n", "7 | \n", "19 | \n", "11 | \n", "3 | \n", "2 | \n", "15 | \n", "1 | \n", "36 | \n", "12 | \n", "12 | \n", "
| 69 | \n", "69 | \n", "1 | \n", "14 | \n", "1 | \n", "1 | \n", "12 | \n", "10 | \n", "3 | \n", "72 | \n", "13 | \n", "6 | \n", "
| 72 | \n", "72 | \n", "1 | \n", "8 | \n", "18 | \n", "5 | \n", "3 | \n", "10 | \n", "1 | \n", "98 | \n", "12 | \n", "17 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 101929 | \n", "101929 | \n", "1 | \n", "9 | \n", "19 | \n", "4 | \n", "8 | \n", "10 | \n", "1 | \n", "48 | \n", "12 | \n", "5 | \n", "
| 101931 | \n", "101931 | \n", "4 | \n", "12 | \n", "8 | \n", "5 | \n", "3 | \n", "10 | \n", "3 | \n", "33 | \n", "18 | \n", "7 | \n", "
| 101933 | \n", "101933 | \n", "2 | \n", "7 | \n", "19 | \n", "3 | \n", "8 | \n", "15 | \n", "2 | \n", "70 | \n", "11 | \n", "4 | \n", "
| 101935 | \n", "101935 | \n", "1 | \n", "6 | \n", "15 | \n", "4 | \n", "3 | \n", "20 | \n", "2 | \n", "72 | \n", "8 | \n", "12 | \n", "
| 101937 | \n", "101937 | \n", "14 | \n", "16 | \n", "22 | \n", "7 | \n", "2 | \n", "10 | \n", "1 | \n", "54 | \n", "10 | \n", "11 | \n", "
| 101939 | \n", "101939 | \n", "5 | \n", "7 | \n", "16 | \n", "2 | \n", "8 | \n", "20 | \n", "1 | \n", "79 | \n", "8 | \n", "18 | \n", "
| 101942 | \n", "101942 | \n", "4 | \n", "3 | \n", "5 | \n", "4 | \n", "3 | \n", "10 | \n", "1 | \n", "47 | \n", "12 | \n", "4 | \n", "
| 101943 | \n", "101943 | \n", "2 | \n", "3 | \n", "17 | \n", "1 | \n", "12 | \n", "20 | \n", "1 | \n", "53 | \n", "11 | \n", "17 | \n", "
| 101944 | \n", "101944 | \n", "4 | \n", "3 | \n", "17 | \n", "2 | \n", "8 | \n", "15 | \n", "1 | \n", "38 | \n", "9 | \n", "8 | \n", "
| 101945 | \n", "101945 | \n", "6 | \n", "6 | \n", "13 | \n", "2 | \n", "7 | \n", "20 | \n", "3 | \n", "72 | \n", "8 | \n", "10 | \n", "
| 101946 | \n", "101946 | \n", "9 | \n", "15 | \n", "8 | \n", "6 | \n", "8 | \n", "20 | \n", "1 | \n", "65 | \n", "14 | \n", "10 | \n", "
| 101953 | \n", "101953 | \n", "1 | \n", "4 | \n", "11 | \n", "2 | \n", "3 | \n", "15 | \n", "1 | \n", "92 | \n", "6 | \n", "14 | \n", "
| 101959 | \n", "101959 | \n", "1 | \n", "1 | \n", "14 | \n", "5 | \n", "12 | \n", "10 | \n", "2 | \n", "42 | \n", "15 | \n", "16 | \n", "
| 101962 | \n", "101962 | \n", "5 | \n", "9 | \n", "19 | \n", "2 | \n", "8 | \n", "10 | \n", "1 | \n", "7 | \n", "14 | \n", "12 | \n", "
| 101968 | \n", "101968 | \n", "1 | \n", "17 | \n", "1 | \n", "1 | \n", "7 | \n", "20 | \n", "1 | \n", "29 | \n", "8 | \n", "4 | \n", "
| 101971 | \n", "101971 | \n", "1 | \n", "6 | \n", "4 | \n", "2 | \n", "12 | \n", "15 | \n", "3 | \n", "36 | \n", "4 | \n", "21 | \n", "
| 101975 | \n", "101975 | \n", "1 | \n", "3 | \n", "18 | \n", "2 | \n", "12 | \n", "10 | \n", "1 | \n", "82 | \n", "10 | \n", "12 | \n", "
| 101978 | \n", "101978 | \n", "14 | \n", "6 | \n", "21 | \n", "3 | \n", "12 | \n", "20 | \n", "1 | \n", "46 | \n", "9 | \n", "9 | \n", "
| 101980 | \n", "101980 | \n", "3 | \n", "5 | \n", "14 | \n", "4 | \n", "8 | \n", "15 | \n", "3 | \n", "98 | \n", "6 | \n", "7 | \n", "
| 101981 | \n", "101981 | \n", "1 | \n", "13 | \n", "24 | \n", "4 | \n", "7 | \n", "15 | \n", "1 | \n", "77 | \n", "15 | \n", "4 | \n", "
| 101984 | \n", "101984 | \n", "2 | \n", "5 | \n", "18 | \n", "1 | \n", "8 | \n", "10 | \n", "1 | \n", "93 | \n", "9 | \n", "8 | \n", "
| 101986 | \n", "101986 | \n", "16 | \n", "10 | \n", "19 | \n", "5 | \n", "8 | \n", "15 | \n", "1 | \n", "49 | \n", "16 | \n", "6 | \n", "
| 101987 | \n", "101987 | \n", "12 | \n", "14 | \n", "3 | \n", "2 | \n", "12 | \n", "20 | \n", "3 | \n", "51 | \n", "20 | \n", "10 | \n", "
| 101988 | \n", "101988 | \n", "4 | \n", "5 | \n", "19 | \n", "3 | \n", "3 | \n", "15 | \n", "1 | \n", "88 | \n", "8 | \n", "21 | \n", "
| 101991 | \n", "101991 | \n", "1 | \n", "8 | \n", "2 | \n", "2 | \n", "8 | \n", "10 | \n", "1 | \n", "3 | \n", "10 | \n", "14 | \n", "
| 101992 | \n", "101992 | \n", "7 | \n", "12 | \n", "24 | \n", "1 | \n", "12 | \n", "10 | \n", "1 | \n", "64 | \n", "9 | \n", "6 | \n", "
| 101993 | \n", "101993 | \n", "4 | \n", "12 | \n", "17 | \n", "4 | \n", "3 | \n", "15 | \n", "1 | \n", "75 | \n", "10 | \n", "10 | \n", "
| 101994 | \n", "101994 | \n", "3 | \n", "18 | \n", "7 | \n", "5 | \n", "8 | \n", "20 | \n", "2 | \n", "33 | \n", "13 | \n", "3 | \n", "
| 101998 | \n", "101998 | \n", "14 | \n", "18 | \n", "17 | \n", "5 | \n", "8 | \n", "10 | \n", "1 | \n", "35 | \n", "11 | \n", "18 | \n", "
| 101999 | \n", "101999 | \n", "9 | \n", "5 | \n", "15 | \n", "3 | \n", "8 | \n", "15 | \n", "3 | \n", "49 | \n", "10 | \n", "6 | \n", "
50999 rows \u00d7 11 columns
\n", "| \n", " | Hazard | \n", "
|---|---|
| Id | \n", "\n", " |
| 6 | \n", "1 | \n", "
| 7 | \n", "1 | \n", "
| 8 | \n", "1 | \n", "
| 9 | \n", "4 | \n", "
| 10 | \n", "1 | \n", "