{ "metadata": { "name": "" }, "nbformat": 3, "nbformat_minor": 0, "worksheets": [ { "cells": [ { "cell_type": "code", "collapsed": false, "input": [ "import pandas as pd\n", "import numpy as np\n", "from matplotlib import pyplot as plt\n", "from sklearn.linear_model import LinearRegression\n", "from sklearn.feature_selection import f_regression\n", "from sklearn.metrics import mean_squared_error, mean_absolute_error\n" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 1 }, { "cell_type": "code", "collapsed": false, "input": [ "data = pd.read_csv('day.csv')" ], "language": "python", "metadata": {}, "outputs": [], "prompt_number": 4 }, { "cell_type": "code", "collapsed": false, "input": [ "data" ], "language": "python", "metadata": {}, "outputs": [ { "html": [ "
\n", " | instant | \n", "dteday | \n", "season | \n", "yr | \n", "mnth | \n", "holiday | \n", "weekday | \n", "workingday | \n", "weathersit | \n", "temp | \n", "atemp | \n", "hum | \n", "windspeed | \n", "casual | \n", "registered | \n", "cnt | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "2011-01-01 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "2 | \n", "0.344167 | \n", "0.363625 | \n", "0.805833 | \n", "0.160446 | \n", "331 | \n", "654 | \n", "985 | \n", "
1 | \n", "2 | \n", "2011-01-02 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "2 | \n", "0.363478 | \n", "0.353739 | \n", "0.696087 | \n", "0.248539 | \n", "131 | \n", "670 | \n", "801 | \n", "
2 | \n", "3 | \n", "2011-01-03 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0.196364 | \n", "0.189405 | \n", "0.437273 | \n", "0.248309 | \n", "120 | \n", "1229 | \n", "1349 | \n", "
3 | \n", "4 | \n", "2011-01-04 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0.200000 | \n", "0.212122 | \n", "0.590435 | \n", "0.160296 | \n", "108 | \n", "1454 | \n", "1562 | \n", "
4 | \n", "5 | \n", "2011-01-05 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "3 | \n", "1 | \n", "1 | \n", "0.226957 | \n", "0.229270 | \n", "0.436957 | \n", "0.186900 | \n", "82 | \n", "1518 | \n", "1600 | \n", "
5 | \n", "6 | \n", "2011-01-06 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.204348 | \n", "0.233209 | \n", "0.518261 | \n", "0.089565 | \n", "88 | \n", "1518 | \n", "1606 | \n", "
6 | \n", "7 | \n", "2011-01-07 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "5 | \n", "1 | \n", "2 | \n", "0.196522 | \n", "0.208839 | \n", "0.498696 | \n", "0.168726 | \n", "148 | \n", "1362 | \n", "1510 | \n", "
7 | \n", "8 | \n", "2011-01-08 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "2 | \n", "0.165000 | \n", "0.162254 | \n", "0.535833 | \n", "0.266804 | \n", "68 | \n", "891 | \n", "959 | \n", "
8 | \n", "9 | \n", "2011-01-09 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.138333 | \n", "0.116175 | \n", "0.434167 | \n", "0.361950 | \n", "54 | \n", "768 | \n", "822 | \n", "
9 | \n", "10 | \n", "2011-01-10 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0.150833 | \n", "0.150888 | \n", "0.482917 | \n", "0.223267 | \n", "41 | \n", "1280 | \n", "1321 | \n", "
10 | \n", "11 | \n", "2011-01-11 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "2 | \n", "1 | \n", "2 | \n", "0.169091 | \n", "0.191464 | \n", "0.686364 | \n", "0.122132 | \n", "43 | \n", "1220 | \n", "1263 | \n", "
11 | \n", "12 | \n", "2011-01-12 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "3 | \n", "1 | \n", "1 | \n", "0.172727 | \n", "0.160473 | \n", "0.599545 | \n", "0.304627 | \n", "25 | \n", "1137 | \n", "1162 | \n", "
12 | \n", "13 | \n", "2011-01-13 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.165000 | \n", "0.150883 | \n", "0.470417 | \n", "0.301000 | \n", "38 | \n", "1368 | \n", "1406 | \n", "
13 | \n", "14 | \n", "2011-01-14 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "5 | \n", "1 | \n", "1 | \n", "0.160870 | \n", "0.188413 | \n", "0.537826 | \n", "0.126548 | \n", "54 | \n", "1367 | \n", "1421 | \n", "
14 | \n", "15 | \n", "2011-01-15 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "2 | \n", "0.233333 | \n", "0.248112 | \n", "0.498750 | \n", "0.157963 | \n", "222 | \n", "1026 | \n", "1248 | \n", "
15 | \n", "16 | \n", "2011-01-16 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.231667 | \n", "0.234217 | \n", "0.483750 | \n", "0.188433 | \n", "251 | \n", "953 | \n", "1204 | \n", "
16 | \n", "17 | \n", "2011-01-17 | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0 | \n", "2 | \n", "0.175833 | \n", "0.176771 | \n", "0.537500 | \n", "0.194017 | \n", "117 | \n", "883 | \n", "1000 | \n", "
17 | \n", "18 | \n", "2011-01-18 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "2 | \n", "1 | \n", "2 | \n", "0.216667 | \n", "0.232333 | \n", "0.861667 | \n", "0.146775 | \n", "9 | \n", "674 | \n", "683 | \n", "
18 | \n", "19 | \n", "2011-01-19 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "3 | \n", "1 | \n", "2 | \n", "0.292174 | \n", "0.298422 | \n", "0.741739 | \n", "0.208317 | \n", "78 | \n", "1572 | \n", "1650 | \n", "
19 | \n", "20 | \n", "2011-01-20 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "4 | \n", "1 | \n", "2 | \n", "0.261667 | \n", "0.255050 | \n", "0.538333 | \n", "0.195904 | \n", "83 | \n", "1844 | \n", "1927 | \n", "
20 | \n", "21 | \n", "2011-01-21 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "5 | \n", "1 | \n", "1 | \n", "0.177500 | \n", "0.157833 | \n", "0.457083 | \n", "0.353242 | \n", "75 | \n", "1468 | \n", "1543 | \n", "
21 | \n", "22 | \n", "2011-01-22 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "1 | \n", "0.059130 | \n", "0.079070 | \n", "0.400000 | \n", "0.171970 | \n", "93 | \n", "888 | \n", "981 | \n", "
22 | \n", "23 | \n", "2011-01-23 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.096522 | \n", "0.098839 | \n", "0.436522 | \n", "0.246600 | \n", "150 | \n", "836 | \n", "986 | \n", "
23 | \n", "24 | \n", "2011-01-24 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0.097391 | \n", "0.117930 | \n", "0.491739 | \n", "0.158330 | \n", "86 | \n", "1330 | \n", "1416 | \n", "
24 | \n", "25 | \n", "2011-01-25 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "2 | \n", "1 | \n", "2 | \n", "0.223478 | \n", "0.234526 | \n", "0.616957 | \n", "0.129796 | \n", "186 | \n", "1799 | \n", "1985 | \n", "
25 | \n", "26 | \n", "2011-01-26 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "3 | \n", "1 | \n", "3 | \n", "0.217500 | \n", "0.203600 | \n", "0.862500 | \n", "0.293850 | \n", "34 | \n", "472 | \n", "506 | \n", "
26 | \n", "27 | \n", "2011-01-27 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.195000 | \n", "0.219700 | \n", "0.687500 | \n", "0.113837 | \n", "15 | \n", "416 | \n", "431 | \n", "
27 | \n", "28 | \n", "2011-01-28 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "5 | \n", "1 | \n", "2 | \n", "0.203478 | \n", "0.223317 | \n", "0.793043 | \n", "0.123300 | \n", "38 | \n", "1129 | \n", "1167 | \n", "
28 | \n", "29 | \n", "2011-01-29 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "1 | \n", "0.196522 | \n", "0.212126 | \n", "0.651739 | \n", "0.145365 | \n", "123 | \n", "975 | \n", "1098 | \n", "
29 | \n", "30 | \n", "2011-01-30 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.216522 | \n", "0.250322 | \n", "0.722174 | \n", "0.073983 | \n", "140 | \n", "956 | \n", "1096 | \n", "
30 | \n", "31 | \n", "2011-01-31 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "2 | \n", "0.180833 | \n", "0.186250 | \n", "0.603750 | \n", "0.187192 | \n", "42 | \n", "1459 | \n", "1501 | \n", "
31 | \n", "32 | \n", "2011-02-01 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "2 | \n", "1 | \n", "2 | \n", "0.192174 | \n", "0.234530 | \n", "0.829565 | \n", "0.053213 | \n", "47 | \n", "1313 | \n", "1360 | \n", "
32 | \n", "33 | \n", "2011-02-02 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "3 | \n", "1 | \n", "2 | \n", "0.260000 | \n", "0.254417 | \n", "0.775417 | \n", "0.264308 | \n", "72 | \n", "1454 | \n", "1526 | \n", "
33 | \n", "34 | \n", "2011-02-03 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.186957 | \n", "0.177878 | \n", "0.437826 | \n", "0.277752 | \n", "61 | \n", "1489 | \n", "1550 | \n", "
34 | \n", "35 | \n", "2011-02-04 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "1 | \n", "2 | \n", "0.211304 | \n", "0.228587 | \n", "0.585217 | \n", "0.127839 | \n", "88 | \n", "1620 | \n", "1708 | \n", "
35 | \n", "36 | \n", "2011-02-05 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "6 | \n", "0 | \n", "2 | \n", "0.233333 | \n", "0.243058 | \n", "0.929167 | \n", "0.161079 | \n", "100 | \n", "905 | \n", "1005 | \n", "
36 | \n", "37 | \n", "2011-02-06 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.285833 | \n", "0.291671 | \n", "0.568333 | \n", "0.141800 | \n", "354 | \n", "1269 | \n", "1623 | \n", "
37 | \n", "38 | \n", "2011-02-07 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0.271667 | \n", "0.303658 | \n", "0.738333 | \n", "0.045408 | \n", "120 | \n", "1592 | \n", "1712 | \n", "
38 | \n", "39 | \n", "2011-02-08 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0.220833 | \n", "0.198246 | \n", "0.537917 | \n", "0.361950 | \n", "64 | \n", "1466 | \n", "1530 | \n", "
39 | \n", "40 | \n", "2011-02-09 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "3 | \n", "1 | \n", "2 | \n", "0.134783 | \n", "0.144283 | \n", "0.494783 | \n", "0.188839 | \n", "53 | \n", "1552 | \n", "1605 | \n", "
40 | \n", "41 | \n", "2011-02-10 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.144348 | \n", "0.149548 | \n", "0.437391 | \n", "0.221935 | \n", "47 | \n", "1491 | \n", "1538 | \n", "
41 | \n", "42 | \n", "2011-02-11 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "1 | \n", "1 | \n", "0.189091 | \n", "0.213509 | \n", "0.506364 | \n", "0.108550 | \n", "149 | \n", "1597 | \n", "1746 | \n", "
42 | \n", "43 | \n", "2011-02-12 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "6 | \n", "0 | \n", "1 | \n", "0.222500 | \n", "0.232954 | \n", "0.544167 | \n", "0.203367 | \n", "288 | \n", "1184 | \n", "1472 | \n", "
43 | \n", "44 | \n", "2011-02-13 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.316522 | \n", "0.324113 | \n", "0.457391 | \n", "0.260883 | \n", "397 | \n", "1192 | \n", "1589 | \n", "
44 | \n", "45 | \n", "2011-02-14 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "1 | \n", "1 | \n", "1 | \n", "0.415000 | \n", "0.398350 | \n", "0.375833 | \n", "0.417908 | \n", "208 | \n", "1705 | \n", "1913 | \n", "
45 | \n", "46 | \n", "2011-02-15 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0.266087 | \n", "0.254274 | \n", "0.314348 | \n", "0.291374 | \n", "140 | \n", "1675 | \n", "1815 | \n", "
46 | \n", "47 | \n", "2011-02-16 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "3 | \n", "1 | \n", "1 | \n", "0.318261 | \n", "0.316200 | \n", "0.423478 | \n", "0.251791 | \n", "218 | \n", "1897 | \n", "2115 | \n", "
47 | \n", "48 | \n", "2011-02-17 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "4 | \n", "1 | \n", "1 | \n", "0.435833 | \n", "0.428658 | \n", "0.505000 | \n", "0.230104 | \n", "259 | \n", "2216 | \n", "2475 | \n", "
48 | \n", "49 | \n", "2011-02-18 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "1 | \n", "1 | \n", "0.521667 | \n", "0.511983 | \n", "0.516667 | \n", "0.264925 | \n", "579 | \n", "2348 | \n", "2927 | \n", "
49 | \n", "50 | \n", "2011-02-19 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "6 | \n", "0 | \n", "1 | \n", "0.399167 | \n", "0.391404 | \n", "0.187917 | \n", "0.507463 | \n", "532 | \n", "1103 | \n", "1635 | \n", "
50 | \n", "51 | \n", "2011-02-20 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.285217 | \n", "0.277330 | \n", "0.407826 | \n", "0.223235 | \n", "639 | \n", "1173 | \n", "1812 | \n", "
51 | \n", "52 | \n", "2011-02-21 | \n", "1 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0 | \n", "2 | \n", "0.303333 | \n", "0.284075 | \n", "0.605000 | \n", "0.307846 | \n", "195 | \n", "912 | \n", "1107 | \n", "
52 | \n", "53 | \n", "2011-02-22 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0.182222 | \n", "0.186033 | \n", "0.577778 | \n", "0.195683 | \n", "74 | \n", "1376 | \n", "1450 | \n", "
53 | \n", "54 | \n", "2011-02-23 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "3 | \n", "1 | \n", "1 | \n", "0.221739 | \n", "0.245717 | \n", "0.423043 | \n", "0.094113 | \n", "139 | \n", "1778 | \n", "1917 | \n", "
54 | \n", "55 | \n", "2011-02-24 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "4 | \n", "1 | \n", "2 | \n", "0.295652 | \n", "0.289191 | \n", "0.697391 | \n", "0.250496 | \n", "100 | \n", "1707 | \n", "1807 | \n", "
55 | \n", "56 | \n", "2011-02-25 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "1 | \n", "2 | \n", "0.364348 | \n", "0.350461 | \n", "0.712174 | \n", "0.346539 | \n", "120 | \n", "1341 | \n", "1461 | \n", "
56 | \n", "57 | \n", "2011-02-26 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "6 | \n", "0 | \n", "1 | \n", "0.282500 | \n", "0.282192 | \n", "0.537917 | \n", "0.186571 | \n", "424 | \n", "1545 | \n", "1969 | \n", "
57 | \n", "58 | \n", "2011-02-27 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0.343478 | \n", "0.351109 | \n", "0.680000 | \n", "0.125248 | \n", "694 | \n", "1708 | \n", "2402 | \n", "
58 | \n", "59 | \n", "2011-02-28 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "1 | \n", "1 | \n", "2 | \n", "0.407273 | \n", "0.400118 | \n", "0.876364 | \n", "0.289686 | \n", "81 | \n", "1365 | \n", "1446 | \n", "
59 | \n", "60 | \n", "2011-03-01 | \n", "1 | \n", "0 | \n", "3 | \n", "0 | \n", "2 | \n", "1 | \n", "1 | \n", "0.266667 | \n", "0.263879 | \n", "0.535000 | \n", "0.216425 | \n", "137 | \n", "1714 | \n", "1851 | \n", "
\n", " | ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
731 rows \u00d7 16 columns
\n", "