{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Part III : Exploratory Data Analyses" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "> Jump to : \n", "* [Part 1](https://github.com/Niladri-B/Coursera_Captstone/blob/master/wk4/Capstone_part1.ipynb) *Extracting Street Addresses & Coordinates* \n", "* [Part 2](https://github.com/Niladri-B/Coursera_Captstone/blob/master/wk4/Capstone_part2-forUpload.ipynb), *Extracting Foursquare Data*\n", "* [Part 4](https://github.com/Niladri-B/Coursera_Captstone/blob/master/wk4/Capstone_part4.ipynb), *Clustering and Visualising*\n", "* [Part 5](https://github.com/Niladri-B/Coursera_Captstone/blob/master/wk4/Capstone_part5.ipynb), *Conclusion & Discussion*" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Step 1: Load up environment and data" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
StreetStreet LatitudeStreet LongitudeTrikkTrikk Distance01234567891011121314151617T-bane_1T-bane_2T-bane_3T-bane_4Train Station
0Gregers Grams vei59.93487610.647214NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
1Åsbrekka59.97155910.664394NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
2Lilleborggata59.93692910.770171Torshov (trikk)401.0Buss 55 BNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
3Simensbrekka59.90077810.783550NaNNaNUnderveis med 34 bussenNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
4Krossveien59.96255010.764100NaNNaN25-bussenNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
\n", "
" ], "text/plain": [ " Street Street Latitude Street Longitude Trikk \\\n", "0 Gregers Grams vei 59.934876 10.647214 NaN \n", "1 Åsbrekka 59.971559 10.664394 NaN \n", "2 Lilleborggata 59.936929 10.770171 Torshov (trikk) \n", "3 Simensbrekka 59.900778 10.783550 NaN \n", "4 Krossveien 59.962550 10.764100 NaN \n", "\n", " Trikk Distance 0 1 2 3 4 5 6 7 \\\n", "0 NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "1 NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2 401.0 Buss 55 B NaN NaN NaN NaN NaN NaN NaN \n", "3 NaN Underveis med 34 bussen NaN NaN NaN NaN NaN NaN NaN \n", "4 NaN 25-bussen NaN NaN NaN NaN NaN NaN NaN \n", "\n", " 8 9 10 11 12 13 14 15 16 17 T-bane_1 T-bane_2 \\\n", "0 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "1 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "3 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "4 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "\n", " T-bane_3 T-bane_4 Train Station \n", "0 NaN NaN NaN \n", "1 NaN NaN NaN \n", "2 NaN NaN NaN \n", "3 NaN NaN NaN \n", "4 NaN NaN NaN " ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "streetTrikkBussMetroTog = pd.read_csv('./streetData_TrikkBusMetroTog.csv')\n", "streetTrikkBussMetroTog.head()" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2460, 28)" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "streetTrikkBussMetroTog.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "So, in all we have information on **2460** streets in Oslo, Norway" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Step 2: Find total transport options" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index([, , , ,\n", " , , , ,\n", " , , , ,\n", " , , , ,\n", " , , , ,\n", " , , , ,\n", " , , , ],\n", " dtype='object')" ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#Check column type in the above dataframe\n", "streetTrikkBussMetroTog.columns.map(type)" ] }, { "cell_type": "code", "execution_count": 35, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "[str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str,\n", " str]" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#To find total transport options/street, we sum the columns that are NOT null, followed by sorting in descending order to obtain streets with maximum number of transport options\n", "\n", "#First we must select the columns to sum on\n", "busCOLS = list(range(18))\n", "\n", "#Now we define a function that can automatically add text to numbers, useful for colns of T-bane\n", "def makeColnName (list_of_colnNum):\n", " \n", " metroCOLSlist = []\n", " for i in list_of_colnNum:\n", " #print('T-bane_'+str(i))\n", " metroCOLSlist.append('T-bane_'+str(i))#Choose whatever colnName you want to prepend to the numbers\n", " return(metroCOLSlist)\n", "\n", "#Makes columns of T-bane\n", "COLSlist = makeColnName(list(range(1,5)))\n", "\n", "#Join T-bane and bus lists together with additional list of Trikk+Tog\n", "COLSlist = ['Trikk','Train Station']+ COLSlist + busCOLS\n", "COLSlist#Total 24 transport colns, out of which max comes 22...wow...a street with 22 options..??\n", "\n", "#Check data type in the list\n", "#for i in COLSlist:\n", "# if (type(i)) == str:\n", "# print('YABBA',i)\n", "# else:\n", "# print('BOO',i)\n", "# \n", "# \n", "#Convert int types to str types\n", "def convertType (LIST):\n", " \n", " newLIST = list()\n", " for i in LIST:\n", " if type(i) == str:\n", " newLIST.append(i)\n", " else:\n", " #str(i)\n", " newLIST.append(str(i))\n", " \n", " return newLIST\n", "\n", "COLSlist_str = convertType(COLSlist)\n", "\n", "#Check correctly formatted\n", "[type(i) for i in COLSlist_str] " ] }, { "cell_type": "code", "execution_count": 41, "metadata": {}, "outputs": [], "source": [ "#Sort in descending order of non-null values i.e. highest transport to lowest\n", "streetTrikkBussMetroTog[COLSlist_str].notnull().sum(axis = 'columns').sort_values(ascending = False) \n", "\n", "#Also store this in a new coln named totalTransport\n", "streetTrikkBussMetroTog['Total Transport']= streetTrikkBussMetroTog[COLSlist_str].notnull().sum(axis = 'columns').sort_values(ascending = False) #Sort in descending order of non-null values i.e. highest transport to lowest" ] }, { "cell_type": "code", "execution_count": 42, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Int64Index([1993, 554, 1736, 1152, 2354, 79, 1654, 1555, 1439, 279,\n", " ...\n", " 1136, 1134, 1126, 1124, 1122, 1115, 1101, 1092, 1091, 0],\n", " dtype='int64', length=2460)" ] }, "execution_count": 42, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#Obtain new index of the sorted order\n", "newIndex = streetTrikkBussMetroTog[COLSlist_str].notnull().sum(axis = 'columns').sort_values(ascending = False).index \n", "newIndex" ] }, { "cell_type": "code", "execution_count": 43, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 0, 1, 2, ..., 2457, 2458, 2459])" ] }, "execution_count": 43, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#If you want to see all the values of the original dataframe (not the sorted)\n", "streetTrikkBussMetroTog.index.values" ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
StreetStreet LatitudeStreet LongitudeTrikkTrikk Distance01234567891011121314151617T-bane_1T-bane_2T-bane_3T-bane_4Train StationTotal Transport
0Lilletorget59.91350010.755900Jernbanetorget (Trikk/B)356.0buss 500Buss 30Buss 252Buss 70Buss 34Buss 54Buss 143Buss 54Buss 490Eplatform 29 oslo bussterminalBuss 111Buss 31Buss 31 EBuss 542 Seiersten Ekspress150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 Lillestrøm('Jernbanetorget (T)', 248)('Grønland (T)', 318)NaNNaN('Oslo Sentralstasjon', 332)22
1Europarådets plass59.91200010.749300Jernbanetorget (Trikk/B)48.0Buss 31 EBuss 34Buss 542 Seiersten EkspressBuss 54Buss 82EBuss 143Buss 542 Til DrøbakBuss 37Buss 70Buss 54Buss 30Buss 252buss 500Buss 83Buss 3181B-Bussen81A-bussenplatform 29 oslo bussterminal('Jernbanetorget (T)', 164)('Stortinget (T)', 420)NaNNaN('Oslo Sentralstasjon', 300)22
2Brugata59.91400510.755774Jernbanetorget (Trikk/B)375.0Buss 30buss 500Buss 252Buss 54Buss 70Buss 34Buss 111Buss 143Buss 490EBuss 54Buss 31Buss 31 Eplatform 29 oslo bussterminal150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 LillestrømNaN('Jernbanetorget (T)', 277)('Grønland (T)', 345)NaNNaN('Oslo Sentralstasjon', 384)21
3Pløens gate59.91390010.749325Jernbanetorget (Trikk/B)187.0Buss 54Buss 31Buss 54Buss 30Buss 37Buss 34Buss 31 EBuss 70Buss 143Buss 252Buss 82EBuss 542 Til Drøbakbuss 500Buss 542 Seiersten Ekspress81A-bussen81B-Bussenplatform 29 oslo bussterminalNaN('Jernbanetorget (T)', 241)('Stortinget (T)', 428)NaNNaN('Oslo Sentralstasjon', 443)21
4Sonja Henies plass59.91270010.755500NaNNaNBuss 252platform 29 oslo bussterminalbuss 500Buss 70Buss 30Buss 143Buss 34Buss 490EBuss 54Buss 54Buss 31 EBuss 82EBuss 31Buss 542 Seiersten EkspressBuss 111150 Oslo Bussterminal - Gullhaug - Oslo Busst...550 Oslo Bussterminal - Lillestrømplattform 20-Buss 501 enebakk-Lillestrøm('Jernbanetorget (T)', 190)('Grønland (T)', 327)NaNNaN('Oslo Sentralstasjon', 240)21
\n", "
" ], "text/plain": [ " Street Street Latitude Street Longitude \\\n", "0 Lilletorget 59.913500 10.755900 \n", "1 Europarådets plass 59.912000 10.749300 \n", "2 Brugata 59.914005 10.755774 \n", "3 Pløens gate 59.913900 10.749325 \n", "4 Sonja Henies plass 59.912700 10.755500 \n", "\n", " Trikk Trikk Distance 0 \\\n", "0 Jernbanetorget (Trikk/B) 356.0 buss 500 \n", "1 Jernbanetorget (Trikk/B) 48.0 Buss 31 E \n", "2 Jernbanetorget (Trikk/B) 375.0 Buss 30 \n", "3 Jernbanetorget (Trikk/B) 187.0 Buss 54 \n", "4 NaN NaN Buss 252 \n", "\n", " 1 2 3 \\\n", "0 Buss 30 Buss 252 Buss 70 \n", "1 Buss 34 Buss 542 Seiersten Ekspress Buss 54 \n", "2 buss 500 Buss 252 Buss 54 \n", "3 Buss 31 Buss 54 Buss 30 \n", "4 platform 29 oslo bussterminal buss 500 Buss 70 \n", "\n", " 4 5 6 7 8 \\\n", "0 Buss 34 Buss 54 Buss 143 Buss 54 Buss 490E \n", "1 Buss 82E Buss 143 Buss 542 Til Drøbak Buss 37 Buss 70 \n", "2 Buss 70 Buss 34 Buss 111 Buss 143 Buss 490E \n", "3 Buss 37 Buss 34 Buss 31 E Buss 70 Buss 143 \n", "4 Buss 30 Buss 143 Buss 34 Buss 490E Buss 54 \n", "\n", " 9 10 11 \\\n", "0 platform 29 oslo bussterminal Buss 111 Buss 31 \n", "1 Buss 54 Buss 30 Buss 252 \n", "2 Buss 54 Buss 31 Buss 31 E \n", "3 Buss 252 Buss 82E Buss 542 Til Drøbak \n", "4 Buss 54 Buss 31 E Buss 82E \n", "\n", " 12 \\\n", "0 Buss 31 E \n", "1 buss 500 \n", "2 platform 29 oslo bussterminal \n", "3 buss 500 \n", "4 Buss 31 \n", "\n", " 13 \\\n", "0 Buss 542 Seiersten Ekspress \n", "1 Buss 83 \n", "2 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "3 Buss 542 Seiersten Ekspress \n", "4 Buss 542 Seiersten Ekspress \n", "\n", " 14 \\\n", "0 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "1 Buss 31 \n", "2 plattform 20-Buss 501 enebakk-Lillestrøm \n", "3 81A-bussen \n", "4 Buss 111 \n", "\n", " 15 \\\n", "0 plattform 20-Buss 501 enebakk-Lillestrøm \n", "1 81B-Bussen \n", "2 550 Oslo Bussterminal - Lillestrøm \n", "3 81B-Bussen \n", "4 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "\n", " 16 \\\n", "0 550 Oslo Bussterminal - Lillestrøm \n", "1 81A-bussen \n", "2 Plattform 18 - Buss 411 Lillestrøm \n", "3 platform 29 oslo bussterminal \n", "4 550 Oslo Bussterminal - Lillestrøm \n", "\n", " 17 T-bane_1 \\\n", "0 Plattform 18 - Buss 411 Lillestrøm ('Jernbanetorget (T)', 248) \n", "1 platform 29 oslo bussterminal ('Jernbanetorget (T)', 164) \n", "2 NaN ('Jernbanetorget (T)', 277) \n", "3 NaN ('Jernbanetorget (T)', 241) \n", "4 plattform 20-Buss 501 enebakk-Lillestrøm ('Jernbanetorget (T)', 190) \n", "\n", " T-bane_2 T-bane_3 T-bane_4 Train Station \\\n", "0 ('Grønland (T)', 318) NaN NaN ('Oslo Sentralstasjon', 332) \n", "1 ('Stortinget (T)', 420) NaN NaN ('Oslo Sentralstasjon', 300) \n", "2 ('Grønland (T)', 345) NaN NaN ('Oslo Sentralstasjon', 384) \n", "3 ('Stortinget (T)', 428) NaN NaN ('Oslo Sentralstasjon', 443) \n", "4 ('Grønland (T)', 327) NaN NaN ('Oslo Sentralstasjon', 240) \n", "\n", " Total Transport \n", "0 22 \n", "1 22 \n", "2 21 \n", "3 21 \n", "4 21 " ] }, "execution_count": 44, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#Attempt to change old index to new custom ordered index\n", "orderedStreetTrikkBussMetroTog = streetTrikkBussMetroTog.iloc[newIndex,]\n", "\n", "#Right now, the index values will be like 554, 2354 etc, to get them in the order of 0,1,2...\n", "\n", "#Get range for the index values\n", "manualIndex2 = range(orderedStreetTrikkBussMetroTog.shape[0])\n", "\n", "#Assign this new index\n", "orderedStreetTrikkBussMetroTog.index = manualIndex2\n", "orderedStreetTrikkBussMetroTog.head()" ] }, { "cell_type": "code", "execution_count": 48, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/opt/local/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/ipykernel_launcher.py:6: SettingWithCopyWarning: \n", "A value is trying to be set on a copy of a slice from a DataFrame.\n", "Try using .loc[row_indexer,col_indexer] = value instead\n", "\n", "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n", " \n" ] }, { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
StreetStreet LatitudeStreet LongitudeTrikkTrikk Distance01234567891011121314151617T-bane_1T-bane_2T-bane_3T-bane_4Train StationTotal TransportTotal Bus
0Lilletorget59.91350010.755900Jernbanetorget (Trikk/B)356.0buss 500Buss 30Buss 252Buss 70Buss 34Buss 54Buss 143Buss 54Buss 490Eplatform 29 oslo bussterminalBuss 111Buss 31Buss 31 EBuss 542 Seiersten Ekspress150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 Lillestrøm('Jernbanetorget (T)', 248)('Grønland (T)', 318)NaNNaN('Oslo Sentralstasjon', 332)2218
1Europarådets plass59.91200010.749300Jernbanetorget (Trikk/B)48.0Buss 31 EBuss 34Buss 542 Seiersten EkspressBuss 54Buss 82EBuss 143Buss 542 Til DrøbakBuss 37Buss 70Buss 54Buss 30Buss 252buss 500Buss 83Buss 3181B-Bussen81A-bussenplatform 29 oslo bussterminal('Jernbanetorget (T)', 164)('Stortinget (T)', 420)NaNNaN('Oslo Sentralstasjon', 300)2218
2Brugata59.91400510.755774Jernbanetorget (Trikk/B)375.0Buss 30buss 500Buss 252Buss 54Buss 70Buss 34Buss 111Buss 143Buss 490EBuss 54Buss 31Buss 31 Eplatform 29 oslo bussterminal150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 LillestrømNaN('Jernbanetorget (T)', 277)('Grønland (T)', 345)NaNNaN('Oslo Sentralstasjon', 384)2117
3Pløens gate59.91390010.749325Jernbanetorget (Trikk/B)187.0Buss 54Buss 31Buss 54Buss 30Buss 37Buss 34Buss 31 EBuss 70Buss 143Buss 252Buss 82EBuss 542 Til Drøbakbuss 500Buss 542 Seiersten Ekspress81A-bussen81B-Bussenplatform 29 oslo bussterminalNaN('Jernbanetorget (T)', 241)('Stortinget (T)', 428)NaNNaN('Oslo Sentralstasjon', 443)2117
4Sonja Henies plass59.91270010.755500NaNNaNBuss 252platform 29 oslo bussterminalbuss 500Buss 70Buss 30Buss 143Buss 34Buss 490EBuss 54Buss 54Buss 31 EBuss 82EBuss 31Buss 542 Seiersten EkspressBuss 111150 Oslo Bussterminal - Gullhaug - Oslo Busst...550 Oslo Bussterminal - Lillestrømplattform 20-Buss 501 enebakk-Lillestrøm('Jernbanetorget (T)', 190)('Grønland (T)', 327)NaNNaN('Oslo Sentralstasjon', 240)2118
\n", "
" ], "text/plain": [ " Street Street Latitude Street Longitude \\\n", "0 Lilletorget 59.913500 10.755900 \n", "1 Europarådets plass 59.912000 10.749300 \n", "2 Brugata 59.914005 10.755774 \n", "3 Pløens gate 59.913900 10.749325 \n", "4 Sonja Henies plass 59.912700 10.755500 \n", "\n", " Trikk Trikk Distance 0 \\\n", "0 Jernbanetorget (Trikk/B) 356.0 buss 500 \n", "1 Jernbanetorget (Trikk/B) 48.0 Buss 31 E \n", "2 Jernbanetorget (Trikk/B) 375.0 Buss 30 \n", "3 Jernbanetorget (Trikk/B) 187.0 Buss 54 \n", "4 NaN NaN Buss 252 \n", "\n", " 1 2 3 \\\n", "0 Buss 30 Buss 252 Buss 70 \n", "1 Buss 34 Buss 542 Seiersten Ekspress Buss 54 \n", "2 buss 500 Buss 252 Buss 54 \n", "3 Buss 31 Buss 54 Buss 30 \n", "4 platform 29 oslo bussterminal buss 500 Buss 70 \n", "\n", " 4 5 6 7 8 \\\n", "0 Buss 34 Buss 54 Buss 143 Buss 54 Buss 490E \n", "1 Buss 82E Buss 143 Buss 542 Til Drøbak Buss 37 Buss 70 \n", "2 Buss 70 Buss 34 Buss 111 Buss 143 Buss 490E \n", "3 Buss 37 Buss 34 Buss 31 E Buss 70 Buss 143 \n", "4 Buss 30 Buss 143 Buss 34 Buss 490E Buss 54 \n", "\n", " 9 10 11 \\\n", "0 platform 29 oslo bussterminal Buss 111 Buss 31 \n", "1 Buss 54 Buss 30 Buss 252 \n", "2 Buss 54 Buss 31 Buss 31 E \n", "3 Buss 252 Buss 82E Buss 542 Til Drøbak \n", "4 Buss 54 Buss 31 E Buss 82E \n", "\n", " 12 \\\n", "0 Buss 31 E \n", "1 buss 500 \n", "2 platform 29 oslo bussterminal \n", "3 buss 500 \n", "4 Buss 31 \n", "\n", " 13 \\\n", "0 Buss 542 Seiersten Ekspress \n", "1 Buss 83 \n", "2 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "3 Buss 542 Seiersten Ekspress \n", "4 Buss 542 Seiersten Ekspress \n", "\n", " 14 \\\n", "0 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "1 Buss 31 \n", "2 plattform 20-Buss 501 enebakk-Lillestrøm \n", "3 81A-bussen \n", "4 Buss 111 \n", "\n", " 15 \\\n", "0 plattform 20-Buss 501 enebakk-Lillestrøm \n", "1 81B-Bussen \n", "2 550 Oslo Bussterminal - Lillestrøm \n", "3 81B-Bussen \n", "4 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "\n", " 16 \\\n", "0 550 Oslo Bussterminal - Lillestrøm \n", "1 81A-bussen \n", "2 Plattform 18 - Buss 411 Lillestrøm \n", "3 platform 29 oslo bussterminal \n", "4 550 Oslo Bussterminal - Lillestrøm \n", "\n", " 17 T-bane_1 \\\n", "0 Plattform 18 - Buss 411 Lillestrøm ('Jernbanetorget (T)', 248) \n", "1 platform 29 oslo bussterminal ('Jernbanetorget (T)', 164) \n", "2 NaN ('Jernbanetorget (T)', 277) \n", "3 NaN ('Jernbanetorget (T)', 241) \n", "4 plattform 20-Buss 501 enebakk-Lillestrøm ('Jernbanetorget (T)', 190) \n", "\n", " T-bane_2 T-bane_3 T-bane_4 Train Station \\\n", "0 ('Grønland (T)', 318) NaN NaN ('Oslo Sentralstasjon', 332) \n", "1 ('Stortinget (T)', 420) NaN NaN ('Oslo Sentralstasjon', 300) \n", "2 ('Grønland (T)', 345) NaN NaN ('Oslo Sentralstasjon', 384) \n", "3 ('Stortinget (T)', 428) NaN NaN ('Oslo Sentralstasjon', 443) \n", "4 ('Grønland (T)', 327) NaN NaN ('Oslo Sentralstasjon', 240) \n", "\n", " Total Transport Total Bus \n", "0 22 18 \n", "1 22 18 \n", "2 21 17 \n", "3 21 17 \n", "4 21 18 " ] }, "execution_count": 48, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#Find total bus options, but first convert the busCOLS to str\n", "busCOLS_str = convertType(busCOLS)\n", "orderedStreetTrikkBussMetroTog[busCOLS_str].notnull().sum(axis = 'columns').sort_values(ascending = False) #Sort in descending order of non-null values i.e. highest transport to lowest\n", "\n", "#Add this info as a new column\n", "orderedStreetTrikkBussMetroTog['Total Bus'] = orderedStreetTrikkBussMetroTog[busCOLS_str].notnull().sum(axis = 'columns').sort_values(ascending = False)\n", "orderedStreetTrikkBussMetroTog.head()" ] }, { "cell_type": "code", "execution_count": 54, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "A total of 630 streets seem to have NO transport option within 400m\n" ] } ], "source": [ "#Find total streets with least amount of transport options\n", "print ('A total of ', orderedStreetTrikkBussMetroTog[orderedStreetTrikkBussMetroTog['Total Transport'] == 0].shape[0],'streets seem to have NO transport option within 400m')" ] }, { "cell_type": "code", "execution_count": 52, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(2460, 30)" ] }, "execution_count": 52, "metadata": {}, "output_type": "execute_result" } ], "source": [ "orderedStreetTrikkBussMetroTog.shape" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Step 6: Exploratory Analysis " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Let us explore some of the streets with the most, the least transport options. Let us also review the distribution of transport options across all streets." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 6.1 Top 10 streets with most transport options within 400m" ] }, { "cell_type": "code", "execution_count": 50, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
StreetStreet LatitudeStreet LongitudeTrikkTrikk Distance01234567891011121314151617T-bane_1T-bane_2T-bane_3T-bane_4Train StationTotal TransportTotal Bus
0Lilletorget59.91350010.755900Jernbanetorget (Trikk/B)356.0buss 500Buss 30Buss 252Buss 70Buss 34Buss 54Buss 143Buss 54Buss 490Eplatform 29 oslo bussterminalBuss 111Buss 31Buss 31 EBuss 542 Seiersten Ekspress150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 Lillestrøm('Jernbanetorget (T)', 248)('Grønland (T)', 318)NaNNaN('Oslo Sentralstasjon', 332)2218
1Europarådets plass59.91200010.749300Jernbanetorget (Trikk/B)48.0Buss 31 EBuss 34Buss 542 Seiersten EkspressBuss 54Buss 82EBuss 143Buss 542 Til DrøbakBuss 37Buss 70Buss 54Buss 30Buss 252buss 500Buss 83Buss 3181B-Bussen81A-bussenplatform 29 oslo bussterminal('Jernbanetorget (T)', 164)('Stortinget (T)', 420)NaNNaN('Oslo Sentralstasjon', 300)2218
2Brugata59.91400510.755774Jernbanetorget (Trikk/B)375.0Buss 30buss 500Buss 252Buss 54Buss 70Buss 34Buss 111Buss 143Buss 490EBuss 54Buss 31Buss 31 Eplatform 29 oslo bussterminal150 Oslo Bussterminal - Gullhaug - Oslo Busst...plattform 20-Buss 501 enebakk-Lillestrøm550 Oslo Bussterminal - LillestrømPlattform 18 - Buss 411 LillestrømNaN('Jernbanetorget (T)', 277)('Grønland (T)', 345)NaNNaN('Oslo Sentralstasjon', 384)2117
3Pløens gate59.91390010.749325Jernbanetorget (Trikk/B)187.0Buss 54Buss 31Buss 54Buss 30Buss 37Buss 34Buss 31 EBuss 70Buss 143Buss 252Buss 82EBuss 542 Til Drøbakbuss 500Buss 542 Seiersten Ekspress81A-bussen81B-Bussenplatform 29 oslo bussterminalNaN('Jernbanetorget (T)', 241)('Stortinget (T)', 428)NaNNaN('Oslo Sentralstasjon', 443)2117
4Sonja Henies plass59.91270010.755500NaNNaNBuss 252platform 29 oslo bussterminalbuss 500Buss 70Buss 30Buss 143Buss 34Buss 490EBuss 54Buss 54Buss 31 EBuss 82EBuss 31Buss 542 Seiersten EkspressBuss 111150 Oslo Bussterminal - Gullhaug - Oslo Busst...550 Oslo Bussterminal - Lillestrømplattform 20-Buss 501 enebakk-Lillestrøm('Jernbanetorget (T)', 190)('Grønland (T)', 327)NaNNaN('Oslo Sentralstasjon', 240)2118
\n", "
" ], "text/plain": [ " Street Street Latitude Street Longitude \\\n", "0 Lilletorget 59.913500 10.755900 \n", "1 Europarådets plass 59.912000 10.749300 \n", "2 Brugata 59.914005 10.755774 \n", "3 Pløens gate 59.913900 10.749325 \n", "4 Sonja Henies plass 59.912700 10.755500 \n", "\n", " Trikk Trikk Distance 0 \\\n", "0 Jernbanetorget (Trikk/B) 356.0 buss 500 \n", "1 Jernbanetorget (Trikk/B) 48.0 Buss 31 E \n", "2 Jernbanetorget (Trikk/B) 375.0 Buss 30 \n", "3 Jernbanetorget (Trikk/B) 187.0 Buss 54 \n", "4 NaN NaN Buss 252 \n", "\n", " 1 2 3 \\\n", "0 Buss 30 Buss 252 Buss 70 \n", "1 Buss 34 Buss 542 Seiersten Ekspress Buss 54 \n", "2 buss 500 Buss 252 Buss 54 \n", "3 Buss 31 Buss 54 Buss 30 \n", "4 platform 29 oslo bussterminal buss 500 Buss 70 \n", "\n", " 4 5 6 7 8 \\\n", "0 Buss 34 Buss 54 Buss 143 Buss 54 Buss 490E \n", "1 Buss 82E Buss 143 Buss 542 Til Drøbak Buss 37 Buss 70 \n", "2 Buss 70 Buss 34 Buss 111 Buss 143 Buss 490E \n", "3 Buss 37 Buss 34 Buss 31 E Buss 70 Buss 143 \n", "4 Buss 30 Buss 143 Buss 34 Buss 490E Buss 54 \n", "\n", " 9 10 11 \\\n", "0 platform 29 oslo bussterminal Buss 111 Buss 31 \n", "1 Buss 54 Buss 30 Buss 252 \n", "2 Buss 54 Buss 31 Buss 31 E \n", "3 Buss 252 Buss 82E Buss 542 Til Drøbak \n", "4 Buss 54 Buss 31 E Buss 82E \n", "\n", " 12 \\\n", "0 Buss 31 E \n", "1 buss 500 \n", "2 platform 29 oslo bussterminal \n", "3 buss 500 \n", "4 Buss 31 \n", "\n", " 13 \\\n", "0 Buss 542 Seiersten Ekspress \n", "1 Buss 83 \n", "2 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "3 Buss 542 Seiersten Ekspress \n", "4 Buss 542 Seiersten Ekspress \n", "\n", " 14 \\\n", "0 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "1 Buss 31 \n", "2 plattform 20-Buss 501 enebakk-Lillestrøm \n", "3 81A-bussen \n", "4 Buss 111 \n", "\n", " 15 \\\n", "0 plattform 20-Buss 501 enebakk-Lillestrøm \n", "1 81B-Bussen \n", "2 550 Oslo Bussterminal - Lillestrøm \n", "3 81B-Bussen \n", "4 150 Oslo Bussterminal - Gullhaug - Oslo Busst... \n", "\n", " 16 \\\n", "0 550 Oslo Bussterminal - Lillestrøm \n", "1 81A-bussen \n", "2 Plattform 18 - Buss 411 Lillestrøm \n", "3 platform 29 oslo bussterminal \n", "4 550 Oslo Bussterminal - Lillestrøm \n", "\n", " 17 T-bane_1 \\\n", "0 Plattform 18 - Buss 411 Lillestrøm ('Jernbanetorget (T)', 248) \n", "1 platform 29 oslo bussterminal ('Jernbanetorget (T)', 164) \n", "2 NaN ('Jernbanetorget (T)', 277) \n", "3 NaN ('Jernbanetorget (T)', 241) \n", "4 plattform 20-Buss 501 enebakk-Lillestrøm ('Jernbanetorget (T)', 190) \n", "\n", " T-bane_2 T-bane_3 T-bane_4 Train Station \\\n", "0 ('Grønland (T)', 318) NaN NaN ('Oslo Sentralstasjon', 332) \n", "1 ('Stortinget (T)', 420) NaN NaN ('Oslo Sentralstasjon', 300) \n", "2 ('Grønland (T)', 345) NaN NaN ('Oslo Sentralstasjon', 384) \n", "3 ('Stortinget (T)', 428) NaN NaN ('Oslo Sentralstasjon', 443) \n", "4 ('Grønland (T)', 327) NaN NaN ('Oslo Sentralstasjon', 240) \n", "\n", " Total Transport Total Bus \n", "0 22 18 \n", "1 22 18 \n", "2 21 17 \n", "3 21 17 \n", "4 21 18 " ] }, "execution_count": 50, "metadata": {}, "output_type": "execute_result" } ], "source": [ "#sns.set(rc={'figure.figsize':(12,9)})\n", "top_streets = orderedStreetTrikkBussMetroTog.head(10)\n", "top_streets.head()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 6.2 10 streets with least transport options within 400m" ] }, { "cell_type": "code", "execution_count": 55, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
StreetStreet LatitudeStreet LongitudeTrikkTrikk Distance01234567891011121314151617T-bane_1T-bane_2T-bane_3T-bane_4Train StationTotal TransportTotal Bus
2450Hellerudstubben59.91734510.848599NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN00
2451Gamle Herregårdsvei59.84415610.783600NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN00
2452Vassfaret59.95352110.681836NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN00
2453Vekterveien59.89066310.812804NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN00
2454Tryvannsveien59.98452910.669471NaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN00
\n", "
" ], "text/plain": [ " Street Street Latitude Street Longitude Trikk \\\n", "2450 Hellerudstubben 59.917345 10.848599 NaN \n", "2451 Gamle Herregårdsvei 59.844156 10.783600 NaN \n", "2452 Vassfaret 59.953521 10.681836 NaN \n", "2453 Vekterveien 59.890663 10.812804 NaN \n", "2454 Tryvannsveien 59.984529 10.669471 NaN \n", "\n", " Trikk Distance 0 1 2 3 4 5 6 7 8 9 10 \\\n", "2450 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2451 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2452 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2453 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2454 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "\n", " 11 12 13 14 15 16 17 T-bane_1 T-bane_2 T-bane_3 T-bane_4 \\\n", "2450 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2451 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2452 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2453 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "2454 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN \n", "\n", " Train Station Total Transport Total Bus \n", "2450 NaN 0 0 \n", "2451 NaN 0 0 \n", "2452 NaN 0 0 \n", "2453 NaN 0 0 \n", "2454 NaN 0 0 " ] }, "execution_count": 55, "metadata": {}, "output_type": "execute_result" } ], "source": [ "bottom_streets = orderedStreetTrikkBussMetroTog.tail(10)\n", "bottom_streets.head()" ] }, { "cell_type": "code", "execution_count": 61, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,\n", " 17, 18, 19]), )" ] }, "execution_count": 61, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "#Let us combine the top10 and bottom 10 dataframes into a single dataframe\n", "#We will use pd.concat that takes in a LIST of dataframes to concat\n", "df_list = [top_streets, bottom_streets]\n", "combinedTop10_bottom10streets = pd.concat(df_list)\n", "#combinedTop10_bottom10streets\n", "\n", "#Let us visualise this\n", "import seaborn as sns\n", "import matplotlib.pyplot as plt\n", "sns.set(rc={'figure.figsize':(12,9)})\n", "\n", "sns.barplot(x = 'Street', y = 'Total Transport', data = combinedTop10_bottom10streets, palette = 'Blues_d')\n", "plt.xticks(rotation = 45)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 6.3 Distribution of transport options across all streets" ] }, { "cell_type": "code", "execution_count": 129, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 129, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sns.set_palette(\"Blues_r\")\n", "#sns.set(style=\"white\", palette=\"dark\", color_codes=True)\n", "sns.distplot(orderedStreetTrikkBussMetroTog['Total Transport'], kde = False)" ] }, { "cell_type": "code", "execution_count": 63, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 63, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sns.boxplot(y = orderedStreetTrikkBussMetroTog['Total Transport'], width = 0.1)" ] }, { "cell_type": "code", "execution_count": 132, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 132, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sns.set(style=\"whitegrid\", palette=\"muted\", color_codes=True)\n", "sns.violinplot(x=\"Total Transport\", data=orderedStreetTrikkBussMetroTog)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 6.4 Visualise relation between total bus options and total transport" ] }, { "cell_type": "code", "execution_count": 64, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 64, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sns.jointplot(x = 'Total Transport', y = 'Total Bus', data = orderedStreetTrikkBussMetroTog, height= 9)" ] }, { "cell_type": "code", "execution_count": 65, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 65, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "#Make a density plot version of the above\n", "sns.jointplot(x = 'Total Transport', y = 'Total Bus', kind = 'kde', data = orderedStreetTrikkBussMetroTog, height = 9)" ] }, { "cell_type": "code", "execution_count": 66, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "cmap = sns.cubehelix_palette(as_cmap=True, dark=0, light=1, reverse=True)\n", "sns.kdeplot(orderedStreetTrikkBussMetroTog['Total Transport'], orderedStreetTrikkBussMetroTog['Total Bus'], cmap=cmap, n_levels=60, shade=True);\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 6.4 Divide streets based on no. of transport options" ] }, { "cell_type": "code", "execution_count": 67, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([ 0. , 3.14285714, 6.28571429, 9.42857143, 12.57142857,\n", " 15.71428571, 18.85714286, 22. ])" ] }, "execution_count": 67, "metadata": {}, "output_type": "execute_result" } ], "source": [ "bins = np.linspace(min(orderedStreetTrikkBussMetroTog['Total Transport']), max(orderedStreetTrikkBussMetroTog['Total Transport']), 8)#Provide 1 more than the number of levels to create\n", "bins" ] }, { "cell_type": "code", "execution_count": 69, "metadata": {}, "outputs": [], "source": [ "group_names = ['0-3', '4-6', '7-9', '10-12', '13-15', '16-18', '19-22']" ] }, { "cell_type": "code", "execution_count": 70, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "/opt/local/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages/ipykernel_launcher.py:1: SettingWithCopyWarning: \n", "A value is trying to be set on a copy of a slice from a DataFrame.\n", "Try using .loc[row_indexer,col_indexer] = value instead\n", "\n", "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n", " \"\"\"Entry point for launching an IPython kernel.\n" ] }, { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Binned TransportTotal Transport
019-2222
119-2222
219-2221
319-2221
419-2221
519-2221
619-2221
719-2221
819-2220
919-2220
1019-2219
1116-1818
1216-1818
1316-1817
1416-1817
1516-1816
1613-1515
1713-1515
1813-1514
1913-1514
\n", "
" ], "text/plain": [ " Binned Transport Total Transport\n", "0 19-22 22\n", "1 19-22 22\n", "2 19-22 21\n", "3 19-22 21\n", "4 19-22 21\n", "5 19-22 21\n", "6 19-22 21\n", "7 19-22 21\n", "8 19-22 20\n", "9 19-22 20\n", "10 19-22 19\n", "11 16-18 18\n", "12 16-18 18\n", "13 16-18 17\n", "14 16-18 17\n", "15 16-18 16\n", "16 13-15 15\n", "17 13-15 15\n", "18 13-15 14\n", "19 13-15 14" ] }, "execution_count": 70, "metadata": {}, "output_type": "execute_result" } ], "source": [ "orderedStreetTrikkBussMetroTog['Binned Transport'] = pd.cut(orderedStreetTrikkBussMetroTog['Total Transport'], bins, labels = group_names, include_lowest= True)\n", "orderedStreetTrikkBussMetroTog[['Binned Transport','Total Transport']].head(20)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Let us find out how many streets belong to each category" ] }, { "cell_type": "code", "execution_count": 71, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0-3 2012\n", "4-6 294\n", "7-9 95\n", "10-12 35\n", "19-22 11\n", "13-15 8\n", "16-18 5\n", "Name: Binned Transport, dtype: int64" ] }, "execution_count": 71, "metadata": {}, "output_type": "execute_result" } ], "source": [ "orderedStreetTrikkBussMetroTog['Binned Transport'].value_counts()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Let us try to visualise this to get a better perspective..." ] }, { "cell_type": "code", "execution_count": 72, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Binned Transport
0-32012
4-6294
7-995
10-1235
19-2211
13-158
16-185
\n", "
" ], "text/plain": [ " Binned Transport\n", "0-3 2012\n", "4-6 294\n", "7-9 95\n", "10-12 35\n", "19-22 11\n", "13-15 8\n", "16-18 5" ] }, "execution_count": 72, "metadata": {}, "output_type": "execute_result" } ], "source": [ "new_df = orderedStreetTrikkBussMetroTog['Binned Transport'].value_counts().to_frame()\n", "new_df" ] }, { "cell_type": "code", "execution_count": 73, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Transport OptionsTotal Streets
00-32012
14-6294
27-995
310-1235
419-2211
513-158
616-185
\n", "
" ], "text/plain": [ " Transport Options Total Streets\n", "0 0-3 2012\n", "1 4-6 294\n", "2 7-9 95\n", "3 10-12 35\n", "4 19-22 11\n", "5 13-15 8\n", "6 16-18 5" ] }, "execution_count": 73, "metadata": {}, "output_type": "execute_result" } ], "source": [ "new_df.reset_index(inplace = True)\n", "new_df.columns = ['Transport Options', 'Total Streets']\n", "new_df" ] }, { "cell_type": "code", "execution_count": 74, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([0, 1, 2, 3, 4, 5, 6]),
)" ] }, "execution_count": 74, "metadata": {}, "output_type": "execute_result" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sns.barplot(x = 'Transport Options', y = 'Total Streets', data = new_df, palette= 'Blues_d')\n", "plt.xticks(rotation = 45)" ] }, { "cell_type": "code", "execution_count": 75, "metadata": {}, "outputs": [], "source": [ "#Save to drive\n", "orderedStreetTrikkBussMetroTog.to_csv(path_or_buf='./orderedStreetTrikkBusMetroTog.csv', index = False)" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.5.7" } }, "nbformat": 4, "nbformat_minor": 2 }