{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Hypothesis testing" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Hypothesis: University towns and non-university towns have same effect on their mean housing prices during recessions." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Data sources" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "1) List of university towns from wikipedia. This is a text file with 567 lines either containing state name or the name of city and the university in the city.\n", "\n", "" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "2) Housing data from Zillow containg information about house sale prices in each month from the year 1996 to 2016. A snapshot of the csv file is shown here.\n", "\n", "" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "3) Quarterly GDP data from US Department of Commerce, Bureau of Economic Analysis. A snapshot of the excel file is shown below.\n", "\n", "" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "from scipy.stats import ttest_ind\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "from scipy.stats import norm" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | State | \n", "RegionName | \n", "
---|---|---|
0 | \n", "Alabama | \n", "Auburn | \n", "
1 | \n", "Alabama | \n", "Florence | \n", "
2 | \n", "Alabama | \n", "Jacksonville | \n", "
3 | \n", "Alabama | \n", "Livingston | \n", "
4 | \n", "Alabama | \n", "Montevallo | \n", "
... | \n", "... | \n", "... | \n", "
512 | \n", "Wisconsin | \n", "River Falls | \n", "
513 | \n", "Wisconsin | \n", "Stevens Point | \n", "
514 | \n", "Wisconsin | \n", "Waukesha | \n", "
515 | \n", "Wisconsin | \n", "Whitewater | \n", "
516 | \n", "Wyoming | \n", "Laramie | \n", "
517 rows × 2 columns
\n", "\n", " | yearQ | \n", "2000q1 | \n", "2000q2 | \n", "2000q3 | \n", "2000q4 | \n", "2001q1 | \n", "2001q2 | \n", "2001q3 | \n", "2001q4 | \n", "2002q1 | \n", "2002q2 | \n", "... | \n", "2014q2 | \n", "2014q3 | \n", "2014q4 | \n", "2015q1 | \n", "2015q2 | \n", "2015q3 | \n", "2015q4 | \n", "2016q1 | \n", "2016q2 | \n", "2016q3 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
State | \n", "RegionName | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
Alabama | \n", "Adamsville | \n", "69033.333333 | \n", "69166.666667 | \n", "69800.000000 | \n", "71966.666667 | \n", "73466.666667 | \n", "74000.000000 | \n", "73333.333333 | \n", "73100.000000 | \n", "73333.333333 | \n", "73133.333333 | \n", "... | \n", "77066.666667 | \n", "75966.666667 | \n", "71900.000000 | \n", "71666.666667 | \n", "73033.333333 | \n", "73933.333333 | \n", "73866.666667 | \n", "74166.666667 | \n", "74933.333333 | \n", "74700.0 | \n", "
Alabaster | \n", "122133.333333 | \n", "123066.666667 | \n", "123166.666667 | \n", "123700.000000 | \n", "123233.333333 | \n", "125133.333333 | \n", "127766.666667 | \n", "127200.000000 | \n", "127300.000000 | \n", "128000.000000 | \n", "... | \n", "147133.333333 | \n", "147633.333333 | \n", "148700.000000 | \n", "148900.000000 | \n", "149566.666667 | \n", "150366.666667 | \n", "151733.333333 | \n", "153466.666667 | \n", "155100.000000 | \n", "155850.0 | \n", "|
Albertville | \n", "73966.666667 | \n", "72600.000000 | \n", "72833.333333 | \n", "74200.000000 | \n", "75900.000000 | \n", "76000.000000 | \n", "72066.666667 | \n", "73566.666667 | \n", "76533.333333 | \n", "76366.666667 | \n", "... | \n", "84033.333333 | \n", "84766.666667 | \n", "86800.000000 | \n", "88466.666667 | \n", "89500.000000 | \n", "90233.333333 | \n", "91366.666667 | \n", "92000.000000 | \n", "92466.666667 | \n", "92200.0 | \n", "|
Arab | \n", "83766.666667 | \n", "81566.666667 | \n", "81333.333333 | \n", "82966.666667 | \n", "84200.000000 | \n", "84533.333333 | \n", "81666.666667 | \n", "83900.000000 | \n", "87266.666667 | \n", "87700.000000 | \n", "... | \n", "113366.666667 | \n", "111700.000000 | \n", "111600.000000 | \n", "110166.666667 | \n", "109433.333333 | \n", "110900.000000 | \n", "112233.333333 | \n", "110033.333333 | \n", "110100.000000 | \n", "112000.0 | \n", "|
Ardmore | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "NaN | \n", "... | \n", "140533.333333 | \n", "139566.666667 | \n", "140900.000000 | \n", "143233.333333 | \n", "143000.000000 | \n", "144600.000000 | \n", "143966.666667 | \n", "142566.666667 | \n", "143233.333333 | \n", "141950.0 | \n", "|
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
Wyoming | \n", "Burns | \n", "101533.333333 | \n", "104566.666667 | \n", "108366.666667 | \n", "113000.000000 | \n", "115833.333333 | \n", "117200.000000 | \n", "117800.000000 | \n", "117633.333333 | \n", "117333.333333 | \n", "117233.333333 | \n", "... | \n", "168866.666667 | \n", "161933.333333 | \n", "160433.333333 | \n", "162600.000000 | \n", "163066.666667 | \n", "164600.000000 | \n", "164300.000000 | \n", "168266.666667 | \n", "171600.000000 | \n", "170500.0 | \n", "
Casper | \n", "89233.333333 | \n", "89600.000000 | \n", "89733.333333 | \n", "93166.666667 | \n", "95500.000000 | \n", "97633.333333 | \n", "99433.333333 | \n", "100633.333333 | \n", "101733.333333 | \n", "101533.333333 | \n", "... | \n", "175766.666667 | \n", "177300.000000 | \n", "181000.000000 | \n", "182066.666667 | \n", "182633.333333 | \n", "183300.000000 | \n", "182700.000000 | \n", "184333.333333 | \n", "185166.666667 | \n", "184350.0 | \n", "|
Cheyenne | \n", "116866.666667 | \n", "120033.333333 | \n", "121533.333333 | \n", "123633.333333 | \n", "125533.333333 | \n", "126300.000000 | \n", "126466.666667 | \n", "128133.333333 | \n", "128466.666667 | \n", "129633.333333 | \n", "... | \n", "177466.666667 | \n", "176733.333333 | \n", "178766.666667 | \n", "181700.000000 | \n", "183266.666667 | \n", "186766.666667 | \n", "190666.666667 | \n", "194433.333333 | \n", "196500.000000 | \n", "199100.0 | \n", "|
Evansville | \n", "128033.333333 | \n", "128766.666667 | \n", "130833.333333 | \n", "132066.666667 | \n", "130566.666667 | \n", "131433.333333 | \n", "132400.000000 | \n", "133466.666667 | \n", "133300.000000 | \n", "131066.666667 | \n", "... | \n", "296733.333333 | \n", "305666.666667 | \n", "309500.000000 | \n", "307300.000000 | \n", "303166.666667 | \n", "300966.666667 | \n", "304200.000000 | \n", "309433.333333 | \n", "309200.000000 | \n", "309050.0 | \n", "|
Pine Bluffs | \n", "93733.333333 | \n", "95066.666667 | \n", "94633.333333 | \n", "98066.666667 | \n", "103233.333333 | \n", "104600.000000 | \n", "106500.000000 | \n", "104066.666667 | \n", "102233.333333 | \n", "103566.666667 | \n", "... | \n", "148666.666667 | \n", "154366.666667 | \n", "158100.000000 | \n", "163900.000000 | \n", "167433.333333 | \n", "167466.666667 | \n", "169200.000000 | \n", "166833.333333 | \n", "163800.000000 | \n", "157650.0 | \n", "
10730 rows × 67 columns
\n", "