{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Part 1:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Loader la data\n",
    "\n",
    "import pandas as pd\n",
    "import statsmodels.formula.api as smf\n",
    "\n",
    "df = pd.read_csv('advertising.csv')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "df"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Description de la data\n",
    "\n",
    "df.describe()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "import matplotlib.pyplot as plt\n",
    "%matplotlib inline\n",
    "\n",
    "fig, ax = plt.subplots(1,1)\n",
    "df['Radio'].hist(bins = 100)\n",
    "plt.title('Radio')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# La distribution des variables (Histogrammes)\n",
    "\n",
    "df.hist(bins = 100)\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Détection des outliers (Boxplots)\n",
    "\n",
    "df.boxplot()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Détecter les excates outliers\n",
    "\n",
    "import numpy as np\n",
    "\n",
    "np.percentile(df.Newspaper, 99.5)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Supprimer les outliers\n",
    "\n",
    "condition = df['Newspaper'] < 100\n",
    "df[condition].shape"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "df = df[condition]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Vérification:\n",
    "\n",
    "df.boxplot()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Corrélation\n",
    "\n",
    "import seaborn as sns\n",
    "corr = df.corr()\n",
    "fig, ax = plt.subplots(1,1, figsize = (9,9))\n",
    "sns.heatmap(corr,\n",
    "           xticklabels=corr.columns.values,\n",
    "           yticklabels=corr.columns.values)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "# Scatterplot de chaque couple de variables\n",
    "\n",
    "for i in range (-1,3):\n",
    "    figure = plt.figure()\n",
    "    plt.scatter(df.iloc[:,i], df.iloc[:,i+1])\n",
    "    plt.xlabel('{}'.format(df.columns[i]))\n",
    "    plt.ylabel('{}'.format(df.columns[i+1]))    \n",
    "    "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "for i in range (-1,1):\n",
    "    figure = plt.figure()\n",
    "    plt.scatter(df.iloc[:,i], df.iloc[:,i+2])\n",
    "    plt.xlabel('{}'.format(df.columns[i]))\n",
    "    plt.ylabel('{}'.format(df.columns[i+2]))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Part 2:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "# Linear Regression pour les 3 variables:\n",
    "\n",
    "lm = smf.ols(formula='Sales ~ Radio ', data=df).fit()\n",
    "lm.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "lm.pvalues"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "lm_2 = smf.ols(formula='Sales ~ TV ', data=df).fit()\n",
    "lm_2.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "lm_3 = smf.ols(formula='Sales ~ Newspaper ', data=df).fit()\n",
    "lm_3.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "# Le coefficient de la regression Sales ~ Radio est plus grand que le coefficient de la regression Sales ~ TV\n",
    "# alors que TV est plus corrélé à Sales que Radio, ceci revient au fait que les 2 variables TV et Radio ne sont pas\n",
    "# normées de la même façon !"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "scrolled": true
   },
   "outputs": [],
   "source": [
    "# calcul de la MSE\n",
    "\n",
    "from sklearn.metrics import mean_squared_error\n",
    "mse = mean_squared_error(df.Sales, lm.fittedvalues)\n",
    "mse"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "mse_2 = mean_squared_error(df.Sales, lm_2.fittedvalues)\n",
    "mse_2"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "mse_3 = mean_squared_error(df.Sales, lm_3.fittedvalues)\n",
    "mse_3"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 88,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>TV</th>\n",
       "      <th>Radio</th>\n",
       "      <th>Newspaper</th>\n",
       "      <th>Sales</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>count</th>\n",
       "      <td>198.000000</td>\n",
       "      <td>198.000000</td>\n",
       "      <td>198.000000</td>\n",
       "      <td>198.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>mean</th>\n",
       "      <td>0.499620</td>\n",
       "      <td>23.130808</td>\n",
       "      <td>29.777273</td>\n",
       "      <td>13.980808</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>std</th>\n",
       "      <td>0.291019</td>\n",
       "      <td>14.862111</td>\n",
       "      <td>20.446303</td>\n",
       "      <td>5.196097</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>min</th>\n",
       "      <td>0.002384</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.300000</td>\n",
       "      <td>1.600000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25%</th>\n",
       "      <td>0.254768</td>\n",
       "      <td>9.925000</td>\n",
       "      <td>12.650000</td>\n",
       "      <td>10.325000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>50%</th>\n",
       "      <td>0.510048</td>\n",
       "      <td>22.400000</td>\n",
       "      <td>25.600000</td>\n",
       "      <td>12.900000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>75%</th>\n",
       "      <td>0.744125</td>\n",
       "      <td>36.325000</td>\n",
       "      <td>44.050000</td>\n",
       "      <td>17.375000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>max</th>\n",
       "      <td>1.000000</td>\n",
       "      <td>49.600000</td>\n",
       "      <td>89.400000</td>\n",
       "      <td>27.000000</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "               TV       Radio   Newspaper       Sales\n",
       "count  198.000000  198.000000  198.000000  198.000000\n",
       "mean     0.499620   23.130808   29.777273   13.980808\n",
       "std      0.291019   14.862111   20.446303    5.196097\n",
       "min      0.002384    0.000000    0.300000    1.600000\n",
       "25%      0.254768    9.925000   12.650000   10.325000\n",
       "50%      0.510048   22.400000   25.600000   12.900000\n",
       "75%      0.744125   36.325000   44.050000   17.375000\n",
       "max      1.000000   49.600000   89.400000   27.000000"
      ]
     },
     "execution_count": 88,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.describe()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 89,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "C:\\Users\\ASUS N752V\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py:1: SettingWithCopyWarning: \n",
      "A value is trying to be set on a copy of a slice from a DataFrame.\n",
      "Try using .loc[row_indexer,col_indexer] = value instead\n",
      "\n",
      "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n",
      "  \"\"\"Entry point for launching an IPython kernel.\n",
      "C:\\Users\\ASUS N752V\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py:2: SettingWithCopyWarning: \n",
      "A value is trying to be set on a copy of a slice from a DataFrame.\n",
      "Try using .loc[row_indexer,col_indexer] = value instead\n",
      "\n",
      "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n",
      "  \n",
      "C:\\Users\\ASUS N752V\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py:3: SettingWithCopyWarning: \n",
      "A value is trying to be set on a copy of a slice from a DataFrame.\n",
      "Try using .loc[row_indexer,col_indexer] = value instead\n",
      "\n",
      "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n",
      "  This is separate from the ipykernel package so we can avoid doing imports until\n"
     ]
    }
   ],
   "source": [
    "# Normalisation des variables:\n",
    "# modifier les données pour que le coefficient de la regression linéaire \n",
    "# reflete l'importance de la variable par rapport aux autres.\n",
    "\n",
    "df['TV'] = df['TV']/df.TV.max()\n",
    "df['Radio'] = df['Radio']/df.Radio.max()\n",
    "df['Newspaper'] = df['Newspaper']/df.Newspaper.max()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 90,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>TV</th>\n",
       "      <th>Radio</th>\n",
       "      <th>Newspaper</th>\n",
       "      <th>Sales</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0.783719</td>\n",
       "      <td>0.762097</td>\n",
       "      <td>0.774049</td>\n",
       "      <td>22.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>0.151567</td>\n",
       "      <td>0.792339</td>\n",
       "      <td>0.504474</td>\n",
       "      <td>10.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0.058583</td>\n",
       "      <td>0.925403</td>\n",
       "      <td>0.775168</td>\n",
       "      <td>9.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>0.516008</td>\n",
       "      <td>0.832661</td>\n",
       "      <td>0.654362</td>\n",
       "      <td>18.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>0.615804</td>\n",
       "      <td>0.217742</td>\n",
       "      <td>0.653244</td>\n",
       "      <td>12.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>0.029632</td>\n",
       "      <td>0.985887</td>\n",
       "      <td>0.838926</td>\n",
       "      <td>7.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>0.195845</td>\n",
       "      <td>0.661290</td>\n",
       "      <td>0.262864</td>\n",
       "      <td>11.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>0.409401</td>\n",
       "      <td>0.395161</td>\n",
       "      <td>0.129754</td>\n",
       "      <td>13.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>0.029292</td>\n",
       "      <td>0.042339</td>\n",
       "      <td>0.011186</td>\n",
       "      <td>4.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>0.680518</td>\n",
       "      <td>0.052419</td>\n",
       "      <td>0.237136</td>\n",
       "      <td>10.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>0.225136</td>\n",
       "      <td>0.116935</td>\n",
       "      <td>0.270694</td>\n",
       "      <td>8.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>0.731267</td>\n",
       "      <td>0.483871</td>\n",
       "      <td>0.044743</td>\n",
       "      <td>17.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>0.081063</td>\n",
       "      <td>0.707661</td>\n",
       "      <td>0.737136</td>\n",
       "      <td>9.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>0.332084</td>\n",
       "      <td>0.153226</td>\n",
       "      <td>0.080537</td>\n",
       "      <td>9.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>0.695163</td>\n",
       "      <td>0.663306</td>\n",
       "      <td>0.514541</td>\n",
       "      <td>19.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>0.665531</td>\n",
       "      <td>0.961694</td>\n",
       "      <td>0.591723</td>\n",
       "      <td>22.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>0.958447</td>\n",
       "      <td>0.798387</td>\n",
       "      <td>0.624161</td>\n",
       "      <td>24.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>0.235695</td>\n",
       "      <td>0.413306</td>\n",
       "      <td>0.204698</td>\n",
       "      <td>11.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>0.501703</td>\n",
       "      <td>0.481855</td>\n",
       "      <td>0.213647</td>\n",
       "      <td>14.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>0.743869</td>\n",
       "      <td>0.558468</td>\n",
       "      <td>0.597315</td>\n",
       "      <td>18.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>0.808583</td>\n",
       "      <td>0.102823</td>\n",
       "      <td>0.262864</td>\n",
       "      <td>12.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>0.044959</td>\n",
       "      <td>0.320565</td>\n",
       "      <td>0.554810</td>\n",
       "      <td>5.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>0.777589</td>\n",
       "      <td>0.340726</td>\n",
       "      <td>0.293065</td>\n",
       "      <td>15.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>0.212193</td>\n",
       "      <td>0.254032</td>\n",
       "      <td>0.204698</td>\n",
       "      <td>9.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>0.895436</td>\n",
       "      <td>0.070565</td>\n",
       "      <td>0.218121</td>\n",
       "      <td>12.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>0.486717</td>\n",
       "      <td>0.590726</td>\n",
       "      <td>0.140940</td>\n",
       "      <td>15.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>0.817779</td>\n",
       "      <td>0.336694</td>\n",
       "      <td>0.256152</td>\n",
       "      <td>15.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>0.847411</td>\n",
       "      <td>0.546371</td>\n",
       "      <td>0.256152</td>\n",
       "      <td>18.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>0.240463</td>\n",
       "      <td>0.322581</td>\n",
       "      <td>0.456376</td>\n",
       "      <td>10.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>30</th>\n",
       "      <td>0.997616</td>\n",
       "      <td>0.570565</td>\n",
       "      <td>0.483221</td>\n",
       "      <td>21.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>170</th>\n",
       "      <td>0.170300</td>\n",
       "      <td>0.233871</td>\n",
       "      <td>0.205817</td>\n",
       "      <td>8.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>171</th>\n",
       "      <td>0.560286</td>\n",
       "      <td>0.421371</td>\n",
       "      <td>0.530201</td>\n",
       "      <td>14.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>172</th>\n",
       "      <td>0.066757</td>\n",
       "      <td>0.405242</td>\n",
       "      <td>0.190157</td>\n",
       "      <td>7.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>173</th>\n",
       "      <td>0.573569</td>\n",
       "      <td>0.143145</td>\n",
       "      <td>0.143177</td>\n",
       "      <td>11.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>174</th>\n",
       "      <td>0.757493</td>\n",
       "      <td>0.068548</td>\n",
       "      <td>0.146532</td>\n",
       "      <td>11.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>175</th>\n",
       "      <td>0.943120</td>\n",
       "      <td>0.985887</td>\n",
       "      <td>0.467562</td>\n",
       "      <td>27.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>176</th>\n",
       "      <td>0.846049</td>\n",
       "      <td>0.608871</td>\n",
       "      <td>0.227069</td>\n",
       "      <td>20.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>177</th>\n",
       "      <td>0.579700</td>\n",
       "      <td>0.157258</td>\n",
       "      <td>0.393736</td>\n",
       "      <td>11.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>178</th>\n",
       "      <td>0.942439</td>\n",
       "      <td>0.046371</td>\n",
       "      <td>0.265101</td>\n",
       "      <td>11.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>179</th>\n",
       "      <td>0.564033</td>\n",
       "      <td>0.201613</td>\n",
       "      <td>0.196868</td>\n",
       "      <td>12.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>180</th>\n",
       "      <td>0.533379</td>\n",
       "      <td>0.052419</td>\n",
       "      <td>0.092841</td>\n",
       "      <td>10.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>181</th>\n",
       "      <td>0.744210</td>\n",
       "      <td>0.108871</td>\n",
       "      <td>0.306488</td>\n",
       "      <td>12.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>182</th>\n",
       "      <td>0.191417</td>\n",
       "      <td>0.114919</td>\n",
       "      <td>0.332215</td>\n",
       "      <td>8.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>183</th>\n",
       "      <td>0.979564</td>\n",
       "      <td>0.866935</td>\n",
       "      <td>0.803132</td>\n",
       "      <td>26.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>184</th>\n",
       "      <td>0.864441</td>\n",
       "      <td>0.429435</td>\n",
       "      <td>0.335570</td>\n",
       "      <td>17.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>185</th>\n",
       "      <td>0.698229</td>\n",
       "      <td>0.909274</td>\n",
       "      <td>0.219239</td>\n",
       "      <td>22.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>186</th>\n",
       "      <td>0.475136</td>\n",
       "      <td>0.042339</td>\n",
       "      <td>0.297539</td>\n",
       "      <td>10.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>187</th>\n",
       "      <td>0.650886</td>\n",
       "      <td>0.578629</td>\n",
       "      <td>0.203579</td>\n",
       "      <td>17.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>188</th>\n",
       "      <td>0.974114</td>\n",
       "      <td>0.280242</td>\n",
       "      <td>0.041387</td>\n",
       "      <td>15.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>189</th>\n",
       "      <td>0.063692</td>\n",
       "      <td>0.243952</td>\n",
       "      <td>0.261745</td>\n",
       "      <td>6.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>190</th>\n",
       "      <td>0.134537</td>\n",
       "      <td>0.828629</td>\n",
       "      <td>0.064877</td>\n",
       "      <td>10.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>191</th>\n",
       "      <td>0.257153</td>\n",
       "      <td>0.217742</td>\n",
       "      <td>0.067114</td>\n",
       "      <td>9.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>192</th>\n",
       "      <td>0.058583</td>\n",
       "      <td>0.082661</td>\n",
       "      <td>0.353468</td>\n",
       "      <td>5.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>193</th>\n",
       "      <td>0.568120</td>\n",
       "      <td>0.846774</td>\n",
       "      <td>0.040268</td>\n",
       "      <td>19.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>194</th>\n",
       "      <td>0.509877</td>\n",
       "      <td>0.717742</td>\n",
       "      <td>0.067114</td>\n",
       "      <td>17.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>195</th>\n",
       "      <td>0.130109</td>\n",
       "      <td>0.074597</td>\n",
       "      <td>0.154362</td>\n",
       "      <td>7.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>196</th>\n",
       "      <td>0.320845</td>\n",
       "      <td>0.098790</td>\n",
       "      <td>0.090604</td>\n",
       "      <td>9.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>197</th>\n",
       "      <td>0.602861</td>\n",
       "      <td>0.187500</td>\n",
       "      <td>0.071588</td>\n",
       "      <td>12.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>198</th>\n",
       "      <td>0.965940</td>\n",
       "      <td>0.846774</td>\n",
       "      <td>0.740492</td>\n",
       "      <td>25.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>199</th>\n",
       "      <td>0.790531</td>\n",
       "      <td>0.173387</td>\n",
       "      <td>0.097315</td>\n",
       "      <td>13.4</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>198 rows × 4 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           TV     Radio  Newspaper  Sales\n",
       "0    0.783719  0.762097   0.774049   22.1\n",
       "1    0.151567  0.792339   0.504474   10.4\n",
       "2    0.058583  0.925403   0.775168    9.3\n",
       "3    0.516008  0.832661   0.654362   18.5\n",
       "4    0.615804  0.217742   0.653244   12.9\n",
       "5    0.029632  0.985887   0.838926    7.2\n",
       "6    0.195845  0.661290   0.262864   11.8\n",
       "7    0.409401  0.395161   0.129754   13.2\n",
       "8    0.029292  0.042339   0.011186    4.8\n",
       "9    0.680518  0.052419   0.237136   10.6\n",
       "10   0.225136  0.116935   0.270694    8.6\n",
       "11   0.731267  0.483871   0.044743   17.4\n",
       "12   0.081063  0.707661   0.737136    9.2\n",
       "13   0.332084  0.153226   0.080537    9.7\n",
       "14   0.695163  0.663306   0.514541   19.0\n",
       "15   0.665531  0.961694   0.591723   22.4\n",
       "17   0.958447  0.798387   0.624161   24.4\n",
       "18   0.235695  0.413306   0.204698   11.3\n",
       "19   0.501703  0.481855   0.213647   14.6\n",
       "20   0.743869  0.558468   0.597315   18.0\n",
       "21   0.808583  0.102823   0.262864   12.5\n",
       "22   0.044959  0.320565   0.554810    5.6\n",
       "23   0.777589  0.340726   0.293065   15.5\n",
       "24   0.212193  0.254032   0.204698    9.7\n",
       "25   0.895436  0.070565   0.218121   12.0\n",
       "26   0.486717  0.590726   0.140940   15.0\n",
       "27   0.817779  0.336694   0.256152   15.9\n",
       "28   0.847411  0.546371   0.256152   18.9\n",
       "29   0.240463  0.322581   0.456376   10.5\n",
       "30   0.997616  0.570565   0.483221   21.4\n",
       "..        ...       ...        ...    ...\n",
       "170  0.170300  0.233871   0.205817    8.4\n",
       "171  0.560286  0.421371   0.530201   14.5\n",
       "172  0.066757  0.405242   0.190157    7.6\n",
       "173  0.573569  0.143145   0.143177   11.7\n",
       "174  0.757493  0.068548   0.146532   11.5\n",
       "175  0.943120  0.985887   0.467562   27.0\n",
       "176  0.846049  0.608871   0.227069   20.2\n",
       "177  0.579700  0.157258   0.393736   11.7\n",
       "178  0.942439  0.046371   0.265101   11.8\n",
       "179  0.564033  0.201613   0.196868   12.6\n",
       "180  0.533379  0.052419   0.092841   10.5\n",
       "181  0.744210  0.108871   0.306488   12.2\n",
       "182  0.191417  0.114919   0.332215    8.7\n",
       "183  0.979564  0.866935   0.803132   26.2\n",
       "184  0.864441  0.429435   0.335570   17.6\n",
       "185  0.698229  0.909274   0.219239   22.6\n",
       "186  0.475136  0.042339   0.297539   10.3\n",
       "187  0.650886  0.578629   0.203579   17.3\n",
       "188  0.974114  0.280242   0.041387   15.9\n",
       "189  0.063692  0.243952   0.261745    6.7\n",
       "190  0.134537  0.828629   0.064877   10.8\n",
       "191  0.257153  0.217742   0.067114    9.9\n",
       "192  0.058583  0.082661   0.353468    5.9\n",
       "193  0.568120  0.846774   0.040268   19.6\n",
       "194  0.509877  0.717742   0.067114   17.3\n",
       "195  0.130109  0.074597   0.154362    7.6\n",
       "196  0.320845  0.098790   0.090604    9.7\n",
       "197  0.602861  0.187500   0.071588   12.8\n",
       "198  0.965940  0.846774   0.740492   25.5\n",
       "199  0.790531  0.173387   0.097315   13.4\n",
       "\n",
       "[198 rows x 4 columns]"
      ]
     },
     "execution_count": 90,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 91,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.333</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.329</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   97.69</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th> <td>5.99e-19</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:15:16</td>     <th>  Log-Likelihood:    </th> <td> -566.70</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   1137.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   196</td>      <th>  BIC:               </th> <td>   1144.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     1</td>      <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>    9.3166</td> <td>    0.560</td> <td>   16.622</td> <td> 0.000</td> <td>    8.211</td> <td>   10.422</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Radio</th>     <td>   10.0015</td> <td>    1.012</td> <td>    9.884</td> <td> 0.000</td> <td>    8.006</td> <td>   11.997</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td>20.193</td> <th>  Durbin-Watson:     </th> <td>   1.923</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.000</td> <th>  Jarque-Bera (JB):  </th> <td>  23.115</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td>-0.785</td> <th>  Prob(JB):          </th> <td>9.56e-06</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td> 3.582</td> <th>  Cond. No.          </th> <td>    4.13</td>\n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.333\n",
       "Model:                            OLS   Adj. R-squared:                  0.329\n",
       "Method:                 Least Squares   F-statistic:                     97.69\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):           5.99e-19\n",
       "Time:                        16:15:16   Log-Likelihood:                -566.70\n",
       "No. Observations:                 198   AIC:                             1137.\n",
       "Df Residuals:                     196   BIC:                             1144.\n",
       "Df Model:                           1                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept      9.3166      0.560     16.622      0.000       8.211      10.422\n",
       "Radio         10.0015      1.012      9.884      0.000       8.006      11.997\n",
       "==============================================================================\n",
       "Omnibus:                       20.193   Durbin-Watson:                   1.923\n",
       "Prob(Omnibus):                  0.000   Jarque-Bera (JB):               23.115\n",
       "Skew:                          -0.785   Prob(JB):                     9.56e-06\n",
       "Kurtosis:                       3.582   Cond. No.                         4.13\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 91,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "lm = smf.ols(formula='Sales ~ Radio ', data=df).fit()\n",
    "lm.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 92,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.607</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.605</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   302.8</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th> <td>1.29e-41</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:15:35</td>     <th>  Log-Likelihood:    </th> <td> -514.27</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   1033.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   196</td>      <th>  BIC:               </th> <td>   1039.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     1</td>      <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>    7.0306</td> <td>    0.462</td> <td>   15.219</td> <td> 0.000</td> <td>    6.120</td> <td>    7.942</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>TV</th>        <td>   13.9111</td> <td>    0.799</td> <td>   17.400</td> <td> 0.000</td> <td>   12.334</td> <td>   15.488</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td> 0.404</td> <th>  Durbin-Watson:     </th> <td>   1.872</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.817</td> <th>  Jarque-Bera (JB):  </th> <td>   0.551</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td>-0.062</td> <th>  Prob(JB):          </th> <td>   0.759</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td> 2.774</td> <th>  Cond. No.          </th> <td>    4.37</td>\n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.607\n",
       "Model:                            OLS   Adj. R-squared:                  0.605\n",
       "Method:                 Least Squares   F-statistic:                     302.8\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):           1.29e-41\n",
       "Time:                        16:15:35   Log-Likelihood:                -514.27\n",
       "No. Observations:                 198   AIC:                             1033.\n",
       "Df Residuals:                     196   BIC:                             1039.\n",
       "Df Model:                           1                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept      7.0306      0.462     15.219      0.000       6.120       7.942\n",
       "TV            13.9111      0.799     17.400      0.000      12.334      15.488\n",
       "==============================================================================\n",
       "Omnibus:                        0.404   Durbin-Watson:                   1.872\n",
       "Prob(Omnibus):                  0.817   Jarque-Bera (JB):                0.551\n",
       "Skew:                          -0.062   Prob(JB):                        0.759\n",
       "Kurtosis:                       2.774   Cond. No.                         4.37\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 92,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "lm_2 = smf.ols(formula='Sales ~ TV ', data=df).fit()\n",
    "lm_2.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 93,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.048</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.043</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   9.927</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th>  <td>0.00188</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:15:57</td>     <th>  Log-Likelihood:    </th> <td> -601.84</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   1208.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   196</td>      <th>  BIC:               </th> <td>   1214.</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     1</td>      <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>   12.3193</td> <td>    0.639</td> <td>   19.274</td> <td> 0.000</td> <td>   11.059</td> <td>   13.580</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Newspaper</th> <td>    4.9882</td> <td>    1.583</td> <td>    3.151</td> <td> 0.002</td> <td>    1.866</td> <td>    8.111</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td> 5.835</td> <th>  Durbin-Watson:     </th> <td>   1.916</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.054</td> <th>  Jarque-Bera (JB):  </th> <td>   5.303</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td> 0.333</td> <th>  Prob(JB):          </th> <td>  0.0706</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td> 2.555</td> <th>  Cond. No.          </th> <td>    4.89</td>\n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.048\n",
       "Model:                            OLS   Adj. R-squared:                  0.043\n",
       "Method:                 Least Squares   F-statistic:                     9.927\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):            0.00188\n",
       "Time:                        16:15:57   Log-Likelihood:                -601.84\n",
       "No. Observations:                 198   AIC:                             1208.\n",
       "Df Residuals:                     196   BIC:                             1214.\n",
       "Df Model:                           1                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept     12.3193      0.639     19.274      0.000      11.059      13.580\n",
       "Newspaper      4.9882      1.583      3.151      0.002       1.866       8.111\n",
       "==============================================================================\n",
       "Omnibus:                        5.835   Durbin-Watson:                   1.916\n",
       "Prob(Omnibus):                  0.054   Jarque-Bera (JB):                5.303\n",
       "Skew:                           0.333   Prob(JB):                       0.0706\n",
       "Kurtosis:                       2.555   Cond. No.                         4.89\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 93,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "lm_3 = smf.ols(formula='Sales ~ Newspaper ', data=df).fit()\n",
    "lm_3.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Dans le modèle Sales~TV, l'intercept représente le gain même sans dépenser de l'argent à la publicité télévisée."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Part 3"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 94,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.895</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.894</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   553.5</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th> <td>8.35e-95</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:18:24</td>     <th>  Log-Likelihood:    </th> <td> -383.24</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   774.5</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   194</td>      <th>  BIC:               </th> <td>   787.6</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     3</td>      <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>    2.9523</td> <td>    0.318</td> <td>    9.280</td> <td> 0.000</td> <td>    2.325</td> <td>    3.580</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Radio</th>     <td>    9.3521</td> <td>    0.430</td> <td>   21.772</td> <td> 0.000</td> <td>    8.505</td> <td>   10.199</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>TV</th>        <td>   13.4147</td> <td>    0.415</td> <td>   32.293</td> <td> 0.000</td> <td>   12.595</td> <td>   14.234</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Newspaper</th> <td>   -0.1053</td> <td>    0.563</td> <td>   -0.187</td> <td> 0.852</td> <td>   -1.215</td> <td>    1.005</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td>59.593</td> <th>  Durbin-Watson:     </th> <td>   2.041</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.000</td> <th>  Jarque-Bera (JB):  </th> <td> 147.654</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td>-1.324</td> <th>  Prob(JB):          </th> <td>8.66e-33</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td> 6.299</td> <th>  Cond. No.          </th> <td>    6.35</td>\n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.895\n",
       "Model:                            OLS   Adj. R-squared:                  0.894\n",
       "Method:                 Least Squares   F-statistic:                     553.5\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):           8.35e-95\n",
       "Time:                        16:18:24   Log-Likelihood:                -383.24\n",
       "No. Observations:                 198   AIC:                             774.5\n",
       "Df Residuals:                     194   BIC:                             787.6\n",
       "Df Model:                           3                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept      2.9523      0.318      9.280      0.000       2.325       3.580\n",
       "Radio          9.3521      0.430     21.772      0.000       8.505      10.199\n",
       "TV            13.4147      0.415     32.293      0.000      12.595      14.234\n",
       "Newspaper     -0.1053      0.563     -0.187      0.852      -1.215       1.005\n",
       "==============================================================================\n",
       "Omnibus:                       59.593   Durbin-Watson:                   2.041\n",
       "Prob(Omnibus):                  0.000   Jarque-Bera (JB):              147.654\n",
       "Skew:                          -1.324   Prob(JB):                     8.66e-33\n",
       "Kurtosis:                       6.299   Cond. No.                         6.35\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 94,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# modele multi variables\n",
    "\n",
    "lm_4 = smf.ols(formula='Sales ~ Radio + TV + Newspaper', data=df).fit()\n",
    "lm_4.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Si on augmente de 50 les sommes allouées au média TV, les ventes augmentent de 50 fois le coef de TV dans le modèle."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Le coef de la variable Newspaper est presuqe nul vu que cette dernière n'est pas une variable significative.\n",
    "# Le coef de la variable Newspaper est devenue négatif, parce qu'elle diminue les ventes quand elle est incluse dans \n",
    "# le même modèle avec TV et Radio"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 95,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.895</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.894</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   834.4</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th> <td>2.60e-96</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:24:40</td>     <th>  Log-Likelihood:    </th> <td> -383.26</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   772.5</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   195</td>      <th>  BIC:               </th> <td>   782.4</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     2</td>      <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>    2.9315</td> <td>    0.297</td> <td>    9.861</td> <td> 0.000</td> <td>    2.345</td> <td>    3.518</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Radio</th>     <td>    9.3244</td> <td>    0.402</td> <td>   23.182</td> <td> 0.000</td> <td>    8.531</td> <td>   10.118</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>TV</th>        <td>   13.4120</td> <td>    0.414</td> <td>   32.385</td> <td> 0.000</td> <td>   12.595</td> <td>   14.229</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td>59.228</td> <th>  Durbin-Watson:     </th> <td>   2.038</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.000</td> <th>  Jarque-Bera (JB):  </th> <td> 145.127</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td>-1.321</td> <th>  Prob(JB):          </th> <td>3.06e-32</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td> 6.257</td> <th>  Cond. No.          </th> <td>    4.97</td>\n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.895\n",
       "Model:                            OLS   Adj. R-squared:                  0.894\n",
       "Method:                 Least Squares   F-statistic:                     834.4\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):           2.60e-96\n",
       "Time:                        16:24:40   Log-Likelihood:                -383.26\n",
       "No. Observations:                 198   AIC:                             772.5\n",
       "Df Residuals:                     195   BIC:                             782.4\n",
       "Df Model:                           2                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept      2.9315      0.297      9.861      0.000       2.345       3.518\n",
       "Radio          9.3244      0.402     23.182      0.000       8.531      10.118\n",
       "TV            13.4120      0.414     32.385      0.000      12.595      14.229\n",
       "==============================================================================\n",
       "Omnibus:                       59.228   Durbin-Watson:                   2.038\n",
       "Prob(Omnibus):                  0.000   Jarque-Bera (JB):              145.127\n",
       "Skew:                          -1.321   Prob(JB):                     3.06e-32\n",
       "Kurtosis:                       6.257   Cond. No.                         4.97\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 95,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Le modèle sans Newspaper:\n",
    "\n",
    "lm_5 = smf.ols(formula='Sales ~ Radio + TV', data=df).fit()\n",
    "lm_5.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 97,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "2.8100991768174137\n",
      "2.8106062513305865\n"
     ]
    }
   ],
   "source": [
    "mse_4 = mean_squared_error(df.Sales, lm_4.fittedvalues)\n",
    "mse_5 = mean_squared_error(df.Sales, lm_5.fittedvalues)\n",
    "print(mse_4)\n",
    "print(mse_5)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Même si on a enlevé la variable Newspaper le modèle ne s'améliore pas, il est pratiquement le même."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 96,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Part 4:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 98,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "C:\\Users\\ASUS N752V\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py:3: SettingWithCopyWarning: \n",
      "A value is trying to be set on a copy of a slice from a DataFrame.\n",
      "Try using .loc[row_indexer,col_indexer] = value instead\n",
      "\n",
      "See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy\n",
      "  This is separate from the ipykernel package so we can avoid doing imports until\n"
     ]
    }
   ],
   "source": [
    "# Ajouter la nouvelle variable tv_radio:\n",
    "\n",
    "df['TV_Radio'] = df.TV * df.Radio"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 99,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>TV</th>\n",
       "      <th>Radio</th>\n",
       "      <th>Newspaper</th>\n",
       "      <th>Sales</th>\n",
       "      <th>TV_Radio</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0.783719</td>\n",
       "      <td>0.762097</td>\n",
       "      <td>0.774049</td>\n",
       "      <td>22.1</td>\n",
       "      <td>0.597270</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>0.151567</td>\n",
       "      <td>0.792339</td>\n",
       "      <td>0.504474</td>\n",
       "      <td>10.4</td>\n",
       "      <td>0.120092</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0.058583</td>\n",
       "      <td>0.925403</td>\n",
       "      <td>0.775168</td>\n",
       "      <td>9.3</td>\n",
       "      <td>0.054213</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>0.516008</td>\n",
       "      <td>0.832661</td>\n",
       "      <td>0.654362</td>\n",
       "      <td>18.5</td>\n",
       "      <td>0.429660</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>0.615804</td>\n",
       "      <td>0.217742</td>\n",
       "      <td>0.653244</td>\n",
       "      <td>12.9</td>\n",
       "      <td>0.134086</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>0.029632</td>\n",
       "      <td>0.985887</td>\n",
       "      <td>0.838926</td>\n",
       "      <td>7.2</td>\n",
       "      <td>0.029214</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>0.195845</td>\n",
       "      <td>0.661290</td>\n",
       "      <td>0.262864</td>\n",
       "      <td>11.8</td>\n",
       "      <td>0.129510</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>0.409401</td>\n",
       "      <td>0.395161</td>\n",
       "      <td>0.129754</td>\n",
       "      <td>13.2</td>\n",
       "      <td>0.161779</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>0.029292</td>\n",
       "      <td>0.042339</td>\n",
       "      <td>0.011186</td>\n",
       "      <td>4.8</td>\n",
       "      <td>0.001240</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>0.680518</td>\n",
       "      <td>0.052419</td>\n",
       "      <td>0.237136</td>\n",
       "      <td>10.6</td>\n",
       "      <td>0.035672</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>0.225136</td>\n",
       "      <td>0.116935</td>\n",
       "      <td>0.270694</td>\n",
       "      <td>8.6</td>\n",
       "      <td>0.026326</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>0.731267</td>\n",
       "      <td>0.483871</td>\n",
       "      <td>0.044743</td>\n",
       "      <td>17.4</td>\n",
       "      <td>0.353839</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>0.081063</td>\n",
       "      <td>0.707661</td>\n",
       "      <td>0.737136</td>\n",
       "      <td>9.2</td>\n",
       "      <td>0.057365</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>0.332084</td>\n",
       "      <td>0.153226</td>\n",
       "      <td>0.080537</td>\n",
       "      <td>9.7</td>\n",
       "      <td>0.050884</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>0.695163</td>\n",
       "      <td>0.663306</td>\n",
       "      <td>0.514541</td>\n",
       "      <td>19.0</td>\n",
       "      <td>0.461106</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>0.665531</td>\n",
       "      <td>0.961694</td>\n",
       "      <td>0.591723</td>\n",
       "      <td>22.4</td>\n",
       "      <td>0.640037</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>0.958447</td>\n",
       "      <td>0.798387</td>\n",
       "      <td>0.624161</td>\n",
       "      <td>24.4</td>\n",
       "      <td>0.765212</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>0.235695</td>\n",
       "      <td>0.413306</td>\n",
       "      <td>0.204698</td>\n",
       "      <td>11.3</td>\n",
       "      <td>0.097414</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>0.501703</td>\n",
       "      <td>0.481855</td>\n",
       "      <td>0.213647</td>\n",
       "      <td>14.6</td>\n",
       "      <td>0.241748</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>0.743869</td>\n",
       "      <td>0.558468</td>\n",
       "      <td>0.597315</td>\n",
       "      <td>18.0</td>\n",
       "      <td>0.415427</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>0.808583</td>\n",
       "      <td>0.102823</td>\n",
       "      <td>0.262864</td>\n",
       "      <td>12.5</td>\n",
       "      <td>0.083141</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>0.044959</td>\n",
       "      <td>0.320565</td>\n",
       "      <td>0.554810</td>\n",
       "      <td>5.6</td>\n",
       "      <td>0.014412</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>0.777589</td>\n",
       "      <td>0.340726</td>\n",
       "      <td>0.293065</td>\n",
       "      <td>15.5</td>\n",
       "      <td>0.264944</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>0.212193</td>\n",
       "      <td>0.254032</td>\n",
       "      <td>0.204698</td>\n",
       "      <td>9.7</td>\n",
       "      <td>0.053904</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>0.895436</td>\n",
       "      <td>0.070565</td>\n",
       "      <td>0.218121</td>\n",
       "      <td>12.0</td>\n",
       "      <td>0.063186</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>0.486717</td>\n",
       "      <td>0.590726</td>\n",
       "      <td>0.140940</td>\n",
       "      <td>15.0</td>\n",
       "      <td>0.287516</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>0.817779</td>\n",
       "      <td>0.336694</td>\n",
       "      <td>0.256152</td>\n",
       "      <td>15.9</td>\n",
       "      <td>0.275341</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>0.847411</td>\n",
       "      <td>0.546371</td>\n",
       "      <td>0.256152</td>\n",
       "      <td>18.9</td>\n",
       "      <td>0.463001</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>0.240463</td>\n",
       "      <td>0.322581</td>\n",
       "      <td>0.456376</td>\n",
       "      <td>10.5</td>\n",
       "      <td>0.077569</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>30</th>\n",
       "      <td>0.997616</td>\n",
       "      <td>0.570565</td>\n",
       "      <td>0.483221</td>\n",
       "      <td>21.4</td>\n",
       "      <td>0.569204</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>170</th>\n",
       "      <td>0.170300</td>\n",
       "      <td>0.233871</td>\n",
       "      <td>0.205817</td>\n",
       "      <td>8.4</td>\n",
       "      <td>0.039828</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>171</th>\n",
       "      <td>0.560286</td>\n",
       "      <td>0.421371</td>\n",
       "      <td>0.530201</td>\n",
       "      <td>14.5</td>\n",
       "      <td>0.236088</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>172</th>\n",
       "      <td>0.066757</td>\n",
       "      <td>0.405242</td>\n",
       "      <td>0.190157</td>\n",
       "      <td>7.6</td>\n",
       "      <td>0.027053</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>173</th>\n",
       "      <td>0.573569</td>\n",
       "      <td>0.143145</td>\n",
       "      <td>0.143177</td>\n",
       "      <td>11.7</td>\n",
       "      <td>0.082104</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>174</th>\n",
       "      <td>0.757493</td>\n",
       "      <td>0.068548</td>\n",
       "      <td>0.146532</td>\n",
       "      <td>11.5</td>\n",
       "      <td>0.051925</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>175</th>\n",
       "      <td>0.943120</td>\n",
       "      <td>0.985887</td>\n",
       "      <td>0.467562</td>\n",
       "      <td>27.0</td>\n",
       "      <td>0.929810</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>176</th>\n",
       "      <td>0.846049</td>\n",
       "      <td>0.608871</td>\n",
       "      <td>0.227069</td>\n",
       "      <td>20.2</td>\n",
       "      <td>0.515135</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>177</th>\n",
       "      <td>0.579700</td>\n",
       "      <td>0.157258</td>\n",
       "      <td>0.393736</td>\n",
       "      <td>11.7</td>\n",
       "      <td>0.091163</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>178</th>\n",
       "      <td>0.942439</td>\n",
       "      <td>0.046371</td>\n",
       "      <td>0.265101</td>\n",
       "      <td>11.8</td>\n",
       "      <td>0.043702</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>179</th>\n",
       "      <td>0.564033</td>\n",
       "      <td>0.201613</td>\n",
       "      <td>0.196868</td>\n",
       "      <td>12.6</td>\n",
       "      <td>0.113716</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>180</th>\n",
       "      <td>0.533379</td>\n",
       "      <td>0.052419</td>\n",
       "      <td>0.092841</td>\n",
       "      <td>10.5</td>\n",
       "      <td>0.027959</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>181</th>\n",
       "      <td>0.744210</td>\n",
       "      <td>0.108871</td>\n",
       "      <td>0.306488</td>\n",
       "      <td>12.2</td>\n",
       "      <td>0.081023</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>182</th>\n",
       "      <td>0.191417</td>\n",
       "      <td>0.114919</td>\n",
       "      <td>0.332215</td>\n",
       "      <td>8.7</td>\n",
       "      <td>0.021998</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>183</th>\n",
       "      <td>0.979564</td>\n",
       "      <td>0.866935</td>\n",
       "      <td>0.803132</td>\n",
       "      <td>26.2</td>\n",
       "      <td>0.849219</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>184</th>\n",
       "      <td>0.864441</td>\n",
       "      <td>0.429435</td>\n",
       "      <td>0.335570</td>\n",
       "      <td>17.6</td>\n",
       "      <td>0.371222</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>185</th>\n",
       "      <td>0.698229</td>\n",
       "      <td>0.909274</td>\n",
       "      <td>0.219239</td>\n",
       "      <td>22.6</td>\n",
       "      <td>0.634882</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>186</th>\n",
       "      <td>0.475136</td>\n",
       "      <td>0.042339</td>\n",
       "      <td>0.297539</td>\n",
       "      <td>10.3</td>\n",
       "      <td>0.020117</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>187</th>\n",
       "      <td>0.650886</td>\n",
       "      <td>0.578629</td>\n",
       "      <td>0.203579</td>\n",
       "      <td>17.3</td>\n",
       "      <td>0.376621</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>188</th>\n",
       "      <td>0.974114</td>\n",
       "      <td>0.280242</td>\n",
       "      <td>0.041387</td>\n",
       "      <td>15.9</td>\n",
       "      <td>0.272988</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>189</th>\n",
       "      <td>0.063692</td>\n",
       "      <td>0.243952</td>\n",
       "      <td>0.261745</td>\n",
       "      <td>6.7</td>\n",
       "      <td>0.015538</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>190</th>\n",
       "      <td>0.134537</td>\n",
       "      <td>0.828629</td>\n",
       "      <td>0.064877</td>\n",
       "      <td>10.8</td>\n",
       "      <td>0.111481</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>191</th>\n",
       "      <td>0.257153</td>\n",
       "      <td>0.217742</td>\n",
       "      <td>0.067114</td>\n",
       "      <td>9.9</td>\n",
       "      <td>0.055993</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>192</th>\n",
       "      <td>0.058583</td>\n",
       "      <td>0.082661</td>\n",
       "      <td>0.353468</td>\n",
       "      <td>5.9</td>\n",
       "      <td>0.004843</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>193</th>\n",
       "      <td>0.568120</td>\n",
       "      <td>0.846774</td>\n",
       "      <td>0.040268</td>\n",
       "      <td>19.6</td>\n",
       "      <td>0.481069</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>194</th>\n",
       "      <td>0.509877</td>\n",
       "      <td>0.717742</td>\n",
       "      <td>0.067114</td>\n",
       "      <td>17.3</td>\n",
       "      <td>0.365960</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>195</th>\n",
       "      <td>0.130109</td>\n",
       "      <td>0.074597</td>\n",
       "      <td>0.154362</td>\n",
       "      <td>7.6</td>\n",
       "      <td>0.009706</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>196</th>\n",
       "      <td>0.320845</td>\n",
       "      <td>0.098790</td>\n",
       "      <td>0.090604</td>\n",
       "      <td>9.7</td>\n",
       "      <td>0.031696</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>197</th>\n",
       "      <td>0.602861</td>\n",
       "      <td>0.187500</td>\n",
       "      <td>0.071588</td>\n",
       "      <td>12.8</td>\n",
       "      <td>0.113036</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>198</th>\n",
       "      <td>0.965940</td>\n",
       "      <td>0.846774</td>\n",
       "      <td>0.740492</td>\n",
       "      <td>25.5</td>\n",
       "      <td>0.817933</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>199</th>\n",
       "      <td>0.790531</td>\n",
       "      <td>0.173387</td>\n",
       "      <td>0.097315</td>\n",
       "      <td>13.4</td>\n",
       "      <td>0.137068</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>198 rows × 5 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "           TV     Radio  Newspaper  Sales  TV_Radio\n",
       "0    0.783719  0.762097   0.774049   22.1  0.597270\n",
       "1    0.151567  0.792339   0.504474   10.4  0.120092\n",
       "2    0.058583  0.925403   0.775168    9.3  0.054213\n",
       "3    0.516008  0.832661   0.654362   18.5  0.429660\n",
       "4    0.615804  0.217742   0.653244   12.9  0.134086\n",
       "5    0.029632  0.985887   0.838926    7.2  0.029214\n",
       "6    0.195845  0.661290   0.262864   11.8  0.129510\n",
       "7    0.409401  0.395161   0.129754   13.2  0.161779\n",
       "8    0.029292  0.042339   0.011186    4.8  0.001240\n",
       "9    0.680518  0.052419   0.237136   10.6  0.035672\n",
       "10   0.225136  0.116935   0.270694    8.6  0.026326\n",
       "11   0.731267  0.483871   0.044743   17.4  0.353839\n",
       "12   0.081063  0.707661   0.737136    9.2  0.057365\n",
       "13   0.332084  0.153226   0.080537    9.7  0.050884\n",
       "14   0.695163  0.663306   0.514541   19.0  0.461106\n",
       "15   0.665531  0.961694   0.591723   22.4  0.640037\n",
       "17   0.958447  0.798387   0.624161   24.4  0.765212\n",
       "18   0.235695  0.413306   0.204698   11.3  0.097414\n",
       "19   0.501703  0.481855   0.213647   14.6  0.241748\n",
       "20   0.743869  0.558468   0.597315   18.0  0.415427\n",
       "21   0.808583  0.102823   0.262864   12.5  0.083141\n",
       "22   0.044959  0.320565   0.554810    5.6  0.014412\n",
       "23   0.777589  0.340726   0.293065   15.5  0.264944\n",
       "24   0.212193  0.254032   0.204698    9.7  0.053904\n",
       "25   0.895436  0.070565   0.218121   12.0  0.063186\n",
       "26   0.486717  0.590726   0.140940   15.0  0.287516\n",
       "27   0.817779  0.336694   0.256152   15.9  0.275341\n",
       "28   0.847411  0.546371   0.256152   18.9  0.463001\n",
       "29   0.240463  0.322581   0.456376   10.5  0.077569\n",
       "30   0.997616  0.570565   0.483221   21.4  0.569204\n",
       "..        ...       ...        ...    ...       ...\n",
       "170  0.170300  0.233871   0.205817    8.4  0.039828\n",
       "171  0.560286  0.421371   0.530201   14.5  0.236088\n",
       "172  0.066757  0.405242   0.190157    7.6  0.027053\n",
       "173  0.573569  0.143145   0.143177   11.7  0.082104\n",
       "174  0.757493  0.068548   0.146532   11.5  0.051925\n",
       "175  0.943120  0.985887   0.467562   27.0  0.929810\n",
       "176  0.846049  0.608871   0.227069   20.2  0.515135\n",
       "177  0.579700  0.157258   0.393736   11.7  0.091163\n",
       "178  0.942439  0.046371   0.265101   11.8  0.043702\n",
       "179  0.564033  0.201613   0.196868   12.6  0.113716\n",
       "180  0.533379  0.052419   0.092841   10.5  0.027959\n",
       "181  0.744210  0.108871   0.306488   12.2  0.081023\n",
       "182  0.191417  0.114919   0.332215    8.7  0.021998\n",
       "183  0.979564  0.866935   0.803132   26.2  0.849219\n",
       "184  0.864441  0.429435   0.335570   17.6  0.371222\n",
       "185  0.698229  0.909274   0.219239   22.6  0.634882\n",
       "186  0.475136  0.042339   0.297539   10.3  0.020117\n",
       "187  0.650886  0.578629   0.203579   17.3  0.376621\n",
       "188  0.974114  0.280242   0.041387   15.9  0.272988\n",
       "189  0.063692  0.243952   0.261745    6.7  0.015538\n",
       "190  0.134537  0.828629   0.064877   10.8  0.111481\n",
       "191  0.257153  0.217742   0.067114    9.9  0.055993\n",
       "192  0.058583  0.082661   0.353468    5.9  0.004843\n",
       "193  0.568120  0.846774   0.040268   19.6  0.481069\n",
       "194  0.509877  0.717742   0.067114   17.3  0.365960\n",
       "195  0.130109  0.074597   0.154362    7.6  0.009706\n",
       "196  0.320845  0.098790   0.090604    9.7  0.031696\n",
       "197  0.602861  0.187500   0.071588   12.8  0.113036\n",
       "198  0.965940  0.846774   0.740492   25.5  0.817933\n",
       "199  0.790531  0.173387   0.097315   13.4  0.137068\n",
       "\n",
       "[198 rows x 5 columns]"
      ]
     },
     "execution_count": 99,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 100,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<table class=\"simpletable\">\n",
       "<caption>OLS Regression Results</caption>\n",
       "<tr>\n",
       "  <th>Dep. Variable:</th>          <td>Sales</td>      <th>  R-squared:         </th> <td>   0.968</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>   0.967</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>   1934.</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Date:</th>             <td>Wed, 26 Sep 2018</td> <th>  Prob (F-statistic):</th> <td>3.19e-144</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Time:</th>                 <td>16:41:33</td>     <th>  Log-Likelihood:    </th> <td> -267.07</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>No. Observations:</th>      <td>   198</td>      <th>  AIC:               </th> <td>   542.1</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Residuals:</th>          <td>   194</td>      <th>  BIC:               </th> <td>   555.3</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Df Model:</th>              <td>     3</td>      <th>                     </th>     <td> </td>    \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>    \n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Intercept</th> <td>    6.7577</td> <td>    0.247</td> <td>   27.304</td> <td> 0.000</td> <td>    6.270</td> <td>    7.246</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Radio</th>     <td>    1.3688</td> <td>    0.443</td> <td>    3.089</td> <td> 0.002</td> <td>    0.495</td> <td>    2.243</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>TV</th>        <td>    5.5919</td> <td>    0.441</td> <td>   12.682</td> <td> 0.000</td> <td>    4.722</td> <td>    6.462</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>TV_Radio</th>  <td>   15.9617</td> <td>    0.767</td> <td>   20.817</td> <td> 0.000</td> <td>   14.449</td> <td>   17.474</td>\n",
       "</tr>\n",
       "</table>\n",
       "<table class=\"simpletable\">\n",
       "<tr>\n",
       "  <th>Omnibus:</th>       <td>126.182</td> <th>  Durbin-Watson:     </th> <td>   2.241</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Prob(Omnibus):</th> <td> 0.000</td>  <th>  Jarque-Bera (JB):  </th> <td>1151.060</td> \n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Skew:</th>          <td>-2.306</td>  <th>  Prob(JB):          </th> <td>1.12e-250</td>\n",
       "</tr>\n",
       "<tr>\n",
       "  <th>Kurtosis:</th>      <td>13.875</td>  <th>  Cond. No.          </th> <td>    18.1</td> \n",
       "</tr>\n",
       "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified."
      ],
      "text/plain": [
       "<class 'statsmodels.iolib.summary.Summary'>\n",
       "\"\"\"\n",
       "                            OLS Regression Results                            \n",
       "==============================================================================\n",
       "Dep. Variable:                  Sales   R-squared:                       0.968\n",
       "Model:                            OLS   Adj. R-squared:                  0.967\n",
       "Method:                 Least Squares   F-statistic:                     1934.\n",
       "Date:                Wed, 26 Sep 2018   Prob (F-statistic):          3.19e-144\n",
       "Time:                        16:41:33   Log-Likelihood:                -267.07\n",
       "No. Observations:                 198   AIC:                             542.1\n",
       "Df Residuals:                     194   BIC:                             555.3\n",
       "Df Model:                           3                                         \n",
       "Covariance Type:            nonrobust                                         \n",
       "==============================================================================\n",
       "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
       "------------------------------------------------------------------------------\n",
       "Intercept      6.7577      0.247     27.304      0.000       6.270       7.246\n",
       "Radio          1.3688      0.443      3.089      0.002       0.495       2.243\n",
       "TV             5.5919      0.441     12.682      0.000       4.722       6.462\n",
       "TV_Radio      15.9617      0.767     20.817      0.000      14.449      17.474\n",
       "==============================================================================\n",
       "Omnibus:                      126.182   Durbin-Watson:                   2.241\n",
       "Prob(Omnibus):                  0.000   Jarque-Bera (JB):             1151.060\n",
       "Skew:                          -2.306   Prob(JB):                    1.12e-250\n",
       "Kurtosis:                      13.875   Cond. No.                         18.1\n",
       "==============================================================================\n",
       "\n",
       "Warnings:\n",
       "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
       "\"\"\""
      ]
     },
     "execution_count": 100,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# Rajoutez au modèle la variable multiplicative:\n",
    "\n",
    "lm_6 = smf.ols(formula='Sales ~ Radio + TV + TV_Radio', data=df).fit()\n",
    "lm_6.summary()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": [
    "# On peut expliquer que cette variable ait une grande influence sur le modèle par le fait d'investir sur les deux à la fois\n",
    "# et en même temps est mieux qu'investir sur l'un des deux ou les deux séparément.\n",
    "\n",
    "# C'est à dire si la personne voit la publication à la fois à la télé et au radio, ceci augmente les chances de ventes."
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}