{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "f7efc033",
   "metadata": {},
   "source": [
    "## License \n",
    "\n",
    "Copyright 2021-2023 Patrick Hall (jphall@gwu.edu)\n",
    "\n",
    "Licensed under the Apache License, Version 2.0 (the \"License\");\n",
    "you may not use this file except in compliance with the License.\n",
    "You may obtain a copy of the License at\n",
    "\n",
    "    http://www.apache.org/licenses/LICENSE-2.0\n",
    "\n",
    "Unless required by applicable law or agreed to in writing, software\n",
    "distributed under the License is distributed on an \"AS IS\" BASIS,\n",
    "WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n",
    "See the License for the specific language governing permissions and\n",
    "limitations under the License.\n",
    "\n",
    "*DISCLAIMER*: This notebook is not legal or compliance advice."
   ]
  },
  {
   "cell_type": "markdown",
   "id": "aab60b41",
   "metadata": {},
   "source": [
    "# Model Evaluation Notebook"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "281af306",
   "metadata": {},
   "source": [
    "#### Imports and inits"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "id": "fd180587",
   "metadata": {},
   "outputs": [],
   "source": [
    "import os              # for directory and file manipulation\n",
    "import numpy as np     # for basic array manipulation\n",
    "import pandas as pd    # for dataframe manipulation\n",
    "import datetime        # for timestamp\n",
    "\n",
    "# for model eval\n",
    "from sklearn.metrics import accuracy_score, f1_score, log_loss, mean_squared_error, roc_auc_score\n",
    "\n",
    "# global constants \n",
    "ROUND = 3              # generally, insane precision is not needed \n",
    "SEED = 12345           # seed for better reproducibility\n",
    "\n",
    "# set global random seed for better reproducibility\n",
    "np.random.seed(SEED)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "eb2a39d4",
   "metadata": {},
   "source": [
    "#### Set basic metadata"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "id": "98f640ed",
   "metadata": {},
   "outputs": [],
   "source": [
    "y_name = 'high_priced'\n",
    "scores_dir = 'data/scores'"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "cc8d83d0",
   "metadata": {},
   "source": [
    "#### Read in score files "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "355c2b81",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>high_priced</th>\n",
       "      <th>fold</th>\n",
       "      <th>group1_rem_ebm</th>\n",
       "      <th>group2_rem_ebm</th>\n",
       "      <th>group2_rem_ebm2</th>\n",
       "      <th>group3_rem_piml_EBM</th>\n",
       "      <th>group3_rem_piml_EBM2</th>\n",
       "      <th>group5_rem_xgb2</th>\n",
       "      <th>group8_rem_ebm</th>\n",
       "      <th>group9_rem_xgb</th>\n",
       "      <th>ph_rem_ebm</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>2</td>\n",
       "      <td>0.118787</td>\n",
       "      <td>0.080557</td>\n",
       "      <td>0.080557</td>\n",
       "      <td>0.920389</td>\n",
       "      <td>0.136749</td>\n",
       "      <td>0.078326</td>\n",
       "      <td>0.223846</td>\n",
       "      <td>0.081792</td>\n",
       "      <td>0.219429</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>0.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0.084506</td>\n",
       "      <td>0.026001</td>\n",
       "      <td>0.026001</td>\n",
       "      <td>0.969301</td>\n",
       "      <td>0.053751</td>\n",
       "      <td>0.035825</td>\n",
       "      <td>0.053926</td>\n",
       "      <td>0.110702</td>\n",
       "      <td>0.053929</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>1.0</td>\n",
       "      <td>4</td>\n",
       "      <td>0.210389</td>\n",
       "      <td>0.194961</td>\n",
       "      <td>0.194961</td>\n",
       "      <td>0.814272</td>\n",
       "      <td>0.182311</td>\n",
       "      <td>0.195332</td>\n",
       "      <td>0.143522</td>\n",
       "      <td>0.204048</td>\n",
       "      <td>0.133863</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>0.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0.008529</td>\n",
       "      <td>0.028556</td>\n",
       "      <td>0.028556</td>\n",
       "      <td>0.974559</td>\n",
       "      <td>0.004065</td>\n",
       "      <td>0.022765</td>\n",
       "      <td>0.009371</td>\n",
       "      <td>0.024038</td>\n",
       "      <td>0.014419</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>1.0</td>\n",
       "      <td>2</td>\n",
       "      <td>0.189933</td>\n",
       "      <td>0.208263</td>\n",
       "      <td>0.208263</td>\n",
       "      <td>0.802908</td>\n",
       "      <td>0.211120</td>\n",
       "      <td>0.193035</td>\n",
       "      <td>0.151100</td>\n",
       "      <td>0.170243</td>\n",
       "      <td>0.156047</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19826</th>\n",
       "      <td>0.0</td>\n",
       "      <td>3</td>\n",
       "      <td>0.163697</td>\n",
       "      <td>0.228342</td>\n",
       "      <td>0.228342</td>\n",
       "      <td>0.792251</td>\n",
       "      <td>0.209322</td>\n",
       "      <td>0.235192</td>\n",
       "      <td>0.216720</td>\n",
       "      <td>0.181403</td>\n",
       "      <td>0.184214</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19827</th>\n",
       "      <td>0.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0.114999</td>\n",
       "      <td>0.253998</td>\n",
       "      <td>0.253998</td>\n",
       "      <td>0.762946</td>\n",
       "      <td>0.206744</td>\n",
       "      <td>0.235832</td>\n",
       "      <td>0.161401</td>\n",
       "      <td>0.159468</td>\n",
       "      <td>0.141663</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19828</th>\n",
       "      <td>1.0</td>\n",
       "      <td>3</td>\n",
       "      <td>0.141307</td>\n",
       "      <td>0.213364</td>\n",
       "      <td>0.213364</td>\n",
       "      <td>0.747401</td>\n",
       "      <td>0.246610</td>\n",
       "      <td>0.208723</td>\n",
       "      <td>0.242814</td>\n",
       "      <td>0.138141</td>\n",
       "      <td>0.233266</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19829</th>\n",
       "      <td>0.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0.007766</td>\n",
       "      <td>0.002176</td>\n",
       "      <td>0.002176</td>\n",
       "      <td>0.996455</td>\n",
       "      <td>0.000268</td>\n",
       "      <td>0.018702</td>\n",
       "      <td>0.005657</td>\n",
       "      <td>0.034570</td>\n",
       "      <td>0.009914</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19830</th>\n",
       "      <td>0.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0.163946</td>\n",
       "      <td>0.185484</td>\n",
       "      <td>0.185484</td>\n",
       "      <td>0.811429</td>\n",
       "      <td>0.177857</td>\n",
       "      <td>0.215085</td>\n",
       "      <td>0.167812</td>\n",
       "      <td>0.177785</td>\n",
       "      <td>0.155447</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>19831 rows × 11 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "       high_priced  fold  group1_rem_ebm  group2_rem_ebm  group2_rem_ebm2  \\\n",
       "0              0.0     2        0.118787        0.080557         0.080557   \n",
       "1              0.0     1        0.084506        0.026001         0.026001   \n",
       "2              1.0     4        0.210389        0.194961         0.194961   \n",
       "3              0.0     1        0.008529        0.028556         0.028556   \n",
       "4              1.0     2        0.189933        0.208263         0.208263   \n",
       "...            ...   ...             ...             ...              ...   \n",
       "19826          0.0     3        0.163697        0.228342         0.228342   \n",
       "19827          0.0     1        0.114999        0.253998         0.253998   \n",
       "19828          1.0     3        0.141307        0.213364         0.213364   \n",
       "19829          0.0     1        0.007766        0.002176         0.002176   \n",
       "19830          0.0     0        0.163946        0.185484         0.185484   \n",
       "\n",
       "       group3_rem_piml_EBM  group3_rem_piml_EBM2  group5_rem_xgb2  \\\n",
       "0                 0.920389              0.136749         0.078326   \n",
       "1                 0.969301              0.053751         0.035825   \n",
       "2                 0.814272              0.182311         0.195332   \n",
       "3                 0.974559              0.004065         0.022765   \n",
       "4                 0.802908              0.211120         0.193035   \n",
       "...                    ...                   ...              ...   \n",
       "19826             0.792251              0.209322         0.235192   \n",
       "19827             0.762946              0.206744         0.235832   \n",
       "19828             0.747401              0.246610         0.208723   \n",
       "19829             0.996455              0.000268         0.018702   \n",
       "19830             0.811429              0.177857         0.215085   \n",
       "\n",
       "       group8_rem_ebm  group9_rem_xgb  ph_rem_ebm  \n",
       "0            0.223846        0.081792    0.219429  \n",
       "1            0.053926        0.110702    0.053929  \n",
       "2            0.143522        0.204048    0.133863  \n",
       "3            0.009371        0.024038    0.014419  \n",
       "4            0.151100        0.170243    0.156047  \n",
       "...               ...             ...         ...  \n",
       "19826        0.216720        0.181403    0.184214  \n",
       "19827        0.161401        0.159468    0.141663  \n",
       "19828        0.242814        0.138141    0.233266  \n",
       "19829        0.005657        0.034570    0.009914  \n",
       "19830        0.167812        0.177785    0.155447  \n",
       "\n",
       "[19831 rows x 11 columns]"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# init score frame with known test y values\n",
    "scores_frame = pd.read_csv(scores_dir + os.sep +'key.csv', index_col='Unnamed: 0')\n",
    "\n",
    "# create random folds in reproducible way\n",
    "np.random.seed(SEED)\n",
    "scores_frame['fold'] = np.random.choice(5, scores_frame.shape[0])\n",
    "\n",
    "# read in each score file in the directory as a new column \n",
    "for file in sorted(os.listdir(scores_dir)):\n",
    "    if file != 'key.csv' and file.endswith('.csv'):\n",
    "        scores_frame[file[:-4]] = pd.read_csv(scores_dir + os.sep + file)['phat']\n",
    "\n",
    "# sanity check \n",
    "scores_frame"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "3e3cccda",
   "metadata": {},
   "source": [
    "#### Utility function for max. accuracy"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "id": "2eb43506",
   "metadata": {},
   "outputs": [],
   "source": [
    "def max_acc(y, phat, res=0.01): \n",
    "\n",
    "    \"\"\" Utility function for finding max. accuracy at some cutoff. \n",
    "    \n",
    "        :param y: Known y values.\n",
    "        :param phat: Model scores.\n",
    "        :param res: Resolution over which to search for max. accuracy, default 0.01.\n",
    "        :return: Max. accuracy for model scores.\n",
    "    \n",
    "    \"\"\"\n",
    "    \n",
    "    # init frame to store acc at different cutoffs\n",
    "    acc_frame = pd.DataFrame(columns=['cut', 'acc'])\n",
    "    \n",
    "    # copy known y and score values into a temporary frame\n",
    "    temp_df = pd.concat([y, phat], axis=1)\n",
    "    \n",
    "    # find accuracy at different cutoffs and store in acc_frame\n",
    "    for cut in np.arange(0, 1 + res, res):\n",
    "        temp_df['decision'] = np.where(temp_df.iloc[:, 1] > cut, 1, 0)\n",
    "        acc = accuracy_score(temp_df.iloc[:, 0], temp_df['decision'])\n",
    "        acc_frame = acc_frame.append({'cut': cut,\n",
    "                                      'acc': acc},\n",
    "                                     ignore_index=True)\n",
    "\n",
    "    # find max accurcay across all cutoffs\n",
    "    max_acc = acc_frame['acc'].max()\n",
    "    \n",
    "    # house keeping\n",
    "    del acc_frame, temp_df\n",
    "    \n",
    "    return max_acc"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "b02c9651",
   "metadata": {},
   "source": [
    "####  Utility function for max. F1"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "id": "fae3756b",
   "metadata": {},
   "outputs": [],
   "source": [
    "def max_f1(y, phat, res=0.01): \n",
    "    \n",
    "    \"\"\" Utility function for finding max. F1 at some cutoff. \n",
    "    \n",
    "        :param y: Known y values.\n",
    "        :param phat: Model scores.\n",
    "        :param res: Resolution over which to search for max. F1, default 0.01.\n",
    "        :return: Max. F1 for model scores.\n",
    "    \n",
    "    \"\"\"\n",
    "    \n",
    "    # init frame to store f1 at different cutoffs\n",
    "    f1_frame = pd.DataFrame(columns=['cut', 'f1'])\n",
    "    \n",
    "    # copy known y and score values into a temporary frame\n",
    "    temp_df = pd.concat([y, phat], axis=1)\n",
    "    \n",
    "    # find f1 at different cutoffs and store in acc_frame\n",
    "    for cut in np.arange(0, 1 + res, res):\n",
    "        temp_df['decision'] = np.where(temp_df.iloc[:, 1] > cut, 1, 0)\n",
    "        f1 = f1_score(temp_df.iloc[:, 0], temp_df['decision'])\n",
    "        f1_frame = f1_frame.append({'cut': cut,\n",
    "                                    'f1': f1},\n",
    "                                    ignore_index=True)\n",
    "        \n",
    "    # find max f1 across all cutoffs\n",
    "    max_f1 = f1_frame['f1'].max()\n",
    "    \n",
    "     # house keeping\n",
    "    del f1_frame, temp_df\n",
    "    \n",
    "    return max_f1"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "b447b732",
   "metadata": {},
   "source": [
    "#### Rank all submitted scores "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "id": "40fbe608",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>fold</th>\n",
       "      <th>metric</th>\n",
       "      <th>group1_rem_ebm</th>\n",
       "      <th>group2_rem_ebm</th>\n",
       "      <th>group2_rem_ebm2</th>\n",
       "      <th>group3_rem_piml_EBM</th>\n",
       "      <th>group3_rem_piml_EBM2</th>\n",
       "      <th>group5_rem_xgb2</th>\n",
       "      <th>group8_rem_ebm</th>\n",
       "      <th>group9_rem_xgb</th>\n",
       "      <th>ph_rem_ebm</th>\n",
       "      <th>group1_rem_ebm_rank</th>\n",
       "      <th>group2_rem_ebm_rank</th>\n",
       "      <th>group2_rem_ebm2_rank</th>\n",
       "      <th>group3_rem_piml_EBM_rank</th>\n",
       "      <th>group3_rem_piml_EBM2_rank</th>\n",
       "      <th>group5_rem_xgb2_rank</th>\n",
       "      <th>group8_rem_ebm_rank</th>\n",
       "      <th>group9_rem_xgb_rank</th>\n",
       "      <th>ph_rem_ebm_rank</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>0.0</td>\n",
       "      <td>acc</td>\n",
       "      <td>0.900</td>\n",
       "      <td>0.901</td>\n",
       "      <td>0.901</td>\n",
       "      <td>0.900</td>\n",
       "      <td>0.901</td>\n",
       "      <td>0.901</td>\n",
       "      <td>0.901</td>\n",
       "      <td>0.900</td>\n",
       "      <td>0.901</td>\n",
       "      <td>8.0</td>\n",
       "      <td>3.5</td>\n",
       "      <td>3.5</td>\n",
       "      <td>8.0</td>\n",
       "      <td>3.5</td>\n",
       "      <td>3.5</td>\n",
       "      <td>3.5</td>\n",
       "      <td>8.0</td>\n",
       "      <td>3.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>0.0</td>\n",
       "      <td>auc</td>\n",
       "      <td>0.781</td>\n",
       "      <td>0.840</td>\n",
       "      <td>0.840</td>\n",
       "      <td>0.163</td>\n",
       "      <td>0.821</td>\n",
       "      <td>0.836</td>\n",
       "      <td>0.793</td>\n",
       "      <td>0.797</td>\n",
       "      <td>0.791</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0.0</td>\n",
       "      <td>f1</td>\n",
       "      <td>0.347</td>\n",
       "      <td>0.405</td>\n",
       "      <td>0.405</td>\n",
       "      <td>0.182</td>\n",
       "      <td>0.381</td>\n",
       "      <td>0.392</td>\n",
       "      <td>0.342</td>\n",
       "      <td>0.357</td>\n",
       "      <td>0.347</td>\n",
       "      <td>6.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>8.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>6.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>0.0</td>\n",
       "      <td>logloss</td>\n",
       "      <td>0.280</td>\n",
       "      <td>0.251</td>\n",
       "      <td>0.251</td>\n",
       "      <td>3.257</td>\n",
       "      <td>0.262</td>\n",
       "      <td>0.254</td>\n",
       "      <td>0.274</td>\n",
       "      <td>0.277</td>\n",
       "      <td>0.275</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>0.0</td>\n",
       "      <td>mse</td>\n",
       "      <td>0.082</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.773</td>\n",
       "      <td>0.078</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.081</td>\n",
       "      <td>0.081</td>\n",
       "      <td>0.081</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>1.0</td>\n",
       "      <td>acc</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>0.906</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>1.0</td>\n",
       "      <td>auc</td>\n",
       "      <td>0.767</td>\n",
       "      <td>0.828</td>\n",
       "      <td>0.828</td>\n",
       "      <td>0.172</td>\n",
       "      <td>0.810</td>\n",
       "      <td>0.822</td>\n",
       "      <td>0.774</td>\n",
       "      <td>0.779</td>\n",
       "      <td>0.772</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>1.0</td>\n",
       "      <td>f1</td>\n",
       "      <td>0.312</td>\n",
       "      <td>0.368</td>\n",
       "      <td>0.368</td>\n",
       "      <td>0.172</td>\n",
       "      <td>0.348</td>\n",
       "      <td>0.360</td>\n",
       "      <td>0.319</td>\n",
       "      <td>0.329</td>\n",
       "      <td>0.321</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>1.0</td>\n",
       "      <td>logloss</td>\n",
       "      <td>0.272</td>\n",
       "      <td>0.246</td>\n",
       "      <td>0.246</td>\n",
       "      <td>3.253</td>\n",
       "      <td>0.258</td>\n",
       "      <td>0.250</td>\n",
       "      <td>0.270</td>\n",
       "      <td>0.271</td>\n",
       "      <td>0.272</td>\n",
       "      <td>7.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>7.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>1.0</td>\n",
       "      <td>mse</td>\n",
       "      <td>0.079</td>\n",
       "      <td>0.074</td>\n",
       "      <td>0.074</td>\n",
       "      <td>0.778</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.075</td>\n",
       "      <td>0.079</td>\n",
       "      <td>0.078</td>\n",
       "      <td>0.079</td>\n",
       "      <td>7.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>2.0</td>\n",
       "      <td>acc</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.910</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.908</td>\n",
       "      <td>0.909</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>2.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>2.0</td>\n",
       "      <td>auc</td>\n",
       "      <td>0.759</td>\n",
       "      <td>0.825</td>\n",
       "      <td>0.825</td>\n",
       "      <td>0.175</td>\n",
       "      <td>0.815</td>\n",
       "      <td>0.826</td>\n",
       "      <td>0.781</td>\n",
       "      <td>0.772</td>\n",
       "      <td>0.780</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.5</td>\n",
       "      <td>2.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>2.0</td>\n",
       "      <td>f1</td>\n",
       "      <td>0.304</td>\n",
       "      <td>0.372</td>\n",
       "      <td>0.372</td>\n",
       "      <td>0.169</td>\n",
       "      <td>0.354</td>\n",
       "      <td>0.371</td>\n",
       "      <td>0.315</td>\n",
       "      <td>0.320</td>\n",
       "      <td>0.323</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>5.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>2.0</td>\n",
       "      <td>logloss</td>\n",
       "      <td>0.271</td>\n",
       "      <td>0.246</td>\n",
       "      <td>0.246</td>\n",
       "      <td>3.284</td>\n",
       "      <td>0.251</td>\n",
       "      <td>0.245</td>\n",
       "      <td>0.264</td>\n",
       "      <td>0.271</td>\n",
       "      <td>0.264</td>\n",
       "      <td>7.5</td>\n",
       "      <td>2.5</td>\n",
       "      <td>2.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>5.5</td>\n",
       "      <td>7.5</td>\n",
       "      <td>5.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>2.0</td>\n",
       "      <td>mse</td>\n",
       "      <td>0.078</td>\n",
       "      <td>0.073</td>\n",
       "      <td>0.073</td>\n",
       "      <td>0.781</td>\n",
       "      <td>0.074</td>\n",
       "      <td>0.073</td>\n",
       "      <td>0.076</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.076</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>5.5</td>\n",
       "      <td>7.0</td>\n",
       "      <td>5.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>3.0</td>\n",
       "      <td>acc</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>0.903</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>5.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>3.0</td>\n",
       "      <td>auc</td>\n",
       "      <td>0.772</td>\n",
       "      <td>0.826</td>\n",
       "      <td>0.826</td>\n",
       "      <td>0.174</td>\n",
       "      <td>0.809</td>\n",
       "      <td>0.823</td>\n",
       "      <td>0.775</td>\n",
       "      <td>0.786</td>\n",
       "      <td>0.772</td>\n",
       "      <td>7.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>3.0</td>\n",
       "      <td>f1</td>\n",
       "      <td>0.317</td>\n",
       "      <td>0.371</td>\n",
       "      <td>0.371</td>\n",
       "      <td>0.177</td>\n",
       "      <td>0.361</td>\n",
       "      <td>0.365</td>\n",
       "      <td>0.328</td>\n",
       "      <td>0.343</td>\n",
       "      <td>0.323</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>3.0</td>\n",
       "      <td>logloss</td>\n",
       "      <td>0.276</td>\n",
       "      <td>0.252</td>\n",
       "      <td>0.252</td>\n",
       "      <td>3.254</td>\n",
       "      <td>0.262</td>\n",
       "      <td>0.253</td>\n",
       "      <td>0.275</td>\n",
       "      <td>0.275</td>\n",
       "      <td>0.276</td>\n",
       "      <td>7.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>5.5</td>\n",
       "      <td>5.5</td>\n",
       "      <td>7.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>3.0</td>\n",
       "      <td>mse</td>\n",
       "      <td>0.081</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.775</td>\n",
       "      <td>0.079</td>\n",
       "      <td>0.077</td>\n",
       "      <td>0.080</td>\n",
       "      <td>0.080</td>\n",
       "      <td>0.080</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>4.0</td>\n",
       "      <td>acc</td>\n",
       "      <td>0.895</td>\n",
       "      <td>0.897</td>\n",
       "      <td>0.897</td>\n",
       "      <td>0.895</td>\n",
       "      <td>0.895</td>\n",
       "      <td>0.898</td>\n",
       "      <td>0.895</td>\n",
       "      <td>0.896</td>\n",
       "      <td>0.895</td>\n",
       "      <td>7.0</td>\n",
       "      <td>2.5</td>\n",
       "      <td>2.5</td>\n",
       "      <td>7.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>7.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>4.0</td>\n",
       "      <td>auc</td>\n",
       "      <td>0.754</td>\n",
       "      <td>0.831</td>\n",
       "      <td>0.831</td>\n",
       "      <td>0.170</td>\n",
       "      <td>0.818</td>\n",
       "      <td>0.828</td>\n",
       "      <td>0.785</td>\n",
       "      <td>0.779</td>\n",
       "      <td>0.782</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>4.0</td>\n",
       "      <td>f1</td>\n",
       "      <td>0.323</td>\n",
       "      <td>0.401</td>\n",
       "      <td>0.401</td>\n",
       "      <td>0.190</td>\n",
       "      <td>0.404</td>\n",
       "      <td>0.397</td>\n",
       "      <td>0.364</td>\n",
       "      <td>0.354</td>\n",
       "      <td>0.362</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.5</td>\n",
       "      <td>2.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>4.0</td>\n",
       "      <td>logloss</td>\n",
       "      <td>0.296</td>\n",
       "      <td>0.263</td>\n",
       "      <td>0.263</td>\n",
       "      <td>3.200</td>\n",
       "      <td>0.273</td>\n",
       "      <td>0.266</td>\n",
       "      <td>0.286</td>\n",
       "      <td>0.291</td>\n",
       "      <td>0.287</td>\n",
       "      <td>8.0</td>\n",
       "      <td>1.5</td>\n",
       "      <td>1.5</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>3.0</td>\n",
       "      <td>5.0</td>\n",
       "      <td>7.0</td>\n",
       "      <td>6.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>4.0</td>\n",
       "      <td>mse</td>\n",
       "      <td>0.087</td>\n",
       "      <td>0.080</td>\n",
       "      <td>0.080</td>\n",
       "      <td>0.771</td>\n",
       "      <td>0.082</td>\n",
       "      <td>0.080</td>\n",
       "      <td>0.084</td>\n",
       "      <td>0.086</td>\n",
       "      <td>0.084</td>\n",
       "      <td>8.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>9.0</td>\n",
       "      <td>4.0</td>\n",
       "      <td>2.0</td>\n",
       "      <td>5.5</td>\n",
       "      <td>7.0</td>\n",
       "      <td>5.5</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "    fold   metric  group1_rem_ebm  group2_rem_ebm  group2_rem_ebm2  \\\n",
       "0    0.0      acc           0.900           0.901            0.901   \n",
       "1    0.0      auc           0.781           0.840            0.840   \n",
       "2    0.0       f1           0.347           0.405            0.405   \n",
       "3    0.0  logloss           0.280           0.251            0.251   \n",
       "4    0.0      mse           0.082           0.077            0.077   \n",
       "5    1.0      acc           0.906           0.906            0.906   \n",
       "6    1.0      auc           0.767           0.828            0.828   \n",
       "7    1.0       f1           0.312           0.368            0.368   \n",
       "8    1.0  logloss           0.272           0.246            0.246   \n",
       "9    1.0      mse           0.079           0.074            0.074   \n",
       "10   2.0      acc           0.908           0.908            0.908   \n",
       "11   2.0      auc           0.759           0.825            0.825   \n",
       "12   2.0       f1           0.304           0.372            0.372   \n",
       "13   2.0  logloss           0.271           0.246            0.246   \n",
       "14   2.0      mse           0.078           0.073            0.073   \n",
       "15   3.0      acc           0.903           0.903            0.903   \n",
       "16   3.0      auc           0.772           0.826            0.826   \n",
       "17   3.0       f1           0.317           0.371            0.371   \n",
       "18   3.0  logloss           0.276           0.252            0.252   \n",
       "19   3.0      mse           0.081           0.077            0.077   \n",
       "20   4.0      acc           0.895           0.897            0.897   \n",
       "21   4.0      auc           0.754           0.831            0.831   \n",
       "22   4.0       f1           0.323           0.401            0.401   \n",
       "23   4.0  logloss           0.296           0.263            0.263   \n",
       "24   4.0      mse           0.087           0.080            0.080   \n",
       "\n",
       "    group3_rem_piml_EBM  group3_rem_piml_EBM2  group5_rem_xgb2  \\\n",
       "0                 0.900                 0.901            0.901   \n",
       "1                 0.163                 0.821            0.836   \n",
       "2                 0.182                 0.381            0.392   \n",
       "3                 3.257                 0.262            0.254   \n",
       "4                 0.773                 0.078            0.077   \n",
       "5                 0.906                 0.906            0.906   \n",
       "6                 0.172                 0.810            0.822   \n",
       "7                 0.172                 0.348            0.360   \n",
       "8                 3.253                 0.258            0.250   \n",
       "9                 0.778                 0.077            0.075   \n",
       "10                0.908                 0.908            0.910   \n",
       "11                0.175                 0.815            0.826   \n",
       "12                0.169                 0.354            0.371   \n",
       "13                3.284                 0.251            0.245   \n",
       "14                0.781                 0.074            0.073   \n",
       "15                0.903                 0.903            0.903   \n",
       "16                0.174                 0.809            0.823   \n",
       "17                0.177                 0.361            0.365   \n",
       "18                3.254                 0.262            0.253   \n",
       "19                0.775                 0.079            0.077   \n",
       "20                0.895                 0.895            0.898   \n",
       "21                0.170                 0.818            0.828   \n",
       "22                0.190                 0.404            0.397   \n",
       "23                3.200                 0.273            0.266   \n",
       "24                0.771                 0.082            0.080   \n",
       "\n",
       "    group8_rem_ebm  group9_rem_xgb  ph_rem_ebm  group1_rem_ebm_rank  \\\n",
       "0            0.901           0.900       0.901                  8.0   \n",
       "1            0.793           0.797       0.791                  8.0   \n",
       "2            0.342           0.357       0.347                  6.5   \n",
       "3            0.274           0.277       0.275                  8.0   \n",
       "4            0.081           0.081       0.081                  8.0   \n",
       "5            0.906           0.906       0.906                  5.0   \n",
       "6            0.774           0.779       0.772                  8.0   \n",
       "7            0.319           0.329       0.321                  8.0   \n",
       "8            0.270           0.271       0.272                  7.5   \n",
       "9            0.079           0.078       0.079                  7.0   \n",
       "10           0.908           0.908       0.909                  6.0   \n",
       "11           0.781           0.772       0.780                  8.0   \n",
       "12           0.315           0.320       0.323                  8.0   \n",
       "13           0.264           0.271       0.264                  7.5   \n",
       "14           0.076           0.077       0.076                  8.0   \n",
       "15           0.903           0.903       0.903                  5.0   \n",
       "16           0.775           0.786       0.772                  7.5   \n",
       "17           0.328           0.343       0.323                  8.0   \n",
       "18           0.275           0.275       0.276                  7.5   \n",
       "19           0.080           0.080       0.080                  8.0   \n",
       "20           0.895           0.896       0.895                  7.0   \n",
       "21           0.785           0.779       0.782                  8.0   \n",
       "22           0.364           0.354       0.362                  8.0   \n",
       "23           0.286           0.291       0.287                  8.0   \n",
       "24           0.084           0.086       0.084                  8.0   \n",
       "\n",
       "    group2_rem_ebm_rank  group2_rem_ebm2_rank  group3_rem_piml_EBM_rank  \\\n",
       "0                   3.5                   3.5                       8.0   \n",
       "1                   1.5                   1.5                       9.0   \n",
       "2                   1.5                   1.5                       9.0   \n",
       "3                   1.5                   1.5                       9.0   \n",
       "4                   2.0                   2.0                       9.0   \n",
       "5                   5.0                   5.0                       5.0   \n",
       "6                   1.5                   1.5                       9.0   \n",
       "7                   1.5                   1.5                       9.0   \n",
       "8                   1.5                   1.5                       9.0   \n",
       "9                   1.5                   1.5                       9.0   \n",
       "10                  6.0                   6.0                       6.0   \n",
       "11                  2.5                   2.5                       9.0   \n",
       "12                  1.5                   1.5                       9.0   \n",
       "13                  2.5                   2.5                       9.0   \n",
       "14                  2.0                   2.0                       9.0   \n",
       "15                  5.0                   5.0                       5.0   \n",
       "16                  1.5                   1.5                       9.0   \n",
       "17                  1.5                   1.5                       9.0   \n",
       "18                  1.5                   1.5                       9.0   \n",
       "19                  2.0                   2.0                       9.0   \n",
       "20                  2.5                   2.5                       7.0   \n",
       "21                  1.5                   1.5                       9.0   \n",
       "22                  2.5                   2.5                       9.0   \n",
       "23                  1.5                   1.5                       9.0   \n",
       "24                  2.0                   2.0                       9.0   \n",
       "\n",
       "    group3_rem_piml_EBM2_rank  group5_rem_xgb2_rank  group8_rem_ebm_rank  \\\n",
       "0                         3.5                   3.5                  3.5   \n",
       "1                         4.0                   3.0                  6.0   \n",
       "2                         4.0                   3.0                  8.0   \n",
       "3                         4.0                   3.0                  5.0   \n",
       "4                         4.0                   2.0                  6.0   \n",
       "5                         5.0                   5.0                  5.0   \n",
       "6                         4.0                   3.0                  6.0   \n",
       "7                         4.0                   3.0                  7.0   \n",
       "8                         4.0                   3.0                  5.0   \n",
       "9                         4.0                   3.0                  7.0   \n",
       "10                        6.0                   1.0                  6.0   \n",
       "11                        4.0                   1.0                  5.0   \n",
       "12                        4.0                   3.0                  7.0   \n",
       "13                        4.0                   1.0                  5.5   \n",
       "14                        4.0                   2.0                  5.5   \n",
       "15                        5.0                   5.0                  5.0   \n",
       "16                        4.0                   3.0                  6.0   \n",
       "17                        4.0                   3.0                  6.0   \n",
       "18                        4.0                   3.0                  5.5   \n",
       "19                        4.0                   2.0                  6.0   \n",
       "20                        7.0                   1.0                  7.0   \n",
       "21                        4.0                   3.0                  5.0   \n",
       "22                        1.0                   4.0                  5.0   \n",
       "23                        4.0                   3.0                  5.0   \n",
       "24                        4.0                   2.0                  5.5   \n",
       "\n",
       "    group9_rem_xgb_rank  ph_rem_ebm_rank  \n",
       "0                   8.0              3.5  \n",
       "1                   5.0              7.0  \n",
       "2                   5.0              6.5  \n",
       "3                   7.0              6.0  \n",
       "4                   6.0              6.0  \n",
       "5                   5.0              5.0  \n",
       "6                   5.0              7.0  \n",
       "7                   5.0              6.0  \n",
       "8                   6.0              7.5  \n",
       "9                   5.0              7.0  \n",
       "10                  6.0              2.0  \n",
       "11                  7.0              6.0  \n",
       "12                  6.0              5.0  \n",
       "13                  7.5              5.5  \n",
       "14                  7.0              5.5  \n",
       "15                  5.0              5.0  \n",
       "16                  5.0              7.5  \n",
       "17                  5.0              7.0  \n",
       "18                  5.5              7.5  \n",
       "19                  6.0              6.0  \n",
       "20                  4.0              7.0  \n",
       "21                  7.0              6.0  \n",
       "22                  7.0              6.0  \n",
       "23                  7.0              6.0  \n",
       "24                  7.0              5.5  "
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "eval_frame = pd.DataFrame() # init frame to hold score ranking\n",
    "metric_list = ['acc', 'auc', 'f1', 'logloss', 'mse'] # metric to use for evaluation\n",
    "\n",
    "# create eval frame row-by-row\n",
    "for fold in sorted(scores_frame['fold'].unique()): # loop through folds \n",
    "    for metric_name in metric_list: # loop through metrics\n",
    "        \n",
    "        # init row dict to hold each rows values\n",
    "        row_dict = {'fold': fold,\n",
    "                    'metric': metric_name}\n",
    "        \n",
    "        # cache known y values for fold\n",
    "        fold_y = scores_frame.loc[scores_frame['fold'] == fold, y_name]\n",
    "        \n",
    "        for col_name in scores_frame.columns[2:]:\n",
    "            \n",
    "            # cache fold scores\n",
    "            fold_scores = scores_frame.loc[scores_frame['fold'] == fold, col_name]\n",
    "            \n",
    "            # calculate evaluation metric for fold\n",
    "            # with reasonable precision \n",
    "            \n",
    "            if metric_name == 'acc':\n",
    "                row_dict[col_name] = np.round(max_acc(fold_y, fold_scores), ROUND)\n",
    "                \n",
    "            if metric_name == 'auc':\n",
    "                row_dict[col_name] = np.round(roc_auc_score(fold_y, fold_scores), ROUND)\n",
    "                \n",
    "            if metric_name == 'f1':\n",
    "                row_dict[col_name] = np.round(max_f1(fold_y, fold_scores), ROUND) \n",
    "                \n",
    "            if metric_name == 'logloss':\n",
    "                row_dict[col_name] = np.round(log_loss(fold_y, fold_scores), ROUND)\n",
    "                \n",
    "            if metric_name == 'mse':\n",
    "                row_dict[col_name] = np.round(mean_squared_error(fold_y, fold_scores), ROUND)\n",
    "        \n",
    "        # append row values to eval_frame\n",
    "        eval_frame = eval_frame.append(row_dict, ignore_index=True)\n",
    "\n",
    "# init a temporary frame to hold rank information\n",
    "rank_names = [name + '_rank' for name in sorted(eval_frame.columns) if name not in ['fold', 'metric']]\n",
    "rank_frame = pd.DataFrame(columns=rank_names)        \n",
    "\n",
    "# set columns to necessary order\n",
    "eval_frame = eval_frame[['fold', 'metric'] + [name for name in sorted(eval_frame.columns) if name not in ['fold', 'metric']]]\n",
    "\n",
    "# determine score ranks row-by-row\n",
    "for i in range(0, eval_frame.shape[0]):\n",
    "        \n",
    "        # get ranks for row based on metric\n",
    "        metric_name = eval_frame.loc[i, 'metric']\n",
    "        if metric_name in ['logloss', 'mse']:\n",
    "            ranks = eval_frame.iloc[i, 2:].rank().values\n",
    "        else:\n",
    "            ranks = eval_frame.iloc[i, 2:].rank(ascending=False).values\n",
    "        \n",
    "        # create single-row frame and append to rank_frame\n",
    "        row_frame = pd.DataFrame(ranks.reshape(1, ranks.shape[0]), columns=rank_names)\n",
    "        rank_frame = rank_frame.append(row_frame, ignore_index=True)\n",
    "        \n",
    "        # house keeping\n",
    "        del row_frame\n",
    "\n",
    "# merge ranks onto eval_frame\n",
    "eval_frame = pd.concat([eval_frame, rank_frame], axis=1)\n",
    "\n",
    "# house keeping\n",
    "del rank_frame\n",
    "        \n",
    "eval_frame"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "37ed3b5f",
   "metadata": {},
   "source": [
    "#### Save `eval_frame` as CSV"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "id": "aa89d862",
   "metadata": {},
   "outputs": [],
   "source": [
    "eval_frame.to_csv('model_eval_' + str(datetime.datetime.now().strftime(\"%Y_%m_%d_%H_%M_%S\") + '.csv'), \n",
    "                  index=False)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "4525d3ea",
   "metadata": {},
   "source": [
    "#### Display simple ranked score list "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "id": "f8ff5fa5",
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "group2_rem_ebm_rank          2.28\n",
       "group2_rem_ebm2_rank         2.28\n",
       "group5_rem_xgb2_rank         2.74\n",
       "group3_rem_piml_EBM2_rank    4.14\n",
       "group8_rem_ebm_rank          5.74\n",
       "group9_rem_xgb_rank          5.96\n",
       "ph_rem_ebm_rank              5.96\n",
       "group1_rem_ebm_rank          7.46\n",
       "group3_rem_piml_EBM_rank     8.44\n",
       "dtype: float64"
      ]
     },
     "execution_count": 8,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "eval_frame[[name for name in eval_frame.columns if name.endswith('rank')]].mean().sort_values()"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.16"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}