{ "cells": [ { "cell_type": "code", "execution_count": 3, "id": "3dbfa033", "metadata": {}, "outputs": [], "source": [ "# 라이브러리 로드\n", "import pandas as pd\n", "import matplotlib.pyplot as plt\n", "import seaborn as sns \n", "from imblearn.over_sampling import SMOTE\n", "from imblearn.over_sampling import SVMSMOTE\n", "from sklearn.model_selection import train_test_split\n", "from sklearn.metrics import accuracy_score\n", "from sklearn.metrics import precision_score\n", "from sklearn.metrics import recall_score\n", "from sklearn.metrics import f1_score\n", "from sklearn.metrics import roc_auc_score\n", "from sklearn.metrics import confusion_matrix" ] }, { "cell_type": "code", "execution_count": 4, "id": "065b3362", "metadata": { "scrolled": false }, "outputs": [ { "data": { "text/html": [ "
| \n", " | HeartDisease | \n", "BMI | \n", "Smoking | \n", "AlcoholDrinking | \n", "Stroke | \n", "PhysicalHealth | \n", "MentalHealth | \n", "DiffWalking | \n", "Sex | \n", "AgeCategory | \n", "Race | \n", "Diabetic | \n", "PhysicalActivity | \n", "GenHealth | \n", "SleepTime | \n", "Asthma | \n", "KidneyDisease | \n", "SkinCancer | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "No | \n", "16.60 | \n", "Yes | \n", "No | \n", "No | \n", "3.0 | \n", "30.0 | \n", "No | \n", "Female | \n", "55-59 | \n", "White | \n", "Yes | \n", "Yes | \n", "Very good | \n", "5.0 | \n", "Yes | \n", "No | \n", "Yes | \n", "
| 1 | \n", "No | \n", "20.34 | \n", "No | \n", "No | \n", "Yes | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Female | \n", "80 or older | \n", "White | \n", "No | \n", "Yes | \n", "Very good | \n", "7.0 | \n", "No | \n", "No | \n", "No | \n", "
| 2 | \n", "No | \n", "26.58 | \n", "Yes | \n", "No | \n", "No | \n", "20.0 | \n", "30.0 | \n", "No | \n", "Male | \n", "65-69 | \n", "White | \n", "Yes | \n", "Yes | \n", "Fair | \n", "8.0 | \n", "Yes | \n", "No | \n", "No | \n", "
| 3 | \n", "No | \n", "24.21 | \n", "No | \n", "No | \n", "No | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Female | \n", "75-79 | \n", "White | \n", "No | \n", "No | \n", "Good | \n", "6.0 | \n", "No | \n", "No | \n", "Yes | \n", "
| 4 | \n", "No | \n", "23.71 | \n", "No | \n", "No | \n", "No | \n", "28.0 | \n", "0.0 | \n", "Yes | \n", "Female | \n", "40-44 | \n", "White | \n", "No | \n", "Yes | \n", "Very good | \n", "8.0 | \n", "No | \n", "No | \n", "No | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 319790 | \n", "Yes | \n", "27.41 | \n", "Yes | \n", "No | \n", "No | \n", "7.0 | \n", "0.0 | \n", "Yes | \n", "Male | \n", "60-64 | \n", "Hispanic | \n", "Yes | \n", "No | \n", "Fair | \n", "6.0 | \n", "Yes | \n", "No | \n", "No | \n", "
| 319791 | \n", "No | \n", "29.84 | \n", "Yes | \n", "No | \n", "No | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Male | \n", "35-39 | \n", "Hispanic | \n", "No | \n", "Yes | \n", "Very good | \n", "5.0 | \n", "Yes | \n", "No | \n", "No | \n", "
| 319792 | \n", "No | \n", "24.24 | \n", "No | \n", "No | \n", "No | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Female | \n", "45-49 | \n", "Hispanic | \n", "No | \n", "Yes | \n", "Good | \n", "6.0 | \n", "No | \n", "No | \n", "No | \n", "
| 319793 | \n", "No | \n", "32.81 | \n", "No | \n", "No | \n", "No | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Female | \n", "25-29 | \n", "Hispanic | \n", "No | \n", "No | \n", "Good | \n", "12.0 | \n", "No | \n", "No | \n", "No | \n", "
| 319794 | \n", "No | \n", "46.56 | \n", "No | \n", "No | \n", "No | \n", "0.0 | \n", "0.0 | \n", "No | \n", "Female | \n", "80 or older | \n", "Hispanic | \n", "No | \n", "Yes | \n", "Good | \n", "8.0 | \n", "No | \n", "No | \n", "No | \n", "
301717 rows × 18 columns
\n", "| \n", " | HeartDisease | \n", "BMI | \n", "Smoking | \n", "AlcoholDrinking | \n", "Stroke | \n", "PhysicalHealth | \n", "MentalHealth | \n", "DiffWalking | \n", "Sex | \n", "AgeCategory | \n", "... | \n", "SleepTime | \n", "Asthma | \n", "KidneyDisease | \n", "SkinCancer | \n", "American Indian/Alaskan Native | \n", "Asian | \n", "Black | \n", "Hispanic | \n", "Other | \n", "White | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "0 | \n", "16.60 | \n", "1 | \n", "0 | \n", "0 | \n", "3.0 | \n", "30.0 | \n", "0 | \n", "0 | \n", "55 | \n", "... | \n", "5.0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
| 1 | \n", "0 | \n", "20.34 | \n", "0 | \n", "0 | \n", "1 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0 | \n", "80 | \n", "... | \n", "7.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
| 2 | \n", "0 | \n", "26.58 | \n", "1 | \n", "0 | \n", "0 | \n", "20.0 | \n", "30.0 | \n", "0 | \n", "1 | \n", "65 | \n", "... | \n", "8.0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
| 3 | \n", "0 | \n", "24.21 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0 | \n", "75 | \n", "... | \n", "6.0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
| 4 | \n", "0 | \n", "23.71 | \n", "0 | \n", "0 | \n", "0 | \n", "28.0 | \n", "0.0 | \n", "1 | \n", "0 | \n", "40 | \n", "... | \n", "8.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 319790 | \n", "1 | \n", "27.41 | \n", "1 | \n", "0 | \n", "0 | \n", "7.0 | \n", "0.0 | \n", "1 | \n", "1 | \n", "60 | \n", "... | \n", "6.0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
| 319791 | \n", "0 | \n", "29.84 | \n", "1 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "1 | \n", "35 | \n", "... | \n", "5.0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
| 319792 | \n", "0 | \n", "24.24 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0 | \n", "45 | \n", "... | \n", "6.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
| 319793 | \n", "0 | \n", "32.81 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0 | \n", "25 | \n", "... | \n", "12.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
| 319794 | \n", "0 | \n", "46.56 | \n", "0 | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0 | \n", "80 | \n", "... | \n", "8.0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
301717 rows × 23 columns
\n", "