{ "cells": [ { "cell_type": "markdown", "metadata": { "id": "hdOQy8vcIw1l" }, "source": [ "# 4장. 데이터 표현과 특성 공학" ] }, { "cell_type": "markdown", "metadata": { "id": "NlkpirlKIw19" }, "source": [ "*아래 링크를 통해 이 노트북을 주피터 노트북 뷰어(nbviewer.org)로 보거나 구글 코랩(colab.research.google.com)에서 실행할 수 있습니다.*\n", "\n", "
\n", " 주피터 노트북 뷰어로 보기\n", " | \n", "\n", " 구글 코랩(Colab)에서 실행하기\n", " | \n", "
\n", " | age | \n", "workclass | \n", "education | \n", "gender | \n", "hours-per-week | \n", "occupation | \n", "income | \n", "
---|---|---|---|---|---|---|---|
0 | \n", "39 | \n", "State-gov | \n", "Bachelors | \n", "Male | \n", "40 | \n", "Adm-clerical | \n", "<=50K | \n", "
1 | \n", "50 | \n", "Self-emp-not-inc | \n", "Bachelors | \n", "Male | \n", "13 | \n", "Exec-managerial | \n", "<=50K | \n", "
2 | \n", "38 | \n", "Private | \n", "HS-grad | \n", "Male | \n", "40 | \n", "Handlers-cleaners | \n", "<=50K | \n", "
3 | \n", "53 | \n", "Private | \n", "11th | \n", "Male | \n", "40 | \n", "Handlers-cleaners | \n", "<=50K | \n", "
4 | \n", "28 | \n", "Private | \n", "Bachelors | \n", "Female | \n", "40 | \n", "Prof-specialty | \n", "<=50K | \n", "
\n", " | age | \n", "hours-per-week | \n", "workclass_ ? | \n", "workclass_ Federal-gov | \n", "... | \n", "occupation_ Tech-support | \n", "occupation_ Transport-moving | \n", "income_ <=50K | \n", "income_ >50K | \n", "
---|---|---|---|---|---|---|---|---|---|
0 | \n", "39 | \n", "40 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
1 | \n", "50 | \n", "13 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
2 | \n", "38 | \n", "40 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
3 | \n", "53 | \n", "40 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
4 | \n", "28 | \n", "40 | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
5 rows × 46 columns
\n", "\n", " | 숫자 특성 | \n", "범주형 특성 | \n", "
---|---|---|
0 | \n", "0 | \n", "양말 | \n", "
1 | \n", "1 | \n", "여우 | \n", "
2 | \n", "2 | \n", "양말 | \n", "
3 | \n", "1 | \n", "상자 | \n", "
\n", " | 숫자 특성 | \n", "범주형 특성_상자 | \n", "범주형 특성_양말 | \n", "범주형 특성_여우 | \n", "
---|---|---|---|---|
0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
1 | \n", "1 | \n", "0 | \n", "0 | \n", "1 | \n", "
2 | \n", "2 | \n", "0 | \n", "1 | \n", "0 | \n", "
3 | \n", "1 | \n", "1 | \n", "0 | \n", "0 | \n", "
\n", " | 숫자 특성_0 | \n", "숫자 특성_1 | \n", "숫자 특성_2 | \n", "범주형 특성_상자 | \n", "범주형 특성_양말 | \n", "범주형 특성_여우 | \n", "
---|---|---|---|---|---|---|
0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "
1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "
2 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "
3 | \n", "0 | \n", "1 | \n", "0 | \n", "1 | \n", "0 | \n", "0 | \n", "
\n", " | age | \n", "workclass | \n", "education | \n", "gender | \n", "hours-per-week | \n", "occupation | \n", "income | \n", "
---|---|---|---|---|---|---|---|
0 | \n", "39 | \n", "State-gov | \n", "Bachelors | \n", "Male | \n", "40 | \n", "Adm-clerical | \n", "<=50K | \n", "
1 | \n", "50 | \n", "Self-emp-not-inc | \n", "Bachelors | \n", "Male | \n", "13 | \n", "Exec-managerial | \n", "<=50K | \n", "
2 | \n", "38 | \n", "Private | \n", "HS-grad | \n", "Male | \n", "40 | \n", "Handlers-cleaners | \n", "<=50K | \n", "
3 | \n", "53 | \n", "Private | \n", "11th | \n", "Male | \n", "40 | \n", "Handlers-cleaners | \n", "<=50K | \n", "
4 | \n", "28 | \n", "Private | \n", "Bachelors | \n", "Female | \n", "40 | \n", "Prof-specialty | \n", "<=50K | \n", "
OneHotEncoder(sparse_output=False)In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
OneHotEncoder(sparse_output=False)