{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import os, math, subprocess\n",
"import pandas as pd\n",
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"import pandas_profiling\n",
"\n",
"# some settings for displaying Pandas results\n",
"pd.set_option('display.width', 2000)\n",
"pd.set_option('display.max_rows', 500)\n",
"pd.set_option('display.max_columns', 500)\n",
"pd.set_option('display.precision', 4)\n",
"pd.set_option('display.max_colwidth', -1)"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"(307511, 122)\n"
]
},
{
"data": {
"text/html": [
"
\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" SK_ID_CURR | \n",
" TARGET | \n",
" NAME_CONTRACT_TYPE | \n",
" CODE_GENDER | \n",
" FLAG_OWN_CAR | \n",
" FLAG_OWN_REALTY | \n",
" CNT_CHILDREN | \n",
" AMT_INCOME_TOTAL | \n",
" AMT_CREDIT | \n",
" AMT_ANNUITY | \n",
" AMT_GOODS_PRICE | \n",
" NAME_TYPE_SUITE | \n",
" NAME_INCOME_TYPE | \n",
" NAME_EDUCATION_TYPE | \n",
" NAME_FAMILY_STATUS | \n",
" NAME_HOUSING_TYPE | \n",
" REGION_POPULATION_RELATIVE | \n",
" DAYS_BIRTH | \n",
" DAYS_EMPLOYED | \n",
" DAYS_REGISTRATION | \n",
" DAYS_ID_PUBLISH | \n",
" OWN_CAR_AGE | \n",
" FLAG_MOBIL | \n",
" FLAG_EMP_PHONE | \n",
" FLAG_WORK_PHONE | \n",
" FLAG_CONT_MOBILE | \n",
" FLAG_PHONE | \n",
" FLAG_EMAIL | \n",
" OCCUPATION_TYPE | \n",
" CNT_FAM_MEMBERS | \n",
" REGION_RATING_CLIENT | \n",
" REGION_RATING_CLIENT_W_CITY | \n",
" WEEKDAY_APPR_PROCESS_START | \n",
" HOUR_APPR_PROCESS_START | \n",
" REG_REGION_NOT_LIVE_REGION | \n",
" REG_REGION_NOT_WORK_REGION | \n",
" LIVE_REGION_NOT_WORK_REGION | \n",
" REG_CITY_NOT_LIVE_CITY | \n",
" REG_CITY_NOT_WORK_CITY | \n",
" LIVE_CITY_NOT_WORK_CITY | \n",
" ORGANIZATION_TYPE | \n",
" EXT_SOURCE_1 | \n",
" EXT_SOURCE_2 | \n",
" EXT_SOURCE_3 | \n",
" APARTMENTS_AVG | \n",
" BASEMENTAREA_AVG | \n",
" YEARS_BEGINEXPLUATATION_AVG | \n",
" YEARS_BUILD_AVG | \n",
" COMMONAREA_AVG | \n",
" ELEVATORS_AVG | \n",
" ENTRANCES_AVG | \n",
" FLOORSMAX_AVG | \n",
" FLOORSMIN_AVG | \n",
" LANDAREA_AVG | \n",
" LIVINGAPARTMENTS_AVG | \n",
" LIVINGAREA_AVG | \n",
" NONLIVINGAPARTMENTS_AVG | \n",
" NONLIVINGAREA_AVG | \n",
" APARTMENTS_MODE | \n",
" BASEMENTAREA_MODE | \n",
" YEARS_BEGINEXPLUATATION_MODE | \n",
" YEARS_BUILD_MODE | \n",
" COMMONAREA_MODE | \n",
" ELEVATORS_MODE | \n",
" ENTRANCES_MODE | \n",
" FLOORSMAX_MODE | \n",
" FLOORSMIN_MODE | \n",
" LANDAREA_MODE | \n",
" LIVINGAPARTMENTS_MODE | \n",
" LIVINGAREA_MODE | \n",
" NONLIVINGAPARTMENTS_MODE | \n",
" NONLIVINGAREA_MODE | \n",
" APARTMENTS_MEDI | \n",
" BASEMENTAREA_MEDI | \n",
" YEARS_BEGINEXPLUATATION_MEDI | \n",
" YEARS_BUILD_MEDI | \n",
" COMMONAREA_MEDI | \n",
" ELEVATORS_MEDI | \n",
" ENTRANCES_MEDI | \n",
" FLOORSMAX_MEDI | \n",
" FLOORSMIN_MEDI | \n",
" LANDAREA_MEDI | \n",
" LIVINGAPARTMENTS_MEDI | \n",
" LIVINGAREA_MEDI | \n",
" NONLIVINGAPARTMENTS_MEDI | \n",
" NONLIVINGAREA_MEDI | \n",
" FONDKAPREMONT_MODE | \n",
" HOUSETYPE_MODE | \n",
" TOTALAREA_MODE | \n",
" WALLSMATERIAL_MODE | \n",
" EMERGENCYSTATE_MODE | \n",
" OBS_30_CNT_SOCIAL_CIRCLE | \n",
" DEF_30_CNT_SOCIAL_CIRCLE | \n",
" OBS_60_CNT_SOCIAL_CIRCLE | \n",
" DEF_60_CNT_SOCIAL_CIRCLE | \n",
" DAYS_LAST_PHONE_CHANGE | \n",
" FLAG_DOCUMENT_2 | \n",
" FLAG_DOCUMENT_3 | \n",
" FLAG_DOCUMENT_4 | \n",
" FLAG_DOCUMENT_5 | \n",
" FLAG_DOCUMENT_6 | \n",
" FLAG_DOCUMENT_7 | \n",
" FLAG_DOCUMENT_8 | \n",
" FLAG_DOCUMENT_9 | \n",
" FLAG_DOCUMENT_10 | \n",
" FLAG_DOCUMENT_11 | \n",
" FLAG_DOCUMENT_12 | \n",
" FLAG_DOCUMENT_13 | \n",
" FLAG_DOCUMENT_14 | \n",
" FLAG_DOCUMENT_15 | \n",
" FLAG_DOCUMENT_16 | \n",
" FLAG_DOCUMENT_17 | \n",
" FLAG_DOCUMENT_18 | \n",
" FLAG_DOCUMENT_19 | \n",
" FLAG_DOCUMENT_20 | \n",
" FLAG_DOCUMENT_21 | \n",
" AMT_REQ_CREDIT_BUREAU_HOUR | \n",
" AMT_REQ_CREDIT_BUREAU_DAY | \n",
" AMT_REQ_CREDIT_BUREAU_WEEK | \n",
" AMT_REQ_CREDIT_BUREAU_MON | \n",
" AMT_REQ_CREDIT_BUREAU_QRT | \n",
" AMT_REQ_CREDIT_BUREAU_YEAR | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 100002 | \n",
" 1 | \n",
" Cash loans | \n",
" M | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 202500.0 | \n",
" 406597.5 | \n",
" 24700.5 | \n",
" 351000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0188 | \n",
" -9461 | \n",
" -637 | \n",
" -3648.0 | \n",
" -2120 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Laborers | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" WEDNESDAY | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Business Entity Type 3 | \n",
" 0.0830 | \n",
" 0.2629 | \n",
" 0.1394 | \n",
" 0.0247 | \n",
" 0.0369 | \n",
" 0.9722 | \n",
" 0.6192 | \n",
" 0.0143 | \n",
" 0.00 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0369 | \n",
" 0.0202 | \n",
" 0.0190 | \n",
" 0.0000 | \n",
" 0.0000 | \n",
" 0.0252 | \n",
" 0.0383 | \n",
" 0.9722 | \n",
" 0.6341 | \n",
" 0.0144 | \n",
" 0.0000 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0377 | \n",
" 0.022 | \n",
" 0.0198 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0250 | \n",
" 0.0369 | \n",
" 0.9722 | \n",
" 0.6243 | \n",
" 0.0144 | \n",
" 0.00 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0375 | \n",
" 0.0205 | \n",
" 0.0193 | \n",
" 0.0000 | \n",
" 0.00 | \n",
" reg oper account | \n",
" block of flats | \n",
" 0.0149 | \n",
" Stone, brick | \n",
" No | \n",
" 2.0 | \n",
" 2.0 | \n",
" 2.0 | \n",
" 2.0 | \n",
" -1134.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 1.0 | \n",
"
\n",
" \n",
" 1 | \n",
" 100003 | \n",
" 0 | \n",
" Cash loans | \n",
" F | \n",
" N | \n",
" N | \n",
" 0 | \n",
" 270000.0 | \n",
" 1293502.5 | \n",
" 35698.5 | \n",
" 1129500.0 | \n",
" Family | \n",
" State servant | \n",
" Higher education | \n",
" Married | \n",
" House / apartment | \n",
" 0.0035 | \n",
" -16765 | \n",
" -1188 | \n",
" -1186.0 | \n",
" -291 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Core staff | \n",
" 2.0 | \n",
" 1 | \n",
" 1 | \n",
" MONDAY | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" School | \n",
" 0.3113 | \n",
" 0.6222 | \n",
" NaN | \n",
" 0.0959 | \n",
" 0.0529 | \n",
" 0.9851 | \n",
" 0.7960 | \n",
" 0.0605 | \n",
" 0.08 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0130 | \n",
" 0.0773 | \n",
" 0.0549 | \n",
" 0.0039 | \n",
" 0.0098 | \n",
" 0.0924 | \n",
" 0.0538 | \n",
" 0.9851 | \n",
" 0.8040 | \n",
" 0.0497 | \n",
" 0.0806 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0128 | \n",
" 0.079 | \n",
" 0.0554 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0968 | \n",
" 0.0529 | \n",
" 0.9851 | \n",
" 0.7987 | \n",
" 0.0608 | \n",
" 0.08 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0132 | \n",
" 0.0787 | \n",
" 0.0558 | \n",
" 0.0039 | \n",
" 0.01 | \n",
" reg oper account | \n",
" block of flats | \n",
" 0.0714 | \n",
" Block | \n",
" No | \n",
" 1.0 | \n",
" 0.0 | \n",
" 1.0 | \n",
" 0.0 | \n",
" -828.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
" 2 | \n",
" 100004 | \n",
" 0 | \n",
" Revolving loans | \n",
" M | \n",
" Y | \n",
" Y | \n",
" 0 | \n",
" 67500.0 | \n",
" 135000.0 | \n",
" 6750.0 | \n",
" 135000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0100 | \n",
" -19046 | \n",
" -225 | \n",
" -4260.0 | \n",
" -2531 | \n",
" 26.0 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Laborers | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" MONDAY | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Government | \n",
" NaN | \n",
" 0.5559 | \n",
" 0.7296 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" -815.0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
" 3 | \n",
" 100006 | \n",
" 0 | \n",
" Cash loans | \n",
" F | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 135000.0 | \n",
" 312682.5 | \n",
" 29686.5 | \n",
" 297000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Civil marriage | \n",
" House / apartment | \n",
" 0.0080 | \n",
" -19005 | \n",
" -3039 | \n",
" -9833.0 | \n",
" -2437 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" Laborers | \n",
" 2.0 | \n",
" 2 | \n",
" 2 | \n",
" WEDNESDAY | \n",
" 17 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Business Entity Type 3 | \n",
" NaN | \n",
" 0.6504 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 2.0 | \n",
" 0.0 | \n",
" 2.0 | \n",
" 0.0 | \n",
" -617.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
"
\n",
" \n",
" 4 | \n",
" 100007 | \n",
" 0 | \n",
" Cash loans | \n",
" M | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 121500.0 | \n",
" 513000.0 | \n",
" 21865.5 | \n",
" 513000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0287 | \n",
" -19932 | \n",
" -3038 | \n",
" -4311.0 | \n",
" -3458 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" Core staff | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" THURSDAY | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" Religion | \n",
" NaN | \n",
" 0.3227 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" -1106.0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" SK_ID_CURR TARGET NAME_CONTRACT_TYPE CODE_GENDER FLAG_OWN_CAR FLAG_OWN_REALTY CNT_CHILDREN AMT_INCOME_TOTAL AMT_CREDIT AMT_ANNUITY AMT_GOODS_PRICE NAME_TYPE_SUITE NAME_INCOME_TYPE NAME_EDUCATION_TYPE NAME_FAMILY_STATUS NAME_HOUSING_TYPE REGION_POPULATION_RELATIVE DAYS_BIRTH DAYS_EMPLOYED DAYS_REGISTRATION DAYS_ID_PUBLISH OWN_CAR_AGE FLAG_MOBIL FLAG_EMP_PHONE FLAG_WORK_PHONE FLAG_CONT_MOBILE FLAG_PHONE FLAG_EMAIL OCCUPATION_TYPE CNT_FAM_MEMBERS REGION_RATING_CLIENT REGION_RATING_CLIENT_W_CITY WEEKDAY_APPR_PROCESS_START HOUR_APPR_PROCESS_START REG_REGION_NOT_LIVE_REGION REG_REGION_NOT_WORK_REGION LIVE_REGION_NOT_WORK_REGION REG_CITY_NOT_LIVE_CITY REG_CITY_NOT_WORK_CITY LIVE_CITY_NOT_WORK_CITY ORGANIZATION_TYPE EXT_SOURCE_1 EXT_SOURCE_2 EXT_SOURCE_3 APARTMENTS_AVG BASEMENTAREA_AVG YEARS_BEGINEXPLUATATION_AVG YEARS_BUILD_AVG COMMONAREA_AVG ELEVATORS_AVG ENTRANCES_AVG FLOORSMAX_AVG FLOORSMIN_AVG LANDAREA_AVG LIVINGAPARTMENTS_AVG LIVINGAREA_AVG NONLIVINGAPARTMENTS_AVG NONLIVINGAREA_AVG APARTMENTS_MODE BASEMENTAREA_MODE YEARS_BEGINEXPLUATATION_MODE YEARS_BUILD_MODE COMMONAREA_MODE ELEVATORS_MODE ENTRANCES_MODE FLOORSMAX_MODE FLOORSMIN_MODE LANDAREA_MODE LIVINGAPARTMENTS_MODE LIVINGAREA_MODE NONLIVINGAPARTMENTS_MODE NONLIVINGAREA_MODE APARTMENTS_MEDI BASEMENTAREA_MEDI YEARS_BEGINEXPLUATATION_MEDI YEARS_BUILD_MEDI COMMONAREA_MEDI ELEVATORS_MEDI ENTRANCES_MEDI FLOORSMAX_MEDI FLOORSMIN_MEDI LANDAREA_MEDI LIVINGAPARTMENTS_MEDI LIVINGAREA_MEDI NONLIVINGAPARTMENTS_MEDI NONLIVINGAREA_MEDI FONDKAPREMONT_MODE HOUSETYPE_MODE TOTALAREA_MODE WALLSMATERIAL_MODE EMERGENCYSTATE_MODE OBS_30_CNT_SOCIAL_CIRCLE DEF_30_CNT_SOCIAL_CIRCLE OBS_60_CNT_SOCIAL_CIRCLE DEF_60_CNT_SOCIAL_CIRCLE DAYS_LAST_PHONE_CHANGE FLAG_DOCUMENT_2 FLAG_DOCUMENT_3 FLAG_DOCUMENT_4 FLAG_DOCUMENT_5 FLAG_DOCUMENT_6 FLAG_DOCUMENT_7 FLAG_DOCUMENT_8 FLAG_DOCUMENT_9 FLAG_DOCUMENT_10 FLAG_DOCUMENT_11 \\\n",
"0 100002 1 Cash loans M N Y 0 202500.0 406597.5 24700.5 351000.0 Unaccompanied Working Secondary / secondary special Single / not married House / apartment 0.0188 -9461 -637 -3648.0 -2120 NaN 1 1 0 1 1 0 Laborers 1.0 2 2 WEDNESDAY 10 0 0 0 0 0 0 Business Entity Type 3 0.0830 0.2629 0.1394 0.0247 0.0369 0.9722 0.6192 0.0143 0.00 0.0690 0.0833 0.1250 0.0369 0.0202 0.0190 0.0000 0.0000 0.0252 0.0383 0.9722 0.6341 0.0144 0.0000 0.0690 0.0833 0.1250 0.0377 0.022 0.0198 0.0 0.0 0.0250 0.0369 0.9722 0.6243 0.0144 0.00 0.0690 0.0833 0.1250 0.0375 0.0205 0.0193 0.0000 0.00 reg oper account block of flats 0.0149 Stone, brick No 2.0 2.0 2.0 2.0 -1134.0 0 1 0 0 0 0 0 0 0 0 \n",
"1 100003 0 Cash loans F N N 0 270000.0 1293502.5 35698.5 1129500.0 Family State servant Higher education Married House / apartment 0.0035 -16765 -1188 -1186.0 -291 NaN 1 1 0 1 1 0 Core staff 2.0 1 1 MONDAY 11 0 0 0 0 0 0 School 0.3113 0.6222 NaN 0.0959 0.0529 0.9851 0.7960 0.0605 0.08 0.0345 0.2917 0.3333 0.0130 0.0773 0.0549 0.0039 0.0098 0.0924 0.0538 0.9851 0.8040 0.0497 0.0806 0.0345 0.2917 0.3333 0.0128 0.079 0.0554 0.0 0.0 0.0968 0.0529 0.9851 0.7987 0.0608 0.08 0.0345 0.2917 0.3333 0.0132 0.0787 0.0558 0.0039 0.01 reg oper account block of flats 0.0714 Block No 1.0 0.0 1.0 0.0 -828.0 0 1 0 0 0 0 0 0 0 0 \n",
"2 100004 0 Revolving loans M Y Y 0 67500.0 135000.0 6750.0 135000.0 Unaccompanied Working Secondary / secondary special Single / not married House / apartment 0.0100 -19046 -225 -4260.0 -2531 26.0 1 1 1 1 1 0 Laborers 1.0 2 2 MONDAY 9 0 0 0 0 0 0 Government NaN 0.5559 0.7296 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 0.0 0.0 0.0 0.0 -815.0 0 0 0 0 0 0 0 0 0 0 \n",
"3 100006 0 Cash loans F N Y 0 135000.0 312682.5 29686.5 297000.0 Unaccompanied Working Secondary / secondary special Civil marriage House / apartment 0.0080 -19005 -3039 -9833.0 -2437 NaN 1 1 0 1 0 0 Laborers 2.0 2 2 WEDNESDAY 17 0 0 0 0 0 0 Business Entity Type 3 NaN 0.6504 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 2.0 0.0 2.0 0.0 -617.0 0 1 0 0 0 0 0 0 0 0 \n",
"4 100007 0 Cash loans M N Y 0 121500.0 513000.0 21865.5 513000.0 Unaccompanied Working Secondary / secondary special Single / not married House / apartment 0.0287 -19932 -3038 -4311.0 -3458 NaN 1 1 0 1 0 0 Core staff 1.0 2 2 THURSDAY 11 0 0 0 0 1 1 Religion NaN 0.3227 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 0.0 0.0 0.0 0.0 -1106.0 0 0 0 0 0 0 1 0 0 0 \n",
"\n",
" FLAG_DOCUMENT_12 FLAG_DOCUMENT_13 FLAG_DOCUMENT_14 FLAG_DOCUMENT_15 FLAG_DOCUMENT_16 FLAG_DOCUMENT_17 FLAG_DOCUMENT_18 FLAG_DOCUMENT_19 FLAG_DOCUMENT_20 FLAG_DOCUMENT_21 AMT_REQ_CREDIT_BUREAU_HOUR AMT_REQ_CREDIT_BUREAU_DAY AMT_REQ_CREDIT_BUREAU_WEEK AMT_REQ_CREDIT_BUREAU_MON AMT_REQ_CREDIT_BUREAU_QRT AMT_REQ_CREDIT_BUREAU_YEAR \n",
"0 0 0 0 0 0 0 0 0 0 0 0.0 0.0 0.0 0.0 0.0 1.0 \n",
"1 0 0 0 0 0 0 0 0 0 0 0.0 0.0 0.0 0.0 0.0 0.0 \n",
"2 0 0 0 0 0 0 0 0 0 0 0.0 0.0 0.0 0.0 0.0 0.0 \n",
"3 0 0 0 0 0 0 0 0 0 0 NaN NaN NaN NaN NaN NaN \n",
"4 0 0 0 0 0 0 0 0 0 0 0.0 0.0 0.0 0.0 0.0 0.0 "
]
},
"execution_count": 2,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# load data\n",
"pdf_data = pd.read_csv(\"data/application_train.csv\")\n",
"print(pdf_data.shape)\n",
"pdf_data.head()"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {
"scrolled": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"CPU times: user 4min 2s, sys: 7.74 s, total: 4min 9s\n",
"Wall time: 2min 59s\n"
]
},
{
"data": {
"text/html": [
"\n",
"\n",
"\n",
"\n",
"\n",
"
\n",
"
Overview
\n",
" \n",
"
\n",
"
\n",
"
Dataset info
\n",
"
\n",
" \n",
" \n",
" Number of variables | \n",
" 122 | \n",
"
\n",
" \n",
" Number of observations | \n",
" 307511 | \n",
"
\n",
" \n",
" Total Missing (%) | \n",
" 9.6% | \n",
"
\n",
" \n",
" Total size in memory | \n",
" 286.2 MiB | \n",
"
\n",
" \n",
" Average record size in memory | \n",
" 976.0 B | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
Variables types
\n",
"
\n",
" \n",
" \n",
" Numeric | \n",
" 39 | \n",
"
\n",
" \n",
" Categorical | \n",
" 16 | \n",
"
\n",
" \n",
" Boolean | \n",
" 33 | \n",
"
\n",
" \n",
" Date | \n",
" 0 | \n",
"
\n",
" \n",
" Text (Unique) | \n",
" 0 | \n",
"
\n",
" \n",
" Rejected | \n",
" 34 | \n",
"
\n",
" \n",
" Unsupported | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
"
Warnings
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Variables
\n",
" \n",
"
\n",
"
\n",
"
AMT_ANNUITY
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 13673 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 4.4% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 12 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 27109 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1615.5 | \n",
"
\n",
" \n",
" Maximum | \n",
" 258030 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1615.5 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 9000 | \n",
"
\n",
" \n",
" Q1 | \n",
" 16524 | \n",
"
\n",
" \n",
" Median | \n",
" 24903 | \n",
"
\n",
" \n",
" Q3 | \n",
" 34596 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 53325 | \n",
"
\n",
" \n",
" Maximum | \n",
" 258030 | \n",
"
\n",
" \n",
" Range | \n",
" 256410 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 18072 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 14494 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.53466 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 7.7073 | \n",
"
\n",
" \n",
" Mean | \n",
" 27109 | \n",
"
\n",
" \n",
" MAD | \n",
" 10975 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.5798 | \n",
"
\n",
" \n",
" Sum | \n",
" 8335900000 | \n",
"
\n",
" \n",
" Variance | \n",
" 210070000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 9000.0 | \n",
" 6385 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 13500.0 | \n",
" 5514 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6750.0 | \n",
" 2279 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10125.0 | \n",
" 2035 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 37800.0 | \n",
" 1602 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 11250.0 | \n",
" 1459 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 26217.0 | \n",
" 1453 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 20250.0 | \n",
" 1345 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 12375.0 | \n",
" 1339 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 31653.0 | \n",
" 1269 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (13662) | \n",
" 282819 | \n",
" 92.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1615.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1980.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1993.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2052.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2164.5 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 216589.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 220297.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 225000.0 | \n",
" 23 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 230161.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 258025.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_CREDIT
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 5603 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.8% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 599030 | \n",
"
\n",
" \n",
" Minimum | \n",
" 45000 | \n",
"
\n",
" \n",
" Maximum | \n",
" 4050000 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 45000 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 135000 | \n",
"
\n",
" \n",
" Q1 | \n",
" 270000 | \n",
"
\n",
" \n",
" Median | \n",
" 513530 | \n",
"
\n",
" \n",
" Q3 | \n",
" 808650 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 1350000 | \n",
"
\n",
" \n",
" Maximum | \n",
" 4050000 | \n",
"
\n",
" \n",
" Range | \n",
" 4005000 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 538650 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 402490 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.67191 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 1.934 | \n",
"
\n",
" \n",
" Mean | \n",
" 599030 | \n",
"
\n",
" \n",
" MAD | \n",
" 316580 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.2348 | \n",
"
\n",
" \n",
" Sum | \n",
" 184210000000 | \n",
"
\n",
" \n",
" Variance | \n",
" 162000000000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 450000.0 | \n",
" 9709 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 675000.0 | \n",
" 8877 | \n",
" 2.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 225000.0 | \n",
" 8162 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 180000.0 | \n",
" 7342 | \n",
" 2.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 270000.0 | \n",
" 7241 | \n",
" 2.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 900000.0 | \n",
" 6246 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 254700.0 | \n",
" 4500 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 545040.0 | \n",
" 4437 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 808650.0 | \n",
" 4152 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 135000.0 | \n",
" 3660 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (5593) | \n",
" 243185 | \n",
" 79.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 45000.0 | \n",
" 230 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 47970.0 | \n",
" 218 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48519.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 49455.0 | \n",
" 19 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 49500.0 | \n",
" 40 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3860019.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3956274.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4027680.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4031032.5 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4050000.0 | \n",
" 8 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_GOODS_PRICE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with AMT_CREDIT
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98697 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_INCOME_TOTAL
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2548 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.8% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 168800 | \n",
"
\n",
" \n",
" Minimum | \n",
" 25650 | \n",
"
\n",
" \n",
" Maximum | \n",
" 117000000 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 25650 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 67500 | \n",
"
\n",
" \n",
" Q1 | \n",
" 112500 | \n",
"
\n",
" \n",
" Median | \n",
" 147150 | \n",
"
\n",
" \n",
" Q3 | \n",
" 202500 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 337500 | \n",
"
\n",
" \n",
" Maximum | \n",
" 117000000 | \n",
"
\n",
" \n",
" Range | \n",
" 116970000 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 90000 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 237120 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.4048 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 191790 | \n",
"
\n",
" \n",
" Mean | \n",
" 168800 | \n",
"
\n",
" \n",
" MAD | \n",
" 66226 | \n",
"
\n",
" \n",
" Skewness | \n",
" 391.56 | \n",
"
\n",
" \n",
" Sum | \n",
" 51907000000 | \n",
"
\n",
" \n",
" Variance | \n",
" 56227000000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 135000.0 | \n",
" 35750 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 112500.0 | \n",
" 31019 | \n",
" 10.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 157500.0 | \n",
" 26556 | \n",
" 8.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 180000.0 | \n",
" 24719 | \n",
" 8.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 90000.0 | \n",
" 22483 | \n",
" 7.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 225000.0 | \n",
" 20698 | \n",
" 6.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 202500.0 | \n",
" 16341 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 67500.0 | \n",
" 11147 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 270000.0 | \n",
" 10827 | \n",
" 3.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 81000.0 | \n",
" 6001 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (2538) | \n",
" 101970 | \n",
" 33.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 25650.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 26100.0 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 26460.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 26550.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 27000.0 | \n",
" 66 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 6750000.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9000000.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 13500000.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 18000090.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 117000000.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_DAY
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 10 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.0070002 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 9 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 86.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 9 | \n",
"
\n",
" \n",
" Range | \n",
" 9 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.11076 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 15.822 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 1151.9 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.0070002 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.013922 | \n",
"
\n",
" \n",
" Skewness | \n",
" 27.044 | \n",
"
\n",
" \n",
" Sum | \n",
" 1862 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.012267 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 264503 | \n",
" 86.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 1292 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 106 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 45 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 26 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 8 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 264503 | \n",
" 86.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 1292 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 106 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 45 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 26 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 4.0 | \n",
" 26 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 8 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_HOUR
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.0064024 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 4 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 86.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 4 | \n",
"
\n",
" \n",
" Range | \n",
" 4 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.083849 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 13.096 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 254.24 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.0064024 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.012727 | \n",
"
\n",
" \n",
" Skewness | \n",
" 14.534 | \n",
"
\n",
" \n",
" Sum | \n",
" 1703 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0070307 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 264366 | \n",
" 86.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 1560 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 56 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 264366 | \n",
" 86.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 1560 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 56 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 264366 | \n",
" 86.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 1560 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 56 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_MON
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 25 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.2674 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 27 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 72.3% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 27 | \n",
"
\n",
" \n",
" Range | \n",
" 27 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.916 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 3.4256 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 90.435 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.2674 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.44681 | \n",
"
\n",
" \n",
" Skewness | \n",
" 7.8048 | \n",
"
\n",
" \n",
" Sum | \n",
" 71125 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.83906 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 222233 | \n",
" 72.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 33147 | \n",
" 10.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5386 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1991 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 1076 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 602 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 343 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 298 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 206 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 185 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (14) | \n",
" 525 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 222233 | \n",
" 72.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 33147 | \n",
" 10.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5386 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1991 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 1076 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 19.0 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 27.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_QRT
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 12 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.26547 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 261 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 70.1% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 2 | \n",
"
\n",
" \n",
" Maximum | \n",
" 261 | \n",
"
\n",
" \n",
" Range | \n",
" 261 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.79406 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 2.9911 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 43707 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.26547 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.43 | \n",
"
\n",
" \n",
" Skewness | \n",
" 134.37 | \n",
"
\n",
" \n",
" Sum | \n",
" 70614 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.63052 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 215417 | \n",
" 70.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 33862 | \n",
" 11.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 14412 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1717 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 476 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 64 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 28 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 215417 | \n",
" 70.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 33862 | \n",
" 11.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 14412 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1717 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 476 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 6.0 | \n",
" 28 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 261.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_WEEK
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 10 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.034362 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 8 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 83.7% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 8 | \n",
"
\n",
" \n",
" Range | \n",
" 8 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.20468 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 5.9567 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 166.75 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.034362 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.066518 | \n",
"
\n",
" \n",
" Skewness | \n",
" 9.2936 | \n",
"
\n",
" \n",
" Sum | \n",
" 9140 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.041896 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 257456 | \n",
" 83.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 8208 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 199 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 58 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 34 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 257456 | \n",
" 83.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 8208 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 199 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 58 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 34 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 4.0 | \n",
" 34 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
AMT_REQ_CREDIT_BUREAU_YEAR
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 26 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 13.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 41519 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 1.9 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 25 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 23.3% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 1 | \n",
"
\n",
" \n",
" Q3 | \n",
" 3 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 6 | \n",
"
\n",
" \n",
" Maximum | \n",
" 25 | \n",
"
\n",
" \n",
" Range | \n",
" 25 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 3 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 1.8693 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.98385 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 1.969 | \n",
"
\n",
" \n",
" Mean | \n",
" 1.9 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.4548 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.2436 | \n",
"
\n",
" \n",
" Sum | \n",
" 505380 | \n",
"
\n",
" \n",
" Variance | \n",
" 3.4943 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 71801 | \n",
" 23.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 63405 | \n",
" 20.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 50192 | \n",
" 16.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 33628 | \n",
" 10.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 20714 | \n",
" 6.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 12052 | \n",
" 3.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 6967 | \n",
" 2.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 3869 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 2127 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 1096 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (15) | \n",
" 141 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 41519 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 71801 | \n",
" 23.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 63405 | \n",
" 20.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 50192 | \n",
" 16.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 33628 | \n",
" 10.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 20714 | \n",
" 6.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 20.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 25.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
APARTMENTS_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2340 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.8% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 50.7% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 156061 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.11744 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.2% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.0082 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.0577 | \n",
"
\n",
" \n",
" Median | \n",
" 0.0876 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.1485 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.3268 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0908 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.10824 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.92166 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 11.394 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.11744 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.073286 | \n",
"
\n",
" \n",
" Skewness | \n",
" 2.6418 | \n",
"
\n",
" \n",
" Sum | \n",
" 17786 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.011716 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0825 | \n",
" 6663 | \n",
" 2.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0619 | \n",
" 6332 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0928 | \n",
" 4404 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0722 | \n",
" 3986 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0082 | \n",
" 3507 | \n",
" 1.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0165 | \n",
" 3027 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1031 | \n",
" 2892 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1485 | \n",
" 2769 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0124 | \n",
" 2721 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0742 | \n",
" 2231 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (2329) | \n",
" 112918 | \n",
" 36.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 156061 | \n",
" 50.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 751 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.001 | \n",
" 197 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0014 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0015 | \n",
" 6 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0017 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9814 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9876 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9897 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9907 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 147 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
APARTMENTS_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with LIVINGAPARTMENTS_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.93217 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
APARTMENTS_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with LIVINGAPARTMENTS_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.90828 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
BASEMENTAREA_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3781 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.2% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 58.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 179943 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.088442 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 4.8% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.0442 | \n",
"
\n",
" \n",
" Median | \n",
" 0.0763 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.1122 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.2237 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.068 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.082438 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.93211 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 25.93 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.088442 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.052361 | \n",
"
\n",
" \n",
" Skewness | \n",
" 3.5663 | \n",
"
\n",
" \n",
" Sum | \n",
" 11282 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0067961 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 14745 | \n",
" 4.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0545 | \n",
" 251 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0818 | \n",
" 251 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0727 | \n",
" 248 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1091 | \n",
" 246 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0796 | \n",
" 245 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.08 | \n",
" 239 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0805 | \n",
" 230 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0764 | \n",
" 220 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0793 | \n",
" 211 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (3770) | \n",
" 110682 | \n",
" 36.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 179943 | \n",
" 58.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 14745 | \n",
" 4.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0001 | \n",
" 99 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0002 | \n",
" 38 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0003 | \n",
" 8 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 33 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9677 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9682 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9694 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9945 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 130 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
BASEMENTAREA_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with BASEMENTAREA_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97794 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
BASEMENTAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with BASEMENTAREA_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.9735 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
CNT_CHILDREN
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 15 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.41705 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 19 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 70.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 1 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 2 | \n",
"
\n",
" \n",
" Maximum | \n",
" 19 | \n",
"
\n",
" \n",
" Range | \n",
" 19 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 1 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.72212 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.7315 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 7.9041 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.41705 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.58418 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.9746 | \n",
"
\n",
" \n",
" Sum | \n",
" 128248 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.52146 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 215371 | \n",
" 70.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 61119 | \n",
" 19.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 26749 | \n",
" 8.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 3717 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 429 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 84 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 21 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 14 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (5) | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 215371 | \n",
" 70.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 61119 | \n",
" 19.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 26749 | \n",
" 8.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 3717 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 429 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 10 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 11 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 12 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 14 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
CNT_FAM_MEMBERS
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 18 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 2 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 2.1527 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 20 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 2 | \n",
"
\n",
" \n",
" Median | \n",
" 2 | \n",
"
\n",
" \n",
" Q3 | \n",
" 3 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 4 | \n",
"
\n",
" \n",
" Maximum | \n",
" 20 | \n",
"
\n",
" \n",
" Range | \n",
" 19 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 1 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.91068 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.42305 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 2.802 | \n",
"
\n",
" \n",
" Mean | \n",
" 2.1527 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.66587 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.98754 | \n",
"
\n",
" \n",
" Sum | \n",
" 661960 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.82934 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 2.0 | \n",
" 158357 | \n",
" 51.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 67847 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 52601 | \n",
" 17.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 24697 | \n",
" 8.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 3478 | \n",
" 1.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 408 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 81 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 6 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10.0 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (7) | \n",
" 11 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1.0 | \n",
" 67847 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 158357 | \n",
" 51.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 52601 | \n",
" 17.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 24697 | \n",
" 8.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 3478 | \n",
" 1.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 13.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 14.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 15.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 16.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 20.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
CODE_GENDER
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" F | \n",
" \n",
" \n",
" 202448\n",
" \n",
" \n",
" | \n",
"
\n",
" M | \n",
" \n",
" \n",
" 105059\n",
" \n",
" \n",
" | \n",
"
\n",
" XNA | \n",
" \n",
" \n",
" \n",
" \n",
" 4\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" F | \n",
" 202448 | \n",
" 65.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" M | \n",
" 105059 | \n",
" 34.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" XNA | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
COMMONAREA_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3182 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 69.9% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 214865 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.044621 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 2.7% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.0078 | \n",
"
\n",
" \n",
" Median | \n",
" 0.0211 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.0515 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.1601 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0437 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.076036 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.704 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 45.988 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.044621 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.042024 | \n",
"
\n",
" \n",
" Skewness | \n",
" 5.4573 | \n",
"
\n",
" \n",
" Sum | \n",
" 4133.9 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0057814 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 8442 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0079 | \n",
" 544 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0078 | \n",
" 475 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.008 | \n",
" 446 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0077 | \n",
" 414 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0086 | \n",
" 365 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0014 | \n",
" 345 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.006999999999999999 | \n",
" 343 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0013 | \n",
" 317 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0069 | \n",
" 314 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (3171) | \n",
" 80641 | \n",
" 26.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 214865 | \n",
" 69.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 8442 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0001 | \n",
" 45 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0002 | \n",
" 67 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0003 | \n",
" 84 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 62 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9601 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9833 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9906 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9937 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 92 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
COMMONAREA_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with COMMONAREA_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97989 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
COMMONAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with COMMONAREA_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97715 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DAYS_BIRTH
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 17460 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 5.7% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" -16037 | \n",
"
\n",
" \n",
" Minimum | \n",
" -25229 | \n",
"
\n",
" \n",
" Maximum | \n",
" -7489 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" -25229 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" -23204 | \n",
"
\n",
" \n",
" Q1 | \n",
" -19682 | \n",
"
\n",
" \n",
" Median | \n",
" -15750 | \n",
"
\n",
" \n",
" Q3 | \n",
" -12413 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" -9407 | \n",
"
\n",
" \n",
" Maximum | \n",
" -7489 | \n",
"
\n",
" \n",
" Range | \n",
" 17740 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 7269 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 4364 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" -0.27212 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.0491 | \n",
"
\n",
" \n",
" Mean | \n",
" -16037 | \n",
"
\n",
" \n",
" MAD | \n",
" 3728.4 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.11567 | \n",
"
\n",
" \n",
" Sum | \n",
" -4931552390 | \n",
"
\n",
" \n",
" Variance | \n",
" 19044000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -13749 | \n",
" 43 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -13481 | \n",
" 42 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -18248 | \n",
" 41 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -10020 | \n",
" 41 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -15771 | \n",
" 40 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -10292 | \n",
" 40 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -14395 | \n",
" 39 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -14267 | \n",
" 39 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -13263 | \n",
" 39 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -11664 | \n",
" 39 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (17450) | \n",
" 307108 | \n",
" 99.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -25229 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -25201 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -25200 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -25197 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -25196 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -7679 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7678 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7676 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7673 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7489 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DAYS_EMPLOYED
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 12574 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 4.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 63815 | \n",
"
\n",
" \n",
" Minimum | \n",
" -17912 | \n",
"
\n",
" \n",
" Maximum | \n",
" 365243 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" -17912 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" -6742.5 | \n",
"
\n",
" \n",
" Q1 | \n",
" -2760 | \n",
"
\n",
" \n",
" Median | \n",
" -1213 | \n",
"
\n",
" \n",
" Q3 | \n",
" -289 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 365240 | \n",
"
\n",
" \n",
" Maximum | \n",
" 365243 | \n",
"
\n",
" \n",
" Range | \n",
" 383155 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 2471 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 141280 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 2.2138 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 0.77161 | \n",
"
\n",
" \n",
" Mean | \n",
" 63815 | \n",
"
\n",
" \n",
" MAD | \n",
" 108560 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.6643 | \n",
"
\n",
" \n",
" Sum | \n",
" 19623828581 | \n",
"
\n",
" \n",
" Variance | \n",
" 19959000000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 365243 | \n",
" 55374 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -200 | \n",
" 156 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -224 | \n",
" 152 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -199 | \n",
" 151 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -230 | \n",
" 151 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -212 | \n",
" 150 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -229 | \n",
" 143 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -384 | \n",
" 143 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -231 | \n",
" 140 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -215 | \n",
" 138 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (12564) | \n",
" 250813 | \n",
" 81.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -17912 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -17583 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -17546 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -17531 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -17522 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -3 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -1 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 365243 | \n",
" 55374 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DAYS_ID_PUBLISH
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6168 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 2.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" -2994.2 | \n",
"
\n",
" \n",
" Minimum | \n",
" -7197 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" -7197 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" -4944 | \n",
"
\n",
" \n",
" Q1 | \n",
" -4299 | \n",
"
\n",
" \n",
" Median | \n",
" -3254 | \n",
"
\n",
" \n",
" Q3 | \n",
" -1720 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" -375 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Range | \n",
" 7197 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 2579 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 1509.5 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" -0.50412 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.1068 | \n",
"
\n",
" \n",
" Mean | \n",
" -2994.2 | \n",
"
\n",
" \n",
" MAD | \n",
" 1316.2 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.34933 | \n",
"
\n",
" \n",
" Sum | \n",
" -920750166 | \n",
"
\n",
" \n",
" Variance | \n",
" 2278400 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -4053 | \n",
" 169 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4095 | \n",
" 162 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4046 | \n",
" 161 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4417 | \n",
" 159 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4256 | \n",
" 158 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4151 | \n",
" 157 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4032 | \n",
" 157 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4200 | \n",
" 156 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4214 | \n",
" 155 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4171 | \n",
" 155 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (6158) | \n",
" 305922 | \n",
" 99.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -7197 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6551 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6383 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6337 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6274 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -4 | \n",
" 57 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -3 | \n",
" 51 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2 | \n",
" 50 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -1 | \n",
" 64 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 16 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DAYS_LAST_PHONE_CHANGE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3774 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.2% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" -962.86 | \n",
"
\n",
" \n",
" Minimum | \n",
" -4292 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 12.3% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" -4292 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" -2522 | \n",
"
\n",
" \n",
" Q1 | \n",
" -1570 | \n",
"
\n",
" \n",
" Median | \n",
" -757 | \n",
"
\n",
" \n",
" Q3 | \n",
" -274 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Range | \n",
" 4292 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 1296 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 826.81 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" -0.8587 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.30858 | \n",
"
\n",
" \n",
" Mean | \n",
" -962.86 | \n",
"
\n",
" \n",
" MAD | \n",
" 696.28 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.71361 | \n",
"
\n",
" \n",
" Sum | \n",
" -296090000 | \n",
"
\n",
" \n",
" Variance | \n",
" 683610 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 37672 | \n",
" 12.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -1.0 | \n",
" 2812 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2.0 | \n",
" 2318 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -3.0 | \n",
" 1763 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4.0 | \n",
" 1285 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -5.0 | \n",
" 824 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6.0 | \n",
" 537 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7.0 | \n",
" 442 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -8.0 | \n",
" 278 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -476.0 | \n",
" 222 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (3763) | \n",
" 259357 | \n",
" 84.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -4292.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4185.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4173.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4153.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4131.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -4.0 | \n",
" 1285 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -3.0 | \n",
" 1763 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2.0 | \n",
" 2318 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -1.0 | \n",
" 2812 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 37672 | \n",
" 12.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DAYS_REGISTRATION
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 15688 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 5.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" -4986.1 | \n",
"
\n",
" \n",
" Minimum | \n",
" -24672 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" -24672 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" -11416 | \n",
"
\n",
" \n",
" Q1 | \n",
" -7479.5 | \n",
"
\n",
" \n",
" Median | \n",
" -4504 | \n",
"
\n",
" \n",
" Q3 | \n",
" -2010 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" -330 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0 | \n",
"
\n",
" \n",
" Range | \n",
" 24672 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 5469.5 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 3522.9 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" -0.70654 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.32135 | \n",
"
\n",
" \n",
" Mean | \n",
" -4986.1 | \n",
"
\n",
" \n",
" MAD | \n",
" 2915.4 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.59087 | \n",
"
\n",
" \n",
" Sum | \n",
" -1533300000 | \n",
"
\n",
" \n",
" Variance | \n",
" 12411000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -1.0 | \n",
" 113 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -7.0 | \n",
" 98 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -6.0 | \n",
" 96 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2.0 | \n",
" 92 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -4.0 | \n",
" 92 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -5.0 | \n",
" 86 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -9.0 | \n",
" 84 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -3.0 | \n",
" 84 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 80 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -21.0 | \n",
" 80 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (15678) | \n",
" 306606 | \n",
" 99.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -24672.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -23738.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -23416.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -22928.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -22858.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" -4.0 | \n",
" 92 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -3.0 | \n",
" 84 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -2.0 | \n",
" 92 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" -1.0 | \n",
" 113 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 80 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DEF_30_CNT_SOCIAL_CIRCLE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 11 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1021 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.14342 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 34 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 88.2% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 34 | \n",
"
\n",
" \n",
" Range | \n",
" 34 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.4467 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 3.1146 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 126.31 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.14342 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.25393 | \n",
"
\n",
" \n",
" Skewness | \n",
" 5.1835 | \n",
"
\n",
" \n",
" Sum | \n",
" 43957 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.19954 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 271324 | \n",
" 88.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 28328 | \n",
" 9.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5323 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1192 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 253 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 56 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 11 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 1021 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 271324 | \n",
" 88.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 28328 | \n",
" 9.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5323 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 1192 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 253 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 5.0 | \n",
" 56 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 11 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
DEF_60_CNT_SOCIAL_CIRCLE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 10 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1021 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.10005 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 24 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 91.3% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 24 | \n",
"
\n",
" \n",
" Range | \n",
" 24 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.36229 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 3.6211 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 86.563 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.10005 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.18327 | \n",
"
\n",
" \n",
" Skewness | \n",
" 5.2779 | \n",
"
\n",
" \n",
" Sum | \n",
" 30664 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.13125 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 280721 | \n",
" 91.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 21841 | \n",
" 7.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3170 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 598 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 135 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 1021 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 280721 | \n",
" 91.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 21841 | \n",
" 7.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3170 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 598 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 135 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 4.0 | \n",
" 135 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ELEVATORS_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 258 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 53.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 163891 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.078942 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 27.9% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.12 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.36 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.12 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.13458 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.7048 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 7.8694 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.078942 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.09788 | \n",
"
\n",
" \n",
" Skewness | \n",
" 2.4394 | \n",
"
\n",
" \n",
" Sum | \n",
" 11338 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.018111 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 85718 | \n",
" 27.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.08 | \n",
" 9886 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.16 | \n",
" 8806 | \n",
" 2.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.24 | \n",
" 6071 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.12 | \n",
" 5593 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.04 | \n",
" 4585 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2 | \n",
" 4072 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.32 | \n",
" 2788 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.28 | \n",
" 2272 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.4 | \n",
" 1532 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (247) | \n",
" 12297 | \n",
" 4.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 163891 | \n",
" 53.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 85718 | \n",
" 27.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.002 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0024 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0048 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0064 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9 | \n",
" 6 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.92 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9332 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.96 | \n",
" 81 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 158 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ELEVATORS_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with ELEVATORS_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98283 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ELEVATORS_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with ELEVATORS_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97884 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
EMERGENCYSTATE_MODE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 47.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 145755 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" No | \n",
" \n",
" \n",
" 159428\n",
" \n",
" \n",
" | \n",
"
\n",
" Yes | \n",
" \n",
" \n",
" \n",
" \n",
" 2328\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" 145755\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" No | \n",
" 159428 | \n",
" 51.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Yes | \n",
" 2328 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 145755 | \n",
" 47.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ENTRANCES_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 286 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 50.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 154828 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.14972 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.1% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.0345 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.069 | \n",
"
\n",
" \n",
" Median | \n",
" 0.1379 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.2069 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.3103 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.1379 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.10005 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.66822 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 11.593 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.14972 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.069965 | \n",
"
\n",
" \n",
" Skewness | \n",
" 2.3997 | \n",
"
\n",
" \n",
" Sum | \n",
" 22860 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.01001 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.1379 | \n",
" 34007 | \n",
" 11.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.069 | \n",
" 22956 | \n",
" 7.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1034 | \n",
" 19533 | \n",
" 6.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2069 | \n",
" 19062 | \n",
" 6.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0345 | \n",
" 15380 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1724 | \n",
" 9185 | \n",
" 3.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2759 | \n",
" 7895 | \n",
" 2.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2414 | \n",
" 4165 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.3448 | \n",
" 2066 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.3103 | \n",
" 2049 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (275) | \n",
" 16385 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 154828 | \n",
" 50.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 323 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0055 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0086 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0114 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0172 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.8621 | \n",
" 14 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8966 | \n",
" 52 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9309999999999999 | \n",
" 21 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9655 | \n",
" 25 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 153 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ENTRANCES_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with ENTRANCES_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98068 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ENTRANCES_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with ENTRANCES_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97774 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
EXT_SOURCE_1
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 114585 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 37.3% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 56.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 173378 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.50213 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0.014568 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.96269 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0.014568 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.15802 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.33401 | \n",
"
\n",
" \n",
" Median | \n",
" 0.506 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.67505 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.83226 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.96269 | \n",
"
\n",
" \n",
" Range | \n",
" 0.94812 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.34105 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.21106 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.42033 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.96516 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.50213 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.17916 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.068755 | \n",
"
\n",
" \n",
" Sum | \n",
" 67352 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.044547 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.5464264086050881 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5984686928074158 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.4990017461254777 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.605151661169131 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.4439821179601821 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.528197430013715 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6227066347478732 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7657236984386736 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5810147955776347 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6677395635616753 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (114574) | \n",
" 134083 | \n",
" 43.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 173378 | \n",
" 56.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.014568132412445587 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.01469148240341735 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.015052921304163646 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.015600080580903924 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.017094657791038883 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9460755215136519 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.946097614386872 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9476493853501726 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9516239622079844 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.962692770561306 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
EXT_SOURCE_2
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 119832 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 39.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.2% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 660 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.51439 | \n",
"
\n",
" \n",
" Minimum | \n",
" 8.1736e-08 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.855 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 8.1736e-08 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.1333 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.39246 | \n",
"
\n",
" \n",
" Median | \n",
" 0.56596 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.66362 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.74773 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.855 | \n",
"
\n",
" \n",
" Range | \n",
" 0.855 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.27116 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.19106 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.37143 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.26913 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.51439 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.15717 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.79358 | \n",
"
\n",
" \n",
" Sum | \n",
" 157840 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.036504 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.2858978721410488 | \n",
" 721 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2622583692422573 | \n",
" 417 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.26525634018619443 | \n",
" 343 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.15967923350263774 | \n",
" 322 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2653117484731741 | \n",
" 306 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.26651977539251576 | \n",
" 244 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.2631435910213423 | \n",
" 243 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.16214456766623808 | \n",
" 238 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.16219210595922867 | \n",
" 234 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.16318703546427088 | \n",
" 184 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (119821) | \n",
" 303599 | \n",
" 98.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 660 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 8.173616518884397e-08 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.3159555812626235e-06 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.002108762101576e-06 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.600337749107766e-06 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.9396509293128426e-06 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.8206095060949257 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8206159442383357 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8213936273692694 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8217142127828599 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8549996664047012 | \n",
" 26 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
EXT_SOURCE_3
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 815 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.3% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 19.8% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 60965 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.51085 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0.00052727 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.89601 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0.00052727 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.15474 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.37065 | \n",
"
\n",
" \n",
" Median | \n",
" 0.53528 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.66906 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.78627 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.89601 | \n",
"
\n",
" \n",
" Range | \n",
" 0.89548 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.29841 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.19484 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.38141 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.66346 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.51085 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.16264 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.40939 | \n",
"
\n",
" \n",
" Sum | \n",
" 125950 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.037964 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.746300213050371 | \n",
" 1460 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7136313997323308 | \n",
" 1315 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6940926425266661 | \n",
" 1276 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6706517530862718 | \n",
" 1191 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6528965519806539 | \n",
" 1154 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5814837058057234 | \n",
" 1141 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6894791426446275 | \n",
" 1138 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5954562029091491 | \n",
" 1136 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5549467685334323 | \n",
" 1132 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6212263380626669 | \n",
" 1109 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (804) | \n",
" 234494 | \n",
" 76.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 60965 | \n",
" 19.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0005272652387098817 | \n",
" 886 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.011345719434837441 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.012715923858768621 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.013948465584840095 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.014148265518207309 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.8825303127941461 | \n",
" 26 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8854883941521002 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8876642018413868 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8939760746042866 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8960095494948396 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_CONT_MOBILE
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.99813 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 1 | \n",
" \n",
" \n",
" 306937\n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" \n",
" \n",
" \n",
" \n",
" 574\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 306937 | \n",
" 99.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 574 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_10
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 2.2763e-05 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307504\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 7\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307504 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_11
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0039121 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 306308\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 1203\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 306308 | \n",
" 99.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1203 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_12
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 6.5038e-06 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307509\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 2\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307509 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_13
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0035251 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 306427\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 1084\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 306427 | \n",
" 99.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1084 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_14
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0029365 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 306608\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 903\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 306608 | \n",
" 99.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 903 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_15
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0012097 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307139\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 372\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307139 | \n",
" 99.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 372 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_16
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0099281 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 304458\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 3053\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 304458 | \n",
" 99.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 3053 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_17
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.00026666 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307429\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 82\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307429 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 82 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_18
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0081298 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 305011\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 2500\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 305011 | \n",
" 99.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 2500 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_19
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0005951 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307328\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 183\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307328 | \n",
" 99.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 183 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_2
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 4.2275e-05 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307498\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 13\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307498 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 13 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_20
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0005073 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307355\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 156\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307355 | \n",
" 99.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 156 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_21
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.00033495 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307408\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 103\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307408 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 103 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_3
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.71002 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 1 | \n",
" \n",
" \n",
" 218340\n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" \n",
" \n",
" 89171\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 218340 | \n",
" 71.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 89171 | \n",
" 29.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_4
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 8.1298e-05 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307486\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 25\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307486 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 25 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_5
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.015115 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 302863\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 4648\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 302863 | \n",
" 98.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 4648 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_6
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.088055 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 280433\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 27078\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 280433 | \n",
" 91.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 27078 | \n",
" 8.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_7
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.00019186 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 307452\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 59\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 307452 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 59 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_8
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.081376 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 282487\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 25024\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 282487 | \n",
" 91.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 25024 | \n",
" 8.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_DOCUMENT_9
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.0038958 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 306313\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 1198\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 306313 | \n",
" 99.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1198 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_EMAIL
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.05672 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 290069\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 17442\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 290069 | \n",
" 94.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 17442 | \n",
" 5.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_EMP_PHONE
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.81989 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 1 | \n",
" \n",
" \n",
" 252125\n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" \n",
" \n",
" 55386\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 252125 | \n",
" 82.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 55386 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_MOBIL
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 1 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 1 | \n",
" \n",
" \n",
" 307510\n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" \n",
" \n",
" \n",
" \n",
" 1\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 307510 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_OWN_CAR
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" N | \n",
" \n",
" \n",
" 202924\n",
" \n",
" \n",
" | \n",
"
\n",
" Y | \n",
" \n",
" \n",
" 104587\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" N | \n",
" 202924 | \n",
" 66.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Y | \n",
" 104587 | \n",
" 34.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_OWN_REALTY
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Y | \n",
" \n",
" \n",
" 213312\n",
" \n",
" \n",
" | \n",
"
\n",
" N | \n",
" \n",
" \n",
" 94199\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Y | \n",
" 213312 | \n",
" 69.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" N | \n",
" 94199 | \n",
" 30.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_PHONE
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.28107 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 221080\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 86431\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 221080 | \n",
" 71.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 86431 | \n",
" 28.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLAG_WORK_PHONE
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.19937 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 246203\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 61308\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 246203 | \n",
" 80.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 61308 | \n",
" 19.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMAX_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 404 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 49.8% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 153020 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.22628 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 1.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.0417 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.1667 | \n",
"
\n",
" \n",
" Median | \n",
" 0.1667 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.3333 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.4792 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.1666 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.14464 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.63921 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 2.4325 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.22628 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.11612 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.2265 | \n",
"
\n",
" \n",
" Sum | \n",
" 34959 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.020921 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.1667 | \n",
" 61875 | \n",
" 20.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.3333 | \n",
" 31909 | \n",
" 10.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0417 | \n",
" 14600 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.375 | \n",
" 7926 | \n",
" 2.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.125 | \n",
" 6974 | \n",
" 2.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0833 | \n",
" 6586 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 2938 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.4583 | \n",
" 2828 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.625 | \n",
" 1915 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5417 | \n",
" 1685 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (393) | \n",
" 15255 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 153020 | \n",
" 49.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 2938 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0067 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0083 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.01 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0104 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9375 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9479 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9583 | \n",
" 83 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9792 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 167 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMAX_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with FLOORSMAX_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98824 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMAX_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with FLOORSMAX_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98569 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMIN_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 306 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 67.8% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 208642 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.23189 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.8% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.0417 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.0833 | \n",
"
\n",
" \n",
" Median | \n",
" 0.2083 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.375 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.5 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.2917 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.16138 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.69592 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 1.3383 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.23189 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.1246 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.9542 | \n",
"
\n",
" \n",
" Sum | \n",
" 22927 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.026044 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.2083 | \n",
" 32875 | \n",
" 10.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.375 | \n",
" 17845 | \n",
" 5.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0417 | \n",
" 17776 | \n",
" 5.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0833 | \n",
" 5086 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.4167 | \n",
" 3961 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.1667 | \n",
" 3537 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.125 | \n",
" 3336 | \n",
" 1.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 2320 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.5 | \n",
" 1688 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.6667 | \n",
" 1194 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (295) | \n",
" 9251 | \n",
" 3.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 208642 | \n",
" 67.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 2320 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0067 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0104 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0138 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0158 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9304 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9408 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9583 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9792 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 141 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMIN_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with FLOORSMIN_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98841 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FLOORSMIN_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with FLOORSMIN_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98588 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
FONDKAPREMONT_MODE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 5 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 68.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 210295 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" reg oper account | \n",
" \n",
" \n",
" 73830\n",
" \n",
" \n",
" | \n",
"
\n",
" reg oper spec account | \n",
" \n",
" \n",
" \n",
" \n",
" 12080\n",
" | \n",
"
\n",
" not specified | \n",
" \n",
" \n",
" \n",
" \n",
" 5687\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" 210295\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" reg oper account | \n",
" 73830 | \n",
" 24.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" reg oper spec account | \n",
" 12080 | \n",
" 3.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" not specified | \n",
" 5687 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" org spec account | \n",
" 5619 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 210295 | \n",
" 68.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
HOUR_APPR_PROCESS_START
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 24 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 12.063 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 23 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 7 | \n",
"
\n",
" \n",
" Q1 | \n",
" 10 | \n",
"
\n",
" \n",
" Median | \n",
" 12 | \n",
"
\n",
" \n",
" Q3 | \n",
" 14 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 17 | \n",
"
\n",
" \n",
" Maximum | \n",
" 23 | \n",
"
\n",
" \n",
" Range | \n",
" 23 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 4 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 3.2658 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.27072 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.19417 | \n",
"
\n",
" \n",
" Mean | \n",
" 12.063 | \n",
"
\n",
" \n",
" MAD | \n",
" 2.6328 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.028024 | \n",
"
\n",
" \n",
" Sum | \n",
" 3709634 | \n",
"
\n",
" \n",
" Variance | \n",
" 10.666 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 10 | \n",
" 37722 | \n",
" 12.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 11 | \n",
" 37229 | \n",
" 12.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 12 | \n",
" 34233 | \n",
" 11.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 13 | \n",
" 30959 | \n",
" 10.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 14 | \n",
" 27682 | \n",
" 9.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 27384 | \n",
" 8.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 15 | \n",
" 24839 | \n",
" 8.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 16 | \n",
" 20385 | \n",
" 6.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 15127 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 17 | \n",
" 14900 | \n",
" 4.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (14) | \n",
" 37051 | \n",
" 12.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 40 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 86 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 305 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1230 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 2090 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 19 | \n",
" 3848 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 20 | \n",
" 1196 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21 | \n",
" 405 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22 | \n",
" 150 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23 | \n",
" 41 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
HOUSETYPE_MODE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 4 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 50.2% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 154297 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" block of flats | \n",
" \n",
" \n",
" 150503\n",
" \n",
" \n",
" | \n",
"
\n",
" specific housing | \n",
" \n",
" \n",
" \n",
" \n",
" 1499\n",
" | \n",
"
\n",
" terraced house | \n",
" \n",
" \n",
" \n",
" \n",
" 1212\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" 154297\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" block of flats | \n",
" 150503 | \n",
" 48.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" specific housing | \n",
" 1499 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" terraced house | \n",
" 1212 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 154297 | \n",
" 50.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LANDAREA_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3528 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 59.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 182590 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.066333 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 5.1% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.0187 | \n",
"
\n",
" \n",
" Median | \n",
" 0.0481 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.0856 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.1947 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0669 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.081184 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.2239 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 34.745 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.066333 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.049532 | \n",
"
\n",
" \n",
" Skewness | \n",
" 4.4587 | \n",
"
\n",
" \n",
" Sum | \n",
" 8286.4 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0065908 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 15600 | \n",
" 5.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0631 | \n",
" 189 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0316 | \n",
" 187 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0473 | \n",
" 186 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0174 | \n",
" 180 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0237 | \n",
" 175 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0552 | \n",
" 173 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0158 | \n",
" 170 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0331 | \n",
" 170 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.015 | \n",
" 165 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (3517) | \n",
" 107726 | \n",
" 35.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 182590 | \n",
" 59.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 15600 | \n",
" 5.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0001 | \n",
" 13 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0002 | \n",
" 13 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0003 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 11 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9497 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9690000000000001 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9777 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9829 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 135 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LANDAREA_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with LANDAREA_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98084 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LANDAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with LANDAREA_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.9737 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVE_CITY_NOT_WORK_CITY
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.17955 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 252296\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 55215\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 252296 | \n",
" 82.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 55215 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVE_REGION_NOT_WORK_REGION
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.040659 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 295008\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 12503\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 295008 | \n",
" 95.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 12503 | \n",
" 4.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAPARTMENTS_AVG
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.94395 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAPARTMENTS_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_MEDI
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.94249 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAPARTMENTS_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.93776 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAREA_AVG
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.91362 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAREA_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_MEDI
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.91595 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
LIVINGAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with APARTMENTS_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.91038 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_CONTRACT_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Cash loans | \n",
" \n",
" \n",
" 278232\n",
" \n",
" \n",
" | \n",
"
\n",
" Revolving loans | \n",
" \n",
" \n",
" \n",
" \n",
" 29279\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Cash loans | \n",
" 278232 | \n",
" 90.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Revolving loans | \n",
" 29279 | \n",
" 9.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_EDUCATION_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 5 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Secondary / secondary special | \n",
" \n",
" \n",
" 218391\n",
" \n",
" \n",
" | \n",
"
\n",
" Higher education | \n",
" \n",
" \n",
" 74863\n",
" \n",
" \n",
" | \n",
"
\n",
" Incomplete higher | \n",
" \n",
" \n",
" \n",
" \n",
" 10277\n",
" | \n",
"
\n",
" Other values (2) | \n",
" \n",
" \n",
" \n",
" \n",
" 3980\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Secondary / secondary special | \n",
" 218391 | \n",
" 71.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Higher education | \n",
" 74863 | \n",
" 24.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Incomplete higher | \n",
" 10277 | \n",
" 3.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Lower secondary | \n",
" 3816 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Academic degree | \n",
" 164 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_FAMILY_STATUS
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Married | \n",
" \n",
" \n",
" 196432\n",
" \n",
" \n",
" | \n",
"
\n",
" Single / not married | \n",
" \n",
" \n",
" 45444\n",
" \n",
" \n",
" | \n",
"
\n",
" Civil marriage | \n",
" \n",
" \n",
" \n",
" \n",
" 29775\n",
" | \n",
"
\n",
" Other values (3) | \n",
" \n",
" \n",
" \n",
" \n",
" 35860\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Married | \n",
" 196432 | \n",
" 63.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Single / not married | \n",
" 45444 | \n",
" 14.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Civil marriage | \n",
" 29775 | \n",
" 9.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Separated | \n",
" 19770 | \n",
" 6.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Widow | \n",
" 16088 | \n",
" 5.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Unknown | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_HOUSING_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" House / apartment | \n",
" \n",
" \n",
" 272868\n",
" \n",
" \n",
" | \n",
"
\n",
" With parents | \n",
" \n",
" \n",
" \n",
" \n",
" 14840\n",
" | \n",
"
\n",
" Municipal apartment | \n",
" \n",
" \n",
" \n",
" \n",
" 11183\n",
" | \n",
"
\n",
" Other values (3) | \n",
" \n",
" \n",
" \n",
" \n",
" 8620\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" House / apartment | \n",
" 272868 | \n",
" 88.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" With parents | \n",
" 14840 | \n",
" 4.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Municipal apartment | \n",
" 11183 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Rented apartment | \n",
" 4881 | \n",
" 1.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Office apartment | \n",
" 2617 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Co-op apartment | \n",
" 1122 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_INCOME_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 8 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Working | \n",
" \n",
" \n",
" 158774\n",
" \n",
" \n",
" | \n",
"
\n",
" Commercial associate | \n",
" \n",
" \n",
" 71617\n",
" \n",
" \n",
" | \n",
"
\n",
" Pensioner | \n",
" \n",
" \n",
" 55362\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (5) | \n",
" \n",
" \n",
" \n",
" \n",
" 21758\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Working | \n",
" 158774 | \n",
" 51.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Commercial associate | \n",
" 71617 | \n",
" 23.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Pensioner | \n",
" 55362 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" State servant | \n",
" 21703 | \n",
" 7.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Unemployed | \n",
" 22 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Student | \n",
" 18 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Businessman | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Maternity leave | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NAME_TYPE_SUITE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 8 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1292 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Unaccompanied | \n",
" \n",
" \n",
" 248526\n",
" \n",
" \n",
" | \n",
"
\n",
" Family | \n",
" \n",
" \n",
" \n",
" \n",
" 40149\n",
" | \n",
"
\n",
" Spouse, partner | \n",
" \n",
" \n",
" \n",
" \n",
" 11370\n",
" | \n",
"
\n",
" Other values (4) | \n",
" \n",
" \n",
" \n",
" \n",
" 6174\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Unaccompanied | \n",
" 248526 | \n",
" 80.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Family | \n",
" 40149 | \n",
" 13.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Spouse, partner | \n",
" 11370 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Children | \n",
" 3267 | \n",
" 1.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other_B | \n",
" 1770 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other_A | \n",
" 866 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Group of people | \n",
" 271 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 1292 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAPARTMENTS_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 387 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 69.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 213514 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.0088087 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 17.7% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.0039 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.0309 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0039 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.047732 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 5.4187 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 284.73 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.0088087 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.012235 | \n",
"
\n",
" \n",
" Skewness | \n",
" 15.541 | \n",
"
\n",
" \n",
" Sum | \n",
" 827.99 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0022783 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 54549 | \n",
" 17.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0039 | \n",
" 13606 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0077 | \n",
" 6351 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0116 | \n",
" 3714 | \n",
" 1.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0154 | \n",
" 2533 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0193 | \n",
" 1673 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0019 | \n",
" 1250 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0232 | \n",
" 1195 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.027000000000000003 | \n",
" 865 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0309 | \n",
" 717 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (376) | \n",
" 7544 | \n",
" 2.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 213514 | \n",
" 69.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 54549 | \n",
" 17.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0002 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0003 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 25 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0005 | \n",
" 6 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.973 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9884 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9923 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9961 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 97 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAPARTMENTS_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97857 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAPARTMENTS_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.96937 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAREA_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3291 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 1.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 55.2% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 169682 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.028358 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 19.1% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0.0036 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.0277 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.1279 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0277 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.069523 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 2.4516 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 64.912 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.028358 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.036058 | \n",
"
\n",
" \n",
" Skewness | \n",
" 6.559 | \n",
"
\n",
" \n",
" Sum | \n",
" 3908.5 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0048335 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 58735 | \n",
" 19.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0012 | \n",
" 546 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0044 | \n",
" 454 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0022 | \n",
" 440 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0031 | \n",
" 415 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0011 | \n",
" 405 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.001 | \n",
" 405 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0036 | \n",
" 399 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.003 | \n",
" 397 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0024 | \n",
" 395 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (3280) | \n",
" 75238 | \n",
" 24.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 169682 | \n",
" 55.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 58735 | \n",
" 19.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0001 | \n",
" 163 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0002 | \n",
" 107 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0003 | \n",
" 95 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 162 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9591 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9764 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9823 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9956 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 136 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAREA_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with NONLIVINGAREA_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97584 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
NONLIVINGAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with NONLIVINGAREA_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.96609 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
OBS_30_CNT_SOCIAL_CIRCLE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 34 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1021 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 1.4222 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 348 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 53.3% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0 | \n",
"
\n",
" \n",
" Median | \n",
" 0 | \n",
"
\n",
" \n",
" Q3 | \n",
" 2 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 6 | \n",
"
\n",
" \n",
" Maximum | \n",
" 348 | \n",
"
\n",
" \n",
" Range | \n",
" 348 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 2 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 2.401 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 1.6882 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 1424.8 | \n",
"
\n",
" \n",
" Mean | \n",
" 1.4222 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.6556 | \n",
"
\n",
" \n",
" Skewness | \n",
" 12.14 | \n",
"
\n",
" \n",
" Sum | \n",
" 435900 | \n",
"
\n",
" \n",
" Variance | \n",
" 5.7647 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 163910 | \n",
" 53.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 48783 | \n",
" 15.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 29808 | \n",
" 9.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 20322 | \n",
" 6.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 14143 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 9553 | \n",
" 3.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 6453 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7.0 | \n",
" 4390 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 2967 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 2003 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (23) | \n",
" 4158 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 163910 | \n",
" 53.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 48783 | \n",
" 15.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 29808 | \n",
" 9.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 20322 | \n",
" 6.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 14143 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 28.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 30.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 47.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 348.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
OBS_60_CNT_SOCIAL_CIRCLE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.99849 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
OCCUPATION_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 19 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 31.3% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 96391 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Laborers | \n",
" \n",
" \n",
" 55186\n",
" \n",
" \n",
" | \n",
"
\n",
" Sales staff | \n",
" \n",
" \n",
" 32102\n",
" \n",
" \n",
" | \n",
"
\n",
" Core staff | \n",
" \n",
" \n",
" 27570\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (15) | \n",
" \n",
" \n",
" 96262\n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" 96391\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Laborers | \n",
" 55186 | \n",
" 17.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Sales staff | \n",
" 32102 | \n",
" 10.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Core staff | \n",
" 27570 | \n",
" 9.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Managers | \n",
" 21371 | \n",
" 6.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Drivers | \n",
" 18603 | \n",
" 6.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" High skill tech staff | \n",
" 11380 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Accountants | \n",
" 9813 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Medicine staff | \n",
" 8537 | \n",
" 2.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Security staff | \n",
" 6721 | \n",
" 2.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Cooking staff | \n",
" 5946 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (8) | \n",
" 13891 | \n",
" 4.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 96391 | \n",
" 31.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
ORGANIZATION_TYPE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 58 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Business Entity Type 3 | \n",
" \n",
" \n",
" 67992\n",
" \n",
" \n",
" | \n",
"
\n",
" XNA | \n",
" \n",
" \n",
" 55374\n",
" \n",
" \n",
" | \n",
"
\n",
" Self-employed | \n",
" \n",
" \n",
" 38412\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (55) | \n",
" \n",
" \n",
" 145733\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Business Entity Type 3 | \n",
" 67992 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" XNA | \n",
" 55374 | \n",
" 18.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Self-employed | \n",
" 38412 | \n",
" 12.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other | \n",
" 16683 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Medicine | \n",
" 11193 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Business Entity Type 2 | \n",
" 10553 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Government | \n",
" 10404 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" School | \n",
" 8893 | \n",
" 2.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Trade: type 7 | \n",
" 7831 | \n",
" 2.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Kindergarten | \n",
" 6880 | \n",
" 2.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (48) | \n",
" 73296 | \n",
" 23.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
OWN_CAR_AGE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 63 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 66.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 202929 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 12.061 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 91 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.7% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 5 | \n",
"
\n",
" \n",
" Median | \n",
" 9 | \n",
"
\n",
" \n",
" Q3 | \n",
" 15 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 30 | \n",
"
\n",
" \n",
" Maximum | \n",
" 91 | \n",
"
\n",
" \n",
" Range | \n",
" 91 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 10 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 11.945 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.99036 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 9.2149 | \n",
"
\n",
" \n",
" Mean | \n",
" 12.061 | \n",
"
\n",
" \n",
" MAD | \n",
" 7.6692 | \n",
"
\n",
" \n",
" Skewness | \n",
" 2.7454 | \n",
"
\n",
" \n",
" Sum | \n",
" 1261400 | \n",
"
\n",
" \n",
" Variance | \n",
" 142.68 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 7.0 | \n",
" 7424 | \n",
" 2.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6.0 | \n",
" 6382 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 6370 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8.0 | \n",
" 5887 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5852 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 5557 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5280 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9.0 | \n",
" 5020 | \n",
" 1.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10.0 | \n",
" 4806 | \n",
" 1.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 14.0 | \n",
" 4594 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (52) | \n",
" 47410 | \n",
" 15.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 202929 | \n",
" 66.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 2134 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5280 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 5852 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 6370 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 5557 | \n",
" 1.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 63.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 64.0 | \n",
" 2443 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 65.0 | \n",
" 891 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 69.0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 91.0 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REGION_POPULATION_RELATIVE
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 81 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.020868 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0.00029 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.072508 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0.00029 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.00496 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.010006 | \n",
"
\n",
" \n",
" Median | \n",
" 0.01885 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.028663 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.04622 | \n",
"
\n",
" \n",
" Maximum | \n",
" 0.072508 | \n",
"
\n",
" \n",
" Range | \n",
" 0.072218 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.018657 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.013831 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.66279 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 3.2601 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.020868 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.010291 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.488 | \n",
"
\n",
" \n",
" Sum | \n",
" 6417.2 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0001913 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.035792000000000004 | \n",
" 16408 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.04622 | \n",
" 13442 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.030755 | \n",
" 12163 | \n",
" 4.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.025164 | \n",
" 11950 | \n",
" 3.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.026392 | \n",
" 11601 | \n",
" 3.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.031329 | \n",
" 11321 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.028663 | \n",
" 11157 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.019101 | \n",
" 8694 | \n",
" 2.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.072508 | \n",
" 8412 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.020713 | \n",
" 8066 | \n",
" 2.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (71) | \n",
" 194297 | \n",
" 63.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.00029 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.000533 | \n",
" 39 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.000938 | \n",
" 28 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.001276 | \n",
" 558 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.001333 | \n",
" 235 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.031329 | \n",
" 11321 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.032561 | \n",
" 6636 | \n",
" 2.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.035792000000000004 | \n",
" 16408 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.04622 | \n",
" 13442 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.072508 | \n",
" 8412 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REGION_RATING_CLIENT
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 2.0525 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 3 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 2 | \n",
"
\n",
" \n",
" Median | \n",
" 2 | \n",
"
\n",
" \n",
" Q3 | \n",
" 2 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 3 | \n",
"
\n",
" \n",
" Maximum | \n",
" 3 | \n",
"
\n",
" \n",
" Range | \n",
" 2 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.50903 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.24801 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 0.80042 | \n",
"
\n",
" \n",
" Mean | \n",
" 2.0525 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.29784 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.087468 | \n",
"
\n",
" \n",
" Sum | \n",
" 631155 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.25912 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 2 | \n",
" 226984 | \n",
" 73.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 48330 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 32197 | \n",
" 10.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 32197 | \n",
" 10.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 226984 | \n",
" 73.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 48330 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 32197 | \n",
" 10.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 226984 | \n",
" 73.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 48330 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REGION_RATING_CLIENT_W_CITY
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with REGION_RATING_CLIENT
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.95084 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REG_CITY_NOT_LIVE_CITY
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.078173 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 283472\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 24039\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 283472 | \n",
" 92.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 24039 | \n",
" 7.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REG_CITY_NOT_WORK_CITY
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.23045 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 236644\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 70867\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 236644 | \n",
" 77.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 70867 | \n",
" 23.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REG_REGION_NOT_LIVE_REGION
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.015144 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 302854\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 4657\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 302854 | \n",
" 98.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 4657 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
REG_REGION_NOT_WORK_REGION
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.050769 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 291899\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 15612\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 291899 | \n",
" 94.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 15612 | \n",
" 5.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
SK_ID_CURR
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 307511 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 100.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 278180 | \n",
"
\n",
" \n",
" Minimum | \n",
" 100002 | \n",
"
\n",
" \n",
" Maximum | \n",
" 456255 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 100002 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 117950 | \n",
"
\n",
" \n",
" Q1 | \n",
" 189150 | \n",
"
\n",
" \n",
" Median | \n",
" 278200 | \n",
"
\n",
" \n",
" Q3 | \n",
" 367140 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 438430 | \n",
"
\n",
" \n",
" Maximum | \n",
" 456255 | \n",
"
\n",
" \n",
" Range | \n",
" 356253 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 178000 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 102790 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.36951 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.199 | \n",
"
\n",
" \n",
" Mean | \n",
" 278180 | \n",
"
\n",
" \n",
" MAD | \n",
" 89010 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.0012002 | \n",
"
\n",
" \n",
" Sum | \n",
" 85543569448 | \n",
"
\n",
" \n",
" Variance | \n",
" 10566000000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 100303 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 131861 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 158488 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 156441 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 160539 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 150300 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 148253 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 154398 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 152351 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 238369 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (307501) | \n",
" 307501 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 100002 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 100003 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 100004 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 100006 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 100007 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 456251 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 456252 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 456253 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 456254 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 456255 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
TARGET
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.080729 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 282686\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 24825\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 282686 | \n",
" 91.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 24825 | \n",
" 8.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
TOTALAREA_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with LIVINGAREA_MEDI
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.91936 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
WALLSMATERIAL_MODE
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 8 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 50.8% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 156341 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Panel | \n",
" \n",
" \n",
" 66040\n",
" \n",
" \n",
" | \n",
"
\n",
" Stone, brick | \n",
" \n",
" \n",
" 64815\n",
" \n",
" \n",
" | \n",
"
\n",
" Block | \n",
" \n",
" \n",
" \n",
" \n",
" 9253\n",
" | \n",
"
\n",
" Other values (4) | \n",
" \n",
" \n",
" \n",
" \n",
" 11062\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" 156341\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Panel | \n",
" 66040 | \n",
" 21.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Stone, brick | \n",
" 64815 | \n",
" 21.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Block | \n",
" 9253 | \n",
" 3.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Wooden | \n",
" 5362 | \n",
" 1.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Mixed | \n",
" 2296 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Monolithic | \n",
" 1779 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Others | \n",
" 1625 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 156341 | \n",
" 50.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
WEEKDAY_APPR_PROCESS_START
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 7 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" TUESDAY | \n",
" \n",
" \n",
" 53901\n",
" \n",
" \n",
" | \n",
"
\n",
" WEDNESDAY | \n",
" \n",
" \n",
" 51934\n",
" \n",
" \n",
" | \n",
"
\n",
" MONDAY | \n",
" \n",
" \n",
" 50714\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (4) | \n",
" \n",
" \n",
" 150962\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" TUESDAY | \n",
" 53901 | \n",
" 17.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" WEDNESDAY | \n",
" 51934 | \n",
" 16.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" MONDAY | \n",
" 50714 | \n",
" 16.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" THURSDAY | \n",
" 50591 | \n",
" 16.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" FRIDAY | \n",
" 50338 | \n",
" 16.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" SATURDAY | \n",
" 33852 | \n",
" 11.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" SUNDAY | \n",
" 16181 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BEGINEXPLUATATION_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 286 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 48.8% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 150007 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.97773 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.2% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.9687 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.9767 | \n",
"
\n",
" \n",
" Median | \n",
" 0.9816 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.9866 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.996 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.0099 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.059223 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.060572 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 248.18 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.97773 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.010933 | \n",
"
\n",
" \n",
" Skewness | \n",
" -15.515 | \n",
"
\n",
" \n",
" Sum | \n",
" 154000 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.0035074 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9871 | \n",
" 4311 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9856 | \n",
" 4189 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9861 | \n",
" 4171 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9801 | \n",
" 4123 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9866 | \n",
" 4114 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9851 | \n",
" 4096 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9806 | \n",
" 4096 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9811 | \n",
" 3986 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9816 | \n",
" 3982 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9831 | \n",
" 3970 | \n",
" 1.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (275) | \n",
" 116466 | \n",
" 37.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 150007 | \n",
" 48.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 514 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0179 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0447 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0969 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0974 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.998 | \n",
" 1096 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9985 | \n",
" 1062 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9990000000000001 | \n",
" 906 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9995 | \n",
" 691 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 186 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BEGINEXPLUATATION_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.96354 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BEGINEXPLUATATION_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.97189 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BUILD_AVG
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 150 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 66.5% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 204488 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 0.75247 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0.592 | \n",
"
\n",
" \n",
" Q1 | \n",
" 0.6872 | \n",
"
\n",
" \n",
" Median | \n",
" 0.7552 | \n",
"
\n",
" \n",
" Q3 | \n",
" 0.8232 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 0.9524 | \n",
"
\n",
" \n",
" Maximum | \n",
" 1 | \n",
"
\n",
" \n",
" Range | \n",
" 1 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0.136 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.11328 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.15054 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 4.3998 | \n",
"
\n",
" \n",
" Mean | \n",
" 0.75247 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.08391 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.96249 | \n",
"
\n",
" \n",
" Sum | \n",
" 77522 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.012832 | \n",
"
\n",
" \n",
" Memory size | \n",
" 2.3 MiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.8232 | \n",
" 2999 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8164 | \n",
" 2864 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8028 | \n",
" 2848 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.728 | \n",
" 2802 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7348 | \n",
" 2761 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.8096 | \n",
" 2755 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.83 | \n",
" 2738 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7959999999999999 | \n",
" 2734 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7484 | \n",
" 2731 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.7688 | \n",
" 2712 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (139) | \n",
" 75079 | \n",
" 24.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 204488 | \n",
" 66.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 102 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0004 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0072 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.013999999999999999 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0208 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.9728 | \n",
" 813 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9796 | \n",
" 786 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9864 | \n",
" 661 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.9932 | \n",
" 478 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 173 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BUILD_MEDI
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with YEARS_BUILD_MODE
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98946 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
YEARS_BUILD_MODE
\n",
" Highly correlated\n",
"
\n",
"
\n",
"
This variable is highly correlated with YEARS_BUILD_AVG
and should be ignored for analysis
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Correlation | \n",
" 0.98944 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Correlations
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Sample
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" SK_ID_CURR | \n",
" TARGET | \n",
" NAME_CONTRACT_TYPE | \n",
" CODE_GENDER | \n",
" FLAG_OWN_CAR | \n",
" FLAG_OWN_REALTY | \n",
" CNT_CHILDREN | \n",
" AMT_INCOME_TOTAL | \n",
" AMT_CREDIT | \n",
" AMT_ANNUITY | \n",
" AMT_GOODS_PRICE | \n",
" NAME_TYPE_SUITE | \n",
" NAME_INCOME_TYPE | \n",
" NAME_EDUCATION_TYPE | \n",
" NAME_FAMILY_STATUS | \n",
" NAME_HOUSING_TYPE | \n",
" REGION_POPULATION_RELATIVE | \n",
" DAYS_BIRTH | \n",
" DAYS_EMPLOYED | \n",
" DAYS_REGISTRATION | \n",
" DAYS_ID_PUBLISH | \n",
" OWN_CAR_AGE | \n",
" FLAG_MOBIL | \n",
" FLAG_EMP_PHONE | \n",
" FLAG_WORK_PHONE | \n",
" FLAG_CONT_MOBILE | \n",
" FLAG_PHONE | \n",
" FLAG_EMAIL | \n",
" OCCUPATION_TYPE | \n",
" CNT_FAM_MEMBERS | \n",
" REGION_RATING_CLIENT | \n",
" REGION_RATING_CLIENT_W_CITY | \n",
" WEEKDAY_APPR_PROCESS_START | \n",
" HOUR_APPR_PROCESS_START | \n",
" REG_REGION_NOT_LIVE_REGION | \n",
" REG_REGION_NOT_WORK_REGION | \n",
" LIVE_REGION_NOT_WORK_REGION | \n",
" REG_CITY_NOT_LIVE_CITY | \n",
" REG_CITY_NOT_WORK_CITY | \n",
" LIVE_CITY_NOT_WORK_CITY | \n",
" ORGANIZATION_TYPE | \n",
" EXT_SOURCE_1 | \n",
" EXT_SOURCE_2 | \n",
" EXT_SOURCE_3 | \n",
" APARTMENTS_AVG | \n",
" BASEMENTAREA_AVG | \n",
" YEARS_BEGINEXPLUATATION_AVG | \n",
" YEARS_BUILD_AVG | \n",
" COMMONAREA_AVG | \n",
" ELEVATORS_AVG | \n",
" ENTRANCES_AVG | \n",
" FLOORSMAX_AVG | \n",
" FLOORSMIN_AVG | \n",
" LANDAREA_AVG | \n",
" LIVINGAPARTMENTS_AVG | \n",
" LIVINGAREA_AVG | \n",
" NONLIVINGAPARTMENTS_AVG | \n",
" NONLIVINGAREA_AVG | \n",
" APARTMENTS_MODE | \n",
" BASEMENTAREA_MODE | \n",
" YEARS_BEGINEXPLUATATION_MODE | \n",
" YEARS_BUILD_MODE | \n",
" COMMONAREA_MODE | \n",
" ELEVATORS_MODE | \n",
" ENTRANCES_MODE | \n",
" FLOORSMAX_MODE | \n",
" FLOORSMIN_MODE | \n",
" LANDAREA_MODE | \n",
" LIVINGAPARTMENTS_MODE | \n",
" LIVINGAREA_MODE | \n",
" NONLIVINGAPARTMENTS_MODE | \n",
" NONLIVINGAREA_MODE | \n",
" APARTMENTS_MEDI | \n",
" BASEMENTAREA_MEDI | \n",
" YEARS_BEGINEXPLUATATION_MEDI | \n",
" YEARS_BUILD_MEDI | \n",
" COMMONAREA_MEDI | \n",
" ELEVATORS_MEDI | \n",
" ENTRANCES_MEDI | \n",
" FLOORSMAX_MEDI | \n",
" FLOORSMIN_MEDI | \n",
" LANDAREA_MEDI | \n",
" LIVINGAPARTMENTS_MEDI | \n",
" LIVINGAREA_MEDI | \n",
" NONLIVINGAPARTMENTS_MEDI | \n",
" NONLIVINGAREA_MEDI | \n",
" FONDKAPREMONT_MODE | \n",
" HOUSETYPE_MODE | \n",
" TOTALAREA_MODE | \n",
" WALLSMATERIAL_MODE | \n",
" EMERGENCYSTATE_MODE | \n",
" OBS_30_CNT_SOCIAL_CIRCLE | \n",
" DEF_30_CNT_SOCIAL_CIRCLE | \n",
" OBS_60_CNT_SOCIAL_CIRCLE | \n",
" DEF_60_CNT_SOCIAL_CIRCLE | \n",
" DAYS_LAST_PHONE_CHANGE | \n",
" FLAG_DOCUMENT_2 | \n",
" FLAG_DOCUMENT_3 | \n",
" FLAG_DOCUMENT_4 | \n",
" FLAG_DOCUMENT_5 | \n",
" FLAG_DOCUMENT_6 | \n",
" FLAG_DOCUMENT_7 | \n",
" FLAG_DOCUMENT_8 | \n",
" FLAG_DOCUMENT_9 | \n",
" FLAG_DOCUMENT_10 | \n",
" FLAG_DOCUMENT_11 | \n",
" FLAG_DOCUMENT_12 | \n",
" FLAG_DOCUMENT_13 | \n",
" FLAG_DOCUMENT_14 | \n",
" FLAG_DOCUMENT_15 | \n",
" FLAG_DOCUMENT_16 | \n",
" FLAG_DOCUMENT_17 | \n",
" FLAG_DOCUMENT_18 | \n",
" FLAG_DOCUMENT_19 | \n",
" FLAG_DOCUMENT_20 | \n",
" FLAG_DOCUMENT_21 | \n",
" AMT_REQ_CREDIT_BUREAU_HOUR | \n",
" AMT_REQ_CREDIT_BUREAU_DAY | \n",
" AMT_REQ_CREDIT_BUREAU_WEEK | \n",
" AMT_REQ_CREDIT_BUREAU_MON | \n",
" AMT_REQ_CREDIT_BUREAU_QRT | \n",
" AMT_REQ_CREDIT_BUREAU_YEAR | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 100002 | \n",
" 1 | \n",
" Cash loans | \n",
" M | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 202500.0 | \n",
" 406597.5 | \n",
" 24700.5 | \n",
" 351000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0188 | \n",
" -9461 | \n",
" -637 | \n",
" -3648.0 | \n",
" -2120 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Laborers | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" WEDNESDAY | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Business Entity Type 3 | \n",
" 0.0830 | \n",
" 0.2629 | \n",
" 0.1394 | \n",
" 0.0247 | \n",
" 0.0369 | \n",
" 0.9722 | \n",
" 0.6192 | \n",
" 0.0143 | \n",
" 0.00 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0369 | \n",
" 0.0202 | \n",
" 0.0190 | \n",
" 0.0000 | \n",
" 0.0000 | \n",
" 0.0252 | \n",
" 0.0383 | \n",
" 0.9722 | \n",
" 0.6341 | \n",
" 0.0144 | \n",
" 0.0000 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0377 | \n",
" 0.022 | \n",
" 0.0198 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0250 | \n",
" 0.0369 | \n",
" 0.9722 | \n",
" 0.6243 | \n",
" 0.0144 | \n",
" 0.00 | \n",
" 0.0690 | \n",
" 0.0833 | \n",
" 0.1250 | \n",
" 0.0375 | \n",
" 0.0205 | \n",
" 0.0193 | \n",
" 0.0000 | \n",
" 0.00 | \n",
" reg oper account | \n",
" block of flats | \n",
" 0.0149 | \n",
" Stone, brick | \n",
" No | \n",
" 2.0 | \n",
" 2.0 | \n",
" 2.0 | \n",
" 2.0 | \n",
" -1134.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 1.0 | \n",
"
\n",
" \n",
" 1 | \n",
" 100003 | \n",
" 0 | \n",
" Cash loans | \n",
" F | \n",
" N | \n",
" N | \n",
" 0 | \n",
" 270000.0 | \n",
" 1293502.5 | \n",
" 35698.5 | \n",
" 1129500.0 | \n",
" Family | \n",
" State servant | \n",
" Higher education | \n",
" Married | \n",
" House / apartment | \n",
" 0.0035 | \n",
" -16765 | \n",
" -1188 | \n",
" -1186.0 | \n",
" -291 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Core staff | \n",
" 2.0 | \n",
" 1 | \n",
" 1 | \n",
" MONDAY | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" School | \n",
" 0.3113 | \n",
" 0.6222 | \n",
" NaN | \n",
" 0.0959 | \n",
" 0.0529 | \n",
" 0.9851 | \n",
" 0.7960 | \n",
" 0.0605 | \n",
" 0.08 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0130 | \n",
" 0.0773 | \n",
" 0.0549 | \n",
" 0.0039 | \n",
" 0.0098 | \n",
" 0.0924 | \n",
" 0.0538 | \n",
" 0.9851 | \n",
" 0.8040 | \n",
" 0.0497 | \n",
" 0.0806 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0128 | \n",
" 0.079 | \n",
" 0.0554 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0968 | \n",
" 0.0529 | \n",
" 0.9851 | \n",
" 0.7987 | \n",
" 0.0608 | \n",
" 0.08 | \n",
" 0.0345 | \n",
" 0.2917 | \n",
" 0.3333 | \n",
" 0.0132 | \n",
" 0.0787 | \n",
" 0.0558 | \n",
" 0.0039 | \n",
" 0.01 | \n",
" reg oper account | \n",
" block of flats | \n",
" 0.0714 | \n",
" Block | \n",
" No | \n",
" 1.0 | \n",
" 0.0 | \n",
" 1.0 | \n",
" 0.0 | \n",
" -828.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
" 2 | \n",
" 100004 | \n",
" 0 | \n",
" Revolving loans | \n",
" M | \n",
" Y | \n",
" Y | \n",
" 0 | \n",
" 67500.0 | \n",
" 135000.0 | \n",
" 6750.0 | \n",
" 135000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0100 | \n",
" -19046 | \n",
" -225 | \n",
" -4260.0 | \n",
" -2531 | \n",
" 26.0 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" Laborers | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" MONDAY | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Government | \n",
" NaN | \n",
" 0.5559 | \n",
" 0.7296 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" -815.0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
" 3 | \n",
" 100006 | \n",
" 0 | \n",
" Cash loans | \n",
" F | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 135000.0 | \n",
" 312682.5 | \n",
" 29686.5 | \n",
" 297000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Civil marriage | \n",
" House / apartment | \n",
" 0.0080 | \n",
" -19005 | \n",
" -3039 | \n",
" -9833.0 | \n",
" -2437 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" Laborers | \n",
" 2.0 | \n",
" 2 | \n",
" 2 | \n",
" WEDNESDAY | \n",
" 17 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" Business Entity Type 3 | \n",
" NaN | \n",
" 0.6504 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 2.0 | \n",
" 0.0 | \n",
" 2.0 | \n",
" 0.0 | \n",
" -617.0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
"
\n",
" \n",
" 4 | \n",
" 100007 | \n",
" 0 | \n",
" Cash loans | \n",
" M | \n",
" N | \n",
" Y | \n",
" 0 | \n",
" 121500.0 | \n",
" 513000.0 | \n",
" 21865.5 | \n",
" 513000.0 | \n",
" Unaccompanied | \n",
" Working | \n",
" Secondary / secondary special | \n",
" Single / not married | \n",
" House / apartment | \n",
" 0.0287 | \n",
" -19932 | \n",
" -3038 | \n",
" -4311.0 | \n",
" -3458 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" Core staff | \n",
" 1.0 | \n",
" 2 | \n",
" 2 | \n",
" THURSDAY | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 1 | \n",
" Religion | \n",
" NaN | \n",
" 0.3227 | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" NaN | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" -1106.0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
" 0.0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
"
],
"text/plain": [
""
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"%%time\n",
"profile = pandas_profiling.ProfileReport(pdf_data)\n",
"profile"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"CPU times: user 6.29 ms, sys: 5.01 ms, total: 11.3 ms\n",
"Wall time: 10.5 ms\n"
]
}
],
"source": [
"%%time\n",
"profile.to_file(outputfile=\"{}_profiling.html\".format(\"application_train\"))"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.3"
}
},
"nbformat": 4,
"nbformat_minor": 2
}