{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "## Faster First EDA with pandas-profiling" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "# importing required packages\n", "import pandas as pd\n", "import pandas_profiling\n", "import numpy as np" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [], "source": [ "# importing the data\n", "df = pd.read_csv('/Users/lukas/Downloads/titanic/train.csv')" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Th...female38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123S
4503Allen, Mr. William Henrymale35.0003734508.0500NaNS
\n", "
" ], "text/plain": [ " PassengerId Survived Pclass \\\n", "0 1 0 3 \n", "1 2 1 1 \n", "2 3 1 3 \n", "3 4 1 1 \n", "4 5 0 3 \n", "\n", " Name Sex Age SibSp \\\n", "0 Braund, Mr. Owen Harris male 22.0 1 \n", "1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 \n", "2 Heikkinen, Miss. Laina female 26.0 0 \n", "3 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 \n", "4 Allen, Mr. William Henry male 35.0 0 \n", "\n", " Parch Ticket Fare Cabin Embarked \n", "0 0 A/5 21171 7.2500 NaN S \n", "1 0 PC 17599 71.2833 C85 C \n", "2 0 STON/O2. 3101282 7.9250 NaN S \n", "3 0 113803 53.1000 C123 S \n", "4 0 373450 8.0500 NaN S " ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# checking the head\n", "df.head()" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassAgeSibSpParchFare
count891.000000891.000000891.000000714.000000891.000000891.000000891.000000
mean446.0000000.3838382.30864229.6991180.5230080.38159432.204208
std257.3538420.4865920.83607114.5264971.1027430.80605749.693429
min1.0000000.0000001.0000000.4200000.0000000.0000000.000000
25%223.5000000.0000002.00000020.1250000.0000000.0000007.910400
50%446.0000000.0000003.00000028.0000000.0000000.00000014.454200
75%668.5000001.0000003.00000038.0000001.0000000.00000031.000000
max891.0000001.0000003.00000080.0000008.0000006.000000512.329200
\n", "
" ], "text/plain": [ " PassengerId Survived Pclass Age SibSp \\\n", "count 891.000000 891.000000 891.000000 714.000000 891.000000 \n", "mean 446.000000 0.383838 2.308642 29.699118 0.523008 \n", "std 257.353842 0.486592 0.836071 14.526497 1.102743 \n", "min 1.000000 0.000000 1.000000 0.420000 0.000000 \n", "25% 223.500000 0.000000 2.000000 20.125000 0.000000 \n", "50% 446.000000 0.000000 3.000000 28.000000 0.000000 \n", "75% 668.500000 1.000000 3.000000 38.000000 1.000000 \n", "max 891.000000 1.000000 3.000000 80.000000 8.000000 \n", "\n", " Parch Fare \n", "count 891.000000 891.000000 \n", "mean 0.381594 32.204208 \n", "std 0.806057 49.693429 \n", "min 0.000000 0.000000 \n", "25% 0.000000 7.910400 \n", "50% 0.000000 14.454200 \n", "75% 0.000000 31.000000 \n", "max 6.000000 512.329200 " ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# descriptive statistics\n", "df.describe()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Create an inline report**" ] }, { "cell_type": "code", "execution_count": 5, "metadata": { "scrolled": false }, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\n", "
\n", "
\n", "

Overview

\n", "
\n", "
\n", "
\n", "

Dataset info

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Number of variables12
Number of observations891
Total Missing (%)8.1%
Total size in memory83.6 KiB
Average record size in memory96.1 B
\n", "
\n", "
\n", "

Variables types

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Numeric6
Categorical4
Boolean1
Date0
Text (Unique)1
Rejected0
Unsupported0
\n", "
\n", "
\n", " \n", "

Warnings

\n", "
  • Age has 177 / 19.9% missing values Missing
  • Cabin has 687 / 77.1% missing values Missing
  • Cabin has a high cardinality: 148 distinct values Warning
  • Fare has 15 / 1.7% zeros Zeros
  • Parch has 678 / 76.1% zeros Zeros
  • SibSp has 608 / 68.2% zeros Zeros
  • Ticket has a high cardinality: 681 distinct values Warning
\n", "
\n", "
\n", "
\n", "

Variables

\n", "
\n", "
\n", "
\n", "

Age
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count89
Unique (%)10.0%
Missing (%)19.9%
Missing (n)177
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean29.699
Minimum0.42
Maximum80
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0.42
5-th percentile4
Q120.125
Median28
Q338
95-th percentile56
Maximum80
Range79.58
Interquartile range17.875
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation14.526
Coef of variation0.48912
Kurtosis0.17827
Mean29.699
MAD11.323
Skewness0.38911
Sum21205
Variance211.02
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
24.0303.4%\n", "
 
\n", "
22.0273.0%\n", "
 
\n", "
18.0262.9%\n", "
 
\n", "
28.0252.8%\n", "
 
\n", "
19.0252.8%\n", "
 
\n", "
30.0252.8%\n", "
 
\n", "
21.0242.7%\n", "
 
\n", "
25.0232.6%\n", "
 
\n", "
36.0222.5%\n", "
 
\n", "
29.0202.2%\n", "
 
\n", "
Other values (78)46752.4%\n", "
 
\n", "
(Missing)17719.9%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
0.4210.1%\n", "
 
\n", "
0.6710.1%\n", "
 
\n", "
0.7520.2%\n", "
 
\n", "
0.8320.2%\n", "
 
\n", "
0.9210.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
70.020.2%\n", "
 
\n", "
70.510.1%\n", "
 
\n", "
71.020.2%\n", "
 
\n", "
74.010.1%\n", "
 
\n", "
80.010.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Cabin
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count148
Unique (%)16.6%
Missing (%)77.1%
Missing (n)687
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
G6\n", "
\n", "  \n", "
\n", " 4\n", "
C23 C25 C27\n", "
\n", "  \n", "
\n", " 4\n", "
B96 B98\n", "
\n", "  \n", "
\n", " 4\n", "
Other values (144)\n", "
\n", " 192\n", "
\n", " \n", "
(Missing)\n", "
\n", " 687\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
G640.4%\n", "
 
\n", "
C23 C25 C2740.4%\n", "
 
\n", "
B96 B9840.4%\n", "
 
\n", "
D30.3%\n", "
 
\n", "
F230.3%\n", "
 
\n", "
F3330.3%\n", "
 
\n", "
C22 C2630.3%\n", "
 
\n", "
E10130.3%\n", "
 
\n", "
E12120.2%\n", "
 
\n", "
E820.2%\n", "
 
\n", "
Other values (137)17319.4%\n", "
 
\n", "
(Missing)68777.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Embarked
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count4
Unique (%)0.4%
Missing (%)0.2%
Missing (n)2
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
S\n", "
\n", " 644\n", "
\n", " \n", "
C\n", "
\n", " 168\n", "
\n", " \n", "
Q\n", "
\n", "  \n", "
\n", " 77\n", "
(Missing)\n", "
\n", "  \n", "
\n", " 2\n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
S64472.3%\n", "
 
\n", "
C16818.9%\n", "
 
\n", "
Q778.6%\n", "
 
\n", "
(Missing)20.2%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Fare
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count248
Unique (%)27.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean32.204
Minimum0
Maximum512.33
Zeros (%)1.7%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile7.225
Q17.9104
Median14.454
Q331
95-th percentile112.08
Maximum512.33
Range512.33
Interquartile range23.09
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation49.693
Coef of variation1.5431
Kurtosis33.398
Mean32.204
MAD28.164
Skewness4.7873
Sum28694
Variance2469.4
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
8.05434.8%\n", "
 
\n", "
13.0424.7%\n", "
 
\n", "
7.8958384.3%\n", "
 
\n", "
7.75343.8%\n", "
 
\n", "
26.0313.5%\n", "
 
\n", "
10.5242.7%\n", "
 
\n", "
7.925182.0%\n", "
 
\n", "
7.775161.8%\n", "
 
\n", "
26.55151.7%\n", "
 
\n", "
0.0151.7%\n", "
 
\n", "
Other values (238)61569.0%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
0.0151.7%\n", "
 
\n", "
4.012510.1%\n", "
 
\n", "
5.010.1%\n", "
 
\n", "
6.237510.1%\n", "
 
\n", "
6.437510.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
227.52540.4%\n", "
 
\n", "
247.520820.2%\n", "
 
\n", "
262.37520.2%\n", "
 
\n", "
263.040.4%\n", "
 
\n", "
512.329230.3%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Name
\n", " Categorical, Unique\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
First 3 values
Hansen, Mr. Henrik Juul
Aubart, Mme. Leontine Pauline
Abbott, Mrs. Stanton (Rosa Hunt)
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Last 3 values
Pickard, Mr. Berk (Berk Trembisky)
Goldenberg, Mrs. Samuel L (Edwiga Grabowska)
Karlsson, Mr. Nils August
\n", "\n", "
\n", "

First 10 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
Abbing, Mr. Anthony10.1%\n", "
 
\n", "
Abbott, Mr. Rossmore Edward10.1%\n", "
 
\n", "
Abbott, Mrs. Stanton (Rosa Hunt)10.1%\n", "
 
\n", "
Abelson, Mr. Samuel10.1%\n", "
 
\n", "
Abelson, Mrs. Samuel (Hannah Wizosky)10.1%\n", "
 
\n", "
\n", "

Last 10 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
de Mulder, Mr. Theodore10.1%\n", "
 
\n", "
de Pelsmaeker, Mr. Alfons10.1%\n", "
 
\n", "
del Carlo, Mr. Sebastiano10.1%\n", "
 
\n", "
van Billiard, Mr. Austin Blyler10.1%\n", "
 
\n", "
van Melkebeke, Mr. Philemon10.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Parch
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count7
Unique (%)0.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean0.38159
Minimum0
Maximum6
Zeros (%)76.1%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile0
Q10
Median0
Q30
95-th percentile2
Maximum6
Range6
Interquartile range0
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation0.80606
Coef of variation2.1123
Kurtosis9.7781
Mean0.38159
MAD0.58074
Skewness2.7491
Sum340
Variance0.64973
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
067876.1%\n", "
 
\n", "
111813.2%\n", "
 
\n", "
2809.0%\n", "
 
\n", "
550.6%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
610.1%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
067876.1%\n", "
 
\n", "
111813.2%\n", "
 
\n", "
2809.0%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
2809.0%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
550.6%\n", "
 
\n", "
610.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

PassengerId
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count891
Unique (%)100.0%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean446
Minimum1
Maximum891
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum1
5-th percentile45.5
Q1223.5
Median446
Q3668.5
95-th percentile846.5
Maximum891
Range890
Interquartile range445
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation257.35
Coef of variation0.57703
Kurtosis-1.2
Mean446
MAD222.75
Skewness0
Sum397386
Variance66231
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
89110.1%\n", "
 
\n", "
29310.1%\n", "
 
\n", "
30410.1%\n", "
 
\n", "
30310.1%\n", "
 
\n", "
30210.1%\n", "
 
\n", "
30110.1%\n", "
 
\n", "
30010.1%\n", "
 
\n", "
29910.1%\n", "
 
\n", "
29810.1%\n", "
 
\n", "
29710.1%\n", "
 
\n", "
Other values (881)88198.9%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
110.1%\n", "
 
\n", "
210.1%\n", "
 
\n", "
310.1%\n", "
 
\n", "
410.1%\n", "
 
\n", "
510.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
88710.1%\n", "
 
\n", "
88810.1%\n", "
 
\n", "
88910.1%\n", "
 
\n", "
89010.1%\n", "
 
\n", "
89110.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Pclass
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count3
Unique (%)0.3%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean2.3086
Minimum1
Maximum3
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum1
5-th percentile1
Q12
Median3
Q33
95-th percentile3
Maximum3
Range2
Interquartile range1
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation0.83607
Coef of variation0.36215
Kurtosis-1.28
Mean2.3086
MAD0.76197
Skewness-0.63055
Sum2057
Variance0.69902
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
349155.1%\n", "
 
\n", "
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
349155.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
349155.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Sex
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count2
Unique (%)0.2%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", "
male\n", "
\n", " 577\n", "
\n", " \n", "
female\n", "
\n", " 314\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
male57764.8%\n", "
 
\n", "
female31435.2%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

SibSp
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count7
Unique (%)0.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean0.52301
Minimum0
Maximum8
Zeros (%)68.2%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile0
Q10
Median0
Q31
95-th percentile3
Maximum8
Range8
Interquartile range1
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation1.1027
Coef of variation2.1085
Kurtosis17.88
Mean0.52301
MAD0.71378
Skewness3.6954
Sum466
Variance1.216
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
060868.2%\n", "
 
\n", "
120923.5%\n", "
 
\n", "
2283.1%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
870.8%\n", "
 
\n", "
550.6%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
060868.2%\n", "
 
\n", "
120923.5%\n", "
 
\n", "
2283.1%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
2283.1%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
550.6%\n", "
 
\n", "
870.8%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Survived
\n", " Boolean\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count2
Unique (%)0.2%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", "
Mean0.38384
\n", "
\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", "
0\n", "
\n", " 549\n", "
\n", " \n", "
1\n", "
\n", " 342\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
054961.6%\n", "
 
\n", "
134238.4%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Ticket
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count681
Unique (%)76.4%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
1601\n", "
\n", "  \n", "
\n", " 7\n", "
CA. 2343\n", "
\n", "  \n", "
\n", " 7\n", "
347082\n", "
\n", "  \n", "
\n", " 7\n", "
Other values (678)\n", "
\n", " 870\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
160170.8%\n", "
 
\n", "
CA. 234370.8%\n", "
 
\n", "
34708270.8%\n", "
 
\n", "
34708860.7%\n", "
 
\n", "
310129560.7%\n", "
 
\n", "
CA 214460.7%\n", "
 
\n", "
38265250.6%\n", "
 
\n", "
S.O.C. 1487950.6%\n", "
 
\n", "
266640.4%\n", "
 
\n", "
1742140.4%\n", "
 
\n", "
Other values (671)83493.6%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Correlations

\n", "
\n", "
\n", " \n", " \n", "
\n", "
\n", "

Sample

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Th...female38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123S
4503Allen, Mr. William Henrymale35.0003734508.0500NaNS
\n", "
\n", "
\n", "
" ], "text/plain": [ "" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pandas_profiling.ProfileReport(df)" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
53553612Hart, Miss. Eva Miriamfemale7.002F.C.C. 1352926.2500NaNS
62162211Kimball, Mr. Edwin Nelson Jrmale42.0101175352.5542D19S
222313McGowan, Miss. Anna \"Annie\"female15.0003309238.0292NaNQ
65565602Hickman, Mr. Leonard Markmale24.020S.O.C. 1487973.5000NaNS
13613711Newsom, Miss. Helen Monypenyfemale19.0021175226.2833D47S
\n", "
" ], "text/plain": [ " PassengerId Survived Pclass Name Sex \\\n", "535 536 1 2 Hart, Miss. Eva Miriam female \n", "621 622 1 1 Kimball, Mr. Edwin Nelson Jr male \n", "22 23 1 3 McGowan, Miss. Anna \"Annie\" female \n", "655 656 0 2 Hickman, Mr. Leonard Mark male \n", "136 137 1 1 Newsom, Miss. Helen Monypeny female \n", "\n", " Age SibSp Parch Ticket Fare Cabin Embarked \n", "535 7.0 0 2 F.C.C. 13529 26.2500 NaN S \n", "621 42.0 1 0 11753 52.5542 D19 S \n", "22 15.0 0 0 330923 8.0292 NaN Q \n", "655 24.0 2 0 S.O.C. 14879 73.5000 NaN S \n", "136 19.0 0 2 11752 26.2833 D47 S " ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# sample vs. head\n", "df.sample(5)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Save Report to HTML**" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [], "source": [ "pfr = pandas_profiling.ProfileReport(df)\n", "pfr.to_file(\"/tmp/example.html\")" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\n", "
\n", "
\n", "

Overview

\n", "
\n", "
\n", "
\n", "

Dataset info

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Number of variables12
Number of observations891
Total Missing (%)8.1%
Total size in memory83.6 KiB
Average record size in memory96.1 B
\n", "
\n", "
\n", "

Variables types

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Numeric6
Categorical4
Boolean1
Date0
Text (Unique)1
Rejected0
Unsupported0
\n", "
\n", "
\n", " \n", "

Warnings

\n", "
  • Age has 177 / 19.9% missing values Missing
  • Cabin has 687 / 77.1% missing values Missing
  • Cabin has a high cardinality: 148 distinct values Warning
  • Fare has 15 / 1.7% zeros Zeros
  • Parch has 678 / 76.1% zeros Zeros
  • SibSp has 608 / 68.2% zeros Zeros
  • Ticket has a high cardinality: 681 distinct values Warning
\n", "
\n", "
\n", "
\n", "

Variables

\n", "
\n", "
\n", "
\n", "

Age
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count89
Unique (%)10.0%
Missing (%)19.9%
Missing (n)177
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean29.699
Minimum0.42
Maximum80
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0.42
5-th percentile4
Q120.125
Median28
Q338
95-th percentile56
Maximum80
Range79.58
Interquartile range17.875
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation14.526
Coef of variation0.48912
Kurtosis0.17827
Mean29.699
MAD11.323
Skewness0.38911
Sum21205
Variance211.02
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
24.0303.4%\n", "
 
\n", "
22.0273.0%\n", "
 
\n", "
18.0262.9%\n", "
 
\n", "
28.0252.8%\n", "
 
\n", "
19.0252.8%\n", "
 
\n", "
30.0252.8%\n", "
 
\n", "
21.0242.7%\n", "
 
\n", "
25.0232.6%\n", "
 
\n", "
36.0222.5%\n", "
 
\n", "
29.0202.2%\n", "
 
\n", "
Other values (78)46752.4%\n", "
 
\n", "
(Missing)17719.9%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
0.4210.1%\n", "
 
\n", "
0.6710.1%\n", "
 
\n", "
0.7520.2%\n", "
 
\n", "
0.8320.2%\n", "
 
\n", "
0.9210.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
70.020.2%\n", "
 
\n", "
70.510.1%\n", "
 
\n", "
71.020.2%\n", "
 
\n", "
74.010.1%\n", "
 
\n", "
80.010.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Cabin
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count148
Unique (%)16.6%
Missing (%)77.1%
Missing (n)687
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
G6\n", "
\n", "  \n", "
\n", " 4\n", "
C23 C25 C27\n", "
\n", "  \n", "
\n", " 4\n", "
B96 B98\n", "
\n", "  \n", "
\n", " 4\n", "
Other values (144)\n", "
\n", " 192\n", "
\n", " \n", "
(Missing)\n", "
\n", " 687\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
G640.4%\n", "
 
\n", "
C23 C25 C2740.4%\n", "
 
\n", "
B96 B9840.4%\n", "
 
\n", "
D30.3%\n", "
 
\n", "
F230.3%\n", "
 
\n", "
F3330.3%\n", "
 
\n", "
C22 C2630.3%\n", "
 
\n", "
E10130.3%\n", "
 
\n", "
E12120.2%\n", "
 
\n", "
E820.2%\n", "
 
\n", "
Other values (137)17319.4%\n", "
 
\n", "
(Missing)68777.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Embarked
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count4
Unique (%)0.4%
Missing (%)0.2%
Missing (n)2
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
S\n", "
\n", " 644\n", "
\n", " \n", "
C\n", "
\n", " 168\n", "
\n", " \n", "
Q\n", "
\n", "  \n", "
\n", " 77\n", "
(Missing)\n", "
\n", "  \n", "
\n", " 2\n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
S64472.3%\n", "
 
\n", "
C16818.9%\n", "
 
\n", "
Q778.6%\n", "
 
\n", "
(Missing)20.2%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Fare
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count248
Unique (%)27.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean32.204
Minimum0
Maximum512.33
Zeros (%)1.7%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile7.225
Q17.9104
Median14.454
Q331
95-th percentile112.08
Maximum512.33
Range512.33
Interquartile range23.09
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation49.693
Coef of variation1.5431
Kurtosis33.398
Mean32.204
MAD28.164
Skewness4.7873
Sum28694
Variance2469.4
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
8.05434.8%\n", "
 
\n", "
13.0424.7%\n", "
 
\n", "
7.8958384.3%\n", "
 
\n", "
7.75343.8%\n", "
 
\n", "
26.0313.5%\n", "
 
\n", "
10.5242.7%\n", "
 
\n", "
7.925182.0%\n", "
 
\n", "
7.775161.8%\n", "
 
\n", "
26.55151.7%\n", "
 
\n", "
0.0151.7%\n", "
 
\n", "
Other values (238)61569.0%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
0.0151.7%\n", "
 
\n", "
4.012510.1%\n", "
 
\n", "
5.010.1%\n", "
 
\n", "
6.237510.1%\n", "
 
\n", "
6.437510.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
227.52540.4%\n", "
 
\n", "
247.520820.2%\n", "
 
\n", "
262.37520.2%\n", "
 
\n", "
263.040.4%\n", "
 
\n", "
512.329230.3%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Name
\n", " Categorical, Unique\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
First 3 values
Hansen, Mr. Henrik Juul
Aubart, Mme. Leontine Pauline
Abbott, Mrs. Stanton (Rosa Hunt)
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Last 3 values
Pickard, Mr. Berk (Berk Trembisky)
Goldenberg, Mrs. Samuel L (Edwiga Grabowska)
Karlsson, Mr. Nils August
\n", "\n", "
\n", "

First 10 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
Abbing, Mr. Anthony10.1%\n", "
 
\n", "
Abbott, Mr. Rossmore Edward10.1%\n", "
 
\n", "
Abbott, Mrs. Stanton (Rosa Hunt)10.1%\n", "
 
\n", "
Abelson, Mr. Samuel10.1%\n", "
 
\n", "
Abelson, Mrs. Samuel (Hannah Wizosky)10.1%\n", "
 
\n", "
\n", "

Last 10 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
de Mulder, Mr. Theodore10.1%\n", "
 
\n", "
de Pelsmaeker, Mr. Alfons10.1%\n", "
 
\n", "
del Carlo, Mr. Sebastiano10.1%\n", "
 
\n", "
van Billiard, Mr. Austin Blyler10.1%\n", "
 
\n", "
van Melkebeke, Mr. Philemon10.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Parch
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count7
Unique (%)0.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean0.38159
Minimum0
Maximum6
Zeros (%)76.1%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile0
Q10
Median0
Q30
95-th percentile2
Maximum6
Range6
Interquartile range0
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation0.80606
Coef of variation2.1123
Kurtosis9.7781
Mean0.38159
MAD0.58074
Skewness2.7491
Sum340
Variance0.64973
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
067876.1%\n", "
 
\n", "
111813.2%\n", "
 
\n", "
2809.0%\n", "
 
\n", "
550.6%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
610.1%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
067876.1%\n", "
 
\n", "
111813.2%\n", "
 
\n", "
2809.0%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
2809.0%\n", "
 
\n", "
350.6%\n", "
 
\n", "
440.4%\n", "
 
\n", "
550.6%\n", "
 
\n", "
610.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

PassengerId
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count891
Unique (%)100.0%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean446
Minimum1
Maximum891
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum1
5-th percentile45.5
Q1223.5
Median446
Q3668.5
95-th percentile846.5
Maximum891
Range890
Interquartile range445
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation257.35
Coef of variation0.57703
Kurtosis-1.2
Mean446
MAD222.75
Skewness0
Sum397386
Variance66231
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
89110.1%\n", "
 
\n", "
29310.1%\n", "
 
\n", "
30410.1%\n", "
 
\n", "
30310.1%\n", "
 
\n", "
30210.1%\n", "
 
\n", "
30110.1%\n", "
 
\n", "
30010.1%\n", "
 
\n", "
29910.1%\n", "
 
\n", "
29810.1%\n", "
 
\n", "
29710.1%\n", "
 
\n", "
Other values (881)88198.9%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
110.1%\n", "
 
\n", "
210.1%\n", "
 
\n", "
310.1%\n", "
 
\n", "
410.1%\n", "
 
\n", "
510.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
88710.1%\n", "
 
\n", "
88810.1%\n", "
 
\n", "
88910.1%\n", "
 
\n", "
89010.1%\n", "
 
\n", "
89110.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Pclass
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count3
Unique (%)0.3%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean2.3086
Minimum1
Maximum3
Zeros (%)0.0%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum1
5-th percentile1
Q12
Median3
Q33
95-th percentile3
Maximum3
Range2
Interquartile range1
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation0.83607
Coef of variation0.36215
Kurtosis-1.28
Mean2.3086
MAD0.76197
Skewness-0.63055
Sum2057
Variance0.69902
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
349155.1%\n", "
 
\n", "
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
349155.1%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
121624.2%\n", "
 
\n", "
218420.7%\n", "
 
\n", "
349155.1%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Sex
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count2
Unique (%)0.2%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", "
male\n", "
\n", " 577\n", "
\n", " \n", "
female\n", "
\n", " 314\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
male57764.8%\n", "
 
\n", "
female31435.2%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

SibSp
\n", " Numeric\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count7
Unique (%)0.8%
Missing (%)0.0%
Missing (n)0
Infinite (%)0.0%
Infinite (n)0
\n", "\n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Mean0.52301
Minimum0
Maximum8
Zeros (%)68.2%
\n", "
\n", "
\n", "
\n", "
\n", " \n", "\n", "
\n", "\n", "
\n", " \n", "\n", "
\n", "
\n", "
\n", "

Quantile statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Minimum0
5-th percentile0
Q10
Median0
Q31
95-th percentile3
Maximum8
Range8
Interquartile range1
\n", "
\n", "
\n", "

Descriptive statistics

\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Standard deviation1.1027
Coef of variation2.1085
Kurtosis17.88
Mean0.52301
MAD0.71378
Skewness3.6954
Sum466
Variance1.216
Memory size7.0 KiB
\n", "
\n", "
\n", "
\n", " \n", "
\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
060868.2%\n", "
 
\n", "
120923.5%\n", "
 
\n", "
2283.1%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
870.8%\n", "
 
\n", "
550.6%\n", "
 
\n", "
\n", "
\n", "
\n", "

Minimum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
060868.2%\n", "
 
\n", "
120923.5%\n", "
 
\n", "
2283.1%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
\n", "

Maximum 5 values

\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
2283.1%\n", "
 
\n", "
3161.8%\n", "
 
\n", "
4182.0%\n", "
 
\n", "
550.6%\n", "
 
\n", "
870.8%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "
\n", "

Survived
\n", " Boolean\n", "

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count2
Unique (%)0.2%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", "
Mean0.38384
\n", "
\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", "
0\n", "
\n", " 549\n", "
\n", " \n", "
1\n", "
\n", " 342\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
054961.6%\n", "
 
\n", "
134238.4%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Ticket
\n", " Categorical\n", "

\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Distinct count681
Unique (%)76.4%
Missing (%)0.0%
Missing (n)0
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", " \n", " \n", "\n", "
1601\n", "
\n", "  \n", "
\n", " 7\n", "
CA. 2343\n", "
\n", "  \n", "
\n", " 7\n", "
347082\n", "
\n", "  \n", "
\n", " 7\n", "
Other values (678)\n", "
\n", " 870\n", "
\n", " \n", "
\n", "
\n", "\n", "
\n", " \n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", " \n", " \n", " \n", " \n", "\n", "
ValueCountFrequency (%) 
160170.8%\n", "
 
\n", "
CA. 234370.8%\n", "
 
\n", "
34708270.8%\n", "
 
\n", "
34708860.7%\n", "
 
\n", "
310129560.7%\n", "
 
\n", "
CA 214460.7%\n", "
 
\n", "
38265250.6%\n", "
 
\n", "
S.O.C. 1487950.6%\n", "
 
\n", "
266640.4%\n", "
 
\n", "
1742140.4%\n", "
 
\n", "
Other values (671)83493.6%\n", "
 
\n", "
\n", "
\n", "
\n", "
\n", "

Correlations

\n", "
\n", "
\n", " \n", " \n", "
\n", "
\n", "

Sample

\n", "
\n", "
\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Th...female38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123S
4503Allen, Mr. William Henrymale35.0003734508.0500NaNS
\n", "
\n", "
\n", "
" ], "text/plain": [ "" ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pfr" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harrismale22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Th...female38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Lainafemale26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)female35.01011380353.1000C123S
4503Allen, Mr. William Henrymale35.0003734508.0500NaNS
\n", "
" ], "text/plain": [ " PassengerId Survived Pclass \\\n", "0 1 0 3 \n", "1 2 1 1 \n", "2 3 1 3 \n", "3 4 1 1 \n", "4 5 0 3 \n", "\n", " Name Sex Age SibSp \\\n", "0 Braund, Mr. Owen Harris male 22.0 1 \n", "1 Cumings, Mrs. John Bradley (Florence Briggs Th... female 38.0 1 \n", "2 Heikkinen, Miss. Laina female 26.0 0 \n", "3 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35.0 1 \n", "4 Allen, Mr. William Henry male 35.0 0 \n", "\n", " Parch Ticket Fare Cabin Embarked \n", "0 0 A/5 21171 7.2500 NaN S \n", "1 0 PC 17599 71.2833 C85 C \n", "2 0 STON/O2. 3101282 7.9250 NaN S \n", "3 0 113803 53.1000 C123 S \n", "4 0 373450 8.0500 NaN S " ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.head()" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.8" } }, "nbformat": 4, "nbformat_minor": 2 }