{ "cells": [ { "cell_type": "markdown", "id": "069bf06b", "metadata": {}, "source": [ "# Análise de Dados de Empresa de Telecomunicações" ] }, { "cell_type": "markdown", "id": "157151b6", "metadata": {}, "source": [ "## Entendendo a Situação Atual" ] }, { "cell_type": "markdown", "id": "8a29ba08", "metadata": {}, "source": [ "Você é um Analista de Dados em uma empresa de telecomunicações que fornece serviços de internet e telefonia. Recentemente, você teve acesso a dados históricos que indicam que a empresa perdeu 26% dos seus clientes nos últimos trimestres. Essa perda significativa de clientes impactou negativamente as finanças da empresa, gerando um prejuízo de milhões de reais." ] }, { "cell_type": "markdown", "id": "72791db0", "metadata": {}, "source": [ "## Desafio" ] }, { "cell_type": "markdown", "id": "c9628de6", "metadata": {}, "source": [ "O seu próximo desafio como Analista de Dados é identificar a principal causa do problema, para que você possa propor um plano de ação para resolvê-lo." ] }, { "cell_type": "markdown", "id": "1c8c292c", "metadata": {}, "source": [ "## Base de Dados" ] }, { "cell_type": "markdown", "id": "81c54fb2", "metadata": {}, "source": [ "Este é o link do Google Drive para a base de dados que será analisada:\n", "\n", "- https://drive.google.com/drive/folders/1T7D0BlWkNuy_MDpUHuBG44kT80EmRYIs?usp=sharing\n", "\n", "Este é o link original no Kaggle:\n", "- https://www.kaggle.com/radmirzosimov/telecom-users-dataset" ] }, { "cell_type": "markdown", "id": "b90cf3ed", "metadata": {}, "source": [ "## Divisão do Problema" ] }, { "cell_type": "markdown", "id": "76c79d11", "metadata": {}, "source": [ "1. Importar a base de dados com o pandas\n", "2. Visualizar a base de dados\n", " 1. Identificar quais informações estão disponíveis\n", " 2. Identificar dados problemáticos\n", "3. Tratar os dados\n", " 1. Converter os valores para os tipos de dados corretos\n", " 2. Eliminar valores vazios (informações que não ajudam, atrapalham)\n", "4. Analisar os dados parcialmente\n", "5. Analisar os dados de forma completa" ] }, { "cell_type": "markdown", "id": "d657099d", "metadata": {}, "source": [ "### Importar a Base de Dados" ] }, { "cell_type": "code", "execution_count": 1, "id": "9bcb0119", "metadata": {}, "outputs": [], "source": [ "# Importa o pandas com o apelido pd\n", "import pandas as pd\n", "\n", "# Importa o arquivo\n", "df_clientes = pd.read_csv('telecom_users.csv')" ] }, { "cell_type": "markdown", "id": "611cd830", "metadata": {}, "source": [ "### Visualizar a Base de Dados" ] }, { "cell_type": "code", "execution_count": 2, "id": "391c8c70", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | Unnamed: 0 | \n", "IDCliente | \n", "Genero | \n", "Aposentado | \n", "Casado | \n", "Dependentes | \n", "MesesComoCliente | \n", "ServicoTelefone | \n", "MultiplasLinhas | \n", "ServicoInternet | \n", "... | \n", "ServicoSuporteTecnico | \n", "ServicoStreamingTV | \n", "ServicoFilmes | \n", "TipoContrato | \n", "FaturaDigital | \n", "FormaPagamento | \n", "ValorMensal | \n", "TotalGasto | \n", "Churn | \n", "Codigo | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "1869 | \n", "7010-BRBUU | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "72 | \n", "Sim | \n", "Sim | \n", "Nao | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "2 anos | \n", "Nao | \n", "CartaoCredito | \n", "24.10 | \n", "1734.65 | \n", "Nao | \n", "NaN | \n", "
| 1 | \n", "4528 | \n", "9688-YGXVR | \n", "Feminino | \n", "0 | \n", "Nao | \n", "Nao | \n", "44 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "... | \n", "Nao | \n", "Sim | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "CartaoCredito | \n", "88.15 | \n", "3973.2 | \n", "Nao | \n", "NaN | \n", "
| 2 | \n", "6344 | \n", "9286-DOJGF | \n", "Feminino | \n", "1 | \n", "Sim | \n", "Nao | \n", "38 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "DebitoAutomatico | \n", "74.95 | \n", "2869.85 | \n", "Sim | \n", "NaN | \n", "
| 3 | \n", "6739 | \n", "6994-KERXL | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "4 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "... | \n", "Nao | \n", "Nao | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "55.90 | \n", "238.5 | \n", "Nao | \n", "NaN | \n", "
| 4 | \n", "432 | \n", "2181-UAESM | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "2 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Nao | \n", "BoletoEletronico | \n", "53.45 | \n", "119.5 | \n", "Nao | \n", "NaN | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 5981 | \n", "3772 | \n", "0684-AOSIH | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Nao | \n", "1 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "... | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "95.00 | \n", "95 | \n", "Sim | \n", "NaN | \n", "
| 5982 | \n", "5191 | \n", "5982-PSMKW | \n", "Feminino | \n", "0 | \n", "Sim | \n", "Sim | \n", "23 | \n", "Sim | \n", "Sim | \n", "DSL | \n", "... | \n", "Sim | \n", "Sim | \n", "Sim | \n", "2 anos | \n", "Sim | \n", "CartaoCredito | \n", "91.10 | \n", "2198.3 | \n", "Nao | \n", "NaN | \n", "
| 5983 | \n", "5226 | \n", "8044-BGWPI | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "12 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "21.15 | \n", "306.05 | \n", "Nao | \n", "NaN | \n", "
| 5984 | \n", "5390 | \n", "7450-NWRTR | \n", "Masculino | \n", "1 | \n", "Nao | \n", "Nao | \n", "12 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "... | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "99.45 | \n", "1200.15 | \n", "Sim | \n", "NaN | \n", "
| 5985 | \n", "860 | \n", "4795-UXVCJ | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "26 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Anual | \n", "Nao | \n", "CartaoCredito | \n", "19.80 | \n", "457.3 | \n", "Nao | \n", "NaN | \n", "
5986 rows × 23 columns
\n", "| \n", " | IDCliente | \n", "Genero | \n", "Aposentado | \n", "Casado | \n", "Dependentes | \n", "MesesComoCliente | \n", "ServicoTelefone | \n", "MultiplasLinhas | \n", "ServicoInternet | \n", "ServicoSegurancaOnline | \n", "... | \n", "ServicoSuporteTecnico | \n", "ServicoStreamingTV | \n", "ServicoFilmes | \n", "TipoContrato | \n", "FaturaDigital | \n", "FormaPagamento | \n", "ValorMensal | \n", "TotalGasto | \n", "Churn | \n", "Codigo | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "7010-BRBUU | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "72 | \n", "Sim | \n", "Sim | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "2 anos | \n", "Nao | \n", "CartaoCredito | \n", "24.10 | \n", "1734.65 | \n", "Nao | \n", "NaN | \n", "
| 1 | \n", "9688-YGXVR | \n", "Feminino | \n", "0 | \n", "Nao | \n", "Nao | \n", "44 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "Nao | \n", "... | \n", "Nao | \n", "Sim | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "CartaoCredito | \n", "88.15 | \n", "3973.2 | \n", "Nao | \n", "NaN | \n", "
| 2 | \n", "9286-DOJGF | \n", "Feminino | \n", "1 | \n", "Sim | \n", "Nao | \n", "38 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "Nao | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "DebitoAutomatico | \n", "74.95 | \n", "2869.85 | \n", "Sim | \n", "NaN | \n", "
| 3 | \n", "6994-KERXL | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "4 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "Nao | \n", "... | \n", "Nao | \n", "Nao | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "55.90 | \n", "238.5 | \n", "Nao | \n", "NaN | \n", "
| 4 | \n", "2181-UAESM | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "2 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "Sim | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Nao | \n", "BoletoEletronico | \n", "53.45 | \n", "119.5 | \n", "Nao | \n", "NaN | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 5981 | \n", "0684-AOSIH | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Nao | \n", "1 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "Sim | \n", "... | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "95.00 | \n", "95 | \n", "Sim | \n", "NaN | \n", "
| 5982 | \n", "5982-PSMKW | \n", "Feminino | \n", "0 | \n", "Sim | \n", "Sim | \n", "23 | \n", "Sim | \n", "Sim | \n", "DSL | \n", "Sim | \n", "... | \n", "Sim | \n", "Sim | \n", "Sim | \n", "2 anos | \n", "Sim | \n", "CartaoCredito | \n", "91.10 | \n", "2198.3 | \n", "Nao | \n", "NaN | \n", "
| 5983 | \n", "8044-BGWPI | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "12 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "21.15 | \n", "306.05 | \n", "Nao | \n", "NaN | \n", "
| 5984 | \n", "7450-NWRTR | \n", "Masculino | \n", "1 | \n", "Nao | \n", "Nao | \n", "12 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "Nao | \n", "... | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "99.45 | \n", "1200.15 | \n", "Sim | \n", "NaN | \n", "
| 5985 | \n", "4795-UXVCJ | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "26 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Anual | \n", "Nao | \n", "CartaoCredito | \n", "19.80 | \n", "457.3 | \n", "Nao | \n", "NaN | \n", "
5986 rows × 22 columns
\n", "| \n", " | IDCliente | \n", "Genero | \n", "Aposentado | \n", "Casado | \n", "Dependentes | \n", "MesesComoCliente | \n", "ServicoTelefone | \n", "MultiplasLinhas | \n", "ServicoInternet | \n", "ServicoSegurancaOnline | \n", "... | \n", "ProtecaoEquipamento | \n", "ServicoSuporteTecnico | \n", "ServicoStreamingTV | \n", "ServicoFilmes | \n", "TipoContrato | \n", "FaturaDigital | \n", "FormaPagamento | \n", "ValorMensal | \n", "TotalGasto | \n", "Churn | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "7010-BRBUU | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "72 | \n", "Sim | \n", "Sim | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "2 anos | \n", "Nao | \n", "CartaoCredito | \n", "24.10 | \n", "1734.65 | \n", "Nao | \n", "
| 1 | \n", "9688-YGXVR | \n", "Feminino | \n", "0 | \n", "Nao | \n", "Nao | \n", "44 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "Nao | \n", "... | \n", "Sim | \n", "Nao | \n", "Sim | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "CartaoCredito | \n", "88.15 | \n", "3973.20 | \n", "Nao | \n", "
| 2 | \n", "9286-DOJGF | \n", "Feminino | \n", "1 | \n", "Sim | \n", "Nao | \n", "38 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "Nao | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Sim | \n", "DebitoAutomatico | \n", "74.95 | \n", "2869.85 | \n", "Sim | \n", "
| 3 | \n", "6994-KERXL | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "4 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "Nao | \n", "... | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "55.90 | \n", "238.50 | \n", "Nao | \n", "
| 4 | \n", "2181-UAESM | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "2 | \n", "Sim | \n", "Nao | \n", "DSL | \n", "Sim | \n", "... | \n", "Sim | \n", "Nao | \n", "Nao | \n", "Nao | \n", "Mensal | \n", "Nao | \n", "BoletoEletronico | \n", "53.45 | \n", "119.50 | \n", "Nao | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 5981 | \n", "0684-AOSIH | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Nao | \n", "1 | \n", "Sim | \n", "Nao | \n", "Fibra | \n", "Sim | \n", "... | \n", "Nao | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "95.00 | \n", "95.00 | \n", "Sim | \n", "
| 5982 | \n", "5982-PSMKW | \n", "Feminino | \n", "0 | \n", "Sim | \n", "Sim | \n", "23 | \n", "Sim | \n", "Sim | \n", "DSL | \n", "Sim | \n", "... | \n", "Sim | \n", "Sim | \n", "Sim | \n", "Sim | \n", "2 anos | \n", "Sim | \n", "CartaoCredito | \n", "91.10 | \n", "2198.30 | \n", "Nao | \n", "
| 5983 | \n", "8044-BGWPI | \n", "Masculino | \n", "0 | \n", "Sim | \n", "Sim | \n", "12 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "21.15 | \n", "306.05 | \n", "Nao | \n", "
| 5984 | \n", "7450-NWRTR | \n", "Masculino | \n", "1 | \n", "Nao | \n", "Nao | \n", "12 | \n", "Sim | \n", "Sim | \n", "Fibra | \n", "Nao | \n", "... | \n", "Sim | \n", "Nao | \n", "Sim | \n", "Sim | \n", "Mensal | \n", "Sim | \n", "BoletoEletronico | \n", "99.45 | \n", "1200.15 | \n", "Sim | \n", "
| 5985 | \n", "4795-UXVCJ | \n", "Masculino | \n", "0 | \n", "Nao | \n", "Nao | \n", "26 | \n", "Sim | \n", "Nao | \n", "Nao | \n", "SemInternet | \n", "... | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "SemInternet | \n", "Anual | \n", "Nao | \n", "CartaoCredito | \n", "19.80 | \n", "457.30 | \n", "Nao | \n", "
5974 rows × 21 columns
\n", "