{ "cells": [ { "cell_type": "markdown", "id": "tracked-vegetation", "metadata": { "slideshow": { "slide_type": "fragment" } }, "source": [ "## **Pandas Essencial**\n", "**Prof. Dr. Samuel Martins (@hisamuka @xavecoding)**
\n", "xavecoding: https://youtube.com/c/xavecoding
\n", "\n", "Neste tutorial, vamos aprender o essencial da biblioteca _Pandas_ para manipulação de dados.

\n", "\n", "\"Creative
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License." ] }, { "cell_type": "markdown", "id": "driving-craft", "metadata": {}, "source": [ "### Pacotes usados neste Notebook" ] }, { "cell_type": "code", "execution_count": 1, "id": "elder-hunger", "metadata": {}, "outputs": [], "source": [ "# pacotes usados neste notebook\n", "import pandas as pd" ] }, { "cell_type": "markdown", "id": "expanded-momentum", "metadata": {}, "source": [ "

Manipulação de Dados com Pandas


" ] }, { "cell_type": "markdown", "id": "associate-mandate", "metadata": {}, "source": [ "

1. Manipulação Básica de Datasets

\n", "
" ] }, { "cell_type": "markdown", "id": "prerequisite-alias", "metadata": {}, "source": [ "**Dataset**: Gas Prices in Brazil: https://www.kaggle.com/matheusfreitag/gas-prices-in-brazil
\n", "\n", "Este dataset contém os **registros dos preços médios semanais dos combustíveis do Brasil entre os anos de 2004 e 2019**.
\n", "Cada *observação (registro/linha)* consiste em um registro de preço aferido para um dado tipo de combustível em uma dada localidade do Brasil.
\n", "Alguns dos principais *atributos* (colunas) do dataset são: 'ESTADO', 'PRODUTO', 'NÚMERO DE POSTOS PESQUISADOS', 'PREÇO MÉDIO REVENDA'.\n", "\n", "\n", "\\* O arquivo disponibilizado no Kaggle está no formato *tsv*. Embora o _pandas_ consiga abrí-lo normalmente, convertemos tal arquivo para o formato *CSV*, que é um dos formatos mais utilizados, e mudamos seu separado para ';' apenas para mostrar algumas opções da função de carregamento." ] }, { "cell_type": "markdown", "id": "single-drilling", "metadata": {}, "source": [ "### 1.1. Importando o Dataset\n", "Para carregar um dataset no formato csv, basta utilizar a função `read_csv` do pandas. Por padrão, ela considera _','_ como separador." ] }, { "cell_type": "code", "execution_count": 2, "id": "specific-sarah", "metadata": {}, "outputs": [], "source": [ "data = pd.read_csv('./datasets/GasPricesinBrazil_2004-2019.csv')" ] }, { "cell_type": "code", "execution_count": 3, "id": "dying-throat", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0;DATA INICIAL;DATA FINAL;REGIÃO;ESTADO;PRODUTO;NÚMERO DE POSTOS PESQUISADOS;UNIDADE DE MEDIDA;PREÇO MÉDIO REVENDA;DESVIO PADRÃO REVENDA;PREÇO MÍNIMO REVENDA;PREÇO MÁXIMO REVENDA;MARGEM MÉDIA REVENDA;COEF DE VARIAÇÃO REVENDA;PREÇO MÉDIO DISTRIBUIÇÃO;DESVIO PADRÃO DISTRIBUIÇÃO;PREÇO MÍNIMO DISTRIBUIÇÃO;PREÇO MÁXIMO DISTRIBUIÇÃO;COEF DE VARIAÇÃO DISTRIBUIÇÃO;MÊS;ANO
00;2004-05-09;2004-05-15;CENTRO OESTE;DISTRITO ...
11;2004-05-09;2004-05-15;CENTRO OESTE;GOIAS;ETA...
22;2004-05-09;2004-05-15;CENTRO OESTE;MATO GROS...
33;2004-05-09;2004-05-15;CENTRO OESTE;MATO GROS...
44;2004-05-09;2004-05-15;NORDESTE;ALAGOAS;ETANO...
......
106818106818;2019-06-23;2019-06-29;NORDESTE;RIO GRAN...
106819106819;2019-06-23;2019-06-29;SUL;RIO GRANDE DO...
106820106820;2019-06-23;2019-06-29;SUL;SANTA CATARIN...
106821106821;2019-06-23;2019-06-29;SUDESTE;SAO PAULO...
106822106822;2019-06-23;2019-06-29;NORDESTE;SERGIPE;...
\n", "

106823 rows × 1 columns

\n", "
" ], "text/plain": [ " Unnamed: 0;DATA INICIAL;DATA FINAL;REGIÃO;ESTADO;PRODUTO;NÚMERO DE POSTOS PESQUISADOS;UNIDADE DE MEDIDA;PREÇO MÉDIO REVENDA;DESVIO PADRÃO REVENDA;PREÇO MÍNIMO REVENDA;PREÇO MÁXIMO REVENDA;MARGEM MÉDIA REVENDA;COEF DE VARIAÇÃO REVENDA;PREÇO MÉDIO DISTRIBUIÇÃO;DESVIO PADRÃO DISTRIBUIÇÃO;PREÇO MÍNIMO DISTRIBUIÇÃO;PREÇO MÁXIMO DISTRIBUIÇÃO;COEF DE VARIAÇÃO DISTRIBUIÇÃO;MÊS;ANO\n", "0 0;2004-05-09;2004-05-15;CENTRO OESTE;DISTRITO ... \n", "1 1;2004-05-09;2004-05-15;CENTRO OESTE;GOIAS;ETA... \n", "2 2;2004-05-09;2004-05-15;CENTRO OESTE;MATO GROS... \n", "3 3;2004-05-09;2004-05-15;CENTRO OESTE;MATO GROS... \n", "4 4;2004-05-09;2004-05-15;NORDESTE;ALAGOAS;ETANO... \n", "... ... \n", "106818 106818;2019-06-23;2019-06-29;NORDESTE;RIO GRAN... \n", "106819 106819;2019-06-23;2019-06-29;SUL;RIO GRANDE DO... \n", "106820 106820;2019-06-23;2019-06-29;SUL;SANTA CATARIN... \n", "106821 106821;2019-06-23;2019-06-29;SUDESTE;SAO PAULO... \n", "106822 106822;2019-06-23;2019-06-29;NORDESTE;SERGIPE;... \n", "\n", "[106823 rows x 1 columns]" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "figured-farming", "metadata": {}, "source": [ "O dataset não foi carregado corretamente pois o separador utilizado seu arquivo CSV era ';' e não a ','.
\n", "Vamos então carregá-lo corretamente:" ] }, { "cell_type": "code", "execution_count": 4, "id": "bizarre-classics", "metadata": {}, "outputs": [], "source": [ "# carregando o dataset corretamente ==> neste caso, usa o separador ';'\n", "data = pd.read_csv('./datasets/GasPricesinBrazil_2004-2019.csv', sep=';')" ] }, { "cell_type": "code", "execution_count": 5, "id": "concerned-jefferson", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...3.6900.8180.0182.75602.7562.756062019
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...3.7890.950.0382.4510.4021.98422.86610.16462019
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...3.4990.9140.0651.99801.99811.9981062019
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...3.4900.6460.0762.3740.1652.01792.50930.0762019
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...3.6991.1790.0012.51802.51752.5175062019
\n", "

106823 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "... ... ... ... \n", "106818 3.690 0.818 0.018 \n", "106819 3.789 0.95 0.038 \n", "106820 3.499 0.914 0.065 \n", "106821 3.490 0.646 0.076 \n", "106822 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... .. ... \n", "106818 0 6 2019 \n", "106819 0.164 6 2019 \n", "106820 0 6 2019 \n", "106821 0.07 6 2019 \n", "106822 0 6 2019 \n", "\n", "[106823 rows x 21 columns]" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "liquid-converter", "metadata": {}, "source": [ "### 1.2. Exibindo as primeiras linhas do Dataset\n", "A função `.head()` exibe as 5 primeiras linhas do dataset/tabela/Data Frame." ] }, { "cell_type": "code", "execution_count": 6, "id": "dutch-martin", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
\n", "

5 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA \\\n", "0 1.288 0.016 ... 1.350 \n", "1 1.162 0.114 ... 1.449 \n", "2 1.389 0.097 ... 1.760 \n", "3 1.262 0.070 ... 1.509 \n", "4 1.181 0.078 ... 1.400 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.463 0.012 0.825 \n", "1 0.399 0.098 0.763 \n", "2 0.419 0.070 0.97 \n", "3 0.432 0.055 0.83 \n", "4 0.24 0.066 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", "[5 rows x 21 columns]" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 7, "id": "minus-uniform", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
552004-05-092004-05-15NORDESTEBAHIAETANOL HIDRATADO408R$/l1.3830.132...2.0500.4260.0950.9570.1280.56861.350.13452004
662004-05-092004-05-15NORDESTECEARAETANOL HIDRATADO278R$/l1.4530.218...1.9500.3530.1501.10.0680.73321.2940.06252004
772004-05-092004-05-15NORDESTEMARANHAOETANOL HIDRATADO105R$/l1.6310.158...2.0000.5150.0971.1160.0910.99231.361830.08252004
882004-05-092004-05-15NORDESTEPARAIBAETANOL HIDRATADO125R$/l1.2840.130...1.6990.3530.1010.9310.0720.75771.29720.07752004
992004-05-092004-05-15NORDESTEPERNAMBUCOETANOL HIDRATADO423R$/l1.2240.141...1.7000.2770.1150.9470.0910.56431.35410.09652004
\n", "

10 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "5 5 2004-05-09 2004-05-15 NORDESTE BAHIA \n", "6 6 2004-05-09 2004-05-15 NORDESTE CEARA \n", "7 7 2004-05-09 2004-05-15 NORDESTE MARANHAO \n", "8 8 2004-05-09 2004-05-15 NORDESTE PARAIBA \n", "9 9 2004-05-09 2004-05-15 NORDESTE PERNAMBUCO \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "5 ETANOL HIDRATADO 408 R$/l \n", "6 ETANOL HIDRATADO 278 R$/l \n", "7 ETANOL HIDRATADO 105 R$/l \n", "8 ETANOL HIDRATADO 125 R$/l \n", "9 ETANOL HIDRATADO 423 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA \\\n", "0 1.288 0.016 ... 1.350 \n", "1 1.162 0.114 ... 1.449 \n", "2 1.389 0.097 ... 1.760 \n", "3 1.262 0.070 ... 1.509 \n", "4 1.181 0.078 ... 1.400 \n", "5 1.383 0.132 ... 2.050 \n", "6 1.453 0.218 ... 1.950 \n", "7 1.631 0.158 ... 2.000 \n", "8 1.284 0.130 ... 1.699 \n", "9 1.224 0.141 ... 1.700 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.463 0.012 0.825 \n", "1 0.399 0.098 0.763 \n", "2 0.419 0.070 0.97 \n", "3 0.432 0.055 0.83 \n", "4 0.24 0.066 0.941 \n", "5 0.426 0.095 0.957 \n", "6 0.353 0.150 1.1 \n", "7 0.515 0.097 1.116 \n", "8 0.353 0.101 0.931 \n", "9 0.277 0.115 0.947 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "5 0.128 0.5686 \n", "6 0.068 0.7332 \n", "7 0.091 0.9923 \n", "8 0.072 0.7577 \n", "9 0.091 0.5643 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "5 1.35 0.134 5 2004 \n", "6 1.294 0.062 5 2004 \n", "7 1.36183 0.082 5 2004 \n", "8 1.2972 0.077 5 2004 \n", "9 1.3541 0.096 5 2004 \n", "\n", "[10 rows x 21 columns]" ] }, "execution_count": 7, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# exibe as 10 primeiras linhas do dataframe\n", "data.head(10)" ] }, { "cell_type": "markdown", "id": "appointed-butterfly", "metadata": {}, "source": [ "### 1.3 Informações do Dataset e Elementos Chave" ] }, { "cell_type": "markdown", "id": "celtic-cardiff", "metadata": {}, "source": [ "### 1.3.1 Informações gerais sobre o Dataset" ] }, { "cell_type": "code", "execution_count": 8, "id": "sensitive-mechanics", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "RangeIndex: 106823 entries, 0 to 106822\n", "Data columns (total 21 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 Unnamed: 0 106823 non-null int64 \n", " 1 DATA INICIAL 106823 non-null object \n", " 2 DATA FINAL 106823 non-null object \n", " 3 REGIÃO 106823 non-null object \n", " 4 ESTADO 106823 non-null object \n", " 5 PRODUTO 106823 non-null object \n", " 6 NÚMERO DE POSTOS PESQUISADOS 106823 non-null int64 \n", " 7 UNIDADE DE MEDIDA 106823 non-null object \n", " 8 PREÇO MÉDIO REVENDA 106823 non-null float64\n", " 9 DESVIO PADRÃO REVENDA 106823 non-null float64\n", " 10 PREÇO MÍNIMO REVENDA 106823 non-null float64\n", " 11 PREÇO MÁXIMO REVENDA 106823 non-null float64\n", " 12 MARGEM MÉDIA REVENDA 106823 non-null object \n", " 13 COEF DE VARIAÇÃO REVENDA 106823 non-null float64\n", " 14 PREÇO MÉDIO DISTRIBUIÇÃO 106823 non-null object \n", " 15 DESVIO PADRÃO DISTRIBUIÇÃO 106823 non-null object \n", " 16 PREÇO MÍNIMO DISTRIBUIÇÃO 106823 non-null object \n", " 17 PREÇO MÁXIMO DISTRIBUIÇÃO 106823 non-null object \n", " 18 COEF DE VARIAÇÃO DISTRIBUIÇÃO 106823 non-null object \n", " 19 MÊS 106823 non-null int64 \n", " 20 ANO 106823 non-null int64 \n", "dtypes: float64(5), int64(4), object(12)\n", "memory usage: 17.1+ MB\n" ] } ], "source": [ "data.info()" ] }, { "cell_type": "markdown", "id": "ready-karaoke", "metadata": {}, "source": [ "A primeira coluna da tabela, chamada _'Unnamed: 0'_, parece não significar nada. Na verdade, ela parece ser os **índices** da tabela, que foram salvos como uma _coluna_.
\n", "Veremos jajá como **remover tal coluna**.\n", "\n", "Outro ponto é que, aparentemente, nenhum atributo/coluna possui valores nulos (_null_), uma vez que o número de registros do dataframe e os números de valores _non-null_ é de **106823**.
\n", "Mas, veremos que não é bem assim para esse caso.\n", "\n", "Além disso, note que alguns atributos/colunas, p. ex., 'PREÇO MÉDIO DISTRIBUIÇÃO', possui tipo de dado `object` ao invés de `float`. Esse `object`, no geral, representa strings. Isso parece estranho e suspeito. Veremos se isso é problemático mais pra frente." ] }, { "cell_type": "markdown", "id": "powered-cutting", "metadata": {}, "source": [ "### 1.3.2 Data Frame\n", "Todo dataset carregado (dados estruturados) é um `Data Frame`: 'Tabela' bi-dimensional, de tamanho mutável, com dados potencialmente heterogêneos.
" ] }, { "cell_type": "code", "execution_count": 9, "id": "prescribed-desperate", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.frame.DataFrame" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(data)" ] }, { "cell_type": "markdown", "id": "configured-gothic", "metadata": {}, "source": [ "Podemos acessar as **dimensões do Data Frame** (número de linhas x número de colunas) utilizando o atributo `.shape` do Data Frame." ] }, { "cell_type": "code", "execution_count": 10, "id": "emotional-emperor", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(106823, 21)" ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.shape" ] }, { "cell_type": "code", "execution_count": 11, "id": "charitable-atlantic", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "O DataFrame possui 106823 linhas/observações/registros e 21 colunas/atributos/variáveis.\n" ] } ], "source": [ "print(f'O DataFrame possui {data.shape[0]} linhas/observações/registros e {data.shape[1]} colunas/atributos/variáveis.')" ] }, { "cell_type": "markdown", "id": "vietnamese-diameter", "metadata": {}, "source": [ "#### **Criando um DataFrame**\n", "\n", "Podemos criar um DataFrame a partir de um _dicionário_, onde cada **chave** possui uma **lista de elementos de igual tamanho**.
\n", "As **chaves** representam as **colunas** e **cada um dos valores de sua lista** representa o **valor da linha** correspondente para aquela coluna." ] }, { "cell_type": "code", "execution_count": 12, "id": "structured-appearance", "metadata": {}, "outputs": [], "source": [ "personagens_df = pd.DataFrame({\n", " 'nome': ['Luke Skywalker', 'Yoda', 'Palpatine'],\n", " 'idade': [16, 1000, 70],\n", " 'peso': [70.5, 15.2, 60.1],\n", " 'eh jedi': [True, True, False] # o nome das colunas podem ter espaços\n", "})" ] }, { "cell_type": "code", "execution_count": 13, "id": "arabic-healing", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadepesoeh jedi
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " nome idade peso eh jedi\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df" ] }, { "cell_type": "code", "execution_count": 14, "id": "public-embassy", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "RangeIndex: 3 entries, 0 to 2\n", "Data columns (total 4 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 nome 3 non-null object \n", " 1 idade 3 non-null int64 \n", " 2 peso 3 non-null float64\n", " 3 eh jedi 3 non-null bool \n", "dtypes: bool(1), float64(1), int64(1), object(1)\n", "memory usage: 203.0+ bytes\n" ] } ], "source": [ "personagens_df.info()" ] }, { "cell_type": "markdown", "id": "soviet-appraisal", "metadata": {}, "source": [ "#### **VEJA MAIS**\n", "Criando um Data Frame a partir de um dicionário: https://www.geeksforgeeks.org/how-to-create-dataframe-from-dictionary-in-python-pandas/" ] }, { "cell_type": "markdown", "id": "rising-archive", "metadata": {}, "source": [ "#### **Renomeando as colunas de um DataFrame**\n", "**===>** O atributo `DataFrame.columns` retorna uma \"lista\" com os **nomes de todas as colunas** do data frame." ] }, { "cell_type": "code", "execution_count": 15, "id": "conventional-feeling", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index(['nome', 'idade', 'peso', 'eh jedi'], dtype='object')" ] }, "execution_count": 15, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df.columns" ] }, { "cell_type": "code", "execution_count": 16, "id": "compressed-township", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.indexes.base.Index" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(personagens_df.columns)" ] }, { "cell_type": "code", "execution_count": 17, "id": "crucial-vietnamese", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['nome', 'idade', 'peso', 'eh jedi']" ] }, "execution_count": 17, "metadata": {}, "output_type": "execute_result" } ], "source": [ "list(personagens_df.columns)" ] }, { "cell_type": "markdown", "id": "independent-psychiatry", "metadata": {}, "source": [ "
\n", "\n", "**===>** Para **renomear colunas** do data frame, utilize o método `DataFrame.rename`, que retorna uma _cópia_ do data frame com as as colunas renomeadas:" ] }, { "cell_type": "code", "execution_count": 18, "id": "naughty-brother", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadepesoeh jedi
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " nome idade peso eh jedi\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df" ] }, { "cell_type": "code", "execution_count": 19, "id": "regulated-bachelor", "metadata": {}, "outputs": [], "source": [ "personagens_df_renomeado = personagens_df.rename(columns={\n", " 'nome': 'Nome Completo', # renomeia a coluna de nome 'nome' para 'Nome Completo'\n", " 'idade': 'Idade'\n", "})" ] }, { "cell_type": "code", "execution_count": 20, "id": "automatic-firewall", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Nome CompletoIdadepesoeh jedi
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " Nome Completo Idade peso eh jedi\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 20, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df_renomeado" ] }, { "cell_type": "code", "execution_count": 21, "id": "combined-translation", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadepesoeh jedi
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " nome idade peso eh jedi\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 21, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df" ] }, { "cell_type": "markdown", "id": "classified-eight", "metadata": {}, "source": [ "Para renomear o _próprio_ data frame em questão, utilize o parâmetro `inplace=True`:" ] }, { "cell_type": "code", "execution_count": 22, "id": "developmental-minneapolis", "metadata": {}, "outputs": [], "source": [ "personagens_df.rename(columns={'nome': 'Nome Completo','idade': 'Idade'}, inplace=True)" ] }, { "cell_type": "code", "execution_count": 23, "id": "narrative-pregnancy", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Nome CompletoIdadepesoeh jedi
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " Nome Completo Idade peso eh jedi\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 23, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df" ] }, { "cell_type": "markdown", "id": "beautiful-switch", "metadata": {}, "source": [ "
\n", "\n", "**===>** Uma outra forma de **renomear todas as colunas** de um data frame é passar uma _lista_ com os novos nomes das colunas para o atributo `DataFrame.columns`:" ] }, { "cell_type": "code", "execution_count": 24, "id": "compliant-productivity", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index(['Nome Completo', 'Idade', 'peso', 'eh jedi'], dtype='object')" ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df.columns" ] }, { "cell_type": "code", "execution_count": 25, "id": "applied-religion", "metadata": {}, "outputs": [], "source": [ "personagens_df.columns = ['NOME', 'IDADE', 'PESO', 'EH_JEDI']" ] }, { "cell_type": "code", "execution_count": 26, "id": "innocent-confidentiality", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NOMEIDADEPESOEH_JEDI
0Luke Skywalker1670.5True
1Yoda100015.2True
2Palpatine7060.1False
\n", "
" ], "text/plain": [ " NOME IDADE PESO EH_JEDI\n", "0 Luke Skywalker 16 70.5 True\n", "1 Yoda 1000 15.2 True\n", "2 Palpatine 70 60.1 False" ] }, "execution_count": 26, "metadata": {}, "output_type": "execute_result" } ], "source": [ "personagens_df" ] }, { "cell_type": "markdown", "id": "active-boating", "metadata": {}, "source": [ "### 1.3.3 Series" ] }, { "cell_type": "markdown", "id": "legitimate-hearing", "metadata": {}, "source": [ "Array uni-dimensional com os dados e rótulos de um eixo." ] }, { "cell_type": "code", "execution_count": 27, "id": "operational-rates", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
\n", "

5 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA \\\n", "0 1.288 0.016 ... 1.350 \n", "1 1.162 0.114 ... 1.449 \n", "2 1.389 0.097 ... 1.760 \n", "3 1.262 0.070 ... 1.509 \n", "4 1.181 0.078 ... 1.400 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.463 0.012 0.825 \n", "1 0.399 0.098 0.763 \n", "2 0.419 0.070 0.97 \n", "3 0.432 0.055 0.83 \n", "4 0.24 0.066 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", "[5 rows x 21 columns]" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 28, "id": "potential-composite", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "106818 RIO GRANDE DO NORTE\n", "106819 RIO GRANDE DO SUL\n", "106820 SANTA CATARINA\n", "106821 SAO PAULO\n", "106822 SERGIPE\n", "Name: ESTADO, Length: 106823, dtype: object" ] }, "execution_count": 28, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando uma coluna inteira\n", "data['ESTADO']" ] }, { "cell_type": "code", "execution_count": 29, "id": "referenced-citation", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "106818 RIO GRANDE DO NORTE\n", "106819 RIO GRANDE DO SUL\n", "106820 SANTA CATARINA\n", "106821 SAO PAULO\n", "106822 SERGIPE\n", "Name: ESTADO, Length: 106823, dtype: object" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando uma coluna inteira\n", "# esta forma de acesso, só funciona para colunas com nomes sem espaços, acentos, etc (caracteres inválidos)\n", "data.ESTADO" ] }, { "cell_type": "code", "execution_count": 30, "id": "altered-entity", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.series.Series" ] }, "execution_count": 30, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(data['ESTADO'])" ] }, { "cell_type": "code", "execution_count": 31, "id": "false-modeling", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Unnamed: 0 1\n", "DATA INICIAL 2004-05-09\n", "DATA FINAL 2004-05-15\n", "REGIÃO CENTRO OESTE\n", "ESTADO GOIAS\n", "PRODUTO ETANOL HIDRATADO\n", "NÚMERO DE POSTOS PESQUISADOS 387\n", "UNIDADE DE MEDIDA R$/l\n", "PREÇO MÉDIO REVENDA 1.162\n", "DESVIO PADRÃO REVENDA 0.114\n", "PREÇO MÍNIMO REVENDA 0.89\n", "PREÇO MÁXIMO REVENDA 1.449\n", "MARGEM MÉDIA REVENDA 0.399\n", "COEF DE VARIAÇÃO REVENDA 0.098\n", "PREÇO MÉDIO DISTRIBUIÇÃO 0.763\n", "DESVIO PADRÃO DISTRIBUIÇÃO 0.088\n", "PREÇO MÍNIMO DISTRIBUIÇÃO 0.5013\n", "PREÇO MÁXIMO DISTRIBUIÇÃO 1.05\n", "COEF DE VARIAÇÃO DISTRIBUIÇÃO 0.115\n", "MÊS 5\n", "ANO 2004\n", "Name: 1, dtype: object" ] }, "execution_count": 31, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando a observação indexada no índice [1] do dataframe\n", "data.iloc[1]" ] }, { "cell_type": "code", "execution_count": 32, "id": "quick-discussion", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.series.Series" ] }, "execution_count": 32, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(data.iloc[1])" ] }, { "cell_type": "markdown", "id": "native-examination", "metadata": {}, "source": [ "#### **Criando uma Series**\n", "\n", "Podemos criar um DataFrame a partir de uma lista de elementos." ] }, { "cell_type": "code", "execution_count": 33, "id": "checked-airplane", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 5.5\n", "1 6.0\n", "2 9.5\n", "dtype: float64" ] }, "execution_count": 33, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pd.Series([5.5, 6.0, 9.5])" ] }, { "cell_type": "markdown", "id": "cooked-employee", "metadata": {}, "source": [ "Podemos alterar o **nome dos índices** (veremos melhor jajá) e o **nome da Series** (o que ela representa):" ] }, { "cell_type": "code", "execution_count": 34, "id": "regular-membrane", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "prova 1 5.5\n", "prova 2 6.0\n", "projeto 9.5\n", "Name: Notas dos Luke Skywalker, dtype: float64" ] }, "execution_count": 34, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pd.Series([5.5, 6.0, 9.5], index=['prova 1', 'prova 2', 'projeto'], name='Notas dos Luke Skywalker')" ] }, { "cell_type": "markdown", "id": "buried-rates", "metadata": {}, "source": [ "#### **VEJA MAIS**\n", "https://pandas.pydata.org/pandas-docs/stable/user_guide/dsintro.html" ] }, { "cell_type": "markdown", "id": "terminal-short", "metadata": {}, "source": [ "### 1.3.4 Atribuindo Dados" ] }, { "cell_type": "code", "execution_count": 35, "id": "grave-victor", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
\n", "

5 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA \\\n", "0 1.288 0.016 ... 1.350 \n", "1 1.162 0.114 ... 1.449 \n", "2 1.389 0.097 ... 1.760 \n", "3 1.262 0.070 ... 1.509 \n", "4 1.181 0.078 ... 1.400 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.463 0.012 0.825 \n", "1 0.399 0.098 0.763 \n", "2 0.419 0.070 0.97 \n", "3 0.432 0.055 0.83 \n", "4 0.24 0.066 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", "[5 rows x 21 columns]" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "markdown", "id": "fleet-dictionary", "metadata": {}, "source": [ "#### 1.3.4.1 Atribuindo constantes" ] }, { "cell_type": "code", "execution_count": 36, "id": "choice-strain", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 ETANOL HIDRATADO\n", "1 ETANOL HIDRATADO\n", "2 ETANOL HIDRATADO\n", "3 ETANOL HIDRATADO\n", "4 ETANOL HIDRATADO\n", " ... \n", "106818 GNV\n", "106819 GNV\n", "106820 GNV\n", "106821 GNV\n", "106822 GNV\n", "Name: PRODUTO, Length: 106823, dtype: object" ] }, "execution_count": 36, "metadata": {}, "output_type": "execute_result" } ], "source": [ "produto_view = data['PRODUTO'] # a series retornada refente à coluna, NÃO É UMA CÓPIA, mas sim, uma REFERÊNCIA/VIEW à coluna do dataframe\n", "produto_view" ] }, { "cell_type": "code", "execution_count": 37, "id": "precious-telescope", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 ETANOL HIDRATADO\n", "1 ETANOL HIDRATADO\n", "2 ETANOL HIDRATADO\n", "3 ETANOL HIDRATADO\n", "4 ETANOL HIDRATADO\n", " ... \n", "106818 GNV\n", "106819 GNV\n", "106820 GNV\n", "106821 GNV\n", "106822 GNV\n", "Name: PRODUTO, Length: 106823, dtype: object" ] }, "execution_count": 37, "metadata": {}, "output_type": "execute_result" } ], "source": [ "produto_copy_bkp = data['PRODUTO'].copy() # retorna uma cópia da coluna 'PRODUTO'\n", "produto_copy_bkp" ] }, { "cell_type": "code", "execution_count": 38, "id": "satisfactory-bridal", "metadata": {}, "outputs": [], "source": [ "data['PRODUTO'] = 'Combustível' # atribuindo o valor constante 'Combustível' para linha do dataframe na coluna 'PRODUTO'" ] }, { "cell_type": "code", "execution_count": 39, "id": "reserved-wonder", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALCombustível127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASCombustível387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOCombustível192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULCombustível162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASCombustível103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
\n", "

5 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 Combustível 127 R$/l \n", "1 Combustível 387 R$/l \n", "2 Combustível 192 R$/l \n", "3 Combustível 162 R$/l \n", "4 Combustível 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA \\\n", "0 1.288 0.016 ... 1.350 \n", "1 1.162 0.114 ... 1.449 \n", "2 1.389 0.097 ... 1.760 \n", "3 1.262 0.070 ... 1.509 \n", "4 1.181 0.078 ... 1.400 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.463 0.012 0.825 \n", "1 0.399 0.098 0.763 \n", "2 0.419 0.070 0.97 \n", "3 0.432 0.055 0.83 \n", "4 0.24 0.066 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", "[5 rows x 21 columns]" ] }, "execution_count": 39, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 40, "id": "preliminary-toyota", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 Combustível\n", "1 Combustível\n", "2 Combustível\n", "3 Combustível\n", "4 Combustível\n", " ... \n", "106818 Combustível\n", "106819 Combustível\n", "106820 Combustível\n", "106821 Combustível\n", "106822 Combustível\n", "Name: PRODUTO, Length: 106823, dtype: object" ] }, "execution_count": 40, "metadata": {}, "output_type": "execute_result" } ], "source": [ "produto_view" ] }, { "cell_type": "code", "execution_count": 41, "id": "exact-distributor", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 ETANOL HIDRATADO\n", "1 ETANOL HIDRATADO\n", "2 ETANOL HIDRATADO\n", "3 ETANOL HIDRATADO\n", "4 ETANOL HIDRATADO\n", " ... \n", "106818 GNV\n", "106819 GNV\n", "106820 GNV\n", "106821 GNV\n", "106822 GNV\n", "Name: PRODUTO, Length: 106823, dtype: object" ] }, "execution_count": 41, "metadata": {}, "output_type": "execute_result" } ], "source": [ "produto_copy_bkp" ] }, { "cell_type": "markdown", "id": "vertical-municipality", "metadata": {}, "source": [ "#### 1.3.4.2 Atribuindo listas ou series" ] }, { "cell_type": "code", "execution_count": 42, "id": "maritime-swift", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(106823, 21)" ] }, "execution_count": 42, "metadata": {}, "output_type": "execute_result" } ], "source": [ "nrows, ncols = data.shape\n", "nrows, ncols" ] }, { "cell_type": "code", "execution_count": 43, "id": "brown-journey", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "106823" ] }, "execution_count": 43, "metadata": {}, "output_type": "execute_result" } ], "source": [ "novos_produtos = [f'Produto {i}' for i in range(nrows)]\n", "len(novos_produtos)" ] }, { "cell_type": "code", "execution_count": 44, "id": "ranking-stability", "metadata": {}, "outputs": [], "source": [ "# a quantidade de elementos da lista `novos_produtos` é igual ao número de linhas do dataframe\n", "data['PRODUTO'] = novos_produtos" ] }, { "cell_type": "code", "execution_count": 45, "id": "played-latino", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALProduto 0127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASProduto 1387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOProduto 2192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULProduto 3162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASProduto 4103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEProduto 1068187R$/m33.5740.065...3.6900.8180.0182.75602.7562.756062019
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULProduto 10681923R$/m33.4010.129...3.7890.950.0382.4510.4021.98422.86610.16462019
1068201068202019-06-232019-06-29SULSANTA CATARINAProduto 10682024R$/m32.9120.190...3.4990.9140.0651.99801.99811.9981062019
1068211068212019-06-232019-06-29SUDESTESAO PAULOProduto 10682152R$/m33.0200.229...3.4900.6460.0762.3740.1652.01792.50930.0762019
1068221068222019-06-232019-06-29NORDESTESERGIPEProduto 1068224R$/m33.6970.005...3.6991.1790.0012.51802.51752.5175062019
\n", "

106823 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL Produto 0 127 \n", "1 GOIAS Produto 1 387 \n", "2 MATO GROSSO Produto 2 192 \n", "3 MATO GROSSO DO SUL Produto 3 162 \n", "4 ALAGOAS Produto 4 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE Produto 106818 7 \n", "106819 RIO GRANDE DO SUL Produto 106819 23 \n", "106820 SANTA CATARINA Produto 106820 24 \n", "106821 SAO PAULO Produto 106821 52 \n", "106822 SERGIPE Produto 106822 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "... ... ... ... \n", "106818 3.690 0.818 0.018 \n", "106819 3.789 0.95 0.038 \n", "106820 3.499 0.914 0.065 \n", "106821 3.490 0.646 0.076 \n", "106822 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... .. ... \n", "106818 0 6 2019 \n", "106819 0.164 6 2019 \n", "106820 0 6 2019 \n", "106821 0.07 6 2019 \n", "106822 0 6 2019 \n", "\n", "[106823 rows x 21 columns]" ] }, "execution_count": 45, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "code", "execution_count": 46, "id": "widespread-midnight", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "0 Produto 0\n", "1 Produto 1\n", "2 Produto 2\n", "3 Produto 3\n", "4 Produto 4\n", " ... \n", "106818 Produto 106818\n", "106819 Produto 106819\n", "106820 Produto 106820\n", "106821 Produto 106821\n", "106822 Produto 106822\n", "Name: PRODUTO, Length: 106823, dtype: object\n", "\n", "\n", "0 ETANOL HIDRATADO\n", "1 ETANOL HIDRATADO\n", "2 ETANOL HIDRATADO\n", "3 ETANOL HIDRATADO\n", "4 ETANOL HIDRATADO\n", " ... \n", "106818 GNV\n", "106819 GNV\n", "106820 GNV\n", "106821 GNV\n", "106822 GNV\n", "Name: PRODUTO, Length: 106823, dtype: object\n" ] } ], "source": [ "print(produto_view)\n", "print('\\n')\n", "print(produto_copy_bkp)" ] }, { "cell_type": "code", "execution_count": 47, "id": "magnetic-photography", "metadata": {}, "outputs": [], "source": [ "# voltando para os produtos originais\n", "data['PRODUTO'] = produto_copy_bkp # produto_copy_bkp é uma Series" ] }, { "cell_type": "code", "execution_count": 48, "id": "copyrighted-ending", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...1.3500.4630.0120.8250.110.42010.96660.13352004
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...1.4490.3990.0980.7630.0880.50131.050.11552004
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...1.7600.4190.0700.970.0950.56141.1610.09852004
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...1.5090.4320.0550.830.1190.59911.222420.14352004
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...1.4000.240.0660.9410.0770.74411.03170.08252004
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...3.6900.8180.0182.75602.7562.756062019
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...3.7890.950.0382.4510.4021.98422.86610.16462019
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...3.4990.9140.0651.99801.99811.9981062019
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...3.4900.6460.0762.3740.1652.01792.50930.0762019
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...3.6991.1790.0012.51802.51752.5175062019
\n", "

106823 rows × 21 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "... ... ... ... \n", "106818 3.690 0.818 0.018 \n", "106819 3.789 0.95 0.038 \n", "106820 3.499 0.914 0.065 \n", "106821 3.490 0.646 0.076 \n", "106822 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... .. ... \n", "106818 0 6 2019 \n", "106819 0.164 6 2019 \n", "106820 0 6 2019 \n", "106821 0.07 6 2019 \n", "106822 0 6 2019 \n", "\n", "[106823 rows x 21 columns]" ] }, "execution_count": 48, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "handled-diary", "metadata": {}, "source": [ "#### 1.3.4.3 Criando novas colunas\n", "Para **criar uma nova coluna** em um data frame, basta atribuirmos uma _lista/Series de valores_ ou uma constante a uma **nova 'chave'** do data frame.
\n", "\n", "**PS:** A _quantidade de valores_ da lista precisa ser **igual** ao _número de linhas/registros_ do data frame." ] }, { "cell_type": "code", "execution_count": 49, "id": "logical-justice", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...MARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocao
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.4630.0120.8250.110.42010.96660.13352004DEFAULT
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.3990.0980.7630.0880.50131.050.11552004DEFAULT
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.4190.0700.970.0950.56141.1610.09852004DEFAULT
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.4320.0550.830.1190.59911.222420.14352004DEFAULT
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.240.0660.9410.0770.74411.03170.08252004DEFAULT
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...0.8180.0182.75602.7562.756062019DEFAULT
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...0.950.0382.4510.4021.98422.86610.16462019DEFAULT
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...0.9140.0651.99801.99811.9981062019DEFAULT
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...0.6460.0762.3740.1652.01792.50930.0762019DEFAULT
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...1.1790.0012.51802.51752.5175062019DEFAULT
\n", "

106823 rows × 22 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 0.463 0.012 \n", "1 0.399 0.098 \n", "2 0.419 0.070 \n", "3 0.432 0.055 \n", "4 0.24 0.066 \n", "... ... ... \n", "106818 0.818 0.018 \n", "106819 0.95 0.038 \n", "106820 0.914 0.065 \n", "106821 0.646 0.076 \n", "106822 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO coluna sem nocao \n", "0 0.133 5 2004 DEFAULT \n", "1 0.115 5 2004 DEFAULT \n", "2 0.098 5 2004 DEFAULT \n", "3 0.143 5 2004 DEFAULT \n", "4 0.082 5 2004 DEFAULT \n", "... ... .. ... ... \n", "106818 0 6 2019 DEFAULT \n", "106819 0.164 6 2019 DEFAULT \n", "106820 0 6 2019 DEFAULT \n", "106821 0.07 6 2019 DEFAULT \n", "106822 0 6 2019 DEFAULT \n", "\n", "[106823 rows x 22 columns]" ] }, "execution_count": 49, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# criando uma coluna a partir de um valor constante/default\n", "# todas as linhas terão o mesmo valor para esta nova coluna\n", "data['coluna sem nocao'] = 'DEFAULT'\n", "data" ] }, { "cell_type": "code", "execution_count": 50, "id": "imperial-artwork", "metadata": {}, "outputs": [], "source": [ "data['coluna a partir de lista'] = range(data.shape[0])" ] }, { "cell_type": "code", "execution_count": 51, "id": "interracial-modem", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...COEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de lista
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.0120.8250.110.42010.96660.13352004DEFAULT0
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.0980.7630.0880.50131.050.11552004DEFAULT1
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.0700.970.0950.56141.1610.09852004DEFAULT2
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.0550.830.1190.59911.222420.14352004DEFAULT3
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.0660.9410.0770.74411.03170.08252004DEFAULT4
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...0.0182.75602.7562.756062019DEFAULT106818
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...0.0382.4510.4021.98422.86610.16462019DEFAULT106819
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...0.0651.99801.99811.9981062019DEFAULT106820
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...0.0762.3740.1652.01792.50930.0762019DEFAULT106821
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...0.0012.51802.51752.5175062019DEFAULT106822
\n", "

106823 rows × 23 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.012 0.825 \n", "1 0.098 0.763 \n", "2 0.070 0.97 \n", "3 0.055 0.83 \n", "4 0.066 0.941 \n", "... ... ... \n", "106818 0.018 2.756 \n", "106819 0.038 2.451 \n", "106820 0.065 1.998 \n", "106821 0.076 2.374 \n", "106822 0.001 2.518 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "... ... ... \n", "106818 0 2.756 \n", "106819 0.402 1.9842 \n", "106820 0 1.9981 \n", "106821 0.165 2.0179 \n", "106822 0 2.5175 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "... ... ... .. ... \n", "106818 2.756 0 6 2019 \n", "106819 2.8661 0.164 6 2019 \n", "106820 1.9981 0 6 2019 \n", "106821 2.5093 0.07 6 2019 \n", "106822 2.5175 0 6 2019 \n", "\n", " coluna sem nocao coluna a partir de lista \n", "0 DEFAULT 0 \n", "1 DEFAULT 1 \n", "2 DEFAULT 2 \n", "3 DEFAULT 3 \n", "4 DEFAULT 4 \n", "... ... ... \n", "106818 DEFAULT 106818 \n", "106819 DEFAULT 106819 \n", "106820 DEFAULT 106820 \n", "106821 DEFAULT 106821 \n", "106822 DEFAULT 106822 \n", "\n", "[106823 rows x 23 columns]" ] }, "execution_count": 51, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "code", "execution_count": 52, "id": "czech-dietary", "metadata": {}, "outputs": [ { "ename": "ValueError", "evalue": "Length of values (3) does not match length of index (106823)", "output_type": "error", "traceback": [ "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", "\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)", "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# não funciona pq a quantidade de elementos da lista (a serem atribuídos a nova coluna) é diferente\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 2\u001b[0m \u001b[0;31m# da quantidade de linhas do dataframe\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 3\u001b[0;31m \u001b[0mdata\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'nao funciona'\u001b[0m\u001b[0;34m]\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;36m2\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;36m3\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/frame.py\u001b[0m in \u001b[0;36m__setitem__\u001b[0;34m(self, key, value)\u001b[0m\n\u001b[1;32m 3161\u001b[0m \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3162\u001b[0m \u001b[0;31m# set column\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3163\u001b[0;31m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_set_item\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3164\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3165\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_setitem_slice\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mkey\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mslice\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/frame.py\u001b[0m in \u001b[0;36m_set_item\u001b[0;34m(self, key, value)\u001b[0m\n\u001b[1;32m 3240\u001b[0m \"\"\"\n\u001b[1;32m 3241\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_ensure_valid_index\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3242\u001b[0;31m \u001b[0mvalue\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_sanitize_column\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3243\u001b[0m \u001b[0mNDFrame\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_set_item\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3244\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/frame.py\u001b[0m in \u001b[0;36m_sanitize_column\u001b[0;34m(self, key, value, broadcast)\u001b[0m\n\u001b[1;32m 3897\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3898\u001b[0m \u001b[0;31m# turn me into an ndarray\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3899\u001b[0;31m \u001b[0mvalue\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0msanitize_index\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalue\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mindex\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3900\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0;32mnot\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalue\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m(\u001b[0m\u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mndarray\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mIndex\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3901\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalue\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mlist\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;32mand\u001b[0m \u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvalue\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m>\u001b[0m \u001b[0;36m0\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/internals/construction.py\u001b[0m in \u001b[0;36msanitize_index\u001b[0;34m(data, index)\u001b[0m\n\u001b[1;32m 749\u001b[0m \"\"\"\n\u001b[1;32m 750\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mdata\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;34m!=\u001b[0m \u001b[0mlen\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mindex\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 751\u001b[0;31m raise ValueError(\n\u001b[0m\u001b[1;32m 752\u001b[0m \u001b[0;34m\"Length of values \"\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 753\u001b[0m \u001b[0;34mf\"({len(data)}) \"\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;31mValueError\u001b[0m: Length of values (3) does not match length of index (106823)" ] } ], "source": [ "# não funciona pq a quantidade de elementos da lista (a serem atribuídos a nova coluna) é diferente\n", "# da quantidade de linhas do dataframe\n", "data['nao funciona'] = [1, 2, 3]" ] }, { "cell_type": "markdown", "id": "unavailable-english", "metadata": {}, "source": [ "
\n", "\n", "Outro exemplo:" ] }, { "cell_type": "code", "execution_count": 53, "id": "frank-broadcasting", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...COEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de lista
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.0120.8250.110.42010.96660.13352004DEFAULT0
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.0980.7630.0880.50131.050.11552004DEFAULT1
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.0700.970.0950.56141.1610.09852004DEFAULT2
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.0550.830.1190.59911.222420.14352004DEFAULT3
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.0660.9410.0770.74411.03170.08252004DEFAULT4
\n", "

5 rows × 23 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... COEF DE VARIAÇÃO REVENDA \\\n", "0 1.288 0.016 ... 0.012 \n", "1 1.162 0.114 ... 0.098 \n", "2 1.389 0.097 ... 0.070 \n", "3 1.262 0.070 ... 0.055 \n", "4 1.181 0.078 ... 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO coluna sem nocao \\\n", "0 0.133 5 2004 DEFAULT \n", "1 0.115 5 2004 DEFAULT \n", "2 0.098 5 2004 DEFAULT \n", "3 0.143 5 2004 DEFAULT \n", "4 0.082 5 2004 DEFAULT \n", "\n", " coluna a partir de lista \n", "0 0 \n", "1 1 \n", "2 2 \n", "3 3 \n", "4 4 \n", "\n", "[5 rows x 23 columns]" ] }, "execution_count": 53, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 54, "id": "composed-distance", "metadata": {}, "outputs": [], "source": [ "data['PREÇO MÉDIO REVENDA (dólares)'] = data['PREÇO MÉDIO REVENDA'] * 6.0" ] }, { "cell_type": "code", "execution_count": 55, "id": "baking-joseph", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...2.75602.7562.756062019DEFAULT10681821.444
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...2.4510.4021.98422.86610.16462019DEFAULT10681920.406
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...1.99801.99811.9981062019DEFAULT10682017.472
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...2.3740.1652.01792.50930.0762019DEFAULT10682118.120
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...2.51802.51752.5175062019DEFAULT10682222.182
\n", "

106823 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO coluna sem nocao \\\n", "0 0.133 5 2004 DEFAULT \n", "1 0.115 5 2004 DEFAULT \n", "2 0.098 5 2004 DEFAULT \n", "3 0.143 5 2004 DEFAULT \n", "4 0.082 5 2004 DEFAULT \n", "... ... .. ... ... \n", "106818 0 6 2019 DEFAULT \n", "106819 0.164 6 2019 DEFAULT \n", "106820 0 6 2019 DEFAULT \n", "106821 0.07 6 2019 DEFAULT \n", "106822 0 6 2019 DEFAULT \n", "\n", " coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 0 7.728 \n", "1 1 6.972 \n", "2 2 8.334 \n", "3 3 7.572 \n", "4 4 7.086 \n", "... ... ... \n", "106818 106818 21.444 \n", "106819 106819 20.406 \n", "106820 106820 17.472 \n", "106821 106821 18.120 \n", "106822 106822 22.182 \n", "\n", "[106823 rows x 24 columns]" ] }, "execution_count": 55, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "outer-section", "metadata": {}, "source": [ "**PS:** Obviamente, a lógica correta em converter o preço dos combustíveis em reais para dólares não é considerar uma taxa de câmbio fixa, uma vez que cada preço em real foi aferido em um momento diferente." ] }, { "cell_type": "markdown", "id": "corporate-trauma", "metadata": {}, "source": [ "### 1.3.4 Índices" ] }, { "cell_type": "markdown", "id": "colored-ballot", "metadata": {}, "source": [ "Todo Data Frame possui **índices**, que não são considerado colunas da tabela. Tais índices são comumente **númericos**, de 0 a num_linhas-1, mas também podem ser **textuais (rótulos/labels)**." ] }, { "cell_type": "code", "execution_count": 56, "id": "authentic-illustration", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
..................................................................
1068181068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.065...2.75602.7562.756062019DEFAULT10681821.444
1068191068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.129...2.4510.4021.98422.86610.16462019DEFAULT10681920.406
1068201068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.190...1.99801.99811.9981062019DEFAULT10682017.472
1068211068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...2.3740.1652.01792.50930.0762019DEFAULT10682118.120
1068221068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.005...2.51802.51752.5175062019DEFAULT10682222.182
\n", "

106823 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE \n", "4 4 2004-05-09 2004-05-15 NORDESTE \n", "... ... ... ... ... \n", "106818 106818 2019-06-23 2019-06-29 NORDESTE \n", "106819 106819 2019-06-23 2019-06-29 SUL \n", "106820 106820 2019-06-23 2019-06-29 SUL \n", "106821 106821 2019-06-23 2019-06-29 SUDESTE \n", "106822 106822 2019-06-23 2019-06-29 NORDESTE \n", "\n", " ESTADO PRODUTO NÚMERO DE POSTOS PESQUISADOS \\\n", "0 DISTRITO FEDERAL ETANOL HIDRATADO 127 \n", "1 GOIAS ETANOL HIDRATADO 387 \n", "2 MATO GROSSO ETANOL HIDRATADO 192 \n", "3 MATO GROSSO DO SUL ETANOL HIDRATADO 162 \n", "4 ALAGOAS ETANOL HIDRATADO 103 \n", "... ... ... ... \n", "106818 RIO GRANDE DO NORTE GNV 7 \n", "106819 RIO GRANDE DO SUL GNV 23 \n", "106820 SANTA CATARINA GNV 24 \n", "106821 SAO PAULO GNV 52 \n", "106822 SERGIPE GNV 4 \n", "\n", " UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... \\\n", "0 R$/l 1.288 0.016 ... \n", "1 R$/l 1.162 0.114 ... \n", "2 R$/l 1.389 0.097 ... \n", "3 R$/l 1.262 0.070 ... \n", "4 R$/l 1.181 0.078 ... \n", "... ... ... ... ... \n", "106818 R$/m3 3.574 0.065 ... \n", "106819 R$/m3 3.401 0.129 ... \n", "106820 R$/m3 2.912 0.190 ... \n", "106821 R$/m3 3.020 0.229 ... \n", "106822 R$/m3 3.697 0.005 ... \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO coluna sem nocao \\\n", "0 0.133 5 2004 DEFAULT \n", "1 0.115 5 2004 DEFAULT \n", "2 0.098 5 2004 DEFAULT \n", "3 0.143 5 2004 DEFAULT \n", "4 0.082 5 2004 DEFAULT \n", "... ... .. ... ... \n", "106818 0 6 2019 DEFAULT \n", "106819 0.164 6 2019 DEFAULT \n", "106820 0 6 2019 DEFAULT \n", "106821 0.07 6 2019 DEFAULT \n", "106822 0 6 2019 DEFAULT \n", "\n", " coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 0 7.728 \n", "1 1 6.972 \n", "2 2 8.334 \n", "3 3 7.572 \n", "4 4 7.086 \n", "... ... ... \n", "106818 106818 21.444 \n", "106819 106819 20.406 \n", "106820 106820 17.472 \n", "106821 106821 18.120 \n", "106822 106822 22.182 \n", "\n", "[106823 rows x 24 columns]" ] }, "execution_count": 56, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "code", "execution_count": 57, "id": "advanced-purple", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "RangeIndex(start=0, stop=106823, step=1)" ] }, "execution_count": 57, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.index" ] }, { "cell_type": "markdown", "id": "super-mambo", "metadata": {}, "source": [ "Use `list(data.index)` ou `data.index.to_list()` para converter um RangeIndex para uma python list." ] }, { "cell_type": "markdown", "id": "spare-benefit", "metadata": {}, "source": [ "#### **Exemplo de Data Frame com Índices Textuais (labels)**" ] }, { "cell_type": "code", "execution_count": 58, "id": "outstanding-growing", "metadata": {}, "outputs": [], "source": [ "pesquisa_de_satisfacao = pd.DataFrame({\n", " 'bom': [50, 21, 100],\n", " 'ruim': [131, 2, 30],\n", " 'pessimo': [30, 20, 1]\n", "}, index=['XboxOne', 'Playstation4', 'Switch'])" ] }, { "cell_type": "code", "execution_count": 59, "id": "tired-friday", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bomruimpessimo
XboxOne5013130
Playstation421220
Switch100301
\n", "
" ], "text/plain": [ " bom ruim pessimo\n", "XboxOne 50 131 30\n", "Playstation4 21 2 20\n", "Switch 100 30 1" ] }, "execution_count": 59, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pesquisa_de_satisfacao.head()" ] }, { "cell_type": "code", "execution_count": 60, "id": "noticed-humor", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index(['XboxOne', 'Playstation4', 'Switch'], dtype='object')" ] }, "execution_count": 60, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pesquisa_de_satisfacao.index" ] }, { "cell_type": "markdown", "id": "faced-fabric", "metadata": {}, "source": [ "### 1.4 Selecionando uma ou mais observações (Indexação)" ] }, { "cell_type": "code", "execution_count": 61, "id": "spoken-empty", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
\n", "

5 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 1.288 0.016 ... 0.825 \n", "1 1.162 0.114 ... 0.763 \n", "2 1.389 0.097 ... 0.97 \n", "3 1.262 0.070 ... 0.83 \n", "4 1.181 0.078 ... 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 DEFAULT 0 7.728 \n", "1 DEFAULT 1 6.972 \n", "2 DEFAULT 2 8.334 \n", "3 DEFAULT 3 7.572 \n", "4 DEFAULT 4 7.086 \n", "\n", "[5 rows x 24 columns]" ] }, "execution_count": 61, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "markdown", "id": "fatal-grass", "metadata": {}, "source": [ "#### **==> Index-based selection (seleção baseada em Índices)**\n", "Mostrando linhas específicas de um DataFrame:\n", "\n", "`iloc`: seleciona elementos do Dataframe, baseado em seu **índice (número)** --> row-first, column-second" ] }, { "cell_type": "markdown", "id": "animal-illinois", "metadata": {}, "source": [ "**Selecionando uma observação/linha:**" ] }, { "cell_type": "code", "execution_count": 62, "id": "reported-louis", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Unnamed: 0 1\n", "DATA INICIAL 2004-05-09\n", "DATA FINAL 2004-05-15\n", "REGIÃO CENTRO OESTE\n", "ESTADO GOIAS\n", "PRODUTO ETANOL HIDRATADO\n", "NÚMERO DE POSTOS PESQUISADOS 387\n", "UNIDADE DE MEDIDA R$/l\n", "PREÇO MÉDIO REVENDA 1.162\n", "DESVIO PADRÃO REVENDA 0.114\n", "PREÇO MÍNIMO REVENDA 0.89\n", "PREÇO MÁXIMO REVENDA 1.449\n", "MARGEM MÉDIA REVENDA 0.399\n", "COEF DE VARIAÇÃO REVENDA 0.098\n", "PREÇO MÉDIO DISTRIBUIÇÃO 0.763\n", "DESVIO PADRÃO DISTRIBUIÇÃO 0.088\n", "PREÇO MÍNIMO DISTRIBUIÇÃO 0.5013\n", "PREÇO MÁXIMO DISTRIBUIÇÃO 1.05\n", "COEF DE VARIAÇÃO DISTRIBUIÇÃO 0.115\n", "MÊS 5\n", "ANO 2004\n", "coluna sem nocao DEFAULT\n", "coluna a partir de lista 1\n", "PREÇO MÉDIO REVENDA (dólares) 6.972\n", "Name: 1, dtype: object" ] }, "execution_count": 62, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando a linha 1 ===> observação de índice [1] do dataframe\n", "data.iloc[1]" ] }, { "cell_type": "markdown", "id": "loved-hierarchy", "metadata": {}, "source": [ "**Selecionando múltiplas observações/linhas:**" ] }, { "cell_type": "code", "execution_count": 63, "id": "ranking-whole", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
552004-05-092004-05-15NORDESTEBAHIAETANOL HIDRATADO408R$/l1.3830.132...0.9570.1280.56861.350.13452004DEFAULT58.298
\n", "

6 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "5 5 2004-05-09 2004-05-15 NORDESTE BAHIA \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "5 ETANOL HIDRATADO 408 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 1.288 0.016 ... 0.825 \n", "1 1.162 0.114 ... 0.763 \n", "2 1.389 0.097 ... 0.97 \n", "3 1.262 0.070 ... 0.83 \n", "4 1.181 0.078 ... 0.941 \n", "5 1.383 0.132 ... 0.957 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "5 0.128 0.5686 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "5 1.35 0.134 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 DEFAULT 0 7.728 \n", "1 DEFAULT 1 6.972 \n", "2 DEFAULT 2 8.334 \n", "3 DEFAULT 3 7.572 \n", "4 DEFAULT 4 7.086 \n", "5 DEFAULT 5 8.298 \n", "\n", "[6 rows x 24 columns]" ] }, "execution_count": 63, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando as linhas de índice de 0 a 5 (incluso)\n", "data.iloc[:6]" ] }, { "cell_type": "code", "execution_count": 64, "id": "academic-lawrence", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
10102004-05-092004-05-15NORDESTEPIAUIETANOL HIDRATADO89R$/l1.5730.134...1.0790.0780.88571.24990.07252004DEFAULT109.438
11112004-05-092004-05-15NORDESTERIO GRANDE DO NORTEETANOL HIDRATADO131R$/l1.2760.116...0.9440.0780.71191.13860.08352004DEFAULT117.656
12122004-05-092004-05-15NORDESTESERGIPEETANOL HIDRATADO57R$/l1.3010.109...0.980.0520.82671.10590.05352004DEFAULT127.806
13132004-05-092004-05-15NORTEACREETANOL HIDRATADO33R$/l1.8050.134...1.1160.1710.7671.29920.15352004DEFAULT1310.830
14142004-05-092004-05-15NORTEAMAPAETANOL HIDRATADO15R$/l1.7850.035...1.3730.1670.83391.49120.12252004DEFAULT1410.710
15152004-05-092004-05-15NORTEAMAZONASETANOL HIDRATADO53R$/l1.5780.123...1.1370.0680.95151.21090.0652004DEFAULT159.468
\n", "

6 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "10 10 2004-05-09 2004-05-15 NORDESTE PIAUI \n", "11 11 2004-05-09 2004-05-15 NORDESTE RIO GRANDE DO NORTE \n", "12 12 2004-05-09 2004-05-15 NORDESTE SERGIPE \n", "13 13 2004-05-09 2004-05-15 NORTE ACRE \n", "14 14 2004-05-09 2004-05-15 NORTE AMAPA \n", "15 15 2004-05-09 2004-05-15 NORTE AMAZONAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "10 ETANOL HIDRATADO 89 R$/l \n", "11 ETANOL HIDRATADO 131 R$/l \n", "12 ETANOL HIDRATADO 57 R$/l \n", "13 ETANOL HIDRATADO 33 R$/l \n", "14 ETANOL HIDRATADO 15 R$/l \n", "15 ETANOL HIDRATADO 53 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "10 1.573 0.134 ... 1.079 \n", "11 1.276 0.116 ... 0.944 \n", "12 1.301 0.109 ... 0.98 \n", "13 1.805 0.134 ... 1.116 \n", "14 1.785 0.035 ... 1.373 \n", "15 1.578 0.123 ... 1.137 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "10 0.078 0.8857 \n", "11 0.078 0.7119 \n", "12 0.052 0.8267 \n", "13 0.171 0.767 \n", "14 0.167 0.8339 \n", "15 0.068 0.9515 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "10 1.2499 0.072 5 2004 \n", "11 1.1386 0.083 5 2004 \n", "12 1.1059 0.053 5 2004 \n", "13 1.2992 0.153 5 2004 \n", "14 1.4912 0.122 5 2004 \n", "15 1.2109 0.06 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "10 DEFAULT 10 9.438 \n", "11 DEFAULT 11 7.656 \n", "12 DEFAULT 12 7.806 \n", "13 DEFAULT 13 10.830 \n", "14 DEFAULT 14 10.710 \n", "15 DEFAULT 15 9.468 \n", "\n", "[6 rows x 24 columns]" ] }, "execution_count": 64, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando as linhas de índice de 10 a 15 (incluso)\n", "data.iloc[10:16]" ] }, { "cell_type": "code", "execution_count": 65, "id": "competent-devon", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
552004-05-092004-05-15NORDESTEBAHIAETANOL HIDRATADO408R$/l1.3830.132...0.9570.1280.56861.350.13452004DEFAULT58.298
10102004-05-092004-05-15NORDESTEPIAUIETANOL HIDRATADO89R$/l1.5730.134...1.0790.0780.88571.24990.07252004DEFAULT109.438
15152004-05-092004-05-15NORTEAMAZONASETANOL HIDRATADO53R$/l1.5780.123...1.1370.0680.95151.21090.0652004DEFAULT159.468
\n", "

4 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "5 5 2004-05-09 2004-05-15 NORDESTE BAHIA \n", "10 10 2004-05-09 2004-05-15 NORDESTE PIAUI \n", "15 15 2004-05-09 2004-05-15 NORTE AMAZONAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "1 ETANOL HIDRATADO 387 R$/l \n", "5 ETANOL HIDRATADO 408 R$/l \n", "10 ETANOL HIDRATADO 89 R$/l \n", "15 ETANOL HIDRATADO 53 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "1 1.162 0.114 ... 0.763 \n", "5 1.383 0.132 ... 0.957 \n", "10 1.573 0.134 ... 1.079 \n", "15 1.578 0.123 ... 1.137 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "1 0.088 0.5013 \n", "5 0.128 0.5686 \n", "10 0.078 0.8857 \n", "15 0.068 0.9515 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "1 1.05 0.115 5 2004 \n", "5 1.35 0.134 5 2004 \n", "10 1.2499 0.072 5 2004 \n", "15 1.2109 0.06 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "1 DEFAULT 1 6.972 \n", "5 DEFAULT 5 8.298 \n", "10 DEFAULT 10 9.438 \n", "15 DEFAULT 15 9.468 \n", "\n", "[4 rows x 24 columns]" ] }, "execution_count": 65, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando as linhas/observações de índice 1, 5, 10, 15\n", "data.iloc[[1, 5, 10, 15]]" ] }, { "cell_type": "code", "execution_count": 66, "id": "hearing-dancing", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
552004-05-092004-05-15NORDESTEBAHIAETANOL HIDRATADO408R$/l1.3830.132...0.9570.1280.56861.350.13452004DEFAULT58.298
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
15152004-05-092004-05-15NORTEAMAZONASETANOL HIDRATADO53R$/l1.5780.123...1.1370.0680.95151.21090.0652004DEFAULT159.468
10102004-05-092004-05-15NORDESTEPIAUIETANOL HIDRATADO89R$/l1.5730.134...1.0790.0780.88571.24990.07252004DEFAULT109.438
\n", "

4 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "5 5 2004-05-09 2004-05-15 NORDESTE BAHIA \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "15 15 2004-05-09 2004-05-15 NORTE AMAZONAS \n", "10 10 2004-05-09 2004-05-15 NORDESTE PIAUI \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "5 ETANOL HIDRATADO 408 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "15 ETANOL HIDRATADO 53 R$/l \n", "10 ETANOL HIDRATADO 89 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "5 1.383 0.132 ... 0.957 \n", "1 1.162 0.114 ... 0.763 \n", "15 1.578 0.123 ... 1.137 \n", "10 1.573 0.134 ... 1.079 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "5 0.128 0.5686 \n", "1 0.088 0.5013 \n", "15 0.068 0.9515 \n", "10 0.078 0.8857 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "5 1.35 0.134 5 2004 \n", "1 1.05 0.115 5 2004 \n", "15 1.2109 0.06 5 2004 \n", "10 1.2499 0.072 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "5 DEFAULT 5 8.298 \n", "1 DEFAULT 1 6.972 \n", "15 DEFAULT 15 9.468 \n", "10 DEFAULT 10 9.438 \n", "\n", "[4 rows x 24 columns]" ] }, "execution_count": 66, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando as linhas/observações de índices 5, 1, 15, 10\n", "data.iloc[[5, 1, 15, 10]]" ] }, { "cell_type": "code", "execution_count": 67, "id": "fifteen-wagner", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "'GOIAS'" ] }, "execution_count": 67, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retornar o valor da linha de índice 1, coluna 4 ('ESTADO')\n", "data.iloc[1, 4]" ] }, { "cell_type": "code", "execution_count": 68, "id": "biological-gibraltar", "metadata": {}, "outputs": [], "source": [ "# e assim por diante!" ] }, { "cell_type": "markdown", "id": "genetic-snapshot", "metadata": {}, "source": [ "#### **==> Label-based selection (seleção baseadas em Rótulos)**\n", "\n", "`loc`: seleciona elementos do Dataframe, baseado em seus **rótulos** --> row-first, column-second" ] }, { "cell_type": "code", "execution_count": 69, "id": "roman-auckland", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bomruimpessimo
XboxOne5013130
Playstation421220
Switch100301
\n", "
" ], "text/plain": [ " bom ruim pessimo\n", "XboxOne 50 131 30\n", "Playstation4 21 2 20\n", "Switch 100 30 1" ] }, "execution_count": 69, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pesquisa_de_satisfacao" ] }, { "cell_type": "code", "execution_count": 70, "id": "colonial-creativity", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "bom 50\n", "ruim 131\n", "pessimo 30\n", "Name: XboxOne, dtype: int64" ] }, "execution_count": 70, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna a linha de índice 0 (implícito) ==> usando o iloc\n", "pesquisa_de_satisfacao.iloc[0]" ] }, { "cell_type": "code", "execution_count": 71, "id": "applied-pendant", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "131" ] }, "execution_count": 71, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna o valor da linha de índice 0 (implícito) e coluna de índice 1 (implícito) ==> usando o iloc\n", "pesquisa_de_satisfacao.iloc[0, 1]" ] }, { "cell_type": "code", "execution_count": 72, "id": "controversial-arena", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "bom 50\n", "ruim 131\n", "pessimo 30\n", "Name: XboxOne, dtype: int64" ] }, "execution_count": 72, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna a linha cujo o rótulo do índice é 'XboxOne'\n", "pesquisa_de_satisfacao.loc['XboxOne']" ] }, { "cell_type": "code", "execution_count": 73, "id": "welsh-offer", "metadata": {}, "outputs": [ { "ename": "TypeError", "evalue": "Cannot index by location index with a non-integer key", "output_type": "error", "traceback": [ "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", "\u001b[0;31mTypeError\u001b[0m Traceback (most recent call last)", "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# NÃO FUNCIONA ===> iloc tentando acessar índices com rótulos\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 2\u001b[0;31m \u001b[0mpesquisa_de_satisfacao\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0miloc\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m'XboxOne'\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexing.py\u001b[0m in \u001b[0;36m__getitem__\u001b[0;34m(self, key)\u001b[0m\n\u001b[1;32m 893\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 894\u001b[0m \u001b[0mmaybe_callable\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mcom\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mapply_if_callable\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mobj\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 895\u001b[0;31m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_getitem_axis\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mmaybe_callable\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0maxis\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 896\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 897\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_is_scalar_access\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mkey\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mTuple\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexing.py\u001b[0m in \u001b[0;36m_getitem_axis\u001b[0;34m(self, key, axis)\u001b[0m\n\u001b[1;32m 1496\u001b[0m \u001b[0mkey\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mitem_from_zerodim\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1497\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0;32mnot\u001b[0m \u001b[0mis_integer\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1498\u001b[0;31m \u001b[0;32mraise\u001b[0m \u001b[0mTypeError\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"Cannot index by location index with a non-integer key\"\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 1499\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1500\u001b[0m \u001b[0;31m# validate the location\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;31mTypeError\u001b[0m: Cannot index by location index with a non-integer key" ] } ], "source": [ "# NÃO FUNCIONA ===> iloc tentando acessar índices com rótulos\n", "pesquisa_de_satisfacao.iloc['XboxOne']" ] }, { "cell_type": "code", "execution_count": 74, "id": "grave-shame", "metadata": {}, "outputs": [ { "ename": "KeyError", "evalue": "0", "output_type": "error", "traceback": [ "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", "\u001b[0;31mKeyError\u001b[0m Traceback (most recent call last)", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexes/base.py\u001b[0m in \u001b[0;36mget_loc\u001b[0;34m(self, key, method, tolerance)\u001b[0m\n\u001b[1;32m 3079\u001b[0m \u001b[0;32mtry\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3080\u001b[0;31m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_engine\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mget_loc\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mcasted_key\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3081\u001b[0m \u001b[0;32mexcept\u001b[0m \u001b[0mKeyError\u001b[0m \u001b[0;32mas\u001b[0m \u001b[0merr\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32mpandas/_libs/index.pyx\u001b[0m in \u001b[0;36mpandas._libs.index.IndexEngine.get_loc\u001b[0;34m()\u001b[0m\n", "\u001b[0;32mpandas/_libs/index.pyx\u001b[0m in \u001b[0;36mpandas._libs.index.IndexEngine.get_loc\u001b[0;34m()\u001b[0m\n", "\u001b[0;32mpandas/_libs/hashtable_class_helper.pxi\u001b[0m in \u001b[0;36mpandas._libs.hashtable.PyObjectHashTable.get_item\u001b[0;34m()\u001b[0m\n", "\u001b[0;32mpandas/_libs/hashtable_class_helper.pxi\u001b[0m in \u001b[0;36mpandas._libs.hashtable.PyObjectHashTable.get_item\u001b[0;34m()\u001b[0m\n", "\u001b[0;31mKeyError\u001b[0m: 0", "\nThe above exception was the direct cause of the following exception:\n", "\u001b[0;31mKeyError\u001b[0m Traceback (most recent call last)", "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# NÃO FUNCIONA ===> loc tentando acessar índices rotulados com números\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 2\u001b[0;31m \u001b[0mpesquisa_de_satisfacao\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mloc\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m0\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexing.py\u001b[0m in \u001b[0;36m__getitem__\u001b[0;34m(self, key)\u001b[0m\n\u001b[1;32m 893\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 894\u001b[0m \u001b[0mmaybe_callable\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mcom\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mapply_if_callable\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mobj\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m--> 895\u001b[0;31m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_getitem_axis\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mmaybe_callable\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0maxis\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 896\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 897\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_is_scalar_access\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mkey\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mTuple\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexing.py\u001b[0m in \u001b[0;36m_getitem_axis\u001b[0;34m(self, key, axis)\u001b[0m\n\u001b[1;32m 1122\u001b[0m \u001b[0;31m# fall thru to straight lookup\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1123\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_validate_key\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1124\u001b[0;31m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_get_label\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0maxis\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 1125\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1126\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_get_slice_axis\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mslice_obj\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mslice\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mint\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexing.py\u001b[0m in \u001b[0;36m_get_label\u001b[0;34m(self, label, axis)\u001b[0m\n\u001b[1;32m 1071\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_get_label\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mlabel\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mint\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1072\u001b[0m \u001b[0;31m# GH#5667 this will fail if the label is not present in the axis.\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 1073\u001b[0;31m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mobj\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mxs\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlabel\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0maxis\u001b[0m\u001b[0;34m=\u001b[0m\u001b[0maxis\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 1074\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 1075\u001b[0m \u001b[0;32mdef\u001b[0m \u001b[0m_handle_lowerdim_multi_index_axis0\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mself\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mtup\u001b[0m\u001b[0;34m:\u001b[0m \u001b[0mTuple\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/generic.py\u001b[0m in \u001b[0;36mxs\u001b[0;34m(self, key, axis, level, drop_level)\u001b[0m\n\u001b[1;32m 3737\u001b[0m \u001b[0;32mraise\u001b[0m \u001b[0mTypeError\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34mf\"Expected label or tuple of labels, got {key}\"\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0me\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3738\u001b[0m \u001b[0;32melse\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3739\u001b[0;31m \u001b[0mloc\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mindex\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mget_loc\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3740\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3741\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0misinstance\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mloc\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mndarray\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;32m~/yeah/lib/python3.8/site-packages/pandas/core/indexes/base.py\u001b[0m in \u001b[0;36mget_loc\u001b[0;34m(self, key, method, tolerance)\u001b[0m\n\u001b[1;32m 3080\u001b[0m \u001b[0;32mreturn\u001b[0m \u001b[0mself\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0m_engine\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mget_loc\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mcasted_key\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3081\u001b[0m \u001b[0;32mexcept\u001b[0m \u001b[0mKeyError\u001b[0m \u001b[0;32mas\u001b[0m \u001b[0merr\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m-> 3082\u001b[0;31m \u001b[0;32mraise\u001b[0m \u001b[0mKeyError\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mkey\u001b[0m\u001b[0;34m)\u001b[0m \u001b[0;32mfrom\u001b[0m \u001b[0merr\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3083\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3084\u001b[0m \u001b[0;32mif\u001b[0m \u001b[0mtolerance\u001b[0m \u001b[0;32mis\u001b[0m \u001b[0;32mnot\u001b[0m \u001b[0;32mNone\u001b[0m\u001b[0;34m:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", "\u001b[0;31mKeyError\u001b[0m: 0" ] } ], "source": [ "# NÃO FUNCIONA ===> loc tentando acessar índices rotulados com números\n", "pesquisa_de_satisfacao.loc[0]" ] }, { "cell_type": "code", "execution_count": 75, "id": "heated-engagement", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bomruimpessimo
XboxOne5013130
Playstation421220
Switch100301
\n", "
" ], "text/plain": [ " bom ruim pessimo\n", "XboxOne 50 131 30\n", "Playstation4 21 2 20\n", "Switch 100 30 1" ] }, "execution_count": 75, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pesquisa_de_satisfacao" ] }, { "cell_type": "code", "execution_count": 76, "id": "guided-creek", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "2" ] }, "execution_count": 76, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna o valor da linha 'Playstation4', coluna 'ruim'\n", "pesquisa_de_satisfacao.loc['Playstation4', 'ruim']" ] }, { "cell_type": "code", "execution_count": 77, "id": "objective-hunger", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bomruimpessimo
XboxOne5013130
Switch100301
\n", "
" ], "text/plain": [ " bom ruim pessimo\n", "XboxOne 50 131 30\n", "Switch 100 30 1" ] }, "execution_count": 77, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando as linhas de índices rotulados 'XboxOne', 'Switch'\n", "pesquisa_de_satisfacao.loc[['XboxOne', 'Switch']]" ] }, { "cell_type": "code", "execution_count": 78, "id": "further-brief", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bompessimo
XboxOne5030
Playstation42120
Switch1001
\n", "
" ], "text/plain": [ " bom pessimo\n", "XboxOne 50 30\n", "Playstation4 21 20\n", "Switch 100 1" ] }, "execution_count": 78, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna todas as linhas e apenas as colunas com rótulos 'bom' e 'pessimo'\n", "pesquisa_de_satisfacao[['bom', 'pessimo']]" ] }, { "cell_type": "code", "execution_count": 79, "id": "august-kitchen", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
bompessimo
XboxOne5030
Playstation42120
Switch1001
\n", "
" ], "text/plain": [ " bom pessimo\n", "XboxOne 50 30\n", "Playstation4 21 20\n", "Switch 100 1" ] }, "execution_count": 79, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna todas as linhas e apenas as colunas com rótulos 'bom' e 'pessimo'\n", "pesquisa_de_satisfacao.loc[:, ['bom', 'pessimo']]" ] }, { "cell_type": "markdown", "id": "sized-forty", "metadata": {}, "source": [ "#### OBSERVAÇÃO\n", "**Índices Númericos**, por default, possuem **rótulos que correspondem aos seus valores númericos.**" ] }, { "cell_type": "code", "execution_count": 80, "id": "pointed-climb", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
\n", "

5 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 1.288 0.016 ... 0.825 \n", "1 1.162 0.114 ... 0.763 \n", "2 1.389 0.097 ... 0.97 \n", "3 1.262 0.070 ... 0.83 \n", "4 1.181 0.078 ... 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 DEFAULT 0 7.728 \n", "1 DEFAULT 1 6.972 \n", "2 DEFAULT 2 8.334 \n", "3 DEFAULT 3 7.572 \n", "4 DEFAULT 4 7.086 \n", "\n", "[5 rows x 24 columns]" ] }, "execution_count": 80, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 81, "id": "guided-begin", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Unnamed: 0 1\n", "DATA INICIAL 2004-05-09\n", "DATA FINAL 2004-05-15\n", "REGIÃO CENTRO OESTE\n", "ESTADO GOIAS\n", "PRODUTO ETANOL HIDRATADO\n", "NÚMERO DE POSTOS PESQUISADOS 387\n", "UNIDADE DE MEDIDA R$/l\n", "PREÇO MÉDIO REVENDA 1.162\n", "DESVIO PADRÃO REVENDA 0.114\n", "PREÇO MÍNIMO REVENDA 0.89\n", "PREÇO MÁXIMO REVENDA 1.449\n", "MARGEM MÉDIA REVENDA 0.399\n", "COEF DE VARIAÇÃO REVENDA 0.098\n", "PREÇO MÉDIO DISTRIBUIÇÃO 0.763\n", "DESVIO PADRÃO DISTRIBUIÇÃO 0.088\n", "PREÇO MÍNIMO DISTRIBUIÇÃO 0.5013\n", "PREÇO MÁXIMO DISTRIBUIÇÃO 1.05\n", "COEF DE VARIAÇÃO DISTRIBUIÇÃO 0.115\n", "MÊS 5\n", "ANO 2004\n", "coluna sem nocao DEFAULT\n", "coluna a partir de lista 1\n", "PREÇO MÉDIO REVENDA (dólares) 6.972\n", "Name: 1, dtype: object" ] }, "execution_count": 81, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.iloc[1]" ] }, { "cell_type": "code", "execution_count": 82, "id": "worse-fossil", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Unnamed: 0 1\n", "DATA INICIAL 2004-05-09\n", "DATA FINAL 2004-05-15\n", "REGIÃO CENTRO OESTE\n", "ESTADO GOIAS\n", "PRODUTO ETANOL HIDRATADO\n", "NÚMERO DE POSTOS PESQUISADOS 387\n", "UNIDADE DE MEDIDA R$/l\n", "PREÇO MÉDIO REVENDA 1.162\n", "DESVIO PADRÃO REVENDA 0.114\n", "PREÇO MÍNIMO REVENDA 0.89\n", "PREÇO MÁXIMO REVENDA 1.449\n", "MARGEM MÉDIA REVENDA 0.399\n", "COEF DE VARIAÇÃO REVENDA 0.098\n", "PREÇO MÉDIO DISTRIBUIÇÃO 0.763\n", "DESVIO PADRÃO DISTRIBUIÇÃO 0.088\n", "PREÇO MÍNIMO DISTRIBUIÇÃO 0.5013\n", "PREÇO MÁXIMO DISTRIBUIÇÃO 1.05\n", "COEF DE VARIAÇÃO DISTRIBUIÇÃO 0.115\n", "MÊS 5\n", "ANO 2004\n", "coluna sem nocao DEFAULT\n", "coluna a partir de lista 1\n", "PREÇO MÉDIO REVENDA (dólares) 6.972\n", "Name: 1, dtype: object" ] }, "execution_count": 82, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.loc[1]" ] }, { "cell_type": "markdown", "id": "manufactured-lottery", "metadata": {}, "source": [ "### 1.5 Selecionando um ou mais atributos (colunas)" ] }, { "cell_type": "code", "execution_count": 83, "id": "secret-essence", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
\n", "

5 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 1.288 0.016 ... 0.825 \n", "1 1.162 0.114 ... 0.763 \n", "2 1.389 0.097 ... 0.97 \n", "3 1.262 0.070 ... 0.83 \n", "4 1.181 0.078 ... 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 DEFAULT 0 7.728 \n", "1 DEFAULT 1 6.972 \n", "2 DEFAULT 2 8.334 \n", "3 DEFAULT 3 7.572 \n", "4 DEFAULT 4 7.086 \n", "\n", "[5 rows x 24 columns]" ] }, "execution_count": 83, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 84, "id": "organizational-manufacturer", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "106818 RIO GRANDE DO NORTE\n", "106819 RIO GRANDE DO SUL\n", "106820 SANTA CATARINA\n", "106821 SAO PAULO\n", "106822 SERGIPE\n", "Name: ESTADO, Length: 106823, dtype: object" ] }, "execution_count": 84, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retornando a coluna/atributo 'ESTADO'\n", "data['ESTADO']" ] }, { "cell_type": "code", "execution_count": 85, "id": "facial-chapter", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "106818 RIO GRANDE DO NORTE\n", "106819 RIO GRANDE DO SUL\n", "106820 SANTA CATARINA\n", "106821 SAO PAULO\n", "106822 SERGIPE\n", "Name: ESTADO, Length: 106823, dtype: object" ] }, "execution_count": 85, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.ESTADO" ] }, { "cell_type": "code", "execution_count": 86, "id": "interior-castle", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "106818 RIO GRANDE DO NORTE\n", "106819 RIO GRANDE DO SUL\n", "106820 SANTA CATARINA\n", "106821 SAO PAULO\n", "106822 SERGIPE\n", "Name: ESTADO, Length: 106823, dtype: object" ] }, "execution_count": 86, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.loc[:, 'ESTADO']" ] }, { "cell_type": "code", "execution_count": 87, "id": "disturbed-blackberry", "metadata": {}, "outputs": [], "source": [ "# a forma de acesso de colunas por .NOME_DA_COLUNA só funciona se\n", "# NOME_DA_COLUNA não possuir caracteres inválidos (espaços, acentos, cedilha, ...)\n", "### não funciona\n", "# data.DATA INICIAL" ] }, { "cell_type": "code", "execution_count": 88, "id": "unexpected-incidence", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 2004-05-09\n", "1 2004-05-09\n", "2 2004-05-09\n", "3 2004-05-09\n", "4 2004-05-09\n", " ... \n", "106818 2019-06-23\n", "106819 2019-06-23\n", "106820 2019-06-23\n", "106821 2019-06-23\n", "106822 2019-06-23\n", "Name: DATA INICIAL, Length: 106823, dtype: object" ] }, "execution_count": 88, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# para colunas cujos rótulos possuem caracteres inválidos,\n", "# apenas a seleção via string é válida\n", "data['DATA INICIAL']" ] }, { "cell_type": "markdown", "id": "bored-temple", "metadata": {}, "source": [ "Como o rótulo da coluna 'DATA INICIAL' **possui espaço**, não é possível acessá-la como método: `data.DATA INICIAL`" ] }, { "cell_type": "code", "execution_count": 89, "id": "accredited-verification", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PRODUTOESTADOREGIÃO
0ETANOL HIDRATADODISTRITO FEDERALCENTRO OESTE
1ETANOL HIDRATADOGOIASCENTRO OESTE
2ETANOL HIDRATADOMATO GROSSOCENTRO OESTE
3ETANOL HIDRATADOMATO GROSSO DO SULCENTRO OESTE
4ETANOL HIDRATADOALAGOASNORDESTE
............
106818GNVRIO GRANDE DO NORTENORDESTE
106819GNVRIO GRANDE DO SULSUL
106820GNVSANTA CATARINASUL
106821GNVSAO PAULOSUDESTE
106822GNVSERGIPENORDESTE
\n", "

106823 rows × 3 columns

\n", "
" ], "text/plain": [ " PRODUTO ESTADO REGIÃO\n", "0 ETANOL HIDRATADO DISTRITO FEDERAL CENTRO OESTE\n", "1 ETANOL HIDRATADO GOIAS CENTRO OESTE\n", "2 ETANOL HIDRATADO MATO GROSSO CENTRO OESTE\n", "3 ETANOL HIDRATADO MATO GROSSO DO SUL CENTRO OESTE\n", "4 ETANOL HIDRATADO ALAGOAS NORDESTE\n", "... ... ... ...\n", "106818 GNV RIO GRANDE DO NORTE NORDESTE\n", "106819 GNV RIO GRANDE DO SUL SUL\n", "106820 GNV SANTA CATARINA SUL\n", "106821 GNV SAO PAULO SUDESTE\n", "106822 GNV SERGIPE NORDESTE\n", "\n", "[106823 rows x 3 columns]" ] }, "execution_count": 89, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# selecionando múltiplas colunas: 'PRODUTO', 'ESTADO', 'REGIÃO'\n", "data[['PRODUTO', 'ESTADO', 'REGIÃO']]" ] }, { "cell_type": "markdown", "id": "union-occasion", "metadata": {}, "source": [ "### 1.6 Removendo um Atributo (Coluna) do Data Frame" ] }, { "cell_type": "code", "execution_count": 90, "id": "protecting-commitment", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Unnamed: 0DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
002004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.016...0.8250.110.42010.96660.13352004DEFAULT07.728
112004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.114...0.7630.0880.50131.050.11552004DEFAULT16.972
222004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.097...0.970.0950.56141.1610.09852004DEFAULT28.334
332004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.070...0.830.1190.59911.222420.14352004DEFAULT37.572
442004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.078...0.9410.0770.74411.03170.08252004DEFAULT47.086
\n", "

5 rows × 24 columns

\n", "
" ], "text/plain": [ " Unnamed: 0 DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA ... PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 1.288 0.016 ... 0.825 \n", "1 1.162 0.114 ... 0.763 \n", "2 1.389 0.097 ... 0.97 \n", "3 1.262 0.070 ... 0.83 \n", "4 1.181 0.078 ... 0.941 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.11 0.4201 \n", "1 0.088 0.5013 \n", "2 0.095 0.5614 \n", "3 0.119 0.5991 \n", "4 0.077 0.7441 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \\\n", "0 0.9666 0.133 5 2004 \n", "1 1.05 0.115 5 2004 \n", "2 1.161 0.098 5 2004 \n", "3 1.22242 0.143 5 2004 \n", "4 1.0317 0.082 5 2004 \n", "\n", " coluna sem nocao coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 DEFAULT 0 7.728 \n", "1 DEFAULT 1 6.972 \n", "2 DEFAULT 2 8.334 \n", "3 DEFAULT 3 7.572 \n", "4 DEFAULT 4 7.086 \n", "\n", "[5 rows x 24 columns]" ] }, "execution_count": 90, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "markdown", "id": "concrete-stability", "metadata": {}, "source": [ "Como vimos anteriormente, o atributo 'Unnamed: 0' parece ser um **ruído** em nosso dataset. Desta maneira, vamos eliminá-lo," ] }, { "cell_type": "code", "execution_count": 91, "id": "valuable-montgomery", "metadata": {}, "outputs": [], "source": [ "# deleta/remove in-place (ou seja, no próprio dataframe) a coluna de rótulo 'Unnamed: 0'\n", "del data['Unnamed: 0']" ] }, { "cell_type": "code", "execution_count": 92, "id": "possible-promotion", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDA...PREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANOcoluna sem nocaocoluna a partir de listaPREÇO MÉDIO REVENDA (dólares)
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.190...0.8250.110.42010.96660.13352004DEFAULT07.728
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.890...0.7630.0880.50131.050.11552004DEFAULT16.972
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.180...0.970.0950.56141.1610.09852004DEFAULT28.334
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.090...0.830.1190.59911.222420.14352004DEFAULT37.572
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.050...0.9410.0770.74411.03170.08252004DEFAULT47.086
..................................................................
1068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.0653.499...2.75602.7562.756062019DEFAULT10681821.444
1068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.1293.230...2.4510.4021.98422.86610.16462019DEFAULT10681920.406
1068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.1902.699...1.99801.99811.9981062019DEFAULT10682017.472
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.699...2.3740.1652.01792.50930.0762019DEFAULT10682118.120
1068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.0053.689...2.51802.51752.5175062019DEFAULT10682222.182
\n", "

106823 rows × 23 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "106818 2019-06-23 2019-06-29 NORDESTE RIO GRANDE DO NORTE \n", "106819 2019-06-23 2019-06-29 SUL RIO GRANDE DO SUL \n", "106820 2019-06-23 2019-06-29 SUL SANTA CATARINA \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO \n", "106822 2019-06-23 2019-06-29 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "106818 GNV 7 R$/m3 \n", "106819 GNV 23 R$/m3 \n", "106820 GNV 24 R$/m3 \n", "106821 GNV 52 R$/m3 \n", "106822 GNV 4 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA ... \\\n", "0 1.288 0.016 1.190 ... \n", "1 1.162 0.114 0.890 ... \n", "2 1.389 0.097 1.180 ... \n", "3 1.262 0.070 1.090 ... \n", "4 1.181 0.078 1.050 ... \n", "... ... ... ... ... \n", "106818 3.574 0.065 3.499 ... \n", "106819 3.401 0.129 3.230 ... \n", "106820 2.912 0.190 2.699 ... \n", "106821 3.020 0.229 2.699 ... \n", "106822 3.697 0.005 3.689 ... \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO coluna sem nocao \\\n", "0 0.133 5 2004 DEFAULT \n", "1 0.115 5 2004 DEFAULT \n", "2 0.098 5 2004 DEFAULT \n", "3 0.143 5 2004 DEFAULT \n", "4 0.082 5 2004 DEFAULT \n", "... ... .. ... ... \n", "106818 0 6 2019 DEFAULT \n", "106819 0.164 6 2019 DEFAULT \n", "106820 0 6 2019 DEFAULT \n", "106821 0.07 6 2019 DEFAULT \n", "106822 0 6 2019 DEFAULT \n", "\n", " coluna a partir de lista PREÇO MÉDIO REVENDA (dólares) \n", "0 0 7.728 \n", "1 1 6.972 \n", "2 2 8.334 \n", "3 3 7.572 \n", "4 4 7.086 \n", "... ... ... \n", "106818 106818 21.444 \n", "106819 106819 20.406 \n", "106820 106820 17.472 \n", "106821 106821 18.120 \n", "106822 106822 22.182 \n", "\n", "[106823 rows x 23 columns]" ] }, "execution_count": 92, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "stable-teacher", "metadata": {}, "source": [ "
\n", "\n", "Vamos agora remover as colunas fictícias criadas nos vídeos para estudo." ] }, { "cell_type": "code", "execution_count": 93, "id": "developing-scotland", "metadata": {}, "outputs": [], "source": [ "del data['coluna sem nocao']\n", "del data['coluna a partir de lista']\n", "del data['PREÇO MÉDIO REVENDA (dólares)']" ] }, { "cell_type": "code", "execution_count": 94, "id": "smooth-senator", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 94, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "markdown", "id": "metropolitan-judgment", "metadata": {}, "source": [ "### 1.7 Salvando um Data Frame" ] }, { "cell_type": "markdown", "id": "described-laugh", "metadata": {}, "source": [ "Para salvarmos um Data Frame para um **arquivo CSV**, basta usarmos o método `.to_csv`.
\n", "Por padrão, esse método **salva os índices da tabela como uma coluna no CSV**.
\n", "Como no geral tais índices são números de 0 a n-1, não há necessidade para isso (veja que removemos anteriormente a coluna 'Unnamed: 0' que foi justamente esse caso).
\n", "Desta forma, utilize o parâmetro: `index=False`.\n", "\n", "Por padrão, o método utilizará a ',' como separador das colunas. Caso queira alterá-lo, utilize o parâmetro `sep`." ] }, { "cell_type": "code", "execution_count": 95, "id": "activated-working", "metadata": {}, "outputs": [], "source": [ "data.to_csv('./datasets/GasPricesinBrazil_2004-2019_preprocessado.csv', index=False)" ] }, { "cell_type": "markdown", "id": "mechanical-burst", "metadata": {}, "source": [ "### 1.8 Seleção Condicional: Filtrando amostras" ] }, { "cell_type": "markdown", "id": "continent-individual", "metadata": {}, "source": [ "Durante nossas análise exploratórias, frequentemente filtraremos nossas amostras, a partir de certas **condições**, para fins de análise mais específica.
\n", "Existem algumas maneiras de fazermos tal filtragem. Antes disso, vamos carregar nosso dataset pré-processado que salvamos no item anterior." ] }, { "cell_type": "code", "execution_count": 96, "id": "starting-campaign", "metadata": {}, "outputs": [], "source": [ "data = pd.read_csv('./datasets/GasPricesinBrazil_2004-2019_preprocessado.csv')" ] }, { "cell_type": "code", "execution_count": 97, "id": "successful-belly", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 97, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 98, "id": "classified-peace", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array(['DISTRITO FEDERAL', 'GOIAS', 'MATO GROSSO', 'MATO GROSSO DO SUL',\n", " 'ALAGOAS', 'BAHIA', 'CEARA', 'MARANHAO', 'PARAIBA', 'PERNAMBUCO',\n", " 'PIAUI', 'RIO GRANDE DO NORTE', 'SERGIPE', 'ACRE', 'AMAPA',\n", " 'AMAZONAS', 'PARA', 'RONDONIA', 'RORAIMA', 'TOCANTINS',\n", " 'ESPIRITO SANTO', 'MINAS GERAIS', 'RIO DE JANEIRO', 'SAO PAULO',\n", " 'PARANA', 'RIO GRANDE DO SUL', 'SANTA CATARINA'], dtype=object)" ] }, "execution_count": 98, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Mostra todos os estados cujos os preços dos combustíveis foram aferidos\n", "# Mais tecnicamente, mostra os valores únicos presentes para o atributo/coluna 'ESTADO'.\n", "data['ESTADO'].unique()" ] }, { "cell_type": "markdown", "id": "dependent-theater", "metadata": {}, "source": [ "#### **Selecionando apenas os preços dos Postos de São Paulo**" ] }, { "cell_type": "markdown", "id": "executive-package", "metadata": {}, "source": [ "##### **==> Alternativa 1: Seleção Condicional (Comparações diretas)**" ] }, { "cell_type": "markdown", "id": "proprietary-basic", "metadata": {}, "source": [ "O código abaixo retorna uma ***Series ('array') de booleans***, com o número de linhas (observações) do Data Frame, que informa os registros de preços dos postos do _estado de São Paulo_ (True)." ] }, { "cell_type": "code", "execution_count": 99, "id": "arbitrary-community", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 False\n", "106819 False\n", "106820 False\n", "106821 True\n", "106822 False\n", "Name: ESTADO, Length: 106823, dtype: bool" ] }, "execution_count": 99, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# faz uma comparação elemento a elemento da series, retornando uma Series de booleans\n", "data['ESTADO'] == 'SAO PAULO'" ] }, { "cell_type": "code", "execution_count": 100, "id": "vocational-council", "metadata": {}, "outputs": [], "source": [ "# salvando essa Series de booleans em uma variável\n", "selecao = data['ESTADO'] == 'SAO PAULO'" ] }, { "cell_type": "code", "execution_count": 101, "id": "found-commons", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 False\n", "106819 False\n", "106820 False\n", "106821 True\n", "106822 False\n", "Name: ESTADO, Length: 106823, dtype: bool" ] }, "execution_count": 101, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao" ] }, { "cell_type": "code", "execution_count": 102, "id": "civil-moisture", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.series.Series" ] }, "execution_count": 102, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(selecao)" ] }, { "cell_type": "code", "execution_count": 103, "id": "indonesian-smell", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(106823,)" ] }, "execution_count": 103, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao.shape" ] }, { "cell_type": "code", "execution_count": 104, "id": "herbal-hughes", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(106823, 20)" ] }, "execution_count": 104, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.shape" ] }, { "cell_type": "markdown", "id": "adverse-peeing", "metadata": {}, "source": [ "Para **filtrarmos** os registros de postos do estado de São Paulo:" ] }, { "cell_type": "code", "execution_count": 105, "id": "southern-particle", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 105, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data[selecao]" ] }, { "cell_type": "markdown", "id": "hollow-perry", "metadata": {}, "source": [ "O resultado é um Data Frame com _apenas_ os registros desejados após a **filtragem**.
\n", "Podemos ainda utilizar o método `loc` para o mesmo fim:" ] }, { "cell_type": "code", "execution_count": 106, "id": "enhanced-liver", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 106, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.loc[selecao]" ] }, { "cell_type": "markdown", "id": "distributed-stanford", "metadata": {}, "source": [ "##### **==> Alternativa 2: Utilizando o método `query`**" ] }, { "cell_type": "markdown", "id": "surface-postage", "metadata": {}, "source": [ "`query` filtra linhas de um DataFrame baseado em uma **query (pergunta)**." ] }, { "cell_type": "code", "execution_count": 107, "id": "protective-absolute", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 107, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 108, "id": "aggressive-girlfriend", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 108, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.query('ESTADO == \"SAO PAULO\"')" ] }, { "cell_type": "markdown", "id": "committed-evaluation", "metadata": {}, "source": [ "
\n", "\n", "Uma boa prática é **salvar o Data Frame filtrado em uma nova variável**. Isso simplifica a complexidade do código para futuras análises feitas para os postos de São Paulo (neste caso)." ] }, { "cell_type": "code", "execution_count": 109, "id": "trained-spending", "metadata": {}, "outputs": [], "source": [ "postos_sp = data.query('ESTADO == \"SAO PAULO\"')" ] }, { "cell_type": "code", "execution_count": 110, "id": "miniature-antenna", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 110, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp" ] }, { "cell_type": "code", "execution_count": 111, "id": "minimal-affairs", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "pandas.core.frame.DataFrame" ] }, "execution_count": 111, "metadata": {}, "output_type": "execute_result" } ], "source": [ "type(postos_sp)" ] }, { "cell_type": "code", "execution_count": 112, "id": "arranged-kazakhstan", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(4263, 20)" ] }, "execution_count": 112, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp.shape" ] }, { "cell_type": "code", "execution_count": 113, "id": "talented-ratio", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 113, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp" ] }, { "cell_type": "markdown", "id": "backed-protein", "metadata": {}, "source": [ "#### Resetando os índices" ] }, { "cell_type": "markdown", "id": "spiritual-honolulu", "metadata": {}, "source": [ "Note que os _índices das linhas/registros_ após a _filtragem_ **continuam sendo os mesmos** do DataFrame original.
\n", "Em muitas situações, manter esta informação será importante.\n", "\n", "Mas, se você quiser **_resetar os índices_** do data frame filtrado, fazendo com que os registros começem com _índice 0 até num_linhas-1_, use o método `.reset_index`." ] }, { "cell_type": "code", "execution_count": 114, "id": "eight-translation", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
indexDATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDA...PREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
0232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.085...1.1500.1980.1110.570.0560.42711.41230.09852004
1502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.083...1.1500.190.1080.5760.050.432040.97240.08752004
2772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.071...1.1990.2090.0860.6140.0630.349511.4120.10352004
31042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.075...1.3590.2160.0850.6710.0750.33981.06690.11252004
41312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.071...1.1990.2050.0790.6890.0720.477971.06690.10462004
..................................................................
42581067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.156...4.2200.4010.0453.0470.0972.85993.34810.03262019
42591067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.169...4.3200.4510.0473.1230.1112.8853.4910.03662019
42601067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.183...4.9990.4290.0443.7130.0973.524.08920.02662019
42611068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.100...89.90017.6790.09149.2145.07140.19720.10362019
42621068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.229...3.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 21 columns

\n", "
" ], "text/plain": [ " index DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "0 23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "1 50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "2 77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "3 104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "4 131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... ... \n", "4258 106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "4259 106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "4260 106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "4261 106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "4262 106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "0 4047 R$/l 0.768 \n", "1 4066 R$/l 0.766 \n", "2 4077 R$/l 0.823 \n", "3 4073 R$/l 0.887 \n", "4 4082 R$/l 0.894 \n", "... ... ... ... \n", "4258 863 R$/l 3.448 \n", "4259 1277 R$/l 3.574 \n", "4260 1644 R$/l 4.142 \n", "4261 1017 R$/13Kg 66.893 \n", "4262 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA ... PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA \\\n", "0 0.085 ... 1.150 0.198 \n", "1 0.083 ... 1.150 0.19 \n", "2 0.071 ... 1.199 0.209 \n", "3 0.075 ... 1.359 0.216 \n", "4 0.071 ... 1.199 0.205 \n", "... ... ... ... ... \n", "4258 0.156 ... 4.220 0.401 \n", "4259 0.169 ... 4.320 0.451 \n", "4260 0.183 ... 4.999 0.429 \n", "4261 6.100 ... 89.900 17.679 \n", "4262 0.229 ... 3.490 0.646 \n", "\n", " COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.111 0.57 \n", "1 0.108 0.576 \n", "2 0.086 0.614 \n", "3 0.085 0.671 \n", "4 0.079 0.689 \n", "... ... ... \n", "4258 0.045 3.047 \n", "4259 0.047 3.123 \n", "4260 0.044 3.713 \n", "4261 0.091 49.214 \n", "4262 0.076 2.374 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.056 0.4271 \n", "1 0.05 0.43204 \n", "2 0.063 0.34951 \n", "3 0.075 0.3398 \n", "4 0.072 0.47797 \n", "... ... ... \n", "4258 0.097 2.8599 \n", "4259 0.111 2.885 \n", "4260 0.097 3.52 \n", "4261 5.071 40.19 \n", "4262 0.165 2.0179 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 1.4123 0.098 5 2004 \n", "1 0.9724 0.087 5 2004 \n", "2 1.412 0.103 5 2004 \n", "3 1.0669 0.112 5 2004 \n", "4 1.0669 0.104 6 2004 \n", "... ... ... .. ... \n", "4258 3.3481 0.032 6 2019 \n", "4259 3.491 0.036 6 2019 \n", "4260 4.0892 0.026 6 2019 \n", "4261 72 0.103 6 2019 \n", "4262 2.5093 0.07 6 2019 \n", "\n", "[4263 rows x 21 columns]" ] }, "execution_count": 114, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp.reset_index()" ] }, { "cell_type": "code", "execution_count": 115, "id": "maritime-blank", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
12004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
22004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
32004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
42004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
42582019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
42592019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
42602019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
42612019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
42622019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "0 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "1 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "2 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "3 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "4 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "4258 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "4259 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "4260 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "4261 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "4262 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "0 4047 R$/l 0.768 \n", "1 4066 R$/l 0.766 \n", "2 4077 R$/l 0.823 \n", "3 4073 R$/l 0.887 \n", "4 4082 R$/l 0.894 \n", "... ... ... ... \n", "4258 863 R$/l 3.448 \n", "4259 1277 R$/l 3.574 \n", "4260 1644 R$/l 4.142 \n", "4261 1017 R$/13Kg 66.893 \n", "4262 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "0 0.085 0.590 1.150 \n", "1 0.083 0.590 1.150 \n", "2 0.071 0.620 1.199 \n", "3 0.075 0.639 1.359 \n", "4 0.071 0.669 1.199 \n", "... ... ... ... \n", "4258 0.156 3.099 4.220 \n", "4259 0.169 3.199 4.320 \n", "4260 0.183 3.769 4.999 \n", "4261 6.100 50.000 89.900 \n", "4262 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.198 0.111 0.57 \n", "1 0.19 0.108 0.576 \n", "2 0.209 0.086 0.614 \n", "3 0.216 0.085 0.671 \n", "4 0.205 0.079 0.689 \n", "... ... ... ... \n", "4258 0.401 0.045 3.047 \n", "4259 0.451 0.047 3.123 \n", "4260 0.429 0.044 3.713 \n", "4261 17.679 0.091 49.214 \n", "4262 0.646 0.076 2.374 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.056 0.4271 \n", "1 0.05 0.43204 \n", "2 0.063 0.34951 \n", "3 0.075 0.3398 \n", "4 0.072 0.47797 \n", "... ... ... \n", "4258 0.097 2.8599 \n", "4259 0.111 2.885 \n", "4260 0.097 3.52 \n", "4261 5.071 40.19 \n", "4262 0.165 2.0179 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 1.4123 0.098 5 2004 \n", "1 0.9724 0.087 5 2004 \n", "2 1.412 0.103 5 2004 \n", "3 1.0669 0.112 5 2004 \n", "4 1.0669 0.104 6 2004 \n", "... ... ... ... ... \n", "4258 3.3481 0.032 6 2019 \n", "4259 3.491 0.036 6 2019 \n", "4260 4.0892 0.026 6 2019 \n", "4261 72 0.103 6 2019 \n", "4262 2.5093 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 115, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp.reset_index(drop=True)" ] }, { "cell_type": "code", "execution_count": 116, "id": "opening-september", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
772004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
1042004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
1312004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
1067242019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
1067512019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "77 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "104 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "131 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106724 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "106751 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "23 4047 R$/l 0.768 \n", "50 4066 R$/l 0.766 \n", "77 4077 R$/l 0.823 \n", "104 4073 R$/l 0.887 \n", "131 4082 R$/l 0.894 \n", "... ... ... ... \n", "106724 863 R$/l 3.448 \n", "106751 1277 R$/l 3.574 \n", "106778 1644 R$/l 4.142 \n", "106805 1017 R$/13Kg 66.893 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "23 0.085 0.590 1.150 \n", "50 0.083 0.590 1.150 \n", "77 0.071 0.620 1.199 \n", "104 0.075 0.639 1.359 \n", "131 0.071 0.669 1.199 \n", "... ... ... ... \n", "106724 0.156 3.099 4.220 \n", "106751 0.169 3.199 4.320 \n", "106778 0.183 3.769 4.999 \n", "106805 6.100 50.000 89.900 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "23 0.198 0.111 \n", "50 0.19 0.108 \n", "77 0.209 0.086 \n", "104 0.216 0.085 \n", "131 0.205 0.079 \n", "... ... ... \n", "106724 0.401 0.045 \n", "106751 0.451 0.047 \n", "106778 0.429 0.044 \n", "106805 17.679 0.091 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "23 0.57 0.056 \n", "50 0.576 0.05 \n", "77 0.614 0.063 \n", "104 0.671 0.075 \n", "131 0.689 0.072 \n", "... ... ... \n", "106724 3.047 0.097 \n", "106751 3.123 0.111 \n", "106778 3.713 0.097 \n", "106805 49.214 5.071 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "23 0.4271 1.4123 \n", "50 0.43204 0.9724 \n", "77 0.34951 1.412 \n", "104 0.3398 1.0669 \n", "131 0.47797 1.0669 \n", "... ... ... \n", "106724 2.8599 3.3481 \n", "106751 2.885 3.491 \n", "106778 3.52 4.0892 \n", "106805 40.19 72 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "23 0.098 5 2004 \n", "50 0.087 5 2004 \n", "77 0.103 5 2004 \n", "104 0.112 5 2004 \n", "131 0.104 6 2004 \n", "... ... ... ... \n", "106724 0.032 6 2019 \n", "106751 0.036 6 2019 \n", "106778 0.026 6 2019 \n", "106805 0.103 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 116, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# ainda não foi alterado, precisamos usar o atributo/parâmetro inplace=True\n", "postos_sp" ] }, { "cell_type": "code", "execution_count": 117, "id": "cheap-tucson", "metadata": {}, "outputs": [], "source": [ "postos_sp.reset_index(drop=True, inplace=True)" ] }, { "cell_type": "code", "execution_count": 118, "id": "ecological-structure", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
12004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
22004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
32004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
42004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
42582019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
42592019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
42602019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
42612019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
42622019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "0 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "1 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "2 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "3 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "4 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "4258 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "4259 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "4260 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "4261 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "4262 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "0 4047 R$/l 0.768 \n", "1 4066 R$/l 0.766 \n", "2 4077 R$/l 0.823 \n", "3 4073 R$/l 0.887 \n", "4 4082 R$/l 0.894 \n", "... ... ... ... \n", "4258 863 R$/l 3.448 \n", "4259 1277 R$/l 3.574 \n", "4260 1644 R$/l 4.142 \n", "4261 1017 R$/13Kg 66.893 \n", "4262 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "0 0.085 0.590 1.150 \n", "1 0.083 0.590 1.150 \n", "2 0.071 0.620 1.199 \n", "3 0.075 0.639 1.359 \n", "4 0.071 0.669 1.199 \n", "... ... ... ... \n", "4258 0.156 3.099 4.220 \n", "4259 0.169 3.199 4.320 \n", "4260 0.183 3.769 4.999 \n", "4261 6.100 50.000 89.900 \n", "4262 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.198 0.111 0.57 \n", "1 0.19 0.108 0.576 \n", "2 0.209 0.086 0.614 \n", "3 0.216 0.085 0.671 \n", "4 0.205 0.079 0.689 \n", "... ... ... ... \n", "4258 0.401 0.045 3.047 \n", "4259 0.451 0.047 3.123 \n", "4260 0.429 0.044 3.713 \n", "4261 17.679 0.091 49.214 \n", "4262 0.646 0.076 2.374 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.056 0.4271 \n", "1 0.05 0.43204 \n", "2 0.063 0.34951 \n", "3 0.075 0.3398 \n", "4 0.072 0.47797 \n", "... ... ... \n", "4258 0.097 2.8599 \n", "4259 0.111 2.885 \n", "4260 0.097 3.52 \n", "4261 5.071 40.19 \n", "4262 0.165 2.0179 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 1.4123 0.098 5 2004 \n", "1 0.9724 0.087 5 2004 \n", "2 1.412 0.103 5 2004 \n", "3 1.0669 0.112 5 2004 \n", "4 1.0669 0.104 6 2004 \n", "... ... ... ... ... \n", "4258 3.3481 0.032 6 2019 \n", "4259 3.491 0.036 6 2019 \n", "4260 4.0892 0.026 6 2019 \n", "4261 72 0.103 6 2019 \n", "4262 2.5093 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 118, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp" ] }, { "cell_type": "code", "execution_count": 119, "id": "smaller-shakespeare", "metadata": {}, "outputs": [], "source": [ "# ALTERNATIVA MUITO COMUM\n", "postos_sp = data.query('ESTADO == \"SAO PAULO\"').reset_index(drop=True)" ] }, { "cell_type": "code", "execution_count": 120, "id": "reserved-screen", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
12004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
22004-05-232004-05-29SUDESTESAO PAULOETANOL HIDRATADO4077R$/l0.8230.0710.6201.1990.2090.0860.6140.0630.349511.4120.10352004
32004-05-302004-06-05SUDESTESAO PAULOETANOL HIDRATADO4073R$/l0.8870.0750.6391.3590.2160.0850.6710.0750.33981.06690.11252004
42004-06-062004-06-12SUDESTESAO PAULOETANOL HIDRATADO4082R$/l0.8940.0710.6691.1990.2050.0790.6890.0720.477971.06690.10462004
...............................................................
42582019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL863R$/l3.4480.1563.0994.2200.4010.0453.0470.0972.85993.34810.03262019
42592019-06-232019-06-29SUDESTESAO PAULOÓLEO DIESEL S101277R$/l3.5740.1693.1994.3200.4510.0473.1230.1112.8853.4910.03662019
42602019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
42612019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
42622019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "0 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "1 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "2 2004-05-23 2004-05-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "3 2004-05-30 2004-06-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "4 2004-06-06 2004-06-12 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "4258 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL \n", "4259 2019-06-23 2019-06-29 SUDESTE SAO PAULO ÓLEO DIESEL S10 \n", "4260 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "4261 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "4262 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "0 4047 R$/l 0.768 \n", "1 4066 R$/l 0.766 \n", "2 4077 R$/l 0.823 \n", "3 4073 R$/l 0.887 \n", "4 4082 R$/l 0.894 \n", "... ... ... ... \n", "4258 863 R$/l 3.448 \n", "4259 1277 R$/l 3.574 \n", "4260 1644 R$/l 4.142 \n", "4261 1017 R$/13Kg 66.893 \n", "4262 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "0 0.085 0.590 1.150 \n", "1 0.083 0.590 1.150 \n", "2 0.071 0.620 1.199 \n", "3 0.075 0.639 1.359 \n", "4 0.071 0.669 1.199 \n", "... ... ... ... \n", "4258 0.156 3.099 4.220 \n", "4259 0.169 3.199 4.320 \n", "4260 0.183 3.769 4.999 \n", "4261 6.100 50.000 89.900 \n", "4262 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "0 0.198 0.111 0.57 \n", "1 0.19 0.108 0.576 \n", "2 0.209 0.086 0.614 \n", "3 0.216 0.085 0.671 \n", "4 0.205 0.079 0.689 \n", "... ... ... ... \n", "4258 0.401 0.045 3.047 \n", "4259 0.451 0.047 3.123 \n", "4260 0.429 0.044 3.713 \n", "4261 17.679 0.091 49.214 \n", "4262 0.646 0.076 2.374 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "0 0.056 0.4271 \n", "1 0.05 0.43204 \n", "2 0.063 0.34951 \n", "3 0.075 0.3398 \n", "4 0.072 0.47797 \n", "... ... ... \n", "4258 0.097 2.8599 \n", "4259 0.111 2.885 \n", "4260 0.097 3.52 \n", "4261 5.071 40.19 \n", "4262 0.165 2.0179 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 1.4123 0.098 5 2004 \n", "1 0.9724 0.087 5 2004 \n", "2 1.412 0.103 5 2004 \n", "3 1.0669 0.112 5 2004 \n", "4 1.0669 0.104 6 2004 \n", "... ... ... ... ... \n", "4258 3.3481 0.032 6 2019 \n", "4259 3.491 0.036 6 2019 \n", "4260 4.0892 0.026 6 2019 \n", "4261 72 0.103 6 2019 \n", "4262 2.5093 0.07 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 120, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_sp" ] }, { "cell_type": "markdown", "id": "capital-promotion", "metadata": {}, "source": [ "#### **Selecionando registros de postos do Rio de Janeiro com Preços acima de 2 reais**" ] }, { "cell_type": "code", "execution_count": 121, "id": "employed-ranch", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 121, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 122, "id": "unknown-drink", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 False\n", "106819 False\n", "106820 False\n", "106821 False\n", "106822 False\n", "Name: ESTADO, Length: 106823, dtype: bool" ] }, "execution_count": 122, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data['ESTADO'] == 'RIO DE JANEIRO'" ] }, { "cell_type": "code", "execution_count": 123, "id": "thrown-clinic", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 True\n", "106819 True\n", "106820 True\n", "106821 True\n", "106822 True\n", "Name: PREÇO MÉDIO REVENDA, Length: 106823, dtype: bool" ] }, "execution_count": 123, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data['PREÇO MÉDIO REVENDA'] > 2.0" ] }, { "cell_type": "code", "execution_count": 124, "id": "sorted-outline", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 False\n", "106819 False\n", "106820 False\n", "106821 False\n", "106822 False\n", "Length: 106823, dtype: bool" ] }, "execution_count": 124, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao = (data['ESTADO'] == 'RIO DE JANEIRO') & (data['PREÇO MÉDIO REVENDA'] > 2.0)\n", "selecao" ] }, { "cell_type": "markdown", "id": "continued-barbados", "metadata": {}, "source": [ "Note que o resultado da seleção continua sendo uma _Series de booleans_ com o _mesmo número de linhas/observações do DataFrame_, de modo que cada linha possuirá um valor booleano indicando se o posto é do Rio de Janeiro **E** o preço aferido do combustível é maior que 2 reais (True) ou não.\n", "\n", "O símbolo **&** significa **AND** na comparação. Essa nomenclatura do python/pandas é diferente das nomenclaturas tradicionais (&&).
\n", "Similarmente:\n", "- **|** representa o **OR** (não é ||)\n", "- **~** representa o **NOT** (não é !)" ] }, { "cell_type": "code", "execution_count": 125, "id": "growing-fundamentals", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
25012006-02-262006-03-04SUDESTERIO DE JANEIROETANOL HIDRATADO881R$/l2.0280.1481.5892.5500.2220.0731.8060.111.312.13580.06122006
25282006-03-052006-03-11SUDESTERIO DE JANEIROETANOL HIDRATADO889R$/l2.1250.1491.7792.5500.2860.0701.8390.1171.4382.28010.06432006
25552006-03-122006-03-18SUDESTERIO DE JANEIROETANOL HIDRATADO902R$/l2.1630.1381.7992.5990.2680.0641.8950.1341.432.34540.07132006
25822006-03-192006-03-25SUDESTERIO DE JANEIROETANOL HIDRATADO898R$/l2.1660.1461.7602.5680.2310.0671.9350.141.4382.29250.07232006
26092006-03-262006-04-01SUDESTERIO DE JANEIROETANOL HIDRATADO890R$/l2.1720.1431.7892.5500.2090.0661.9630.1331.4382.25130.06832006
...............................................................
1067182019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL212R$/l3.5690.1663.1794.0590.4670.0473.1020.1192.8863.51620.03862019
1067452019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL S10335R$/l3.6970.1873.2794.3890.50.0513.1970.1272.97723.53880.0462019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067992019-06-232019-06-29SUDESTERIO DE JANEIROGLP221R$/13Kg65.0105.81250.00079.00017.4750.08947.5353.9343958.20.08362019
1068172019-06-232019-06-29SUDESTERIO DE JANEIROGNV124R$/m33.1110.2602.7993.7990.7070.0842.4040.1742.1262.79090.07262019
\n", "

3054 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "2501 2006-02-26 2006-03-04 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2528 2006-03-05 2006-03-11 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2555 2006-03-12 2006-03-18 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2582 2006-03-19 2006-03-25 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2609 2006-03-26 2006-04-01 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106718 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL \n", "106745 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL S10 \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106799 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GLP \n", "106817 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "2501 881 R$/l 2.028 \n", "2528 889 R$/l 2.125 \n", "2555 902 R$/l 2.163 \n", "2582 898 R$/l 2.166 \n", "2609 890 R$/l 2.172 \n", "... ... ... ... \n", "106718 212 R$/l 3.569 \n", "106745 335 R$/l 3.697 \n", "106772 422 R$/l 4.928 \n", "106799 221 R$/13Kg 65.010 \n", "106817 124 R$/m3 3.111 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "2501 0.148 1.589 2.550 \n", "2528 0.149 1.779 2.550 \n", "2555 0.138 1.799 2.599 \n", "2582 0.146 1.760 2.568 \n", "2609 0.143 1.789 2.550 \n", "... ... ... ... \n", "106718 0.166 3.179 4.059 \n", "106745 0.187 3.279 4.389 \n", "106772 0.165 4.599 5.859 \n", "106799 5.812 50.000 79.000 \n", "106817 0.260 2.799 3.799 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "2501 0.222 0.073 \n", "2528 0.286 0.070 \n", "2555 0.268 0.064 \n", "2582 0.231 0.067 \n", "2609 0.209 0.066 \n", "... ... ... \n", "106718 0.467 0.047 \n", "106745 0.5 0.051 \n", "106772 0.538 0.033 \n", "106799 17.475 0.089 \n", "106817 0.707 0.084 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "2501 1.806 0.11 \n", "2528 1.839 0.117 \n", "2555 1.895 0.134 \n", "2582 1.935 0.14 \n", "2609 1.963 0.133 \n", "... ... ... \n", "106718 3.102 0.119 \n", "106745 3.197 0.127 \n", "106772 4.39 0.097 \n", "106799 47.535 3.934 \n", "106817 2.404 0.174 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "2501 1.31 2.1358 \n", "2528 1.438 2.2801 \n", "2555 1.43 2.3454 \n", "2582 1.438 2.2925 \n", "2609 1.438 2.2513 \n", "... ... ... \n", "106718 2.886 3.5162 \n", "106745 2.9772 3.5388 \n", "106772 4.2 4.618 \n", "106799 39 58.2 \n", "106817 2.126 2.7909 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "2501 0.061 2 2006 \n", "2528 0.064 3 2006 \n", "2555 0.071 3 2006 \n", "2582 0.072 3 2006 \n", "2609 0.068 3 2006 \n", "... ... ... ... \n", "106718 0.038 6 2019 \n", "106745 0.04 6 2019 \n", "106772 0.022 6 2019 \n", "106799 0.083 6 2019 \n", "106817 0.072 6 2019 \n", "\n", "[3054 rows x 20 columns]" ] }, "execution_count": 125, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data[selecao]" ] }, { "cell_type": "markdown", "id": "suspended-atlanta", "metadata": {}, "source": [ "Alternativamente, poderíamos usar o método `query` para fazermos tal seleção. Porém, isso não é possível especificamente para esse caso, pois o rótulo da coluna 'PREÇO MÉDIO REVENDA' possui caracteres inválidos para o método (cedilha, acentos) " ] }, { "cell_type": "code", "execution_count": 126, "id": "certain-preview", "metadata": {}, "outputs": [], "source": [ "# Não funciona\n", "# data.query('ESTADO==\"RIO DE JANEIRO\" and PREÇO MÉDIO REVENDA > 2')" ] }, { "cell_type": "code", "execution_count": 127, "id": "worth-skirt", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
222004-05-092004-05-15SUDESTERIO DE JANEIROETANOL HIDRATADO952R$/l1.0980.1540.7401.8900.3120.1400.7860.1730.3261.2630.2252004
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
492004-05-162004-05-22SUDESTERIO DE JANEIROETANOL HIDRATADO948R$/l1.0920.1570.7401.4990.2840.1440.8080.1750.32571.29210.21752004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
762004-05-232004-05-29SUDESTERIO DE JANEIROETANOL HIDRATADO973R$/l1.1030.1400.7701.5890.2810.1270.8220.1660.389091.18590.20252004
...............................................................
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1067992019-06-232019-06-29SUDESTERIO DE JANEIROGLP221R$/13Kg65.0105.81250.00079.00017.4750.08947.5353.9343958.20.08362019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068172019-06-232019-06-29SUDESTERIO DE JANEIROGNV124R$/m33.1110.2602.7993.7990.7070.0842.4040.1742.1262.79090.07262019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

8526 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "22 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "49 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "76 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106799 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GLP \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106817 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GNV \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "22 952 R$/l 1.098 \n", "23 4047 R$/l 0.768 \n", "49 948 R$/l 1.092 \n", "50 4066 R$/l 0.766 \n", "76 973 R$/l 1.103 \n", "... ... ... ... \n", "106778 1644 R$/l 4.142 \n", "106799 221 R$/13Kg 65.010 \n", "106805 1017 R$/13Kg 66.893 \n", "106817 124 R$/m3 3.111 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "22 0.154 0.740 1.890 \n", "23 0.085 0.590 1.150 \n", "49 0.157 0.740 1.499 \n", "50 0.083 0.590 1.150 \n", "76 0.140 0.770 1.589 \n", "... ... ... ... \n", "106778 0.183 3.769 4.999 \n", "106799 5.812 50.000 79.000 \n", "106805 6.100 50.000 89.900 \n", "106817 0.260 2.799 3.799 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "22 0.312 0.140 \n", "23 0.198 0.111 \n", "49 0.284 0.144 \n", "50 0.19 0.108 \n", "76 0.281 0.127 \n", "... ... ... \n", "106778 0.429 0.044 \n", "106799 17.475 0.089 \n", "106805 17.679 0.091 \n", "106817 0.707 0.084 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "22 0.786 0.173 \n", "23 0.57 0.056 \n", "49 0.808 0.175 \n", "50 0.576 0.05 \n", "76 0.822 0.166 \n", "... ... ... \n", "106778 3.713 0.097 \n", "106799 47.535 3.934 \n", "106805 49.214 5.071 \n", "106817 2.404 0.174 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "22 0.326 1.263 \n", "23 0.4271 1.4123 \n", "49 0.3257 1.2921 \n", "50 0.43204 0.9724 \n", "76 0.38909 1.1859 \n", "... ... ... \n", "106778 3.52 4.0892 \n", "106799 39 58.2 \n", "106805 40.19 72 \n", "106817 2.126 2.7909 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "22 0.22 5 2004 \n", "23 0.098 5 2004 \n", "49 0.217 5 2004 \n", "50 0.087 5 2004 \n", "76 0.202 5 2004 \n", "... ... ... ... \n", "106778 0.026 6 2019 \n", "106799 0.083 6 2019 \n", "106805 0.103 6 2019 \n", "106817 0.072 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[8526 rows x 20 columns]" ] }, "execution_count": 127, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.query('ESTADO == \"RIO DE JANEIRO\" or ESTADO == \"SAO PAULO\"')" ] }, { "cell_type": "markdown", "id": "electrical-knowing", "metadata": {}, "source": [ "**Aprofundando mais ainda**\n", "\n", "A primeira comparação `(data['ESTADO'] == 'RIO DE JANEIRO')` checa, linha a linha (observação a observação) do DataFrame, quais são aquelas cujo o estado é RIO DE JANEIRO. Nenhuma averiguação de preços é feita nesse momento. Como resultado, temos uma Series de booleans que responde **apenas** a essa \"pergunta\" feita.\n", "\n", "A segunda comparação `(data['PREÇO MÉDIO REVENDA'] > 2)` checa, linha a linha (observação a observação) do DataFrame, quais são os registros cujo preço do combustível é maior que 2 reais. Note que essa comparação checará os postos de **TODOS os estados**. Como resultado, temos uma Series de booleans que responde **apenas** a essa \"pergunta\" feita.\n", "\n", "Por fim, as duas \"perguntas\" são unidas pelo AND (&) que retorna a \"pergunta completa\" que fizemos." ] }, { "cell_type": "markdown", "id": "favorite-given", "metadata": {}, "source": [ "Alguns podem argumentar que tal abordagem é **ineficiente**, uma vez que, para cada condição (\"pergunta\"), estamos varrendo todas as linhas do DataFrame.
\n", "O Pandas _tenta otimizar_ isso ao máximo por de trás dos panos. Mas, de fato, se tivermos um dataset **muito grande** (centenas de milhares de linhas), tal abordagem se tornará _lenta_." ] }, { "cell_type": "markdown", "id": "polish-subsection", "metadata": {}, "source": [ "Assim, poderíamos fazer filtragem com múltiplos condicionais em partes:" ] }, { "cell_type": "code", "execution_count": 128, "id": "excess-isolation", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
222004-05-092004-05-15SUDESTERIO DE JANEIROETANOL HIDRATADO952R$/l1.0980.1540.7401.8900.3120.1400.7860.1730.3261.2630.2252004
492004-05-162004-05-22SUDESTERIO DE JANEIROETANOL HIDRATADO948R$/l1.0920.1570.7401.4990.2840.1440.8080.1750.32571.29210.21752004
762004-05-232004-05-29SUDESTERIO DE JANEIROETANOL HIDRATADO973R$/l1.1030.1400.7701.5890.2810.1270.8220.1660.389091.18590.20252004
1032004-05-302004-06-05SUDESTERIO DE JANEIROETANOL HIDRATADO955R$/l1.1490.1560.7991.5990.30.1360.8490.1880.34531.36670.22152004
1302004-06-062004-06-12SUDESTERIO DE JANEIROETANOL HIDRATADO966R$/l1.1650.1540.8301.5990.2540.1320.9110.1980.41.36670.21762004
...............................................................
1067182019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL212R$/l3.5690.1663.1794.0590.4670.0473.1020.1192.8863.51620.03862019
1067452019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL S10335R$/l3.6970.1873.2794.3890.50.0513.1970.1272.97723.53880.0462019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067992019-06-232019-06-29SUDESTERIO DE JANEIROGLP221R$/13Kg65.0105.81250.00079.00017.4750.08947.5353.9343958.20.08362019
1068172019-06-232019-06-29SUDESTERIO DE JANEIROGNV124R$/m33.1110.2602.7993.7990.7070.0842.4040.1742.1262.79090.07262019
\n", "

4263 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "22 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "49 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "76 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "103 2004-05-30 2004-06-05 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "130 2004-06-06 2004-06-12 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106718 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL \n", "106745 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL S10 \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106799 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GLP \n", "106817 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "22 952 R$/l 1.098 \n", "49 948 R$/l 1.092 \n", "76 973 R$/l 1.103 \n", "103 955 R$/l 1.149 \n", "130 966 R$/l 1.165 \n", "... ... ... ... \n", "106718 212 R$/l 3.569 \n", "106745 335 R$/l 3.697 \n", "106772 422 R$/l 4.928 \n", "106799 221 R$/13Kg 65.010 \n", "106817 124 R$/m3 3.111 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "22 0.154 0.740 1.890 \n", "49 0.157 0.740 1.499 \n", "76 0.140 0.770 1.589 \n", "103 0.156 0.799 1.599 \n", "130 0.154 0.830 1.599 \n", "... ... ... ... \n", "106718 0.166 3.179 4.059 \n", "106745 0.187 3.279 4.389 \n", "106772 0.165 4.599 5.859 \n", "106799 5.812 50.000 79.000 \n", "106817 0.260 2.799 3.799 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "22 0.312 0.140 \n", "49 0.284 0.144 \n", "76 0.281 0.127 \n", "103 0.3 0.136 \n", "130 0.254 0.132 \n", "... ... ... \n", "106718 0.467 0.047 \n", "106745 0.5 0.051 \n", "106772 0.538 0.033 \n", "106799 17.475 0.089 \n", "106817 0.707 0.084 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "22 0.786 0.173 \n", "49 0.808 0.175 \n", "76 0.822 0.166 \n", "103 0.849 0.188 \n", "130 0.911 0.198 \n", "... ... ... \n", "106718 3.102 0.119 \n", "106745 3.197 0.127 \n", "106772 4.39 0.097 \n", "106799 47.535 3.934 \n", "106817 2.404 0.174 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "22 0.326 1.263 \n", "49 0.3257 1.2921 \n", "76 0.38909 1.1859 \n", "103 0.3453 1.3667 \n", "130 0.4 1.3667 \n", "... ... ... \n", "106718 2.886 3.5162 \n", "106745 2.9772 3.5388 \n", "106772 4.2 4.618 \n", "106799 39 58.2 \n", "106817 2.126 2.7909 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "22 0.22 5 2004 \n", "49 0.217 5 2004 \n", "76 0.202 5 2004 \n", "103 0.221 5 2004 \n", "130 0.217 6 2004 \n", "... ... ... ... \n", "106718 0.038 6 2019 \n", "106745 0.04 6 2019 \n", "106772 0.022 6 2019 \n", "106799 0.083 6 2019 \n", "106817 0.072 6 2019 \n", "\n", "[4263 rows x 20 columns]" ] }, "execution_count": 128, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_1 = data['ESTADO'] == 'RIO DE JANEIRO'\n", "postos_rj = data[selecao_1]\n", "postos_rj" ] }, { "cell_type": "code", "execution_count": 129, "id": "olive-brunei", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "22 False\n", "49 False\n", "76 False\n", "103 False\n", "130 False\n", " ... \n", "106718 True\n", "106745 True\n", "106772 True\n", "106799 True\n", "106817 True\n", "Name: PREÇO MÉDIO REVENDA, Length: 4263, dtype: bool" ] }, "execution_count": 129, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_2 = postos_rj['PREÇO MÉDIO REVENDA'] > 2\n", "selecao_2" ] }, { "cell_type": "code", "execution_count": 130, "id": "invalid-alaska", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
25012006-02-262006-03-04SUDESTERIO DE JANEIROETANOL HIDRATADO881R$/l2.0280.1481.5892.5500.2220.0731.8060.111.312.13580.06122006
25282006-03-052006-03-11SUDESTERIO DE JANEIROETANOL HIDRATADO889R$/l2.1250.1491.7792.5500.2860.0701.8390.1171.4382.28010.06432006
25552006-03-122006-03-18SUDESTERIO DE JANEIROETANOL HIDRATADO902R$/l2.1630.1381.7992.5990.2680.0641.8950.1341.432.34540.07132006
25822006-03-192006-03-25SUDESTERIO DE JANEIROETANOL HIDRATADO898R$/l2.1660.1461.7602.5680.2310.0671.9350.141.4382.29250.07232006
26092006-03-262006-04-01SUDESTERIO DE JANEIROETANOL HIDRATADO890R$/l2.1720.1431.7892.5500.2090.0661.9630.1331.4382.25130.06832006
...............................................................
1067182019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL212R$/l3.5690.1663.1794.0590.4670.0473.1020.1192.8863.51620.03862019
1067452019-06-232019-06-29SUDESTERIO DE JANEIROÓLEO DIESEL S10335R$/l3.6970.1873.2794.3890.50.0513.1970.1272.97723.53880.0462019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067992019-06-232019-06-29SUDESTERIO DE JANEIROGLP221R$/13Kg65.0105.81250.00079.00017.4750.08947.5353.9343958.20.08362019
1068172019-06-232019-06-29SUDESTERIO DE JANEIROGNV124R$/m33.1110.2602.7993.7990.7070.0842.4040.1742.1262.79090.07262019
\n", "

3054 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "2501 2006-02-26 2006-03-04 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2528 2006-03-05 2006-03-11 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2555 2006-03-12 2006-03-18 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2582 2006-03-19 2006-03-25 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "2609 2006-03-26 2006-04-01 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106718 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL \n", "106745 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO ÓLEO DIESEL S10 \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106799 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GLP \n", "106817 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "2501 881 R$/l 2.028 \n", "2528 889 R$/l 2.125 \n", "2555 902 R$/l 2.163 \n", "2582 898 R$/l 2.166 \n", "2609 890 R$/l 2.172 \n", "... ... ... ... \n", "106718 212 R$/l 3.569 \n", "106745 335 R$/l 3.697 \n", "106772 422 R$/l 4.928 \n", "106799 221 R$/13Kg 65.010 \n", "106817 124 R$/m3 3.111 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "2501 0.148 1.589 2.550 \n", "2528 0.149 1.779 2.550 \n", "2555 0.138 1.799 2.599 \n", "2582 0.146 1.760 2.568 \n", "2609 0.143 1.789 2.550 \n", "... ... ... ... \n", "106718 0.166 3.179 4.059 \n", "106745 0.187 3.279 4.389 \n", "106772 0.165 4.599 5.859 \n", "106799 5.812 50.000 79.000 \n", "106817 0.260 2.799 3.799 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "2501 0.222 0.073 \n", "2528 0.286 0.070 \n", "2555 0.268 0.064 \n", "2582 0.231 0.067 \n", "2609 0.209 0.066 \n", "... ... ... \n", "106718 0.467 0.047 \n", "106745 0.5 0.051 \n", "106772 0.538 0.033 \n", "106799 17.475 0.089 \n", "106817 0.707 0.084 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "2501 1.806 0.11 \n", "2528 1.839 0.117 \n", "2555 1.895 0.134 \n", "2582 1.935 0.14 \n", "2609 1.963 0.133 \n", "... ... ... \n", "106718 3.102 0.119 \n", "106745 3.197 0.127 \n", "106772 4.39 0.097 \n", "106799 47.535 3.934 \n", "106817 2.404 0.174 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "2501 1.31 2.1358 \n", "2528 1.438 2.2801 \n", "2555 1.43 2.3454 \n", "2582 1.438 2.2925 \n", "2609 1.438 2.2513 \n", "... ... ... \n", "106718 2.886 3.5162 \n", "106745 2.9772 3.5388 \n", "106772 4.2 4.618 \n", "106799 39 58.2 \n", "106817 2.126 2.7909 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "2501 0.061 2 2006 \n", "2528 0.064 3 2006 \n", "2555 0.071 3 2006 \n", "2582 0.072 3 2006 \n", "2609 0.068 3 2006 \n", "... ... ... ... \n", "106718 0.038 6 2019 \n", "106745 0.04 6 2019 \n", "106772 0.022 6 2019 \n", "106799 0.083 6 2019 \n", "106817 0.072 6 2019 \n", "\n", "[3054 rows x 20 columns]" ] }, "execution_count": 130, "metadata": {}, "output_type": "execute_result" } ], "source": [ "postos_rj_preco_maior_que_2 = postos_rj[selecao_2]\n", "postos_rj_preco_maior_que_2" ] }, { "cell_type": "markdown", "id": "ready-original", "metadata": {}, "source": [ "#### **Selecionando registros de postos de São Paulo ou do Rio de Janeiro com Gasolina Comum acima de 2 reais**" ] }, { "cell_type": "markdown", "id": "differential-balance", "metadata": {}, "source": [ "Podemos fazer a solução do \"jeito mais lento\", percorrendo o DataFrame inteiro _múltiplas vezes_:" ] }, { "cell_type": "code", "execution_count": 131, "id": "scenic-strengthening", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 131, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "code", "execution_count": 132, "id": "aboriginal-rebecca", "metadata": {}, "outputs": [], "source": [ "selecao_1 = (data['ESTADO'] == 'SAO PAULO') | (data['ESTADO'] == 'RIO DE JANEIRO')\n", "selecao_2 = (data['PRODUTO'] == 'GASOLINA COMUM')\n", "selecao_3 = (data['PREÇO MÉDIO REVENDA'] > 2)\n", "\n", "selecao_final = selecao_1 & selecao_2 & selecao_3" ] }, { "cell_type": "code", "execution_count": 133, "id": "entire-maker", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 False\n", "1 False\n", "2 False\n", "3 False\n", "4 False\n", " ... \n", "106818 False\n", "106819 False\n", "106820 False\n", "106821 False\n", "106822 False\n", "Length: 106823, dtype: bool" ] }, "execution_count": 133, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_final" ] }, { "cell_type": "code", "execution_count": 134, "id": "available-identity", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
120862004-05-092004-05-15SUDESTERIO DE JANEIROGASOLINA COMUM1071R$/l2.0450.1091.7002.5990.2540.0531.7910.0471.63631.95940.02652004
121132004-05-162004-05-22SUDESTERIO DE JANEIROGASOLINA COMUM1055R$/l2.0400.1131.7002.5990.2520.0551.7880.0491.59431.996510.02752004
121402004-05-232004-05-29SUDESTERIO DE JANEIROGASOLINA COMUM1091R$/l2.0420.1081.7002.5990.2520.0531.790.0461.635962.21370.02652004
121672004-05-302004-06-05SUDESTERIO DE JANEIROGASOLINA COMUM1055R$/l2.0530.1111.7302.5990.2510.0541.8020.0551.642.214250.03152004
121942004-06-062004-06-12SUDESTERIO DE JANEIROGASOLINA COMUM1091R$/l2.0630.1071.7602.5990.2470.0521.8160.0541.642.324250.0362004
...............................................................
1064792019-06-092019-06-15SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.2100.1773.7594.9920.4250.0423.7850.0963.524.10070.02562019
1066232019-06-162019-06-22SUDESTERIO DE JANEIROGASOLINA COMUM418R$/l4.9270.1604.5995.8590.5440.0324.3830.14.19724.62390.02362019
1066292019-06-162019-06-22SUDESTESAO PAULOGASOLINA COMUM1635R$/l4.1680.1773.6795.1990.4430.0423.7250.0963.5024.08920.02662019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
\n", "

1564 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "12086 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12113 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12140 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12167 2004-05-30 2004-06-05 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12194 2004-06-06 2004-06-12 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "... ... ... ... ... ... \n", "106479 2019-06-09 2019-06-15 SUDESTE SAO PAULO GASOLINA COMUM \n", "106623 2019-06-16 2019-06-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106629 2019-06-16 2019-06-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "12086 1071 R$/l 2.045 \n", "12113 1055 R$/l 2.040 \n", "12140 1091 R$/l 2.042 \n", "12167 1055 R$/l 2.053 \n", "12194 1091 R$/l 2.063 \n", "... ... ... ... \n", "106479 1643 R$/l 4.210 \n", "106623 418 R$/l 4.927 \n", "106629 1635 R$/l 4.168 \n", "106772 422 R$/l 4.928 \n", "106778 1644 R$/l 4.142 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "12086 0.109 1.700 2.599 \n", "12113 0.113 1.700 2.599 \n", "12140 0.108 1.700 2.599 \n", "12167 0.111 1.730 2.599 \n", "12194 0.107 1.760 2.599 \n", "... ... ... ... \n", "106479 0.177 3.759 4.992 \n", "106623 0.160 4.599 5.859 \n", "106629 0.177 3.679 5.199 \n", "106772 0.165 4.599 5.859 \n", "106778 0.183 3.769 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "12086 0.254 0.053 \n", "12113 0.252 0.055 \n", "12140 0.252 0.053 \n", "12167 0.251 0.054 \n", "12194 0.247 0.052 \n", "... ... ... \n", "106479 0.425 0.042 \n", "106623 0.544 0.032 \n", "106629 0.443 0.042 \n", "106772 0.538 0.033 \n", "106778 0.429 0.044 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "12086 1.791 0.047 \n", "12113 1.788 0.049 \n", "12140 1.79 0.046 \n", "12167 1.802 0.055 \n", "12194 1.816 0.054 \n", "... ... ... \n", "106479 3.785 0.096 \n", "106623 4.383 0.1 \n", "106629 3.725 0.096 \n", "106772 4.39 0.097 \n", "106778 3.713 0.097 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "12086 1.6363 1.9594 \n", "12113 1.5943 1.99651 \n", "12140 1.63596 2.2137 \n", "12167 1.64 2.21425 \n", "12194 1.64 2.32425 \n", "... ... ... \n", "106479 3.52 4.1007 \n", "106623 4.1972 4.6239 \n", "106629 3.502 4.0892 \n", "106772 4.2 4.618 \n", "106778 3.52 4.0892 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "12086 0.026 5 2004 \n", "12113 0.027 5 2004 \n", "12140 0.026 5 2004 \n", "12167 0.031 5 2004 \n", "12194 0.03 6 2004 \n", "... ... ... ... \n", "106479 0.025 6 2019 \n", "106623 0.023 6 2019 \n", "106629 0.026 6 2019 \n", "106772 0.022 6 2019 \n", "106778 0.026 6 2019 \n", "\n", "[1564 rows x 20 columns]" ] }, "execution_count": 134, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_filtrado = data[selecao_final]\n", "data_filtrado" ] }, { "cell_type": "code", "execution_count": 135, "id": "southern-float", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "['RIO DE JANEIRO' 'SAO PAULO']\n", "['GASOLINA COMUM']\n" ] } ], "source": [ "print(data_filtrado['ESTADO'].unique())\n", "print(data_filtrado['PRODUTO'].unique())" ] }, { "cell_type": "markdown", "id": "purple-kennedy", "metadata": {}, "source": [ "
\n", "\n", "Alternativamente:" ] }, { "cell_type": "code", "execution_count": 136, "id": "presidential-split", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
222004-05-092004-05-15SUDESTERIO DE JANEIROETANOL HIDRATADO952R$/l1.0980.1540.7401.8900.3120.1400.7860.1730.3261.2630.2252004
232004-05-092004-05-15SUDESTESAO PAULOETANOL HIDRATADO4047R$/l0.7680.0850.5901.1500.1980.1110.570.0560.42711.41230.09852004
492004-05-162004-05-22SUDESTERIO DE JANEIROETANOL HIDRATADO948R$/l1.0920.1570.7401.4990.2840.1440.8080.1750.32571.29210.21752004
502004-05-162004-05-22SUDESTESAO PAULOETANOL HIDRATADO4066R$/l0.7660.0830.5901.1500.190.1080.5760.050.432040.97240.08752004
762004-05-232004-05-29SUDESTERIO DE JANEIROETANOL HIDRATADO973R$/l1.1030.1400.7701.5890.2810.1270.8220.1660.389091.18590.20252004
...............................................................
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
1067992019-06-232019-06-29SUDESTERIO DE JANEIROGLP221R$/13Kg65.0105.81250.00079.00017.4750.08947.5353.9343958.20.08362019
1068052019-06-232019-06-29SUDESTESAO PAULOGLP1017R$/13Kg66.8936.10050.00089.90017.6790.09149.2145.07140.19720.10362019
1068172019-06-232019-06-29SUDESTERIO DE JANEIROGNV124R$/m33.1110.2602.7993.7990.7070.0842.4040.1742.1262.79090.07262019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
\n", "

8526 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "22 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "23 2004-05-09 2004-05-15 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "49 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "50 2004-05-16 2004-05-22 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "76 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "106799 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GLP \n", "106805 2019-06-23 2019-06-29 SUDESTE SAO PAULO GLP \n", "106817 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GNV \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "22 952 R$/l 1.098 \n", "23 4047 R$/l 0.768 \n", "49 948 R$/l 1.092 \n", "50 4066 R$/l 0.766 \n", "76 973 R$/l 1.103 \n", "... ... ... ... \n", "106778 1644 R$/l 4.142 \n", "106799 221 R$/13Kg 65.010 \n", "106805 1017 R$/13Kg 66.893 \n", "106817 124 R$/m3 3.111 \n", "106821 52 R$/m3 3.020 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "22 0.154 0.740 1.890 \n", "23 0.085 0.590 1.150 \n", "49 0.157 0.740 1.499 \n", "50 0.083 0.590 1.150 \n", "76 0.140 0.770 1.589 \n", "... ... ... ... \n", "106778 0.183 3.769 4.999 \n", "106799 5.812 50.000 79.000 \n", "106805 6.100 50.000 89.900 \n", "106817 0.260 2.799 3.799 \n", "106821 0.229 2.699 3.490 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "22 0.312 0.140 \n", "23 0.198 0.111 \n", "49 0.284 0.144 \n", "50 0.19 0.108 \n", "76 0.281 0.127 \n", "... ... ... \n", "106778 0.429 0.044 \n", "106799 17.475 0.089 \n", "106805 17.679 0.091 \n", "106817 0.707 0.084 \n", "106821 0.646 0.076 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "22 0.786 0.173 \n", "23 0.57 0.056 \n", "49 0.808 0.175 \n", "50 0.576 0.05 \n", "76 0.822 0.166 \n", "... ... ... \n", "106778 3.713 0.097 \n", "106799 47.535 3.934 \n", "106805 49.214 5.071 \n", "106817 2.404 0.174 \n", "106821 2.374 0.165 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "22 0.326 1.263 \n", "23 0.4271 1.4123 \n", "49 0.3257 1.2921 \n", "50 0.43204 0.9724 \n", "76 0.38909 1.1859 \n", "... ... ... \n", "106778 3.52 4.0892 \n", "106799 39 58.2 \n", "106805 40.19 72 \n", "106817 2.126 2.7909 \n", "106821 2.0179 2.5093 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "22 0.22 5 2004 \n", "23 0.098 5 2004 \n", "49 0.217 5 2004 \n", "50 0.087 5 2004 \n", "76 0.202 5 2004 \n", "... ... ... ... \n", "106778 0.026 6 2019 \n", "106799 0.083 6 2019 \n", "106805 0.103 6 2019 \n", "106817 0.072 6 2019 \n", "106821 0.07 6 2019 \n", "\n", "[8526 rows x 20 columns]" ] }, "execution_count": 136, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_1 = (data['ESTADO'] == 'SAO PAULO') | (data['ESTADO'] == 'RIO DE JANEIRO')\n", "postos_sp_rj = data[selecao_1]\n", "\n", "# apenas registros de postos dos estados de SP e RJ\n", "postos_sp_rj" ] }, { "cell_type": "code", "execution_count": 137, "id": "straight-sailing", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
120862004-05-092004-05-15SUDESTERIO DE JANEIROGASOLINA COMUM1071R$/l2.0450.1091.7002.5990.2540.0531.7910.0471.63631.95940.02652004
120872004-05-092004-05-15SUDESTESAO PAULOGASOLINA COMUM4107R$/l1.8910.1011.5702.3990.2350.0531.6560.0641.381.9440.03952004
121132004-05-162004-05-22SUDESTERIO DE JANEIROGASOLINA COMUM1055R$/l2.0400.1131.7002.5990.2520.0551.7880.0491.59431.996510.02752004
121142004-05-162004-05-22SUDESTESAO PAULOGASOLINA COMUM4133R$/l1.8880.1011.5402.2200.2330.0531.6550.0631.381.93190.03852004
121402004-05-232004-05-29SUDESTERIO DE JANEIROGASOLINA COMUM1091R$/l2.0420.1081.7002.5990.2520.0531.790.0461.635962.21370.02652004
...............................................................
1064792019-06-092019-06-15SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.2100.1773.7594.9920.4250.0423.7850.0963.524.10070.02562019
1066232019-06-162019-06-22SUDESTERIO DE JANEIROGASOLINA COMUM418R$/l4.9270.1604.5995.8590.5440.0324.3830.14.19724.62390.02362019
1066292019-06-162019-06-22SUDESTESAO PAULOGASOLINA COMUM1635R$/l4.1680.1773.6795.1990.4430.0423.7250.0963.5024.08920.02662019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
\n", "

1570 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "12086 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12087 2004-05-09 2004-05-15 SUDESTE SAO PAULO GASOLINA COMUM \n", "12113 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12114 2004-05-16 2004-05-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "12140 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "... ... ... ... ... ... \n", "106479 2019-06-09 2019-06-15 SUDESTE SAO PAULO GASOLINA COMUM \n", "106623 2019-06-16 2019-06-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106629 2019-06-16 2019-06-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "12086 1071 R$/l 2.045 \n", "12087 4107 R$/l 1.891 \n", "12113 1055 R$/l 2.040 \n", "12114 4133 R$/l 1.888 \n", "12140 1091 R$/l 2.042 \n", "... ... ... ... \n", "106479 1643 R$/l 4.210 \n", "106623 418 R$/l 4.927 \n", "106629 1635 R$/l 4.168 \n", "106772 422 R$/l 4.928 \n", "106778 1644 R$/l 4.142 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "12086 0.109 1.700 2.599 \n", "12087 0.101 1.570 2.399 \n", "12113 0.113 1.700 2.599 \n", "12114 0.101 1.540 2.220 \n", "12140 0.108 1.700 2.599 \n", "... ... ... ... \n", "106479 0.177 3.759 4.992 \n", "106623 0.160 4.599 5.859 \n", "106629 0.177 3.679 5.199 \n", "106772 0.165 4.599 5.859 \n", "106778 0.183 3.769 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "12086 0.254 0.053 \n", "12087 0.235 0.053 \n", "12113 0.252 0.055 \n", "12114 0.233 0.053 \n", "12140 0.252 0.053 \n", "... ... ... \n", "106479 0.425 0.042 \n", "106623 0.544 0.032 \n", "106629 0.443 0.042 \n", "106772 0.538 0.033 \n", "106778 0.429 0.044 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "12086 1.791 0.047 \n", "12087 1.656 0.064 \n", "12113 1.788 0.049 \n", "12114 1.655 0.063 \n", "12140 1.79 0.046 \n", "... ... ... \n", "106479 3.785 0.096 \n", "106623 4.383 0.1 \n", "106629 3.725 0.096 \n", "106772 4.39 0.097 \n", "106778 3.713 0.097 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "12086 1.6363 1.9594 \n", "12087 1.38 1.944 \n", "12113 1.5943 1.99651 \n", "12114 1.38 1.9319 \n", "12140 1.63596 2.2137 \n", "... ... ... \n", "106479 3.52 4.1007 \n", "106623 4.1972 4.6239 \n", "106629 3.502 4.0892 \n", "106772 4.2 4.618 \n", "106778 3.52 4.0892 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "12086 0.026 5 2004 \n", "12087 0.039 5 2004 \n", "12113 0.027 5 2004 \n", "12114 0.038 5 2004 \n", "12140 0.026 5 2004 \n", "... ... ... ... \n", "106479 0.025 6 2019 \n", "106623 0.023 6 2019 \n", "106629 0.026 6 2019 \n", "106772 0.022 6 2019 \n", "106778 0.026 6 2019 \n", "\n", "[1570 rows x 20 columns]" ] }, "execution_count": 137, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_2 = (postos_sp_rj['PRODUTO'] == 'GASOLINA COMUM')\n", "postos_sp_rj_gasolina = postos_sp_rj[selecao_2]\n", "\n", "# apenas registros de postos dos estados de SP e RJ cujo produto é GASOLINA COMUM\n", "postos_sp_rj_gasolina" ] }, { "cell_type": "code", "execution_count": 138, "id": "significant-potential", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
120862004-05-092004-05-15SUDESTERIO DE JANEIROGASOLINA COMUM1071R$/l2.0450.1091.7002.5990.2540.0531.7910.0471.63631.95940.02652004
121132004-05-162004-05-22SUDESTERIO DE JANEIROGASOLINA COMUM1055R$/l2.0400.1131.7002.5990.2520.0551.7880.0491.59431.996510.02752004
121402004-05-232004-05-29SUDESTERIO DE JANEIROGASOLINA COMUM1091R$/l2.0420.1081.7002.5990.2520.0531.790.0461.635962.21370.02652004
121672004-05-302004-06-05SUDESTERIO DE JANEIROGASOLINA COMUM1055R$/l2.0530.1111.7302.5990.2510.0541.8020.0551.642.214250.03152004
121942004-06-062004-06-12SUDESTERIO DE JANEIROGASOLINA COMUM1091R$/l2.0630.1071.7602.5990.2470.0521.8160.0541.642.324250.0362004
...............................................................
1064792019-06-092019-06-15SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.2100.1773.7594.9920.4250.0423.7850.0963.524.10070.02562019
1066232019-06-162019-06-22SUDESTERIO DE JANEIROGASOLINA COMUM418R$/l4.9270.1604.5995.8590.5440.0324.3830.14.19724.62390.02362019
1066292019-06-162019-06-22SUDESTESAO PAULOGASOLINA COMUM1635R$/l4.1680.1773.6795.1990.4430.0423.7250.0963.5024.08920.02662019
1067722019-06-232019-06-29SUDESTERIO DE JANEIROGASOLINA COMUM422R$/l4.9280.1654.5995.8590.5380.0334.390.0974.24.6180.02262019
1067782019-06-232019-06-29SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.1420.1833.7694.9990.4290.0443.7130.0973.524.08920.02662019
\n", "

1564 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "12086 2004-05-09 2004-05-15 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12113 2004-05-16 2004-05-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12140 2004-05-23 2004-05-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12167 2004-05-30 2004-06-05 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "12194 2004-06-06 2004-06-12 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "... ... ... ... ... ... \n", "106479 2019-06-09 2019-06-15 SUDESTE SAO PAULO GASOLINA COMUM \n", "106623 2019-06-16 2019-06-22 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106629 2019-06-16 2019-06-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "106772 2019-06-23 2019-06-29 SUDESTE RIO DE JANEIRO GASOLINA COMUM \n", "106778 2019-06-23 2019-06-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "12086 1071 R$/l 2.045 \n", "12113 1055 R$/l 2.040 \n", "12140 1091 R$/l 2.042 \n", "12167 1055 R$/l 2.053 \n", "12194 1091 R$/l 2.063 \n", "... ... ... ... \n", "106479 1643 R$/l 4.210 \n", "106623 418 R$/l 4.927 \n", "106629 1635 R$/l 4.168 \n", "106772 422 R$/l 4.928 \n", "106778 1644 R$/l 4.142 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "12086 0.109 1.700 2.599 \n", "12113 0.113 1.700 2.599 \n", "12140 0.108 1.700 2.599 \n", "12167 0.111 1.730 2.599 \n", "12194 0.107 1.760 2.599 \n", "... ... ... ... \n", "106479 0.177 3.759 4.992 \n", "106623 0.160 4.599 5.859 \n", "106629 0.177 3.679 5.199 \n", "106772 0.165 4.599 5.859 \n", "106778 0.183 3.769 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "12086 0.254 0.053 \n", "12113 0.252 0.055 \n", "12140 0.252 0.053 \n", "12167 0.251 0.054 \n", "12194 0.247 0.052 \n", "... ... ... \n", "106479 0.425 0.042 \n", "106623 0.544 0.032 \n", "106629 0.443 0.042 \n", "106772 0.538 0.033 \n", "106778 0.429 0.044 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "12086 1.791 0.047 \n", "12113 1.788 0.049 \n", "12140 1.79 0.046 \n", "12167 1.802 0.055 \n", "12194 1.816 0.054 \n", "... ... ... \n", "106479 3.785 0.096 \n", "106623 4.383 0.1 \n", "106629 3.725 0.096 \n", "106772 4.39 0.097 \n", "106778 3.713 0.097 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "12086 1.6363 1.9594 \n", "12113 1.5943 1.99651 \n", "12140 1.63596 2.2137 \n", "12167 1.64 2.21425 \n", "12194 1.64 2.32425 \n", "... ... ... \n", "106479 3.52 4.1007 \n", "106623 4.1972 4.6239 \n", "106629 3.502 4.0892 \n", "106772 4.2 4.618 \n", "106778 3.52 4.0892 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "12086 0.026 5 2004 \n", "12113 0.027 5 2004 \n", "12140 0.026 5 2004 \n", "12167 0.031 5 2004 \n", "12194 0.03 6 2004 \n", "... ... ... ... \n", "106479 0.025 6 2019 \n", "106623 0.023 6 2019 \n", "106629 0.026 6 2019 \n", "106772 0.022 6 2019 \n", "106778 0.026 6 2019 \n", "\n", "[1564 rows x 20 columns]" ] }, "execution_count": 138, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao_3 = (postos_sp_rj_gasolina['PREÇO MÉDIO REVENDA'] > 2)\n", "\n", "postos_sp_rj_gasolina_preco_maior_que_2 = postos_sp_rj_gasolina[selecao_3]\n", "postos_sp_rj_gasolina_preco_maior_que_2" ] }, { "cell_type": "markdown", "id": "spoken-facing", "metadata": {}, "source": [ "#### **Selecionando registros dos anos de 2008, 2010 e 2012**" ] }, { "cell_type": "code", "execution_count": 139, "id": "polyphonic-prophet", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.240.0660.9410.0770.74411.03170.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 139, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head()" ] }, { "cell_type": "markdown", "id": "forbidden-blast", "metadata": {}, "source": [ "**ALTERNATIVA 1**" ] }, { "cell_type": "code", "execution_count": 140, "id": "dried-voluntary", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
50982008-01-062008-01-12CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO80R$/l1.8060.0821.7091.9500.290.0451.5160.0611.38921.61570.0412008
50992008-01-062008-01-12CENTRO OESTEGOIASETANOL HIDRATADO255R$/l1.6160.1001.4701.8990.2930.0621.3230.051.22421.61730.03812008
51002008-01-062008-01-12CENTRO OESTEMATO GROSSOETANOL HIDRATADO142R$/l1.5810.0951.3901.8500.2780.0601.3030.0731.141.450.05612008
51012008-01-062008-01-12CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO133R$/l1.8310.0461.6801.9100.3820.0251.4490.0441.32471.55140.0312008
51022008-01-062008-01-12NORDESTEALAGOASETANOL HIDRATADO97R$/l1.6990.0981.5301.9990.1990.0581.50.0621.391.76890.04112008
...............................................................
557542012-12-302013-01-05NORDESTERIO GRANDE DO NORTEGNV17R$/m31.8910.0151.8601.9000.4660.0081.4250.0981.26571.47890.069122012
557552012-12-302013-01-05SULRIO GRANDE DO SULGNV34R$/m31.9800.0401.9192.1400.5660.0201.4140.0281.39971.46080.02122012
557562012-12-302013-01-05SULSANTA CATARINAGNV41R$/m32.0030.0341.8792.099-0.017-----122012
557572012-12-302013-01-05SUDESTESAO PAULOGNV82R$/m31.5980.1991.3992.5990.3970.1251.2010.1820.83541.5350.152122012
557582012-12-302013-01-05NORDESTESERGIPEGNV11R$/m31.8470.0331.7901.8990.5040.0181.3430.1781.12531.5430.133122012
\n", "

19576 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "5098 2008-01-06 2008-01-12 CENTRO OESTE DISTRITO FEDERAL \n", "5099 2008-01-06 2008-01-12 CENTRO OESTE GOIAS \n", "5100 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO \n", "5101 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO DO SUL \n", "5102 2008-01-06 2008-01-12 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "55754 2012-12-30 2013-01-05 NORDESTE RIO GRANDE DO NORTE \n", "55755 2012-12-30 2013-01-05 SUL RIO GRANDE DO SUL \n", "55756 2012-12-30 2013-01-05 SUL SANTA CATARINA \n", "55757 2012-12-30 2013-01-05 SUDESTE SAO PAULO \n", "55758 2012-12-30 2013-01-05 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "5098 ETANOL HIDRATADO 80 R$/l \n", "5099 ETANOL HIDRATADO 255 R$/l \n", "5100 ETANOL HIDRATADO 142 R$/l \n", "5101 ETANOL HIDRATADO 133 R$/l \n", "5102 ETANOL HIDRATADO 97 R$/l \n", "... ... ... ... \n", "55754 GNV 17 R$/m3 \n", "55755 GNV 34 R$/m3 \n", "55756 GNV 41 R$/m3 \n", "55757 GNV 82 R$/m3 \n", "55758 GNV 11 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "5098 1.806 0.082 1.709 \n", "5099 1.616 0.100 1.470 \n", "5100 1.581 0.095 1.390 \n", "5101 1.831 0.046 1.680 \n", "5102 1.699 0.098 1.530 \n", "... ... ... ... \n", "55754 1.891 0.015 1.860 \n", "55755 1.980 0.040 1.919 \n", "55756 2.003 0.034 1.879 \n", "55757 1.598 0.199 1.399 \n", "55758 1.847 0.033 1.790 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "5098 1.950 0.29 0.045 \n", "5099 1.899 0.293 0.062 \n", "5100 1.850 0.278 0.060 \n", "5101 1.910 0.382 0.025 \n", "5102 1.999 0.199 0.058 \n", "... ... ... ... \n", "55754 1.900 0.466 0.008 \n", "55755 2.140 0.566 0.020 \n", "55756 2.099 - 0.017 \n", "55757 2.599 0.397 0.125 \n", "55758 1.899 0.504 0.018 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "5098 1.516 0.061 \n", "5099 1.323 0.05 \n", "5100 1.303 0.073 \n", "5101 1.449 0.044 \n", "5102 1.5 0.062 \n", "... ... ... \n", "55754 1.425 0.098 \n", "55755 1.414 0.028 \n", "55756 - - \n", "55757 1.201 0.182 \n", "55758 1.343 0.178 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "5098 1.3892 1.6157 \n", "5099 1.2242 1.6173 \n", "5100 1.14 1.45 \n", "5101 1.3247 1.5514 \n", "5102 1.39 1.7689 \n", "... ... ... \n", "55754 1.2657 1.4789 \n", "55755 1.3997 1.4608 \n", "55756 - - \n", "55757 0.8354 1.535 \n", "55758 1.1253 1.543 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "5098 0.04 1 2008 \n", "5099 0.038 1 2008 \n", "5100 0.056 1 2008 \n", "5101 0.03 1 2008 \n", "5102 0.041 1 2008 \n", "... ... ... ... \n", "55754 0.069 12 2012 \n", "55755 0.02 12 2012 \n", "55756 - 12 2012 \n", "55757 0.152 12 2012 \n", "55758 0.133 12 2012 \n", "\n", "[19576 rows x 20 columns]" ] }, "execution_count": 140, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao = (data['ANO'] == 2008) | (data['ANO'] == 2010) | (data['ANO'] == 2012)\n", "data[selecao]" ] }, { "cell_type": "markdown", "id": "written-capability", "metadata": {}, "source": [ "**ALTERNATIVA 2**" ] }, { "cell_type": "code", "execution_count": 141, "id": "royal-romantic", "metadata": {}, "outputs": [], "source": [ "lista_de_anos = [2008, 2010, 2012]" ] }, { "cell_type": "code", "execution_count": 142, "id": "under-herald", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
50982008-01-062008-01-12CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO80R$/l1.8060.0821.7091.9500.290.0451.5160.0611.38921.61570.0412008
50992008-01-062008-01-12CENTRO OESTEGOIASETANOL HIDRATADO255R$/l1.6160.1001.4701.8990.2930.0621.3230.051.22421.61730.03812008
51002008-01-062008-01-12CENTRO OESTEMATO GROSSOETANOL HIDRATADO142R$/l1.5810.0951.3901.8500.2780.0601.3030.0731.141.450.05612008
51012008-01-062008-01-12CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO133R$/l1.8310.0461.6801.9100.3820.0251.4490.0441.32471.55140.0312008
51022008-01-062008-01-12NORDESTEALAGOASETANOL HIDRATADO97R$/l1.6990.0981.5301.9990.1990.0581.50.0621.391.76890.04112008
...............................................................
557542012-12-302013-01-05NORDESTERIO GRANDE DO NORTEGNV17R$/m31.8910.0151.8601.9000.4660.0081.4250.0981.26571.47890.069122012
557552012-12-302013-01-05SULRIO GRANDE DO SULGNV34R$/m31.9800.0401.9192.1400.5660.0201.4140.0281.39971.46080.02122012
557562012-12-302013-01-05SULSANTA CATARINAGNV41R$/m32.0030.0341.8792.099-0.017-----122012
557572012-12-302013-01-05SUDESTESAO PAULOGNV82R$/m31.5980.1991.3992.5990.3970.1251.2010.1820.83541.5350.152122012
557582012-12-302013-01-05NORDESTESERGIPEGNV11R$/m31.8470.0331.7901.8990.5040.0181.3430.1781.12531.5430.133122012
\n", "

19576 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "5098 2008-01-06 2008-01-12 CENTRO OESTE DISTRITO FEDERAL \n", "5099 2008-01-06 2008-01-12 CENTRO OESTE GOIAS \n", "5100 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO \n", "5101 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO DO SUL \n", "5102 2008-01-06 2008-01-12 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "55754 2012-12-30 2013-01-05 NORDESTE RIO GRANDE DO NORTE \n", "55755 2012-12-30 2013-01-05 SUL RIO GRANDE DO SUL \n", "55756 2012-12-30 2013-01-05 SUL SANTA CATARINA \n", "55757 2012-12-30 2013-01-05 SUDESTE SAO PAULO \n", "55758 2012-12-30 2013-01-05 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "5098 ETANOL HIDRATADO 80 R$/l \n", "5099 ETANOL HIDRATADO 255 R$/l \n", "5100 ETANOL HIDRATADO 142 R$/l \n", "5101 ETANOL HIDRATADO 133 R$/l \n", "5102 ETANOL HIDRATADO 97 R$/l \n", "... ... ... ... \n", "55754 GNV 17 R$/m3 \n", "55755 GNV 34 R$/m3 \n", "55756 GNV 41 R$/m3 \n", "55757 GNV 82 R$/m3 \n", "55758 GNV 11 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "5098 1.806 0.082 1.709 \n", "5099 1.616 0.100 1.470 \n", "5100 1.581 0.095 1.390 \n", "5101 1.831 0.046 1.680 \n", "5102 1.699 0.098 1.530 \n", "... ... ... ... \n", "55754 1.891 0.015 1.860 \n", "55755 1.980 0.040 1.919 \n", "55756 2.003 0.034 1.879 \n", "55757 1.598 0.199 1.399 \n", "55758 1.847 0.033 1.790 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "5098 1.950 0.29 0.045 \n", "5099 1.899 0.293 0.062 \n", "5100 1.850 0.278 0.060 \n", "5101 1.910 0.382 0.025 \n", "5102 1.999 0.199 0.058 \n", "... ... ... ... \n", "55754 1.900 0.466 0.008 \n", "55755 2.140 0.566 0.020 \n", "55756 2.099 - 0.017 \n", "55757 2.599 0.397 0.125 \n", "55758 1.899 0.504 0.018 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "5098 1.516 0.061 \n", "5099 1.323 0.05 \n", "5100 1.303 0.073 \n", "5101 1.449 0.044 \n", "5102 1.5 0.062 \n", "... ... ... \n", "55754 1.425 0.098 \n", "55755 1.414 0.028 \n", "55756 - - \n", "55757 1.201 0.182 \n", "55758 1.343 0.178 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "5098 1.3892 1.6157 \n", "5099 1.2242 1.6173 \n", "5100 1.14 1.45 \n", "5101 1.3247 1.5514 \n", "5102 1.39 1.7689 \n", "... ... ... \n", "55754 1.2657 1.4789 \n", "55755 1.3997 1.4608 \n", "55756 - - \n", "55757 0.8354 1.535 \n", "55758 1.1253 1.543 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "5098 0.04 1 2008 \n", "5099 0.038 1 2008 \n", "5100 0.056 1 2008 \n", "5101 0.03 1 2008 \n", "5102 0.041 1 2008 \n", "... ... ... ... \n", "55754 0.069 12 2012 \n", "55755 0.02 12 2012 \n", "55756 - 12 2012 \n", "55757 0.152 12 2012 \n", "55758 0.133 12 2012 \n", "\n", "[19576 rows x 20 columns]" ] }, "execution_count": 142, "metadata": {}, "output_type": "execute_result" } ], "source": [ "selecao = data['ANO'].isin(lista_de_anos) # retorna uma Series de booleanos\n", "data[selecao]" ] }, { "cell_type": "markdown", "id": "inclusive-longitude", "metadata": {}, "source": [ "**ALTERNATIVA 3**" ] }, { "cell_type": "code", "execution_count": 143, "id": "cathedral-paint", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "[2008, 2010, 2012]" ] }, "execution_count": 143, "metadata": {}, "output_type": "execute_result" } ], "source": [ "lista_de_anos" ] }, { "cell_type": "code", "execution_count": 144, "id": "patient-guarantee", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
50982008-01-062008-01-12CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO80R$/l1.8060.0821.7091.9500.290.0451.5160.0611.38921.61570.0412008
50992008-01-062008-01-12CENTRO OESTEGOIASETANOL HIDRATADO255R$/l1.6160.1001.4701.8990.2930.0621.3230.051.22421.61730.03812008
51002008-01-062008-01-12CENTRO OESTEMATO GROSSOETANOL HIDRATADO142R$/l1.5810.0951.3901.8500.2780.0601.3030.0731.141.450.05612008
51012008-01-062008-01-12CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO133R$/l1.8310.0461.6801.9100.3820.0251.4490.0441.32471.55140.0312008
51022008-01-062008-01-12NORDESTEALAGOASETANOL HIDRATADO97R$/l1.6990.0981.5301.9990.1990.0581.50.0621.391.76890.04112008
...............................................................
557542012-12-302013-01-05NORDESTERIO GRANDE DO NORTEGNV17R$/m31.8910.0151.8601.9000.4660.0081.4250.0981.26571.47890.069122012
557552012-12-302013-01-05SULRIO GRANDE DO SULGNV34R$/m31.9800.0401.9192.1400.5660.0201.4140.0281.39971.46080.02122012
557562012-12-302013-01-05SULSANTA CATARINAGNV41R$/m32.0030.0341.8792.099-0.017-----122012
557572012-12-302013-01-05SUDESTESAO PAULOGNV82R$/m31.5980.1991.3992.5990.3970.1251.2010.1820.83541.5350.152122012
557582012-12-302013-01-05NORDESTESERGIPEGNV11R$/m31.8470.0331.7901.8990.5040.0181.3430.1781.12531.5430.133122012
\n", "

19576 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "5098 2008-01-06 2008-01-12 CENTRO OESTE DISTRITO FEDERAL \n", "5099 2008-01-06 2008-01-12 CENTRO OESTE GOIAS \n", "5100 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO \n", "5101 2008-01-06 2008-01-12 CENTRO OESTE MATO GROSSO DO SUL \n", "5102 2008-01-06 2008-01-12 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "55754 2012-12-30 2013-01-05 NORDESTE RIO GRANDE DO NORTE \n", "55755 2012-12-30 2013-01-05 SUL RIO GRANDE DO SUL \n", "55756 2012-12-30 2013-01-05 SUL SANTA CATARINA \n", "55757 2012-12-30 2013-01-05 SUDESTE SAO PAULO \n", "55758 2012-12-30 2013-01-05 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "5098 ETANOL HIDRATADO 80 R$/l \n", "5099 ETANOL HIDRATADO 255 R$/l \n", "5100 ETANOL HIDRATADO 142 R$/l \n", "5101 ETANOL HIDRATADO 133 R$/l \n", "5102 ETANOL HIDRATADO 97 R$/l \n", "... ... ... ... \n", "55754 GNV 17 R$/m3 \n", "55755 GNV 34 R$/m3 \n", "55756 GNV 41 R$/m3 \n", "55757 GNV 82 R$/m3 \n", "55758 GNV 11 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "5098 1.806 0.082 1.709 \n", "5099 1.616 0.100 1.470 \n", "5100 1.581 0.095 1.390 \n", "5101 1.831 0.046 1.680 \n", "5102 1.699 0.098 1.530 \n", "... ... ... ... \n", "55754 1.891 0.015 1.860 \n", "55755 1.980 0.040 1.919 \n", "55756 2.003 0.034 1.879 \n", "55757 1.598 0.199 1.399 \n", "55758 1.847 0.033 1.790 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "5098 1.950 0.29 0.045 \n", "5099 1.899 0.293 0.062 \n", "5100 1.850 0.278 0.060 \n", "5101 1.910 0.382 0.025 \n", "5102 1.999 0.199 0.058 \n", "... ... ... ... \n", "55754 1.900 0.466 0.008 \n", "55755 2.140 0.566 0.020 \n", "55756 2.099 - 0.017 \n", "55757 2.599 0.397 0.125 \n", "55758 1.899 0.504 0.018 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "5098 1.516 0.061 \n", "5099 1.323 0.05 \n", "5100 1.303 0.073 \n", "5101 1.449 0.044 \n", "5102 1.5 0.062 \n", "... ... ... \n", "55754 1.425 0.098 \n", "55755 1.414 0.028 \n", "55756 - - \n", "55757 1.201 0.182 \n", "55758 1.343 0.178 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "5098 1.3892 1.6157 \n", "5099 1.2242 1.6173 \n", "5100 1.14 1.45 \n", "5101 1.3247 1.5514 \n", "5102 1.39 1.7689 \n", "... ... ... \n", "55754 1.2657 1.4789 \n", "55755 1.3997 1.4608 \n", "55756 - - \n", "55757 0.8354 1.535 \n", "55758 1.1253 1.543 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "5098 0.04 1 2008 \n", "5099 0.038 1 2008 \n", "5100 0.056 1 2008 \n", "5101 0.03 1 2008 \n", "5102 0.041 1 2008 \n", "... ... ... ... \n", "55754 0.069 12 2012 \n", "55755 0.02 12 2012 \n", "55756 - 12 2012 \n", "55757 0.152 12 2012 \n", "55758 0.133 12 2012 \n", "\n", "[19576 rows x 20 columns]" ] }, "execution_count": 144, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.query('ANO in @lista_de_anos')" ] }, { "cell_type": "markdown", "id": "mineral-detail", "metadata": {}, "source": [ "### **Iterando com DataFrames**" ] }, { "cell_type": "markdown", "id": "lonely-saturn", "metadata": {}, "source": [ "#### For-each `DataFrame.iterrows()` (LENTO ==> apenas indicado para iterar pequenos conjunto de dados)" ] }, { "cell_type": "code", "execution_count": 145, "id": "treated-czech", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.240.0660.9410.0770.74411.03170.08252004
52004-05-092004-05-15NORDESTEBAHIAETANOL HIDRATADO408R$/l1.3830.1320.9992.0500.4260.0950.9570.1280.56861.350.13452004
62004-05-092004-05-15NORDESTECEARAETANOL HIDRATADO278R$/l1.4530.2181.0301.9500.3530.1501.10.0680.73321.2940.06252004
72004-05-092004-05-15NORDESTEMARANHAOETANOL HIDRATADO105R$/l1.6310.1581.3502.0000.5150.0971.1160.0910.99231.361830.08252004
82004-05-092004-05-15NORDESTEPARAIBAETANOL HIDRATADO125R$/l1.2840.1301.1001.6990.3530.1010.9310.0720.75771.29720.07752004
92004-05-092004-05-15NORDESTEPERNAMBUCOETANOL HIDRATADO423R$/l1.2240.1410.9891.7000.2770.1150.9470.0910.56431.35410.09652004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "5 2004-05-09 2004-05-15 NORDESTE BAHIA \n", "6 2004-05-09 2004-05-15 NORDESTE CEARA \n", "7 2004-05-09 2004-05-15 NORDESTE MARANHAO \n", "8 2004-05-09 2004-05-15 NORDESTE PARAIBA \n", "9 2004-05-09 2004-05-15 NORDESTE PERNAMBUCO \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "5 ETANOL HIDRATADO 408 R$/l \n", "6 ETANOL HIDRATADO 278 R$/l \n", "7 ETANOL HIDRATADO 105 R$/l \n", "8 ETANOL HIDRATADO 125 R$/l \n", "9 ETANOL HIDRATADO 423 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "5 1.383 0.132 0.999 \n", "6 1.453 0.218 1.030 \n", "7 1.631 0.158 1.350 \n", "8 1.284 0.130 1.100 \n", "9 1.224 0.141 0.989 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "5 2.050 0.426 0.095 \n", "6 1.950 0.353 0.150 \n", "7 2.000 0.515 0.097 \n", "8 1.699 0.353 0.101 \n", "9 1.700 0.277 0.115 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "5 0.957 0.128 \n", "6 1.1 0.068 \n", "7 1.116 0.091 \n", "8 0.931 0.072 \n", "9 0.947 0.091 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "5 0.5686 1.35 \n", "6 0.7332 1.294 \n", "7 0.9923 1.36183 \n", "8 0.7577 1.2972 \n", "9 0.5643 1.3541 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "5 0.134 5 2004 \n", "6 0.062 5 2004 \n", "7 0.082 5 2004 \n", "8 0.077 5 2004 \n", "9 0.096 5 2004 " ] }, "execution_count": 145, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data.head(10)" ] }, { "cell_type": "code", "execution_count": 146, "id": "laden-savings", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "indice 0 ==> DISTRITO FEDERAL\n", "indice 1 ==> GOIAS\n", "indice 2 ==> MATO GROSSO\n", "indice 3 ==> MATO GROSSO DO SUL\n", "indice 4 ==> ALAGOAS\n", "indice 5 ==> BAHIA\n", "indice 6 ==> CEARA\n", "indice 7 ==> MARANHAO\n", "indice 8 ==> PARAIBA\n", "indice 9 ==> PERNAMBUCO\n" ] } ], "source": [ "for index, row in data.head(10).iterrows():\n", " print(f'indice {index} ==> {row[\"ESTADO\"]}')" ] }, { "cell_type": "markdown", "id": "laden-interval", "metadata": {}, "source": [ "

2. Preparação dos dados

\n", "
" ] }, { "cell_type": "code", "execution_count": 147, "id": "foster-statistics", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.110.42010.96660.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.970.0950.56141.1610.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.830.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.240.0660.9410.0770.74411.03170.08252004
...............................................................
1068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.0653.4993.6900.8180.0182.75602.7562.756062019
1068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.1293.2303.7890.950.0382.4510.4021.98422.86610.16462019
1068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.1902.6993.4990.9140.0651.99801.99811.9981062019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.50930.0762019
1068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.0053.6893.6991.1790.0012.51802.51752.5175062019
\n", "

106823 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "106818 2019-06-23 2019-06-29 NORDESTE RIO GRANDE DO NORTE \n", "106819 2019-06-23 2019-06-29 SUL RIO GRANDE DO SUL \n", "106820 2019-06-23 2019-06-29 SUL SANTA CATARINA \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO \n", "106822 2019-06-23 2019-06-29 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "106818 GNV 7 R$/m3 \n", "106819 GNV 23 R$/m3 \n", "106820 GNV 24 R$/m3 \n", "106821 GNV 52 R$/m3 \n", "106822 GNV 4 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "106818 3.574 0.065 3.499 \n", "106819 3.401 0.129 3.230 \n", "106820 2.912 0.190 2.699 \n", "106821 3.020 0.229 2.699 \n", "106822 3.697 0.005 3.689 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.24 0.066 \n", "... ... ... ... \n", "106818 3.690 0.818 0.018 \n", "106819 3.789 0.95 0.038 \n", "106820 3.499 0.914 0.065 \n", "106821 3.490 0.646 0.076 \n", "106822 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.11 \n", "1 0.763 0.088 \n", "2 0.97 0.095 \n", "3 0.83 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0 \n", "106819 2.451 0.402 \n", "106820 1.998 0 \n", "106821 2.374 0.165 \n", "106822 2.518 0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.9666 \n", "1 0.5013 1.05 \n", "2 0.5614 1.161 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.0317 \n", "... ... ... \n", "106818 2.756 2.756 \n", "106819 1.9842 2.8661 \n", "106820 1.9981 1.9981 \n", "106821 2.0179 2.5093 \n", "106822 2.5175 2.5175 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "106818 0 6 2019 \n", "106819 0.164 6 2019 \n", "106820 0 6 2019 \n", "106821 0.07 6 2019 \n", "106822 0 6 2019 \n", "\n", "[106823 rows x 20 columns]" ] }, "execution_count": 147, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data" ] }, { "cell_type": "markdown", "id": "departmental-adult", "metadata": {}, "source": [ "### 2.1 Tratando observações com valores vazios (null / nan) no dataset" ] }, { "cell_type": "code", "execution_count": 148, "id": "thorough-california", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "RangeIndex: 106823 entries, 0 to 106822\n", "Data columns (total 20 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 DATA INICIAL 106823 non-null object \n", " 1 DATA FINAL 106823 non-null object \n", " 2 REGIÃO 106823 non-null object \n", " 3 ESTADO 106823 non-null object \n", " 4 PRODUTO 106823 non-null object \n", " 5 NÚMERO DE POSTOS PESQUISADOS 106823 non-null int64 \n", " 6 UNIDADE DE MEDIDA 106823 non-null object \n", " 7 PREÇO MÉDIO REVENDA 106823 non-null float64\n", " 8 DESVIO PADRÃO REVENDA 106823 non-null float64\n", " 9 PREÇO MÍNIMO REVENDA 106823 non-null float64\n", " 10 PREÇO MÁXIMO REVENDA 106823 non-null float64\n", " 11 MARGEM MÉDIA REVENDA 106823 non-null object \n", " 12 COEF DE VARIAÇÃO REVENDA 106823 non-null float64\n", " 13 PREÇO MÉDIO DISTRIBUIÇÃO 106823 non-null object \n", " 14 DESVIO PADRÃO DISTRIBUIÇÃO 106823 non-null object \n", " 15 PREÇO MÍNIMO DISTRIBUIÇÃO 106823 non-null object \n", " 16 PREÇO MÁXIMO DISTRIBUIÇÃO 106823 non-null object \n", " 17 COEF DE VARIAÇÃO DISTRIBUIÇÃO 106823 non-null object \n", " 18 MÊS 106823 non-null int64 \n", " 19 ANO 106823 non-null int64 \n", "dtypes: float64(5), int64(3), object(12)\n", "memory usage: 16.3+ MB\n" ] } ], "source": [ "data.info()" ] }, { "cell_type": "markdown", "id": "norwegian-order", "metadata": {}, "source": [ "De um total de 106823 observações, **não há valores null / nan** para nenhum atributo. Mas, veremos que não é bem assim neste caso específico.

" ] }, { "cell_type": "markdown", "id": "cathedral-symposium", "metadata": {}, "source": [ "### 2.2 Conversão de tipos de atributos" ] }, { "cell_type": "markdown", "id": "fresh-filter", "metadata": {}, "source": [ "O pandas automaticamente reconhece os tipos de dados de cada coluna.
\n", "Porém, existem alguns atributos que estão com seus tipos errados: P. ex., \"PREÇO MÉDIO DISTRIBUIÇÃO\" deveria ser ```float64``` e não ```object```.
\n", "Nestes casos, muito provavelmente alguns registros têm uma string ao invés de um número para tais atributos.
\n", "\n", "Os atributos *\"DATA INICIAL\"* e *\"DATA FINAL\"* deveriam ser do tipo `datetime`.\n", "\n", "Em outros casos, alguns **atributos categóricos** são ```objects```, mas poderiam ser o tipo ```category```, que é um tipo especial do pandas.
\n", "Este tipo é necessário para se utilizar algumas funções específicas do pandas.
\n", "**Não** converteremos para este tipo por ora." ] }, { "cell_type": "code", "execution_count": 149, "id": "cognitive-auditor", "metadata": {}, "outputs": [], "source": [ "data_pre = data.copy()" ] }, { "cell_type": "markdown", "id": "suspected-joseph", "metadata": {}, "source": [ "#### **Datas**\n", "Como os atributos de data do dataset já estão em um formato de data aceitável (YYYY-MM-DD), não precisamos forçar nenhuma conversão nesse sentido." ] }, { "cell_type": "code", "execution_count": 150, "id": "sexual-solid", "metadata": {}, "outputs": [], "source": [ "data_pre['DATA INICIAL'] = pd.to_datetime(data_pre['DATA INICIAL'])\n", "data_pre['DATA FINAL'] = pd.to_datetime(data_pre['DATA FINAL'])" ] }, { "cell_type": "code", "execution_count": 151, "id": "assisted-senator", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "RangeIndex: 106823 entries, 0 to 106822\n", "Data columns (total 20 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 DATA INICIAL 106823 non-null datetime64[ns]\n", " 1 DATA FINAL 106823 non-null datetime64[ns]\n", " 2 REGIÃO 106823 non-null object \n", " 3 ESTADO 106823 non-null object \n", " 4 PRODUTO 106823 non-null object \n", " 5 NÚMERO DE POSTOS PESQUISADOS 106823 non-null int64 \n", " 6 UNIDADE DE MEDIDA 106823 non-null object \n", " 7 PREÇO MÉDIO REVENDA 106823 non-null float64 \n", " 8 DESVIO PADRÃO REVENDA 106823 non-null float64 \n", " 9 PREÇO MÍNIMO REVENDA 106823 non-null float64 \n", " 10 PREÇO MÁXIMO REVENDA 106823 non-null float64 \n", " 11 MARGEM MÉDIA REVENDA 106823 non-null object \n", " 12 COEF DE VARIAÇÃO REVENDA 106823 non-null float64 \n", " 13 PREÇO MÉDIO DISTRIBUIÇÃO 106823 non-null object \n", " 14 DESVIO PADRÃO DISTRIBUIÇÃO 106823 non-null object \n", " 15 PREÇO MÍNIMO DISTRIBUIÇÃO 106823 non-null object \n", " 16 PREÇO MÁXIMO DISTRIBUIÇÃO 106823 non-null object \n", " 17 COEF DE VARIAÇÃO DISTRIBUIÇÃO 106823 non-null object \n", " 18 MÊS 106823 non-null int64 \n", " 19 ANO 106823 non-null int64 \n", "dtypes: datetime64[ns](2), float64(5), int64(3), object(10)\n", "memory usage: 16.3+ MB\n" ] } ], "source": [ "data_pre.info()" ] }, { "cell_type": "markdown", "id": "complimentary-mechanism", "metadata": {}, "source": [ "#### **Dados Numéricos**" ] }, { "cell_type": "code", "execution_count": 152, "id": "impaired-jones", "metadata": {}, "outputs": [], "source": [ "# convertendo atributos/colunas para 'numeric'\n", "for atributo in ['MARGEM MÉDIA REVENDA', 'PREÇO MÉDIO DISTRIBUIÇÃO', 'DESVIO PADRÃO DISTRIBUIÇÃO', 'PREÇO MÍNIMO DISTRIBUIÇÃO', 'PREÇO MÁXIMO DISTRIBUIÇÃO', 'COEF DE VARIAÇÃO DISTRIBUIÇÃO']:\n", " # converte a coluna (de valores string) para um tipo numérico\n", " # Em caso de erro na conversão (p. ex., uma string que não representa um número), um valor vazio (null / nan) será\n", " # atribuído no lugar\n", " data_pre[atributo] = pd.to_numeric(data_pre[atributo], errors='coerce')" ] }, { "cell_type": "code", "execution_count": 153, "id": "genetic-pendant", "metadata": { "tags": [] }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "RangeIndex: 106823 entries, 0 to 106822\n", "Data columns (total 20 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 DATA INICIAL 106823 non-null datetime64[ns]\n", " 1 DATA FINAL 106823 non-null datetime64[ns]\n", " 2 REGIÃO 106823 non-null object \n", " 3 ESTADO 106823 non-null object \n", " 4 PRODUTO 106823 non-null object \n", " 5 NÚMERO DE POSTOS PESQUISADOS 106823 non-null int64 \n", " 6 UNIDADE DE MEDIDA 106823 non-null object \n", " 7 PREÇO MÉDIO REVENDA 106823 non-null float64 \n", " 8 DESVIO PADRÃO REVENDA 106823 non-null float64 \n", " 9 PREÇO MÍNIMO REVENDA 106823 non-null float64 \n", " 10 PREÇO MÁXIMO REVENDA 106823 non-null float64 \n", " 11 MARGEM MÉDIA REVENDA 103392 non-null float64 \n", " 12 COEF DE VARIAÇÃO REVENDA 106823 non-null float64 \n", " 13 PREÇO MÉDIO DISTRIBUIÇÃO 103423 non-null float64 \n", " 14 DESVIO PADRÃO DISTRIBUIÇÃO 103423 non-null float64 \n", " 15 PREÇO MÍNIMO DISTRIBUIÇÃO 103423 non-null float64 \n", " 16 PREÇO MÁXIMO DISTRIBUIÇÃO 103423 non-null float64 \n", " 17 COEF DE VARIAÇÃO DISTRIBUIÇÃO 103423 non-null float64 \n", " 18 MÊS 106823 non-null int64 \n", " 19 ANO 106823 non-null int64 \n", "dtypes: datetime64[ns](2), float64(11), int64(3), object(4)\n", "memory usage: 16.3+ MB\n" ] } ], "source": [ "data_pre.info()" ] }, { "cell_type": "markdown", "id": "faced-columbus", "metadata": {}, "source": [ "
\n", "\n", "Note que temos vários valores ***null*** agora **após a *conversão de tipos***. Vamos checá-los com mais cuidado nos dados originais e preprocessados." ] }, { "cell_type": "markdown", "id": "stainless-couple", "metadata": {}, "source": [ "### 2.3 Limpeza de dados" ] }, { "cell_type": "code", "execution_count": 154, "id": "unique-smooth", "metadata": {}, "outputs": [], "source": [ "mask = data_pre['PREÇO MÉDIO DISTRIBUIÇÃO'].isnull()" ] }, { "cell_type": "code", "execution_count": 155, "id": "irish-petroleum", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
19032005-09-252005-10-01NORTEPARAETANOL HIDRATADO2R$/l1.6940.2831.6902.090NaN0.167NaNNaNNaNNaNNaN92005
19582005-10-092005-10-15NORTERORAIMAETANOL HIDRATADO3R$/l2.0000.0002.0002.000NaN0.000NaNNaNNaNNaNNaN102005
20122005-10-232005-10-29NORTERORAIMAETANOL HIDRATADO3R$/l2.2770.0232.2502.290NaN0.010NaNNaNNaNNaNNaN102005
24972006-02-262006-03-04NORTERORAIMAETANOL HIDRATADO11R$/l2.1820.0402.1002.200NaN0.018NaNNaNNaNNaNNaN22006
31992006-08-272006-09-02NORTERORAIMAETANOL HIDRATADO22R$/l2.2850.0681.9802.300NaN0.030NaNNaNNaNNaNNaN82006
...............................................................
1066642019-06-162019-06-22SUDESTEMINAS GERAISGNV5R$/m33.4450.1473.3473.699NaN0.043NaNNaNNaNNaNNaN62019
1066662019-06-162019-06-22SULPARANAGNV7R$/m33.1320.2953.0493.890NaN0.094NaNNaNNaNNaNNaN62019
1068112019-06-232019-06-29SUDESTEESPIRITO SANTOGNV4R$/m33.2990.0053.2903.299NaN0.002NaNNaNNaNNaNNaN62019
1068132019-06-232019-06-29SUDESTEMINAS GERAISGNV6R$/m33.5480.1003.4953.699NaN0.028NaNNaNNaNNaNNaN62019
1068152019-06-232019-06-29SULPARANAGNV1R$/m33.2900.0003.2903.290NaN0.000NaNNaNNaNNaNNaN62019
\n", "

3400 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "1903 2005-09-25 2005-10-01 NORTE PARA ETANOL HIDRATADO \n", "1958 2005-10-09 2005-10-15 NORTE RORAIMA ETANOL HIDRATADO \n", "2012 2005-10-23 2005-10-29 NORTE RORAIMA ETANOL HIDRATADO \n", "2497 2006-02-26 2006-03-04 NORTE RORAIMA ETANOL HIDRATADO \n", "3199 2006-08-27 2006-09-02 NORTE RORAIMA ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106664 2019-06-16 2019-06-22 SUDESTE MINAS GERAIS GNV \n", "106666 2019-06-16 2019-06-22 SUL PARANA GNV \n", "106811 2019-06-23 2019-06-29 SUDESTE ESPIRITO SANTO GNV \n", "106813 2019-06-23 2019-06-29 SUDESTE MINAS GERAIS GNV \n", "106815 2019-06-23 2019-06-29 SUL PARANA GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "1903 2 R$/l 1.694 \n", "1958 3 R$/l 2.000 \n", "2012 3 R$/l 2.277 \n", "2497 11 R$/l 2.182 \n", "3199 22 R$/l 2.285 \n", "... ... ... ... \n", "106664 5 R$/m3 3.445 \n", "106666 7 R$/m3 3.132 \n", "106811 4 R$/m3 3.299 \n", "106813 6 R$/m3 3.548 \n", "106815 1 R$/m3 3.290 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "1903 0.283 1.690 2.090 \n", "1958 0.000 2.000 2.000 \n", "2012 0.023 2.250 2.290 \n", "2497 0.040 2.100 2.200 \n", "3199 0.068 1.980 2.300 \n", "... ... ... ... \n", "106664 0.147 3.347 3.699 \n", "106666 0.295 3.049 3.890 \n", "106811 0.005 3.290 3.299 \n", "106813 0.100 3.495 3.699 \n", "106815 0.000 3.290 3.290 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "1903 NaN 0.167 \n", "1958 NaN 0.000 \n", "2012 NaN 0.010 \n", "2497 NaN 0.018 \n", "3199 NaN 0.030 \n", "... ... ... \n", "106664 NaN 0.043 \n", "106666 NaN 0.094 \n", "106811 NaN 0.002 \n", "106813 NaN 0.028 \n", "106815 NaN 0.000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "1903 NaN NaN \n", "1958 NaN NaN \n", "2012 NaN NaN \n", "2497 NaN NaN \n", "3199 NaN NaN \n", "... ... ... \n", "106664 NaN NaN \n", "106666 NaN NaN \n", "106811 NaN NaN \n", "106813 NaN NaN \n", "106815 NaN NaN \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "1903 NaN NaN \n", "1958 NaN NaN \n", "2012 NaN NaN \n", "2497 NaN NaN \n", "3199 NaN NaN \n", "... ... ... \n", "106664 NaN NaN \n", "106666 NaN NaN \n", "106811 NaN NaN \n", "106813 NaN NaN \n", "106815 NaN NaN \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "1903 NaN 9 2005 \n", "1958 NaN 10 2005 \n", "2012 NaN 10 2005 \n", "2497 NaN 2 2006 \n", "3199 NaN 8 2006 \n", "... ... ... ... \n", "106664 NaN 6 2019 \n", "106666 NaN 6 2019 \n", "106811 NaN 6 2019 \n", "106813 NaN 6 2019 \n", "106815 NaN 6 2019 \n", "\n", "[3400 rows x 20 columns]" ] }, "execution_count": 155, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_pre[mask]" ] }, { "cell_type": "code", "execution_count": 156, "id": "attended-poland", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
19032005-09-252005-10-01NORTEPARAETANOL HIDRATADO2R$/l1.6940.2831.6902.090-0.167-----92005
19582005-10-092005-10-15NORTERORAIMAETANOL HIDRATADO3R$/l2.0000.0002.0002.000-0.000-----102005
20122005-10-232005-10-29NORTERORAIMAETANOL HIDRATADO3R$/l2.2770.0232.2502.290-0.010-----102005
24972006-02-262006-03-04NORTERORAIMAETANOL HIDRATADO11R$/l2.1820.0402.1002.200-0.018-----22006
31992006-08-272006-09-02NORTERORAIMAETANOL HIDRATADO22R$/l2.2850.0681.9802.300-0.030-----82006
...............................................................
1066642019-06-162019-06-22SUDESTEMINAS GERAISGNV5R$/m33.4450.1473.3473.699-0.043-----62019
1066662019-06-162019-06-22SULPARANAGNV7R$/m33.1320.2953.0493.890-0.094-----62019
1068112019-06-232019-06-29SUDESTEESPIRITO SANTOGNV4R$/m33.2990.0053.2903.299-0.002-----62019
1068132019-06-232019-06-29SUDESTEMINAS GERAISGNV6R$/m33.5480.1003.4953.699-0.028-----62019
1068152019-06-232019-06-29SULPARANAGNV1R$/m33.2900.0003.2903.290-0.000-----62019
\n", "

3400 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "1903 2005-09-25 2005-10-01 NORTE PARA ETANOL HIDRATADO \n", "1958 2005-10-09 2005-10-15 NORTE RORAIMA ETANOL HIDRATADO \n", "2012 2005-10-23 2005-10-29 NORTE RORAIMA ETANOL HIDRATADO \n", "2497 2006-02-26 2006-03-04 NORTE RORAIMA ETANOL HIDRATADO \n", "3199 2006-08-27 2006-09-02 NORTE RORAIMA ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106664 2019-06-16 2019-06-22 SUDESTE MINAS GERAIS GNV \n", "106666 2019-06-16 2019-06-22 SUL PARANA GNV \n", "106811 2019-06-23 2019-06-29 SUDESTE ESPIRITO SANTO GNV \n", "106813 2019-06-23 2019-06-29 SUDESTE MINAS GERAIS GNV \n", "106815 2019-06-23 2019-06-29 SUL PARANA GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "1903 2 R$/l 1.694 \n", "1958 3 R$/l 2.000 \n", "2012 3 R$/l 2.277 \n", "2497 11 R$/l 2.182 \n", "3199 22 R$/l 2.285 \n", "... ... ... ... \n", "106664 5 R$/m3 3.445 \n", "106666 7 R$/m3 3.132 \n", "106811 4 R$/m3 3.299 \n", "106813 6 R$/m3 3.548 \n", "106815 1 R$/m3 3.290 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "1903 0.283 1.690 2.090 \n", "1958 0.000 2.000 2.000 \n", "2012 0.023 2.250 2.290 \n", "2497 0.040 2.100 2.200 \n", "3199 0.068 1.980 2.300 \n", "... ... ... ... \n", "106664 0.147 3.347 3.699 \n", "106666 0.295 3.049 3.890 \n", "106811 0.005 3.290 3.299 \n", "106813 0.100 3.495 3.699 \n", "106815 0.000 3.290 3.290 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "1903 - 0.167 \n", "1958 - 0.000 \n", "2012 - 0.010 \n", "2497 - 0.018 \n", "3199 - 0.030 \n", "... ... ... \n", "106664 - 0.043 \n", "106666 - 0.094 \n", "106811 - 0.002 \n", "106813 - 0.028 \n", "106815 - 0.000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "1903 - - \n", "1958 - - \n", "2012 - - \n", "2497 - - \n", "3199 - - \n", "... ... ... \n", "106664 - - \n", "106666 - - \n", "106811 - - \n", "106813 - - \n", "106815 - - \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "1903 - - \n", "1958 - - \n", "2012 - - \n", "2497 - - \n", "3199 - - \n", "... ... ... \n", "106664 - - \n", "106666 - - \n", "106811 - - \n", "106813 - - \n", "106815 - - \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "1903 - 9 2005 \n", "1958 - 10 2005 \n", "2012 - 10 2005 \n", "2497 - 2 2006 \n", "3199 - 8 2006 \n", "... ... ... ... \n", "106664 - 6 2019 \n", "106666 - 6 2019 \n", "106811 - 6 2019 \n", "106813 - 6 2019 \n", "106815 - 6 2019 \n", "\n", "[3400 rows x 20 columns]" ] }, "execution_count": 156, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Nos dados originais, quais eram os valores do PREÇO MÉDIO DISTRIBUIÇÃO dos registros que agora possuem valores NaN \n", "data[mask]" ] }, { "cell_type": "markdown", "id": "military-lounge", "metadata": {}, "source": [ "Várias amostras possuem a _string '-'_ em algumas colunas ao invés de um número de fato. Ou seja, não há aferições destes atributos para estas amostras.
\n", "\n", "
\n", "\n", "Poderíamos **preencher os valores NaN com um valor padrão**. Para isso, basta usar o método `.fillna`." ] }, { "cell_type": "code", "execution_count": 157, "id": "lovely-manufacturer", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.2400.0660.9410.0770.74411.031700.08252004
...............................................................
1068182019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.0653.4993.6900.8180.0182.7560.0002.75602.756000.00062019
1068192019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.1293.2303.7890.9500.0382.4510.4021.98422.866100.16462019
1068202019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.1902.6993.4990.9140.0651.9980.0001.99811.998100.00062019
1068212019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.509300.07062019
1068222019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.0053.6893.6991.1790.0012.5180.0002.51752.517500.00062019
\n", "

106823 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "106818 2019-06-23 2019-06-29 NORDESTE RIO GRANDE DO NORTE \n", "106819 2019-06-23 2019-06-29 SUL RIO GRANDE DO SUL \n", "106820 2019-06-23 2019-06-29 SUL SANTA CATARINA \n", "106821 2019-06-23 2019-06-29 SUDESTE SAO PAULO \n", "106822 2019-06-23 2019-06-29 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "106818 GNV 7 R$/m3 \n", "106819 GNV 23 R$/m3 \n", "106820 GNV 24 R$/m3 \n", "106821 GNV 52 R$/m3 \n", "106822 GNV 4 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "106818 3.574 0.065 3.499 \n", "106819 3.401 0.129 3.230 \n", "106820 2.912 0.190 2.699 \n", "106821 3.020 0.229 2.699 \n", "106822 3.697 0.005 3.689 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "... ... ... ... \n", "106818 3.690 0.818 0.018 \n", "106819 3.789 0.950 0.038 \n", "106820 3.499 0.914 0.065 \n", "106821 3.490 0.646 0.076 \n", "106822 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "106818 2.756 0.000 \n", "106819 2.451 0.402 \n", "106820 1.998 0.000 \n", "106821 2.374 0.165 \n", "106822 2.518 0.000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "... ... ... \n", "106818 2.7560 2.75600 \n", "106819 1.9842 2.86610 \n", "106820 1.9981 1.99810 \n", "106821 2.0179 2.50930 \n", "106822 2.5175 2.51750 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "106818 0.000 6 2019 \n", "106819 0.164 6 2019 \n", "106820 0.000 6 2019 \n", "106821 0.070 6 2019 \n", "106822 0.000 6 2019 \n", "\n", "[106823 rows x 20 columns]" ] }, "execution_count": 157, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Retorna uma cópia do data fram `data_pre` com todos os valores NaN de todas as colunas agora preenchidos com 0.\n", "# Para alterar o próprio data frame, use o argumento `inplace=True`.\n", "data_pre_fill = data_pre.fillna(0)\n", "data_pre_fill" ] }, { "cell_type": "code", "execution_count": 158, "id": "under-toronto", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
19032005-09-252005-10-01NORTEPARAETANOL HIDRATADO2R$/l1.6940.2831.6902.0900.00.1670.00.00.00.00.092005
19582005-10-092005-10-15NORTERORAIMAETANOL HIDRATADO3R$/l2.0000.0002.0002.0000.00.0000.00.00.00.00.0102005
20122005-10-232005-10-29NORTERORAIMAETANOL HIDRATADO3R$/l2.2770.0232.2502.2900.00.0100.00.00.00.00.0102005
24972006-02-262006-03-04NORTERORAIMAETANOL HIDRATADO11R$/l2.1820.0402.1002.2000.00.0180.00.00.00.00.022006
31992006-08-272006-09-02NORTERORAIMAETANOL HIDRATADO22R$/l2.2850.0681.9802.3000.00.0300.00.00.00.00.082006
...............................................................
1066642019-06-162019-06-22SUDESTEMINAS GERAISGNV5R$/m33.4450.1473.3473.6990.00.0430.00.00.00.00.062019
1066662019-06-162019-06-22SULPARANAGNV7R$/m33.1320.2953.0493.8900.00.0940.00.00.00.00.062019
1068112019-06-232019-06-29SUDESTEESPIRITO SANTOGNV4R$/m33.2990.0053.2903.2990.00.0020.00.00.00.00.062019
1068132019-06-232019-06-29SUDESTEMINAS GERAISGNV6R$/m33.5480.1003.4953.6990.00.0280.00.00.00.00.062019
1068152019-06-232019-06-29SULPARANAGNV1R$/m33.2900.0003.2903.2900.00.0000.00.00.00.00.062019
\n", "

3400 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "1903 2005-09-25 2005-10-01 NORTE PARA ETANOL HIDRATADO \n", "1958 2005-10-09 2005-10-15 NORTE RORAIMA ETANOL HIDRATADO \n", "2012 2005-10-23 2005-10-29 NORTE RORAIMA ETANOL HIDRATADO \n", "2497 2006-02-26 2006-03-04 NORTE RORAIMA ETANOL HIDRATADO \n", "3199 2006-08-27 2006-09-02 NORTE RORAIMA ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106664 2019-06-16 2019-06-22 SUDESTE MINAS GERAIS GNV \n", "106666 2019-06-16 2019-06-22 SUL PARANA GNV \n", "106811 2019-06-23 2019-06-29 SUDESTE ESPIRITO SANTO GNV \n", "106813 2019-06-23 2019-06-29 SUDESTE MINAS GERAIS GNV \n", "106815 2019-06-23 2019-06-29 SUL PARANA GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "1903 2 R$/l 1.694 \n", "1958 3 R$/l 2.000 \n", "2012 3 R$/l 2.277 \n", "2497 11 R$/l 2.182 \n", "3199 22 R$/l 2.285 \n", "... ... ... ... \n", "106664 5 R$/m3 3.445 \n", "106666 7 R$/m3 3.132 \n", "106811 4 R$/m3 3.299 \n", "106813 6 R$/m3 3.548 \n", "106815 1 R$/m3 3.290 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "1903 0.283 1.690 2.090 \n", "1958 0.000 2.000 2.000 \n", "2012 0.023 2.250 2.290 \n", "2497 0.040 2.100 2.200 \n", "3199 0.068 1.980 2.300 \n", "... ... ... ... \n", "106664 0.147 3.347 3.699 \n", "106666 0.295 3.049 3.890 \n", "106811 0.005 3.290 3.299 \n", "106813 0.100 3.495 3.699 \n", "106815 0.000 3.290 3.290 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "1903 0.0 0.167 \n", "1958 0.0 0.000 \n", "2012 0.0 0.010 \n", "2497 0.0 0.018 \n", "3199 0.0 0.030 \n", "... ... ... \n", "106664 0.0 0.043 \n", "106666 0.0 0.094 \n", "106811 0.0 0.002 \n", "106813 0.0 0.028 \n", "106815 0.0 0.000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "1903 0.0 0.0 \n", "1958 0.0 0.0 \n", "2012 0.0 0.0 \n", "2497 0.0 0.0 \n", "3199 0.0 0.0 \n", "... ... ... \n", "106664 0.0 0.0 \n", "106666 0.0 0.0 \n", "106811 0.0 0.0 \n", "106813 0.0 0.0 \n", "106815 0.0 0.0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "1903 0.0 0.0 \n", "1958 0.0 0.0 \n", "2012 0.0 0.0 \n", "2497 0.0 0.0 \n", "3199 0.0 0.0 \n", "... ... ... \n", "106664 0.0 0.0 \n", "106666 0.0 0.0 \n", "106811 0.0 0.0 \n", "106813 0.0 0.0 \n", "106815 0.0 0.0 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "1903 0.0 9 2005 \n", "1958 0.0 10 2005 \n", "2012 0.0 10 2005 \n", "2497 0.0 2 2006 \n", "3199 0.0 8 2006 \n", "... ... ... ... \n", "106664 0.0 6 2019 \n", "106666 0.0 6 2019 \n", "106811 0.0 6 2019 \n", "106813 0.0 6 2019 \n", "106815 0.0 6 2019 \n", "\n", "[3400 rows x 20 columns]" ] }, "execution_count": 158, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_pre_fill[mask] # valores que antes eram NaN, agora são 0" ] }, { "cell_type": "code", "execution_count": 159, "id": "fluid-adoption", "metadata": {}, "outputs": [], "source": [ "# retorna uma cópia do data frame `data_pre` com todos os valores NaN das colunas:\n", "# 'PREÇO MÉDIO DISTRIBUIÇÃO', 'DESVIO PADRÃO DISTRIBUIÇÃO', 'PREÇO MÍNIMO DISTRIBUIÇÃO' e 'PREÇO MÁXIMO DISTRIBUIÇÃO', respectivamente, com os valores: 10, 20, 30, 'vazio'.\n", "data_pre_fill = data_pre.fillna(value={\n", " 'PREÇO MÉDIO DISTRIBUIÇÃO': 10,\n", " 'DESVIO PADRÃO DISTRIBUIÇÃO': 20,\n", " 'PREÇO MÍNIMO DISTRIBUIÇÃO': 30,\n", " 'PREÇO MÁXIMO DISTRIBUIÇÃO': 'vazio'\n", "})" ] }, { "cell_type": "code", "execution_count": 160, "id": "horizontal-river", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
19032005-09-252005-10-01NORTEPARAETANOL HIDRATADO2R$/l1.6940.2831.6902.090NaN0.16710.020.030.0vazioNaN92005
19582005-10-092005-10-15NORTERORAIMAETANOL HIDRATADO3R$/l2.0000.0002.0002.000NaN0.00010.020.030.0vazioNaN102005
20122005-10-232005-10-29NORTERORAIMAETANOL HIDRATADO3R$/l2.2770.0232.2502.290NaN0.01010.020.030.0vazioNaN102005
24972006-02-262006-03-04NORTERORAIMAETANOL HIDRATADO11R$/l2.1820.0402.1002.200NaN0.01810.020.030.0vazioNaN22006
31992006-08-272006-09-02NORTERORAIMAETANOL HIDRATADO22R$/l2.2850.0681.9802.300NaN0.03010.020.030.0vazioNaN82006
...............................................................
1066642019-06-162019-06-22SUDESTEMINAS GERAISGNV5R$/m33.4450.1473.3473.699NaN0.04310.020.030.0vazioNaN62019
1066662019-06-162019-06-22SULPARANAGNV7R$/m33.1320.2953.0493.890NaN0.09410.020.030.0vazioNaN62019
1068112019-06-232019-06-29SUDESTEESPIRITO SANTOGNV4R$/m33.2990.0053.2903.299NaN0.00210.020.030.0vazioNaN62019
1068132019-06-232019-06-29SUDESTEMINAS GERAISGNV6R$/m33.5480.1003.4953.699NaN0.02810.020.030.0vazioNaN62019
1068152019-06-232019-06-29SULPARANAGNV1R$/m33.2900.0003.2903.290NaN0.00010.020.030.0vazioNaN62019
\n", "

3400 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "1903 2005-09-25 2005-10-01 NORTE PARA ETANOL HIDRATADO \n", "1958 2005-10-09 2005-10-15 NORTE RORAIMA ETANOL HIDRATADO \n", "2012 2005-10-23 2005-10-29 NORTE RORAIMA ETANOL HIDRATADO \n", "2497 2006-02-26 2006-03-04 NORTE RORAIMA ETANOL HIDRATADO \n", "3199 2006-08-27 2006-09-02 NORTE RORAIMA ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "106664 2019-06-16 2019-06-22 SUDESTE MINAS GERAIS GNV \n", "106666 2019-06-16 2019-06-22 SUL PARANA GNV \n", "106811 2019-06-23 2019-06-29 SUDESTE ESPIRITO SANTO GNV \n", "106813 2019-06-23 2019-06-29 SUDESTE MINAS GERAIS GNV \n", "106815 2019-06-23 2019-06-29 SUL PARANA GNV \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "1903 2 R$/l 1.694 \n", "1958 3 R$/l 2.000 \n", "2012 3 R$/l 2.277 \n", "2497 11 R$/l 2.182 \n", "3199 22 R$/l 2.285 \n", "... ... ... ... \n", "106664 5 R$/m3 3.445 \n", "106666 7 R$/m3 3.132 \n", "106811 4 R$/m3 3.299 \n", "106813 6 R$/m3 3.548 \n", "106815 1 R$/m3 3.290 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "1903 0.283 1.690 2.090 \n", "1958 0.000 2.000 2.000 \n", "2012 0.023 2.250 2.290 \n", "2497 0.040 2.100 2.200 \n", "3199 0.068 1.980 2.300 \n", "... ... ... ... \n", "106664 0.147 3.347 3.699 \n", "106666 0.295 3.049 3.890 \n", "106811 0.005 3.290 3.299 \n", "106813 0.100 3.495 3.699 \n", "106815 0.000 3.290 3.290 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "1903 NaN 0.167 \n", "1958 NaN 0.000 \n", "2012 NaN 0.010 \n", "2497 NaN 0.018 \n", "3199 NaN 0.030 \n", "... ... ... \n", "106664 NaN 0.043 \n", "106666 NaN 0.094 \n", "106811 NaN 0.002 \n", "106813 NaN 0.028 \n", "106815 NaN 0.000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "1903 10.0 20.0 \n", "1958 10.0 20.0 \n", "2012 10.0 20.0 \n", "2497 10.0 20.0 \n", "3199 10.0 20.0 \n", "... ... ... \n", "106664 10.0 20.0 \n", "106666 10.0 20.0 \n", "106811 10.0 20.0 \n", "106813 10.0 20.0 \n", "106815 10.0 20.0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "1903 30.0 vazio \n", "1958 30.0 vazio \n", "2012 30.0 vazio \n", "2497 30.0 vazio \n", "3199 30.0 vazio \n", "... ... ... \n", "106664 30.0 vazio \n", "106666 30.0 vazio \n", "106811 30.0 vazio \n", "106813 30.0 vazio \n", "106815 30.0 vazio \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "1903 NaN 9 2005 \n", "1958 NaN 10 2005 \n", "2012 NaN 10 2005 \n", "2497 NaN 2 2006 \n", "3199 NaN 8 2006 \n", "... ... ... ... \n", "106664 NaN 6 2019 \n", "106666 NaN 6 2019 \n", "106811 NaN 6 2019 \n", "106813 NaN 6 2019 \n", "106815 NaN 6 2019 \n", "\n", "[3400 rows x 20 columns]" ] }, "execution_count": 160, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_pre_fill[mask]" ] }, { "cell_type": "markdown", "id": "sound-ethnic", "metadata": {}, "source": [ "
\n", "\n", "Por mais que a função `fillna` seja interessante e útil em muitos casos, no problema em questão estamos interessados em analisar precisamente, p. ex., o **'PREÇO MÉDIO DISTRIBUIÇÃO'**.
\n", "A fim de não termos valores _sintéticos_ gerados pelo `fillna`, que possam atrapalhar nossa análise, iremos **remover (drop) todas as amostras que possuem qualquer valor NaN** para quaisquer atributos/colunas.
\n", "\n", "Para isso, basta utilizarmos o método `dropna`." ] }, { "cell_type": "code", "execution_count": 161, "id": "hungry-equilibrium", "metadata": {}, "outputs": [], "source": [ "# remove, no próprio dataframe, todas as linhas/registros com valores NaN (vazios) em quaisquer colunas/atributos.\n", "data_pre.dropna(inplace=True)" ] }, { "cell_type": "code", "execution_count": 162, "id": "incorrect-telescope", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\n", "Int64Index: 103392 entries, 0 to 106822\n", "Data columns (total 20 columns):\n", " # Column Non-Null Count Dtype \n", "--- ------ -------------- ----- \n", " 0 DATA INICIAL 103392 non-null datetime64[ns]\n", " 1 DATA FINAL 103392 non-null datetime64[ns]\n", " 2 REGIÃO 103392 non-null object \n", " 3 ESTADO 103392 non-null object \n", " 4 PRODUTO 103392 non-null object \n", " 5 NÚMERO DE POSTOS PESQUISADOS 103392 non-null int64 \n", " 6 UNIDADE DE MEDIDA 103392 non-null object \n", " 7 PREÇO MÉDIO REVENDA 103392 non-null float64 \n", " 8 DESVIO PADRÃO REVENDA 103392 non-null float64 \n", " 9 PREÇO MÍNIMO REVENDA 103392 non-null float64 \n", " 10 PREÇO MÁXIMO REVENDA 103392 non-null float64 \n", " 11 MARGEM MÉDIA REVENDA 103392 non-null float64 \n", " 12 COEF DE VARIAÇÃO REVENDA 103392 non-null float64 \n", " 13 PREÇO MÉDIO DISTRIBUIÇÃO 103392 non-null float64 \n", " 14 DESVIO PADRÃO DISTRIBUIÇÃO 103392 non-null float64 \n", " 15 PREÇO MÍNIMO DISTRIBUIÇÃO 103392 non-null float64 \n", " 16 PREÇO MÁXIMO DISTRIBUIÇÃO 103392 non-null float64 \n", " 17 COEF DE VARIAÇÃO DISTRIBUIÇÃO 103392 non-null float64 \n", " 18 MÊS 103392 non-null int64 \n", " 19 ANO 103392 non-null int64 \n", "dtypes: datetime64[ns](2), float64(11), int64(3), object(4)\n", "memory usage: 16.6+ MB\n" ] } ], "source": [ "data_pre.info()" ] }, { "cell_type": "markdown", "id": "announced-separate", "metadata": {}, "source": [ "Nosso data frame agora, após essa _limpeza_, ficou mais enxuto, contentdo 103392 registros frente aos 106823 registros originais.
\n", "\n", "Essas são apenas algumas das possíveis _técnicas de limpeza de dados_. Outras estratégias, p. ex., **confiam na detecção de outliers**, que não veremos neste curso." ] }, { "cell_type": "markdown", "id": "above-maria", "metadata": {}, "source": [ "#### **Salvando o Dataset Preprocessado**" ] }, { "cell_type": "code", "execution_count": 163, "id": "experienced-disclaimer", "metadata": {}, "outputs": [], "source": [ "data_pre.to_csv('./datasets/GasPricesinBrazil_2004-2019_preprocessado_final.csv', index=False)" ] }, { "cell_type": "markdown", "id": "democratic-ebony", "metadata": {}, "source": [ "

3. Estatísticas Descritivas

\n", "
" ] }, { "cell_type": "code", "execution_count": 164, "id": "fixed-tablet", "metadata": {}, "outputs": [], "source": [ "data_final = pd.read_csv('./datasets/GasPricesinBrazil_2004-2019_preprocessado_final.csv')" ] }, { "cell_type": "code", "execution_count": 165, "id": "actual-closing", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.2400.0660.9410.0770.74411.031700.08252004
...............................................................
1033872019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.0653.4993.6900.8180.0182.7560.0002.75602.756000.00062019
1033882019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.1293.2303.7890.9500.0382.4510.4021.98422.866100.16462019
1033892019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.1902.6993.4990.9140.0651.9980.0001.99811.998100.00062019
1033902019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.509300.07062019
1033912019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.0053.6893.6991.1790.0012.5180.0002.51752.517500.00062019
\n", "

103392 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "103387 2019-06-23 2019-06-29 NORDESTE RIO GRANDE DO NORTE \n", "103388 2019-06-23 2019-06-29 SUL RIO GRANDE DO SUL \n", "103389 2019-06-23 2019-06-29 SUL SANTA CATARINA \n", "103390 2019-06-23 2019-06-29 SUDESTE SAO PAULO \n", "103391 2019-06-23 2019-06-29 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "103387 GNV 7 R$/m3 \n", "103388 GNV 23 R$/m3 \n", "103389 GNV 24 R$/m3 \n", "103390 GNV 52 R$/m3 \n", "103391 GNV 4 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "103387 3.574 0.065 3.499 \n", "103388 3.401 0.129 3.230 \n", "103389 2.912 0.190 2.699 \n", "103390 3.020 0.229 2.699 \n", "103391 3.697 0.005 3.689 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "... ... ... ... \n", "103387 3.690 0.818 0.018 \n", "103388 3.789 0.950 0.038 \n", "103389 3.499 0.914 0.065 \n", "103390 3.490 0.646 0.076 \n", "103391 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "103387 2.756 0.000 \n", "103388 2.451 0.402 \n", "103389 1.998 0.000 \n", "103390 2.374 0.165 \n", "103391 2.518 0.000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "... ... ... \n", "103387 2.7560 2.75600 \n", "103388 1.9842 2.86610 \n", "103389 1.9981 1.99810 \n", "103390 2.0179 2.50930 \n", "103391 2.5175 2.51750 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "103387 0.000 6 2019 \n", "103388 0.164 6 2019 \n", "103389 0.000 6 2019 \n", "103390 0.070 6 2019 \n", "103391 0.000 6 2019 \n", "\n", "[103392 rows x 20 columns]" ] }, "execution_count": 165, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final" ] }, { "cell_type": "markdown", "id": "exempt-spine", "metadata": {}, "source": [ "O Pandas fornecem algumas funções/métodos que computam certas estatísticas descritivas." ] }, { "cell_type": "markdown", "id": "lovely-excess", "metadata": {}, "source": [ "`describe`: exibe várias **estatísticas descritivas** para os _atributos_ de um dataframe ou para uma _Series_." ] }, { "cell_type": "code", "execution_count": 166, "id": "global-techno", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
count103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000
mean240.51193510.7844720.6525899.33493112.4586862.2251510.0457498.5593220.5594417.4148149.8056210.0466406.4850672011.737001
std408.03917417.6858521.34642215.02438320.8011904.3750850.02448813.6036861.25691411.68136615.9339990.0421143.4421554.410491
min1.0000000.7660000.0000000.5900000.9990000.0010000.0000000.5060000.0000000.3257000.5992000.0000001.0000002004.000000
25%47.0000002.0730000.0730001.9000002.3300000.2820000.0300001.7950000.0470001.6744001.9456000.0210004.0000002008.000000
50%108.0000002.7230000.1150002.5090003.0000000.3830000.0420002.3350000.0770002.2200002.5070500.0310006.0000002012.000000
75%251.0000003.7450000.1900003.4900004.1500000.5600000.0580003.3070000.1510003.1428003.5200000.0610009.0000002016.000000
max4167.00000099.35700010.74800090.000000120.00000036.8470000.26200083.13700018.38500083.00000094.5000000.78000012.0000002019.000000
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 240.511935 10.784472 \n", "std 408.039174 17.685852 \n", "min 1.000000 0.766000 \n", "25% 47.000000 2.073000 \n", "50% 108.000000 2.723000 \n", "75% 251.000000 3.745000 \n", "max 4167.000000 99.357000 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.652589 9.334931 12.458686 \n", "std 1.346422 15.024383 20.801190 \n", "min 0.000000 0.590000 0.999000 \n", "25% 0.073000 1.900000 2.330000 \n", "50% 0.115000 2.509000 3.000000 \n", "75% 0.190000 3.490000 4.150000 \n", "max 10.748000 90.000000 120.000000 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 2.225151 0.045749 \n", "std 4.375085 0.024488 \n", "min 0.001000 0.000000 \n", "25% 0.282000 0.030000 \n", "50% 0.383000 0.042000 \n", "75% 0.560000 0.058000 \n", "max 36.847000 0.262000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 8.559322 0.559441 \n", "std 13.603686 1.256914 \n", "min 0.506000 0.000000 \n", "25% 1.795000 0.047000 \n", "50% 2.335000 0.077000 \n", "75% 3.307000 0.151000 \n", "max 83.137000 18.385000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 7.414814 9.805621 \n", "std 11.681366 15.933999 \n", "min 0.325700 0.599200 \n", "25% 1.674400 1.945600 \n", "50% 2.220000 2.507050 \n", "75% 3.142800 3.520000 \n", "max 83.000000 94.500000 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.046640 6.485067 2011.737001 \n", "std 0.042114 3.442155 4.410491 \n", "min 0.000000 1.000000 2004.000000 \n", "25% 0.021000 4.000000 2008.000000 \n", "50% 0.031000 6.000000 2012.000000 \n", "75% 0.061000 9.000000 2016.000000 \n", "max 0.780000 12.000000 2019.000000 " ] }, "execution_count": 166, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.describe()" ] }, { "cell_type": "code", "execution_count": 167, "id": "recent-nirvana", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "count 103392.000000\n", "mean 10.784472\n", "std 17.685852\n", "min 0.766000\n", "25% 2.073000\n", "50% 2.723000\n", "75% 3.745000\n", "max 99.357000\n", "Name: PREÇO MÉDIO REVENDA, dtype: float64" ] }, "execution_count": 167, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['PREÇO MÉDIO REVENDA'].describe()" ] }, { "cell_type": "markdown", "id": "subtle-luxembourg", "metadata": {}, "source": [ "
\n", "\n", "Como o resultado do `describe` de um _dataframe_ é outro _dataframe_, podemos filtrar apenas algumas colunas." ] }, { "cell_type": "code", "execution_count": 168, "id": "champion-status", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "count 103392.000000\n", "mean 10.784472\n", "std 17.685852\n", "min 0.766000\n", "25% 2.073000\n", "50% 2.723000\n", "75% 3.745000\n", "max 99.357000\n", "Name: PREÇO MÉDIO REVENDA, dtype: float64" ] }, "execution_count": 168, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.describe()['PREÇO MÉDIO REVENDA']" ] }, { "cell_type": "code", "execution_count": 169, "id": "emerging-circus", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
count103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000
mean240.51193510.7844720.6525899.33493112.4586862.2251510.0457498.5593220.5594417.4148149.8056210.0466406.4850672011.737001
std408.03917417.6858521.34642215.02438320.8011904.3750850.02448813.6036861.25691411.68136615.9339990.0421143.4421554.410491
min1.0000000.7660000.0000000.5900000.9990000.0010000.0000000.5060000.0000000.3257000.5992000.0000001.0000002004.000000
25%47.0000002.0730000.0730001.9000002.3300000.2820000.0300001.7950000.0470001.6744001.9456000.0210004.0000002008.000000
50%108.0000002.7230000.1150002.5090003.0000000.3830000.0420002.3350000.0770002.2200002.5070500.0310006.0000002012.000000
75%251.0000003.7450000.1900003.4900004.1500000.5600000.0580003.3070000.1510003.1428003.5200000.0610009.0000002016.000000
max4167.00000099.35700010.74800090.000000120.00000036.8470000.26200083.13700018.38500083.00000094.5000000.78000012.0000002019.000000
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 240.511935 10.784472 \n", "std 408.039174 17.685852 \n", "min 1.000000 0.766000 \n", "25% 47.000000 2.073000 \n", "50% 108.000000 2.723000 \n", "75% 251.000000 3.745000 \n", "max 4167.000000 99.357000 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.652589 9.334931 12.458686 \n", "std 1.346422 15.024383 20.801190 \n", "min 0.000000 0.590000 0.999000 \n", "25% 0.073000 1.900000 2.330000 \n", "50% 0.115000 2.509000 3.000000 \n", "75% 0.190000 3.490000 4.150000 \n", "max 10.748000 90.000000 120.000000 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 2.225151 0.045749 \n", "std 4.375085 0.024488 \n", "min 0.001000 0.000000 \n", "25% 0.282000 0.030000 \n", "50% 0.383000 0.042000 \n", "75% 0.560000 0.058000 \n", "max 36.847000 0.262000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 8.559322 0.559441 \n", "std 13.603686 1.256914 \n", "min 0.506000 0.000000 \n", "25% 1.795000 0.047000 \n", "50% 2.335000 0.077000 \n", "75% 3.307000 0.151000 \n", "max 83.137000 18.385000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 7.414814 9.805621 \n", "std 11.681366 15.933999 \n", "min 0.325700 0.599200 \n", "25% 1.674400 1.945600 \n", "50% 2.220000 2.507050 \n", "75% 3.142800 3.520000 \n", "max 83.000000 94.500000 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.046640 6.485067 2011.737001 \n", "std 0.042114 3.442155 4.410491 \n", "min 0.000000 1.000000 2004.000000 \n", "25% 0.021000 4.000000 2008.000000 \n", "50% 0.031000 6.000000 2012.000000 \n", "75% 0.061000 9.000000 2016.000000 \n", "max 0.780000 12.000000 2019.000000 " ] }, "execution_count": 169, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats = data_final.describe()\n", "stats" ] }, { "cell_type": "code", "execution_count": 170, "id": "historic-keeping", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PREÇO MÉDIO REVENDAPREÇO MÁXIMO REVENDAPREÇO MÉDIO DISTRIBUIÇÃO
count103392.000000103392.000000103392.000000
mean10.78447212.4586868.559322
std17.68585220.80119013.603686
min0.7660000.9990000.506000
25%2.0730002.3300001.795000
50%2.7230003.0000002.335000
75%3.7450004.1500003.307000
max99.357000120.00000083.137000
\n", "
" ], "text/plain": [ " PREÇO MÉDIO REVENDA PREÇO MÁXIMO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO\n", "count 103392.000000 103392.000000 103392.000000\n", "mean 10.784472 12.458686 8.559322\n", "std 17.685852 20.801190 13.603686\n", "min 0.766000 0.999000 0.506000\n", "25% 2.073000 2.330000 1.795000\n", "50% 2.723000 3.000000 2.335000\n", "75% 3.745000 4.150000 3.307000\n", "max 99.357000 120.000000 83.137000" ] }, "execution_count": 170, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats[['PREÇO MÉDIO REVENDA', 'PREÇO MÁXIMO REVENDA', 'PREÇO MÉDIO DISTRIBUIÇÃO']]" ] }, { "cell_type": "code", "execution_count": 171, "id": "fancy-mortality", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PREÇO MÉDIO REVENDAPREÇO MÁXIMO REVENDAPREÇO MÉDIO DISTRIBUIÇÃO
count103392.000000103392.000000103392.000000
mean10.78447212.4586868.559322
std17.68585220.80119013.603686
min0.7660000.9990000.506000
25%2.0730002.3300001.795000
50%2.7230003.0000002.335000
75%3.7450004.1500003.307000
max99.357000120.00000083.137000
\n", "
" ], "text/plain": [ " PREÇO MÉDIO REVENDA PREÇO MÁXIMO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO\n", "count 103392.000000 103392.000000 103392.000000\n", "mean 10.784472 12.458686 8.559322\n", "std 17.685852 20.801190 13.603686\n", "min 0.766000 0.999000 0.506000\n", "25% 2.073000 2.330000 1.795000\n", "50% 2.723000 3.000000 2.335000\n", "75% 3.745000 4.150000 3.307000\n", "max 99.357000 120.000000 83.137000" ] }, "execution_count": 171, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# ALTERNATIVA MAIS EFICIENTE\n", "# apenas computa as estatísticas descritivas para 3 atributos\n", "data_final[['PREÇO MÉDIO REVENDA', 'PREÇO MÁXIMO REVENDA', 'PREÇO MÉDIO DISTRIBUIÇÃO']].describe()" ] }, { "cell_type": "markdown", "id": "divine-details", "metadata": {}, "source": [ "**Acessando apenas algumas estatísticas**" ] }, { "cell_type": "code", "execution_count": 172, "id": "fatty-homework", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
count103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000103392.000000
mean240.51193510.7844720.6525899.33493112.4586862.2251510.0457498.5593220.5594417.4148149.8056210.0466406.4850672011.737001
std408.03917417.6858521.34642215.02438320.8011904.3750850.02448813.6036861.25691411.68136615.9339990.0421143.4421554.410491
min1.0000000.7660000.0000000.5900000.9990000.0010000.0000000.5060000.0000000.3257000.5992000.0000001.0000002004.000000
25%47.0000002.0730000.0730001.9000002.3300000.2820000.0300001.7950000.0470001.6744001.9456000.0210004.0000002008.000000
50%108.0000002.7230000.1150002.5090003.0000000.3830000.0420002.3350000.0770002.2200002.5070500.0310006.0000002012.000000
75%251.0000003.7450000.1900003.4900004.1500000.5600000.0580003.3070000.1510003.1428003.5200000.0610009.0000002016.000000
max4167.00000099.35700010.74800090.000000120.00000036.8470000.26200083.13700018.38500083.00000094.5000000.78000012.0000002019.000000
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 240.511935 10.784472 \n", "std 408.039174 17.685852 \n", "min 1.000000 0.766000 \n", "25% 47.000000 2.073000 \n", "50% 108.000000 2.723000 \n", "75% 251.000000 3.745000 \n", "max 4167.000000 99.357000 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.652589 9.334931 12.458686 \n", "std 1.346422 15.024383 20.801190 \n", "min 0.000000 0.590000 0.999000 \n", "25% 0.073000 1.900000 2.330000 \n", "50% 0.115000 2.509000 3.000000 \n", "75% 0.190000 3.490000 4.150000 \n", "max 10.748000 90.000000 120.000000 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "count 103392.000000 103392.000000 \n", "mean 2.225151 0.045749 \n", "std 4.375085 0.024488 \n", "min 0.001000 0.000000 \n", "25% 0.282000 0.030000 \n", "50% 0.383000 0.042000 \n", "75% 0.560000 0.058000 \n", "max 36.847000 0.262000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 8.559322 0.559441 \n", "std 13.603686 1.256914 \n", "min 0.506000 0.000000 \n", "25% 1.795000 0.047000 \n", "50% 2.335000 0.077000 \n", "75% 3.307000 0.151000 \n", "max 83.137000 18.385000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "count 103392.000000 103392.000000 \n", "mean 7.414814 9.805621 \n", "std 11.681366 15.933999 \n", "min 0.325700 0.599200 \n", "25% 1.674400 1.945600 \n", "50% 2.220000 2.507050 \n", "75% 3.142800 3.520000 \n", "max 83.000000 94.500000 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "count 103392.000000 103392.000000 103392.000000 \n", "mean 0.046640 6.485067 2011.737001 \n", "std 0.042114 3.442155 4.410491 \n", "min 0.000000 1.000000 2004.000000 \n", "25% 0.021000 4.000000 2008.000000 \n", "50% 0.031000 6.000000 2012.000000 \n", "75% 0.061000 9.000000 2016.000000 \n", "max 0.780000 12.000000 2019.000000 " ] }, "execution_count": 172, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats" ] }, { "cell_type": "code", "execution_count": 173, "id": "complex-layer", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
min1.0000000.7660000.0000000.5900000.9990000.0010000.0000000.5060000.0000000.3257000.5992000.000001.0000002004.000000
max4167.00000099.35700010.74800090.000000120.00000036.8470000.26200083.13700018.38500083.00000094.5000000.7800012.0000002019.000000
mean240.51193510.7844720.6525899.33493112.4586862.2251510.0457498.5593220.5594417.4148149.8056210.046646.4850672011.737001
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "min 1.000000 0.766000 \n", "max 4167.000000 99.357000 \n", "mean 240.511935 10.784472 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "min 0.000000 0.590000 0.999000 \n", "max 10.748000 90.000000 120.000000 \n", "mean 0.652589 9.334931 12.458686 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "min 0.001000 0.000000 \n", "max 36.847000 0.262000 \n", "mean 2.225151 0.045749 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "min 0.506000 0.000000 \n", "max 83.137000 18.385000 \n", "mean 8.559322 0.559441 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "min 0.325700 0.599200 \n", "max 83.000000 94.500000 \n", "mean 7.414814 9.805621 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "min 0.00000 1.000000 2004.000000 \n", "max 0.78000 12.000000 2019.000000 \n", "mean 0.04664 6.485067 2011.737001 " ] }, "execution_count": 173, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats.loc[['min', 'max', 'mean']]" ] }, { "cell_type": "code", "execution_count": 174, "id": "hourly-armenia", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "min 0.766000\n", "max 99.357000\n", "mean 10.784472\n", "Name: PREÇO MÉDIO REVENDA, dtype: float64" ] }, "execution_count": 174, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats.loc[['min', 'max', 'mean'], 'PREÇO MÉDIO REVENDA']" ] }, { "cell_type": "code", "execution_count": 175, "id": "light-diesel", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PREÇO MÉDIO REVENDAPREÇO MÉDIO DISTRIBUIÇÃO
min0.7660000.506000
max99.35700083.137000
mean10.7844728.559322
\n", "
" ], "text/plain": [ " PREÇO MÉDIO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO\n", "min 0.766000 0.506000\n", "max 99.357000 83.137000\n", "mean 10.784472 8.559322" ] }, "execution_count": 175, "metadata": {}, "output_type": "execute_result" } ], "source": [ "stats.loc[['min', 'max', 'mean'], ['PREÇO MÉDIO REVENDA', 'PREÇO MÉDIO DISTRIBUIÇÃO']]" ] }, { "cell_type": "markdown", "id": "suspended-philadelphia", "metadata": {}, "source": [ "
\n", "\n", "`mean`, `std`, `min`, etc: cada uma das estatísticas do `describe` podem ser computadas individualmente:" ] }, { "cell_type": "code", "execution_count": 176, "id": "sunrise-background", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.2400.0660.9410.0770.74411.031700.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 176, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.head()" ] }, { "cell_type": "markdown", "id": "paperback-things", "metadata": {}, "source": [ "#### Qual é o menor preço mínimo de revenda?" ] }, { "cell_type": "code", "execution_count": 177, "id": "hearing-stress", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.59" ] }, "execution_count": 177, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['PREÇO MÍNIMO REVENDA'].min()" ] }, { "cell_type": "markdown", "id": "wrapped-priority", "metadata": {}, "source": [ "#### Qual é a média e desvio padrão dos preços mínimos de revenda?" ] }, { "cell_type": "code", "execution_count": 178, "id": "expensive-prospect", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "A média dos preços mínimos de revenda é 9.33 +- 15.02\n" ] } ], "source": [ "mean = data_final['PREÇO MÍNIMO REVENDA'].mean()\n", "std = data_final['PREÇO MÍNIMO REVENDA'].std()\n", "\n", "print(f'A média dos preços mínimos de revenda é {mean:.2f} +- {std:.2f}')" ] }, { "cell_type": "markdown", "id": "exempt-furniture", "metadata": {}, "source": [ "#### Quais são os estados considerados?" ] }, { "cell_type": "code", "execution_count": 179, "id": "neural-greece", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 DISTRITO FEDERAL\n", "1 GOIAS\n", "2 MATO GROSSO\n", "3 MATO GROSSO DO SUL\n", "4 ALAGOAS\n", " ... \n", "103387 RIO GRANDE DO NORTE\n", "103388 RIO GRANDE DO SUL\n", "103389 SANTA CATARINA\n", "103390 SAO PAULO\n", "103391 SERGIPE\n", "Name: ESTADO, Length: 103392, dtype: object" ] }, "execution_count": 179, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['ESTADO']" ] }, { "cell_type": "code", "execution_count": 180, "id": "bound-stuart", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array(['DISTRITO FEDERAL', 'GOIAS', 'MATO GROSSO', 'MATO GROSSO DO SUL',\n", " 'ALAGOAS', 'BAHIA', 'CEARA', 'MARANHAO', 'PARAIBA', 'PERNAMBUCO',\n", " 'PIAUI', 'RIO GRANDE DO NORTE', 'SERGIPE', 'ACRE', 'AMAPA',\n", " 'AMAZONAS', 'PARA', 'RONDONIA', 'RORAIMA', 'TOCANTINS',\n", " 'ESPIRITO SANTO', 'MINAS GERAIS', 'RIO DE JANEIRO', 'SAO PAULO',\n", " 'PARANA', 'RIO GRANDE DO SUL', 'SANTA CATARINA'], dtype=object)" ] }, "execution_count": 180, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['ESTADO'].unique()" ] }, { "cell_type": "code", "execution_count": 181, "id": "organizational-fairy", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['ACRE',\n", " 'ALAGOAS',\n", " 'AMAPA',\n", " 'AMAZONAS',\n", " 'BAHIA',\n", " 'CEARA',\n", " 'DISTRITO FEDERAL',\n", " 'ESPIRITO SANTO',\n", " 'GOIAS',\n", " 'MARANHAO',\n", " 'MATO GROSSO',\n", " 'MATO GROSSO DO SUL',\n", " 'MINAS GERAIS',\n", " 'PARA',\n", " 'PARAIBA',\n", " 'PARANA',\n", " 'PERNAMBUCO',\n", " 'PIAUI',\n", " 'RIO DE JANEIRO',\n", " 'RIO GRANDE DO NORTE',\n", " 'RIO GRANDE DO SUL',\n", " 'RONDONIA',\n", " 'RORAIMA',\n", " 'SANTA CATARINA',\n", " 'SAO PAULO',\n", " 'SERGIPE',\n", " 'TOCANTINS']" ] }, "execution_count": 181, "metadata": {}, "output_type": "execute_result" } ], "source": [ "sorted(data_final['ESTADO'].unique())" ] }, { "cell_type": "markdown", "id": "painful-credit", "metadata": {}, "source": [ "#### Quantos registros (aferições) cada estado possui?" ] }, { "cell_type": "markdown", "id": "accessory-graphics", "metadata": {}, "source": [ "`.value_counts()`: Conta a frequência dos valores de uma dada variável (de preferência, _categórica_)." ] }, { "cell_type": "code", "execution_count": 182, "id": "skilled-package", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "BAHIA 4263\n", "RIO DE JANEIRO 4262\n", "SAO PAULO 4261\n", "RIO GRANDE DO SUL 4249\n", "PARAIBA 4240\n", "PERNAMBUCO 4236\n", "SERGIPE 4202\n", "SANTA CATARINA 4164\n", "MINAS GERAIS 4142\n", "ESPIRITO SANTO 4079\n", "MATO GROSSO DO SUL 4076\n", "ALAGOAS 4020\n", "RIO GRANDE DO NORTE 3999\n", "CEARA 3964\n", "PARANA 3902\n", "AMAZONAS 3713\n", "MATO GROSSO 3703\n", "PARA 3477\n", "MARANHAO 3470\n", "ACRE 3463\n", "RORAIMA 3457\n", "TOCANTINS 3453\n", "GOIAS 3449\n", "RONDONIA 3441\n", "PIAUI 3394\n", "DISTRITO FEDERAL 3317\n", "AMAPA 2996\n", "Name: ESTADO, dtype: int64" ] }, "execution_count": 182, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['ESTADO'].value_counts() # retorna em ordem decrescente, a quantidade de registros/linhas para cada estado" ] }, { "cell_type": "code", "execution_count": 183, "id": "cutting-party", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ESTADO
BAHIA4263
RIO DE JANEIRO4262
SAO PAULO4261
RIO GRANDE DO SUL4249
PARAIBA4240
PERNAMBUCO4236
SERGIPE4202
SANTA CATARINA4164
MINAS GERAIS4142
ESPIRITO SANTO4079
MATO GROSSO DO SUL4076
ALAGOAS4020
RIO GRANDE DO NORTE3999
CEARA3964
PARANA3902
AMAZONAS3713
MATO GROSSO3703
PARA3477
MARANHAO3470
ACRE3463
RORAIMA3457
TOCANTINS3453
GOIAS3449
RONDONIA3441
PIAUI3394
DISTRITO FEDERAL3317
AMAPA2996
\n", "
" ], "text/plain": [ " ESTADO\n", "BAHIA 4263\n", "RIO DE JANEIRO 4262\n", "SAO PAULO 4261\n", "RIO GRANDE DO SUL 4249\n", "PARAIBA 4240\n", "PERNAMBUCO 4236\n", "SERGIPE 4202\n", "SANTA CATARINA 4164\n", "MINAS GERAIS 4142\n", "ESPIRITO SANTO 4079\n", "MATO GROSSO DO SUL 4076\n", "ALAGOAS 4020\n", "RIO GRANDE DO NORTE 3999\n", "CEARA 3964\n", "PARANA 3902\n", "AMAZONAS 3713\n", "MATO GROSSO 3703\n", "PARA 3477\n", "MARANHAO 3470\n", "ACRE 3463\n", "RORAIMA 3457\n", "TOCANTINS 3453\n", "GOIAS 3449\n", "RONDONIA 3441\n", "PIAUI 3394\n", "DISTRITO FEDERAL 3317\n", "AMAPA 2996" ] }, "execution_count": 183, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final['ESTADO'].value_counts().to_frame() # converte uma Series para um DataFrame" ] }, { "cell_type": "markdown", "id": "mounted-inclusion", "metadata": {}, "source": [ "

4. Executando funções para cada item de um DataFrame ou Series

\n", "
" ] }, { "cell_type": "markdown", "id": "intermediate-submission", "metadata": {}, "source": [ "Uma alternativa ao `for-loop` que vimos anteriormente e que é _lento_, é usarmos _funções próprias do pandas_ que **aplicam/mapeiam uma dada função a todos os elementos de um DataFrame ou Series**, retornando novos elementos \"transformados\".\n" ] }, { "cell_type": "markdown", "id": "developing-freeze", "metadata": {}, "source": [ "\n", "\n", "\n", "Fonte: https://towardsdatascience.com/introduction-to-pandas-apply-applymap-and-map-5d3e044e93ff" ] }, { "cell_type": "code", "execution_count": 184, "id": "standing-circulation", "metadata": {}, "outputs": [], "source": [ "df = pd.DataFrame({ 'A': [1, 2, 3, 4], \n", " 'B': [10, 20, 30, 40],\n", " 'C': [100, 200, 300, 400]}, \n", " index=['Linha 1', 'Linha 2', 'Linha 3', 'Linha 4'])" ] }, { "cell_type": "code", "execution_count": 185, "id": "amber-easter", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
Linha 1110100
Linha 2220200
Linha 3330300
Linha 4440400
\n", "
" ], "text/plain": [ " A B C\n", "Linha 1 1 10 100\n", "Linha 2 2 20 200\n", "Linha 3 3 30 300\n", "Linha 4 4 40 400" ] }, "execution_count": 185, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df" ] }, { "cell_type": "markdown", "id": "alert-welding", "metadata": {}, "source": [ "`apply()`: usado para aplicar uma função ao longo de um eixo de um DataFrame ou em valores de uma Series." ] }, { "cell_type": "markdown", "id": "indie-virginia", "metadata": {}, "source": [ "\n", "\n", "Fonte: https://www.allthesnippets.com/browse/pandas/df_axis.html" ] }, { "cell_type": "code", "execution_count": 186, "id": "supreme-programmer", "metadata": {}, "outputs": [], "source": [ "def nossa_soma(series):\n", " return series.sum() # retorna a soma de todos os valores de uma series" ] }, { "cell_type": "code", "execution_count": 187, "id": "multiple-parcel", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABCSOMA(A, B, C)
Linha 1110100111
Linha 2220200222
Linha 3330300333
Linha 4440400444
\n", "
" ], "text/plain": [ " A B C SOMA(A, B, C)\n", "Linha 1 1 10 100 111\n", "Linha 2 2 20 200 222\n", "Linha 3 3 30 300 333\n", "Linha 4 4 40 400 444" ] }, "execution_count": 187, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# aplica a função soma para cada linha do dataframe\n", "df['SOMA(A, B, C)'] = df.apply(nossa_soma, axis=1)\n", "df" ] }, { "cell_type": "markdown", "id": "demographic-lending", "metadata": {}, "source": [ "" ] }, { "cell_type": "code", "execution_count": 188, "id": "grave-russian", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABCSOMA(A, B, C)
Linha 1110100111
Linha 2220200222
Linha 3330300333
Linha 4440400444
Linha 51010010001110
\n", "
" ], "text/plain": [ " A B C SOMA(A, B, C)\n", "Linha 1 1 10 100 111\n", "Linha 2 2 20 200 222\n", "Linha 3 3 30 300 333\n", "Linha 4 4 40 400 444\n", "Linha 5 10 100 1000 1110" ] }, "execution_count": 188, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# aplica a função soma para cada coluna do dataframe\n", "df.loc['Linha 5'] = df.apply(nossa_soma, axis=0)\n", "df" ] }, { "cell_type": "markdown", "id": "coordinate-wonder", "metadata": {}, "source": [ "" ] }, { "cell_type": "markdown", "id": "fossil-blade", "metadata": {}, "source": [ "##### Usando `lambda` functions" ] }, { "cell_type": "code", "execution_count": 189, "id": "little-turkey", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABCSOMA(A, B, C)MEDIA(A, B, C)
Linha 111010011137.0
Linha 222020022274.0
Linha 3330300333111.0
Linha 4440400444148.0
Linha 51010010001110370.0
\n", "
" ], "text/plain": [ " A B C SOMA(A, B, C) MEDIA(A, B, C)\n", "Linha 1 1 10 100 111 37.0\n", "Linha 2 2 20 200 222 74.0\n", "Linha 3 3 30 300 333 111.0\n", "Linha 4 4 40 400 444 148.0\n", "Linha 5 10 100 1000 1110 370.0" ] }, "execution_count": 189, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df['MEDIA(A, B, C)'] = df[['A', 'B', 'C']].apply(lambda series: series.mean(), axis=1)\n", "df" ] }, { "cell_type": "markdown", "id": "conceptual-graduation", "metadata": {}, "source": [ "" ] }, { "cell_type": "code", "execution_count": 190, "id": "demonstrated-singer", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABCSOMA(A, B, C)MEDIA(A, B, C)C * 2
Linha 111010011137.0200
Linha 222020022274.0400
Linha 3330300333111.0600
Linha 4440400444148.0800
Linha 51010010001110370.02000
\n", "
" ], "text/plain": [ " A B C SOMA(A, B, C) MEDIA(A, B, C) C * 2\n", "Linha 1 1 10 100 111 37.0 200\n", "Linha 2 2 20 200 222 74.0 400\n", "Linha 3 3 30 300 333 111.0 600\n", "Linha 4 4 40 400 444 148.0 800\n", "Linha 5 10 100 1000 1110 370.0 2000" ] }, "execution_count": 190, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# plica a lambda function abaixo para cada elemento da coluna\n", "df['C * 2'] = df['C'].apply(lambda x: x * 2)\n", "df" ] }, { "cell_type": "code", "execution_count": 191, "id": "perfect-finnish", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABCSOMA(A, B, C)MEDIA(A, B, C)C * 2A * 2
Linha 111010011137.02002
Linha 222020022274.04004
Linha 3330300333111.06006
Linha 4440400444148.08008
Linha 51010010001110370.0200020
\n", "
" ], "text/plain": [ " A B C SOMA(A, B, C) MEDIA(A, B, C) C * 2 A * 2\n", "Linha 1 1 10 100 111 37.0 200 2\n", "Linha 2 2 20 200 222 74.0 400 4\n", "Linha 3 3 30 300 333 111.0 600 6\n", "Linha 4 4 40 400 444 148.0 800 8\n", "Linha 5 10 100 1000 1110 370.0 2000 20" ] }, "execution_count": 191, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df['A * 2'] = df['A'] * 2\n", "df" ] }, { "cell_type": "markdown", "id": "weird-exhaust", "metadata": {}, "source": [ "
\n", "\n", "`applymap()`: usado para aplicar uma função para **cada elemento** (_element-wise_) de um DataFrame." ] }, { "cell_type": "code", "execution_count": 192, "id": "qualified-marijuana", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
Linha 1110100
Linha 2220200
Linha 3330300
Linha 4440400
\n", "
" ], "text/plain": [ " A B C\n", "Linha 1 1 10 100\n", "Linha 2 2 20 200\n", "Linha 3 3 30 300\n", "Linha 4 4 40 400" ] }, "execution_count": 192, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df = pd.DataFrame({ 'A': [1, 2, 3, 4], \n", " 'B': [10, 20, 30, 40],\n", " 'C': [100, 200, 300, 400]}, \n", " index=['Linha 1', 'Linha 2', 'Linha 3', 'Linha 4'])\n", "df" ] }, { "cell_type": "code", "execution_count": 193, "id": "higher-empty", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
Linha 1110010000
Linha 2440040000
Linha 3990090000
Linha 4161600160000
\n", "
" ], "text/plain": [ " A B C\n", "Linha 1 1 100 10000\n", "Linha 2 4 400 40000\n", "Linha 3 9 900 90000\n", "Linha 4 16 1600 160000" ] }, "execution_count": 193, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna um novo dataframe com todos os elementos ao quadrado.\n", "# poderíamos usar uma função ao invés de uma lambda function\n", "df.applymap(lambda x: x ** 2)" ] }, { "cell_type": "code", "execution_count": 194, "id": "stylish-estate", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
Linha 1110100
Linha 2220200
Linha 3330300
Linha 4440400
\n", "
" ], "text/plain": [ " A B C\n", "Linha 1 1 10 100\n", "Linha 2 2 20 200\n", "Linha 3 3 30 300\n", "Linha 4 4 40 400" ] }, "execution_count": 194, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df" ] }, { "cell_type": "markdown", "id": "hollow-manitoba", "metadata": {}, "source": [ "
\n", "\n", "`map()`: usado para aplicar uma função para **cada elemento** (_element-wise_) de uma _Series_." ] }, { "cell_type": "code", "execution_count": 195, "id": "approximate-folder", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 João\n", "1 Maria\n", "2 Alice\n", "3 Pedro\n", "dtype: object" ] }, "execution_count": 195, "metadata": {}, "output_type": "execute_result" } ], "source": [ "nomes = pd.Series(['João', 'Maria', 'Alice', 'Pedro'])\n", "nomes" ] }, { "cell_type": "code", "execution_count": 196, "id": "under-homeless", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 JOÃO\n", "1 MARIA\n", "2 ALICE\n", "3 PEDRO\n", "dtype: object" ] }, "execution_count": 196, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna uma nova Series com todos os nomes com letras maiuscúlas.\n", "# poderíamos usar uma função ao invés de uma lambda function\n", "nomes.map(lambda x: x.upper())" ] }, { "cell_type": "code", "execution_count": 197, "id": "great-favor", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 João\n", "1 Maria\n", "2 Alice\n", "3 Pedro\n", "dtype: object" ] }, "execution_count": 197, "metadata": {}, "output_type": "execute_result" } ], "source": [ "nomes" ] }, { "cell_type": "code", "execution_count": 198, "id": "loved-constant", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0 JOÃO\n", "1 MARIA\n", "2 ALICE\n", "3 PEDRO\n", "dtype: object" ] }, "execution_count": 198, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# O Pandas já fornece uma série de métodos para manipulação de strings.\n", "# Assim, poderíamos usar o código abaixo para obter o mesmo resultado.\n", "nomes.str.upper()" ] }, { "cell_type": "markdown", "id": "measured-migration", "metadata": {}, "source": [ "

5. Agrupamento

\n", "
" ] }, { "cell_type": "code", "execution_count": 208, "id": "afraid-limit", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.2400.0660.9410.0770.74411.031700.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 208, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.head()" ] }, { "cell_type": "markdown", "id": "bridal-certificate", "metadata": {}, "source": [ "`groupby`: Usado para criar **grupos de elementos** (e.x., baseado nos valores de um atributo (categórico)).
\n", "**Funções** podem então ser aplicadas para os _elementos de cada grupo_, de modo que os **resultados de cada grupo são combinados**." ] }, { "cell_type": "code", "execution_count": 210, "id": "commercial-destiny", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 210, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# agrupa as linhas da tablea de acordo com suas respectivas regiões\n", "grupos = data_final.groupby('REGIÃO')\n", "grupos" ] }, { "cell_type": "code", "execution_count": 211, "id": "organized-spencer", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "{'CENTRO OESTE': [0, 1, 2, 3, 27, 28, 29, 30, 54, 55, 56, 57, 81, 82, 83, 84, 108, 109, 110, 111, 135, 136, 137, 138, 162, 163, 164, 165, 189, 190, 191, 192, 216, 217, 218, 219, 243, 244, 245, 246, 270, 271, 272, 273, 297, 298, 299, 300, 324, 325, 326, 327, 351, 352, 353, 354, 378, 379, 380, 381, 405, 406, 407, 408, 432, 433, 434, 435, 459, 460, 461, 462, 486, 487, 488, 489, 513, 514, 515, 516, 540, 541, 542, 543, 567, 568, 569, 570, 594, 595, 596, 597, 621, 622, 623, 624, 648, 649, 650, 651, ...], 'NORDESTE': [4, 5, 6, 7, 8, 9, 10, 11, 12, 31, 32, 33, 34, 35, 36, 37, 38, 39, 58, 59, 60, 61, 62, 63, 64, 65, 66, 85, 86, 87, 88, 89, 90, 91, 92, 93, 112, 113, 114, 115, 116, 117, 118, 119, 120, 139, 140, 141, 142, 143, 144, 145, 146, 147, 166, 167, 168, 169, 170, 171, 172, 173, 174, 193, 194, 195, 196, 197, 198, 199, 200, 201, 220, 221, 222, 223, 224, 225, 226, 227, 228, 247, 248, 249, 250, 251, 252, 253, 254, 255, 274, 275, 276, 277, 278, 279, 280, 281, 282, 301, ...], 'NORTE': [13, 14, 15, 16, 17, 18, 19, 40, 41, 42, 43, 44, 45, 46, 67, 68, 69, 70, 71, 72, 73, 94, 95, 96, 97, 98, 99, 100, 121, 122, 123, 124, 125, 126, 127, 148, 149, 150, 151, 152, 153, 154, 175, 176, 177, 178, 179, 180, 181, 202, 203, 204, 205, 206, 207, 208, 229, 230, 231, 232, 233, 234, 235, 256, 257, 258, 259, 260, 261, 262, 283, 284, 285, 286, 287, 288, 289, 310, 311, 312, 313, 314, 315, 316, 337, 338, 339, 340, 341, 342, 343, 364, 365, 366, 367, 368, 369, 370, 391, 392, ...], 'SUDESTE': [20, 21, 22, 23, 47, 48, 49, 50, 74, 75, 76, 77, 101, 102, 103, 104, 128, 129, 130, 131, 155, 156, 157, 158, 182, 183, 184, 185, 209, 210, 211, 212, 236, 237, 238, 239, 263, 264, 265, 266, 290, 291, 292, 293, 317, 318, 319, 320, 344, 345, 346, 347, 371, 372, 373, 374, 398, 399, 400, 401, 425, 426, 427, 428, 452, 453, 454, 455, 479, 480, 481, 482, 506, 507, 508, 509, 533, 534, 535, 536, 560, 561, 562, 563, 587, 588, 589, 590, 614, 615, 616, 617, 641, 642, 643, 644, 668, 669, 670, 671, ...], 'SUL': [24, 25, 26, 51, 52, 53, 78, 79, 80, 105, 106, 107, 132, 133, 134, 159, 160, 161, 186, 187, 188, 213, 214, 215, 240, 241, 242, 267, 268, 269, 294, 295, 296, 321, 322, 323, 348, 349, 350, 375, 376, 377, 402, 403, 404, 429, 430, 431, 456, 457, 458, 483, 484, 485, 510, 511, 512, 537, 538, 539, 564, 565, 566, 591, 592, 593, 618, 619, 620, 645, 646, 647, 672, 673, 674, 699, 700, 701, 726, 727, 728, 753, 754, 755, 780, 781, 782, 807, 808, 809, 834, 835, 836, 861, 862, 863, 888, 889, 890, 915, ...]}" ] }, "execution_count": 211, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna os grupos obtidos pelo groupby\n", "grupos.groups" ] }, { "cell_type": "code", "execution_count": 212, "id": "personal-leeds", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "{'CENTRO OESTE': array([ 0, 1, 2, ..., 103363, 103364, 103383]),\n", " 'NORDESTE': array([ 4, 5, 6, ..., 103385, 103387, 103391]),\n", " 'NORTE': array([ 13, 14, 15, ..., 103374, 103375, 103379]),\n", " 'SUDESTE': array([ 20, 21, 22, ..., 103377, 103386, 103390]),\n", " 'SUL': array([ 24, 25, 26, ..., 103376, 103388, 103389])}" ] }, "execution_count": 212, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna os índices das linhas/observações de cada grupo\n", "grupos.indices" ] }, { "cell_type": "code", "execution_count": 215, "id": "vietnamese-pressure", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
272004-05-162004-05-22CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO144R$/l1.2710.0391.0601.3000.4480.0310.8230.1110.40941.193100.13552004
...............................................................
1033592019-06-232019-06-29CENTRO OESTEDISTRITO FEDERALGLP42R$/13Kg73.4524.87565.00095.00021.5090.06651.9437.87744.000062.820000.15262019
1033612019-06-232019-06-29CENTRO OESTEGOIASGLP209R$/13Kg71.9685.38153.00085.00015.0440.07556.9244.28545.570061.600000.07562019
1033632019-06-232019-06-29CENTRO OESTEMATO GROSSOGLP95R$/13Kg96.6916.83573.000115.00019.7890.07176.9028.84661.150090.000000.11562019
1033642019-06-232019-06-29CENTRO OESTEMATO GROSSO DO SULGLP115R$/13Kg72.2978.05459.99099.00016.7070.11155.5905.10947.000072.000000.09262019
1033832019-06-232019-06-29CENTRO OESTEMATO GROSSO DO SULGNV2R$/m32.9340.0492.8992.9680.9010.0172.0330.2591.85002.216100.12762019
\n", "

14545 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "27 2004-05-16 2004-05-22 CENTRO OESTE DISTRITO FEDERAL \n", "... ... ... ... ... \n", "103359 2019-06-23 2019-06-29 CENTRO OESTE DISTRITO FEDERAL \n", "103361 2019-06-23 2019-06-29 CENTRO OESTE GOIAS \n", "103363 2019-06-23 2019-06-29 CENTRO OESTE MATO GROSSO \n", "103364 2019-06-23 2019-06-29 CENTRO OESTE MATO GROSSO DO SUL \n", "103383 2019-06-23 2019-06-29 CENTRO OESTE MATO GROSSO DO SUL \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "27 ETANOL HIDRATADO 144 R$/l \n", "... ... ... ... \n", "103359 GLP 42 R$/13Kg \n", "103361 GLP 209 R$/13Kg \n", "103363 GLP 95 R$/13Kg \n", "103364 GLP 115 R$/13Kg \n", "103383 GNV 2 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "27 1.271 0.039 1.060 \n", "... ... ... ... \n", "103359 73.452 4.875 65.000 \n", "103361 71.968 5.381 53.000 \n", "103363 96.691 6.835 73.000 \n", "103364 72.297 8.054 59.990 \n", "103383 2.934 0.049 2.899 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "27 1.300 0.448 0.031 \n", "... ... ... ... \n", "103359 95.000 21.509 0.066 \n", "103361 85.000 15.044 0.075 \n", "103363 115.000 19.789 0.071 \n", "103364 99.000 16.707 0.111 \n", "103383 2.968 0.901 0.017 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "27 0.823 0.111 \n", "... ... ... \n", "103359 51.943 7.877 \n", "103361 56.924 4.285 \n", "103363 76.902 8.846 \n", "103364 55.590 5.109 \n", "103383 2.033 0.259 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "27 0.4094 1.19310 \n", "... ... ... \n", "103359 44.0000 62.82000 \n", "103361 45.5700 61.60000 \n", "103363 61.1500 90.00000 \n", "103364 47.0000 72.00000 \n", "103383 1.8500 2.21610 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "27 0.135 5 2004 \n", "... ... ... ... \n", "103359 0.152 6 2019 \n", "103361 0.075 6 2019 \n", "103363 0.115 6 2019 \n", "103364 0.092 6 2019 \n", "103383 0.127 6 2019 \n", "\n", "[14545 rows x 20 columns]" ] }, "execution_count": 215, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# retorna um dataframe apenas com as observações do grupo 'CENTRO OESTE'\n", "grupos.get_group('CENTRO OESTE')" ] }, { "cell_type": "code", "execution_count": 217, "id": "grave-friendship", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDA...MÊSANO
countmeanstdmin25%50%75%maxcountmean...75%maxcountmeanstdmin25%50%75%max
REGIÃO
CENTRO OESTE14545.0144.898453105.6993401.080.0128.0192.0766.014545.012.299706...9.012.014545.02011.7735994.4090362004.02008.02012.02016.02019.0
NORDESTE35788.0124.721834113.1108081.041.095.0169.0625.035788.09.558746...10.012.035788.02011.7044544.4180462004.02008.02012.02016.02019.0
NORTE24000.067.83595852.9613421.031.053.095.0383.024000.012.633086...9.012.024000.02011.8120834.4109142004.02008.02012.02016.02019.0
SUDESTE16744.0726.068024787.5889351.0168.0412.0996.04167.016744.09.828218...9.012.016744.02011.7078954.3954362004.02008.02012.02016.02019.0
SUL12315.0366.266423233.2762851.0188.0368.0563.01416.012315.010.254388...9.012.012315.02011.6816084.4083122004.02008.02012.02015.02019.0
\n", "

5 rows × 112 columns

\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS \\\n", " count mean std min 25% \n", "REGIÃO \n", "CENTRO OESTE 14545.0 144.898453 105.699340 1.0 80.0 \n", "NORDESTE 35788.0 124.721834 113.110808 1.0 41.0 \n", "NORTE 24000.0 67.835958 52.961342 1.0 31.0 \n", "SUDESTE 16744.0 726.068024 787.588935 1.0 168.0 \n", "SUL 12315.0 366.266423 233.276285 1.0 188.0 \n", "\n", " PREÇO MÉDIO REVENDA ... MÊS \\\n", " 50% 75% max count mean ... 75% \n", "REGIÃO ... \n", "CENTRO OESTE 128.0 192.0 766.0 14545.0 12.299706 ... 9.0 \n", "NORDESTE 95.0 169.0 625.0 35788.0 9.558746 ... 10.0 \n", "NORTE 53.0 95.0 383.0 24000.0 12.633086 ... 9.0 \n", "SUDESTE 412.0 996.0 4167.0 16744.0 9.828218 ... 9.0 \n", "SUL 368.0 563.0 1416.0 12315.0 10.254388 ... 9.0 \n", "\n", " ANO \\\n", " max count mean std min 25% 50% \n", "REGIÃO \n", "CENTRO OESTE 12.0 14545.0 2011.773599 4.409036 2004.0 2008.0 2012.0 \n", "NORDESTE 12.0 35788.0 2011.704454 4.418046 2004.0 2008.0 2012.0 \n", "NORTE 12.0 24000.0 2011.812083 4.410914 2004.0 2008.0 2012.0 \n", "SUDESTE 12.0 16744.0 2011.707895 4.395436 2004.0 2008.0 2012.0 \n", "SUL 12.0 12315.0 2011.681608 4.408312 2004.0 2008.0 2012.0 \n", "\n", " \n", " 75% max \n", "REGIÃO \n", "CENTRO OESTE 2016.0 2019.0 \n", "NORDESTE 2016.0 2019.0 \n", "NORTE 2016.0 2019.0 \n", "SUDESTE 2016.0 2019.0 \n", "SUL 2015.0 2019.0 \n", "\n", "[5 rows x 112 columns]" ] }, "execution_count": 217, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# descreva para nós algumas estatística descritivas para as observações de cada grupo\n", "grupos.describe()" ] }, { "cell_type": "code", "execution_count": 219, "id": "saving-easter", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
REGIÃO
CENTRO OESTE144.89845312.2997060.69507810.61007713.9931562.4380770.0420779.8616290.6922598.51118611.1304780.0392886.4833962011.773599
NORDESTE124.7218349.5587460.5522308.37517310.7880182.0691980.0412477.4895490.5140936.5632848.4619560.0478876.4878452011.704454
NORTE67.83595812.6330860.71895711.41017614.4481372.2217460.04748010.4113400.4425669.50532811.3145340.0344856.4884582011.812083
SUDESTE726.0680249.8282180.6786087.96639611.8946712.3357090.0551267.4925090.5854456.0007209.3304760.0607786.4818442011.707895
SUL366.26642310.2543880.7293388.43437612.3911342.2831910.0470457.9711970.7267746.4430759.8510080.0561626.4767362011.681608
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 144.898453 12.299706 \n", "NORDESTE 124.721834 9.558746 \n", "NORTE 67.835958 12.633086 \n", "SUDESTE 726.068024 9.828218 \n", "SUL 366.266423 10.254388 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 0.695078 10.610077 \n", "NORDESTE 0.552230 8.375173 \n", "NORTE 0.718957 11.410176 \n", "SUDESTE 0.678608 7.966396 \n", "SUL 0.729338 8.434376 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 13.993156 2.438077 \n", "NORDESTE 10.788018 2.069198 \n", "NORTE 14.448137 2.221746 \n", "SUDESTE 11.894671 2.335709 \n", "SUL 12.391134 2.283191 \n", "\n", " COEF DE VARIAÇÃO REVENDA PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.042077 9.861629 \n", "NORDESTE 0.041247 7.489549 \n", "NORTE 0.047480 10.411340 \n", "SUDESTE 0.055126 7.492509 \n", "SUL 0.047045 7.971197 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.692259 8.511186 \n", "NORDESTE 0.514093 6.563284 \n", "NORTE 0.442566 9.505328 \n", "SUDESTE 0.585445 6.000720 \n", "SUL 0.726774 6.443075 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO COEF DE VARIAÇÃO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 11.130478 0.039288 \n", "NORDESTE 8.461956 0.047887 \n", "NORTE 11.314534 0.034485 \n", "SUDESTE 9.330476 0.060778 \n", "SUL 9.851008 0.056162 \n", "\n", " MÊS ANO \n", "REGIÃO \n", "CENTRO OESTE 6.483396 2011.773599 \n", "NORDESTE 6.487845 2011.704454 \n", "NORTE 6.488458 2011.812083 \n", "SUDESTE 6.481844 2011.707895 \n", "SUL 6.476736 2011.681608 " ] }, "execution_count": 219, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos.mean()" ] }, { "cell_type": "code", "execution_count": 221, "id": "federal-runner", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
REGIÃO
CENTRO OESTE2004-05-092004-05-15DISTRITO FEDERALETANOL HIDRATADO1R$/13Kg1.0970.00.871.0990.0310.00.7370.00.387900.83590.012004
NORDESTE2004-05-092004-05-15ALAGOASETANOL HIDRATADO1R$/13Kg0.9750.00.790.9990.0390.00.5860.00.363200.59920.012004
NORTE2004-05-092004-05-15ACREETANOL HIDRATADO1R$/13Kg1.2260.01.051.3000.0220.00.6740.00.510220.96120.012004
SUDESTE2004-05-092004-05-15ESPIRITO SANTOETANOL HIDRATADO1R$/13Kg0.7660.00.591.0990.0010.00.5060.00.325700.78220.012004
SUL2004-05-092004-05-15PARANAETANOL HIDRATADO1R$/13Kg0.9220.00.731.1990.0250.00.6670.00.430000.70440.012004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL ESTADO PRODUTO \\\n", "REGIÃO \n", "CENTRO OESTE 2004-05-09 2004-05-15 DISTRITO FEDERAL ETANOL HIDRATADO \n", "NORDESTE 2004-05-09 2004-05-15 ALAGOAS ETANOL HIDRATADO \n", "NORTE 2004-05-09 2004-05-15 ACRE ETANOL HIDRATADO \n", "SUDESTE 2004-05-09 2004-05-15 ESPIRITO SANTO ETANOL HIDRATADO \n", "SUL 2004-05-09 2004-05-15 PARANA ETANOL HIDRATADO \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "REGIÃO \n", "CENTRO OESTE 1 R$/13Kg \n", "NORDESTE 1 R$/13Kg \n", "NORTE 1 R$/13Kg \n", "SUDESTE 1 R$/13Kg \n", "SUL 1 R$/13Kg \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 1.097 0.0 \n", "NORDESTE 0.975 0.0 \n", "NORTE 1.226 0.0 \n", "SUDESTE 0.766 0.0 \n", "SUL 0.922 0.0 \n", "\n", " PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 0.87 1.099 \n", "NORDESTE 0.79 0.999 \n", "NORTE 1.05 1.300 \n", "SUDESTE 0.59 1.099 \n", "SUL 0.73 1.199 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 0.031 0.0 \n", "NORDESTE 0.039 0.0 \n", "NORTE 0.022 0.0 \n", "SUDESTE 0.001 0.0 \n", "SUL 0.025 0.0 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.737 0.0 \n", "NORDESTE 0.586 0.0 \n", "NORTE 0.674 0.0 \n", "SUDESTE 0.506 0.0 \n", "SUL 0.667 0.0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.38790 0.8359 \n", "NORDESTE 0.36320 0.5992 \n", "NORTE 0.51022 0.9612 \n", "SUDESTE 0.32570 0.7822 \n", "SUL 0.43000 0.7044 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "REGIÃO \n", "CENTRO OESTE 0.0 1 2004 \n", "NORDESTE 0.0 1 2004 \n", "NORTE 0.0 1 2004 \n", "SUDESTE 0.0 1 2004 \n", "SUL 0.0 1 2004 " ] }, "execution_count": 221, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos.min()" ] }, { "cell_type": "code", "execution_count": 222, "id": "marine-header", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
REGIÃO
CENTRO OESTE2004-05-092004-05-15DISTRITO FEDERALETANOL HIDRATADO1R$/13Kg1.0970.00.871.0990.0310.00.7370.00.387900.83590.012004
NORDESTE2004-05-092004-05-15ALAGOASETANOL HIDRATADO1R$/13Kg0.9750.00.790.9990.0390.00.5860.00.363200.59920.012004
NORTE2004-05-092004-05-15ACREETANOL HIDRATADO1R$/13Kg1.2260.01.051.3000.0220.00.6740.00.510220.96120.012004
SUDESTE2004-05-092004-05-15ESPIRITO SANTOETANOL HIDRATADO1R$/13Kg0.7660.00.591.0990.0010.00.5060.00.325700.78220.012004
SUL2004-05-092004-05-15PARANAETANOL HIDRATADO1R$/13Kg0.9220.00.731.1990.0250.00.6670.00.430000.70440.012004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL ESTADO PRODUTO \\\n", "REGIÃO \n", "CENTRO OESTE 2004-05-09 2004-05-15 DISTRITO FEDERAL ETANOL HIDRATADO \n", "NORDESTE 2004-05-09 2004-05-15 ALAGOAS ETANOL HIDRATADO \n", "NORTE 2004-05-09 2004-05-15 ACRE ETANOL HIDRATADO \n", "SUDESTE 2004-05-09 2004-05-15 ESPIRITO SANTO ETANOL HIDRATADO \n", "SUL 2004-05-09 2004-05-15 PARANA ETANOL HIDRATADO \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "REGIÃO \n", "CENTRO OESTE 1 R$/13Kg \n", "NORDESTE 1 R$/13Kg \n", "NORTE 1 R$/13Kg \n", "SUDESTE 1 R$/13Kg \n", "SUL 1 R$/13Kg \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 1.097 0.0 \n", "NORDESTE 0.975 0.0 \n", "NORTE 1.226 0.0 \n", "SUDESTE 0.766 0.0 \n", "SUL 0.922 0.0 \n", "\n", " PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 0.87 1.099 \n", "NORDESTE 0.79 0.999 \n", "NORTE 1.05 1.300 \n", "SUDESTE 0.59 1.099 \n", "SUL 0.73 1.199 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "REGIÃO \n", "CENTRO OESTE 0.031 0.0 \n", "NORDESTE 0.039 0.0 \n", "NORTE 0.022 0.0 \n", "SUDESTE 0.001 0.0 \n", "SUL 0.025 0.0 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.737 0.0 \n", "NORDESTE 0.586 0.0 \n", "NORTE 0.674 0.0 \n", "SUDESTE 0.506 0.0 \n", "SUL 0.667 0.0 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "REGIÃO \n", "CENTRO OESTE 0.38790 0.8359 \n", "NORDESTE 0.36320 0.5992 \n", "NORTE 0.51022 0.9612 \n", "SUDESTE 0.32570 0.7822 \n", "SUL 0.43000 0.7044 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "REGIÃO \n", "CENTRO OESTE 0.0 1 2004 \n", "NORDESTE 0.0 1 2004 \n", "NORTE 0.0 1 2004 \n", "SUDESTE 0.0 1 2004 \n", "SUL 0.0 1 2004 " ] }, "execution_count": 222, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.groupby('REGIÃO').min()" ] }, { "cell_type": "markdown", "id": "outdoor-ladder", "metadata": {}, "source": [ "
\n", "\n", "Também podemos ter agrupamentos por mais de um atributo." ] }, { "cell_type": "code", "execution_count": 229, "id": "administrative-reset", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.191.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.891.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.181.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.091.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.051.4000.2400.0660.9410.0770.74411.031700.08252004
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.19 \n", "1 1.162 0.114 0.89 \n", "2 1.389 0.097 1.18 \n", "3 1.262 0.070 1.09 \n", "4 1.181 0.078 1.05 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 " ] }, "execution_count": 229, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.head()" ] }, { "cell_type": "markdown", "id": "compound-defendant", "metadata": {}, "source": [ "#### Qual é o preço médio de cada do Produto (Combustível) para cada Região?" ] }, { "cell_type": "code", "execution_count": 231, "id": "sophisticated-surge", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 231, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Agrupa os registros do dataframe primeiramente por suas regiões.\n", "# Então, agrupa os registros de cada região (grupo) de acordo com seus produtos.\n", "grupos = data_final.groupby(['REGIÃO', 'PRODUTO'])\n", "grupos" ] }, { "cell_type": "code", "execution_count": 232, "id": "brilliant-central", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "{('CENTRO OESTE', 'ETANOL HIDRATADO'): [0, 1, 2, 3, 27, 28, 29, 30, 54, 55, 56, 57, 81, 82, 83, 84, 108, 109, 110, 111, 135, 136, 137, 138, 162, 163, 164, 165, 189, 190, 191, 192, 216, 217, 218, 219, 243, 244, 245, 246, 270, 271, 272, 273, 297, 298, 299, 300, 324, 325, 326, 327, 351, 352, 353, 354, 378, 379, 380, 381, 405, 406, 407, 408, 432, 433, 434, 435, 459, 460, 461, 462, 486, 487, 488, 489, 513, 514, 515, 516, 540, 541, 542, 543, 567, 568, 569, 570, 594, 595, 596, 597, 621, 622, 623, 624, 648, 649, 650, 651, ...], ('CENTRO OESTE', 'GASOLINA COMUM'): [11980, 11981, 11982, 11983, 12007, 12008, 12009, 12010, 12034, 12035, 12036, 12037, 12061, 12062, 12063, 12064, 12088, 12089, 12090, 12091, 12115, 12116, 12117, 12118, 12142, 12143, 12144, 12145, 12169, 12170, 12171, 12172, 12196, 12197, 12198, 12199, 12223, 12224, 12225, 12226, 12250, 12251, 12252, 12253, 12277, 12278, 12279, 12280, 12304, 12305, 12306, 12307, 12331, 12332, 12333, 12334, 12358, 12359, 12360, 12361, 12385, 12386, 12387, 12388, 12412, 12413, 12414, 12415, 12439, 12440, 12441, 12442, 12466, 12467, 12468, 12469, 12493, 12494, 12495, 12496, 12520, 12521, 12522, 12523, 12547, 12548, 12549, 12550, 12574, 12575, 12576, 12577, 12601, 12602, 12603, 12604, 12628, 12629, 12630, 12631, ...], ('CENTRO OESTE', 'GLP'): [24019, 24020, 24021, 24022, 24046, 24047, 24048, 24049, 24073, 24074, 24075, 24076, 24100, 24101, 24102, 24103, 24127, 24128, 24129, 24130, 24154, 24155, 24156, 24157, 24181, 24182, 24183, 24184, 24208, 24209, 24210, 24211, 24235, 24236, 24237, 24238, 24262, 24263, 24264, 24265, 24289, 24290, 24291, 24292, 24316, 24317, 24318, 24319, 24343, 24344, 24345, 24346, 24370, 24371, 24372, 24373, 24397, 24398, 24399, 24400, 24424, 24425, 24426, 24427, 24451, 24452, 24453, 24454, 24478, 24479, 24480, 24481, 24505, 24506, 24507, 24508, 24532, 24533, 24534, 24535, 24558, 24559, 24560, 24561, 24585, 24586, 24587, 24588, 24612, 24613, 24614, 24615, 24639, 24640, 24641, 24642, 24666, 24667, 24668, 24669, ...], ('CENTRO OESTE', 'GNV'): [35892, 35907, 35922, 35937, 35952, 35967, 35982, 35997, 36012, 36027, 36042, 36057, 36072, 36087, 36102, 36117, 36132, 36147, 36162, 36177, 36192, 36207, 36222, 36237, 36252, 36267, 36283, 36298, 36313, 36329, 36345, 36360, 36375, 36390, 36405, 36420, 36436, 36451, 36466, 36481, 36495, 36510, 36525, 36541, 36557, 36572, 36588, 36604, 36620, 36635, 36650, 36665, 36680, 36695, 36710, 36725, 36740, 36755, 36770, 36785, 36800, 36815, 36830, 36845, 36860, 36875, 36890, 36918, 36932, 36948, 36962, 36991, 37006, 37021, 37037, 37053, 37068, 37084, 37100, 37116, 37132, 37148, 37164, 37180, 37196, 37212, 37228, 37244, 37259, 37275, 37291, 37307, 37323, 37339, 37355, 37371, 37387, 37403, 37419, 37435, ...], ('CENTRO OESTE', 'ÓLEO DIESEL'): [42612, 42613, 42614, 42615, 42639, 42640, 42641, 42642, 42666, 42667, 42668, 42669, 42693, 42694, 42695, 42696, 42720, 42721, 42722, 42723, 42747, 42748, 42749, 42750, 42774, 42775, 42776, 42777, 42801, 42802, 42803, 42804, 42828, 42829, 42830, 42831, 42855, 42856, 42857, 42858, 42882, 42883, 42884, 42885, 42909, 42910, 42911, 42912, 42936, 42937, 42938, 42939, 42963, 42964, 42965, 42966, 42990, 42991, 42992, 42993, 43017, 43018, 43019, 43020, 43044, 43045, 43046, 43047, 43071, 43072, 43073, 43074, 43098, 43099, 43100, 43101, 43125, 43126, 43127, 43128, 43152, 43153, 43154, 43155, 43179, 43180, 43181, 43182, 43206, 43207, 43208, 43209, 43233, 43234, 43235, 43236, 43260, 43261, 43262, 43263, ...], ('CENTRO OESTE', 'ÓLEO DIESEL S10'): [54834, 54835, 54973, 54975, 54976, 55117, 55119, 55120, 55260, 55262, 55264, 55265, 55405, 55407, 55408, 55549, 55551, 55552, 55692, 55694, 55695, 55835, 55837, 55838, 55981, 55983, 55984, 56128, 56130, 56131, 56276, 56278, 56279, 56421, 56423, 56424, 56566, 56568, 56569, 56711, 56713, 56714, 56854, 56856, 56858, 56859, 57002, 57004, 57006, 57007, 57148, 57150, 57152, 57153, 57293, 57295, 57297, 57298, 57440, 57442, 57444, 57445, 57586, 57588, 57590, 57591, 57732, 57734, 57736, 57737, 57879, 57881, 57883, 57884, 58027, 58029, 58030, 58174, 58176, 58177, 58317, 58319, 58320, 58461, 58463, 58464, 58607, 58609, 58610, 58750, 58752, 58753, 58894, 58896, 58897, 59040, 59042, 59043, 59184, 59186, ...], ('NORDESTE', 'ETANOL HIDRATADO'): [4, 5, 6, 7, 8, 9, 10, 11, 12, 31, 32, 33, 34, 35, 36, 37, 38, 39, 58, 59, 60, 61, 62, 63, 64, 65, 66, 85, 86, 87, 88, 89, 90, 91, 92, 93, 112, 113, 114, 115, 116, 117, 118, 119, 120, 139, 140, 141, 142, 143, 144, 145, 146, 147, 166, 167, 168, 169, 170, 171, 172, 173, 174, 193, 194, 195, 196, 197, 198, 199, 200, 201, 220, 221, 222, 223, 224, 225, 226, 227, 228, 247, 248, 249, 250, 251, 252, 253, 254, 255, 274, 275, 276, 277, 278, 279, 280, 281, 282, 301, ...], ('NORDESTE', 'GASOLINA COMUM'): [11984, 11985, 11986, 11987, 11988, 11989, 11990, 11991, 11992, 12011, 12012, 12013, 12014, 12015, 12016, 12017, 12018, 12019, 12038, 12039, 12040, 12041, 12042, 12043, 12044, 12045, 12046, 12065, 12066, 12067, 12068, 12069, 12070, 12071, 12072, 12073, 12092, 12093, 12094, 12095, 12096, 12097, 12098, 12099, 12100, 12119, 12120, 12121, 12122, 12123, 12124, 12125, 12126, 12127, 12146, 12147, 12148, 12149, 12150, 12151, 12152, 12153, 12154, 12173, 12174, 12175, 12176, 12177, 12178, 12179, 12180, 12181, 12200, 12201, 12202, 12203, 12204, 12205, 12206, 12207, 12208, 12227, 12228, 12229, 12230, 12231, 12232, 12233, 12234, 12235, 12254, 12255, 12256, 12257, 12258, 12259, 12260, 12261, 12262, 12281, ...], ('NORDESTE', 'GLP'): [24023, 24024, 24025, 24026, 24027, 24028, 24029, 24030, 24031, 24050, 24051, 24052, 24053, 24054, 24055, 24056, 24057, 24058, 24077, 24078, 24079, 24080, 24081, 24082, 24083, 24084, 24085, 24104, 24105, 24106, 24107, 24108, 24109, 24110, 24111, 24112, 24131, 24132, 24133, 24134, 24135, 24136, 24137, 24138, 24139, 24158, 24159, 24160, 24161, 24162, 24163, 24164, 24165, 24166, 24185, 24186, 24187, 24188, 24189, 24190, 24191, 24192, 24193, 24212, 24213, 24214, 24215, 24216, 24217, 24218, 24219, 24220, 24239, 24240, 24241, 24242, 24243, 24244, 24245, 24246, 24247, 24266, 24267, 24268, 24269, 24270, 24271, 24272, 24273, 24274, 24293, 24294, 24295, 24296, 24297, 24298, 24299, 24300, 24301, 24320, ...], ('NORDESTE', 'GNV'): [35893, 35894, 35895, 35896, 35897, 35898, 35899, 35908, 35909, 35910, 35911, 35912, 35913, 35914, 35923, 35924, 35925, 35926, 35927, 35928, 35929, 35938, 35939, 35940, 35941, 35942, 35943, 35944, 35953, 35954, 35955, 35956, 35957, 35958, 35959, 35968, 35969, 35970, 35971, 35972, 35973, 35974, 35983, 35984, 35985, 35986, 35987, 35988, 35989, 35998, 35999, 36000, 36001, 36002, 36003, 36004, 36013, 36014, 36015, 36016, 36017, 36018, 36019, 36028, 36029, 36030, 36031, 36032, 36033, 36034, 36043, 36044, 36045, 36046, 36047, 36048, 36049, 36058, 36059, 36060, 36061, 36062, 36063, 36064, 36073, 36074, 36075, 36076, 36077, 36078, 36079, 36088, 36089, 36090, 36091, 36092, 36093, 36094, 36103, 36104, ...], ('NORDESTE', 'ÓLEO DIESEL'): [42616, 42617, 42618, 42619, 42620, 42621, 42622, 42623, 42624, 42643, 42644, 42645, 42646, 42647, 42648, 42649, 42650, 42651, 42670, 42671, 42672, 42673, 42674, 42675, 42676, 42677, 42678, 42697, 42698, 42699, 42700, 42701, 42702, 42703, 42704, 42705, 42724, 42725, 42726, 42727, 42728, 42729, 42730, 42731, 42732, 42751, 42752, 42753, 42754, 42755, 42756, 42757, 42758, 42759, 42778, 42779, 42780, 42781, 42782, 42783, 42784, 42785, 42786, 42805, 42806, 42807, 42808, 42809, 42810, 42811, 42812, 42813, 42832, 42833, 42834, 42835, 42836, 42837, 42838, 42839, 42840, 42859, 42860, 42861, 42862, 42863, 42864, 42865, 42866, 42867, 42886, 42887, 42888, 42889, 42890, 42891, 42892, 42893, 42894, 42913, ...], ('NORDESTE', 'ÓLEO DIESEL S10'): [54702, 54703, 54706, 54707, 54829, 54831, 54832, 54833, 54839, 54840, 54842, 54847, 54968, 54970, 54971, 54974, 54979, 54981, 54982, 54984, 54989, 55112, 55114, 55115, 55118, 55123, 55125, 55126, 55128, 55133, 55256, 55258, 55259, 55263, 55268, 55270, 55271, 55273, 55278, 55400, 55402, 55403, 55406, 55411, 55413, 55414, 55416, 55421, 55544, 55546, 55547, 55550, 55555, 55557, 55558, 55560, 55565, 55687, 55689, 55690, 55693, 55698, 55700, 55701, 55703, 55708, 55830, 55832, 55833, 55836, 55841, 55843, 55844, 55846, 55852, 55976, 55978, 55979, 55982, 55987, 55989, 55990, 55992, 55998, 56122, 56125, 56126, 56129, 56134, 56136, 56137, 56139, 56145, 56270, 56273, 56274, 56277, 56282, 56284, 56285, ...], ('NORTE', 'ETANOL HIDRATADO'): [13, 14, 15, 16, 17, 18, 19, 40, 41, 42, 43, 44, 45, 46, 67, 68, 69, 70, 71, 72, 73, 94, 95, 96, 97, 98, 99, 100, 121, 122, 123, 124, 125, 126, 127, 148, 149, 150, 151, 152, 153, 154, 175, 176, 177, 178, 179, 180, 181, 202, 203, 204, 205, 206, 207, 208, 229, 230, 231, 232, 233, 234, 235, 256, 257, 258, 259, 260, 261, 262, 283, 284, 285, 286, 287, 288, 289, 310, 311, 312, 313, 314, 315, 316, 337, 338, 339, 340, 341, 342, 343, 364, 365, 366, 367, 368, 369, 370, 391, 392, ...], ('NORTE', 'GASOLINA COMUM'): [11993, 11994, 11995, 11996, 11997, 11998, 11999, 12020, 12021, 12022, 12023, 12024, 12025, 12026, 12047, 12048, 12049, 12050, 12051, 12052, 12053, 12074, 12075, 12076, 12077, 12078, 12079, 12080, 12101, 12102, 12103, 12104, 12105, 12106, 12107, 12128, 12129, 12130, 12131, 12132, 12133, 12134, 12155, 12156, 12157, 12158, 12159, 12160, 12161, 12182, 12183, 12184, 12185, 12186, 12187, 12188, 12209, 12210, 12211, 12212, 12213, 12214, 12215, 12236, 12237, 12238, 12239, 12240, 12241, 12242, 12263, 12264, 12265, 12266, 12267, 12268, 12269, 12290, 12291, 12292, 12293, 12294, 12295, 12296, 12317, 12318, 12319, 12320, 12321, 12322, 12323, 12344, 12345, 12346, 12347, 12348, 12349, 12350, 12371, 12372, ...], ('NORTE', 'GLP'): [24032, 24033, 24034, 24035, 24036, 24037, 24038, 24059, 24060, 24061, 24062, 24063, 24064, 24065, 24086, 24087, 24088, 24089, 24090, 24091, 24092, 24113, 24114, 24115, 24116, 24117, 24118, 24119, 24140, 24141, 24142, 24143, 24144, 24145, 24146, 24167, 24168, 24169, 24170, 24171, 24172, 24173, 24194, 24195, 24196, 24197, 24198, 24199, 24200, 24221, 24222, 24223, 24224, 24225, 24226, 24227, 24248, 24249, 24250, 24251, 24252, 24253, 24254, 24275, 24276, 24277, 24278, 24279, 24280, 24281, 24302, 24303, 24304, 24305, 24306, 24307, 24308, 24329, 24330, 24331, 24332, 24333, 24334, 24335, 24356, 24357, 24358, 24359, 24360, 24361, 24362, 24383, 24384, 24385, 24386, 24387, 24388, 24389, 24410, 24411, ...], ('NORTE', 'GNV'): [36940, 37029, 37045, 37076, 37092, 37108, 37124, 37140, 37156, 37172, 37188, 37204, 37220, 37236, 37267, 37283, 37299, 37315, 37331, 37347, 37363, 37379, 37395, 37411, 37427, 37443, 37459, 37475, 37491, 37507, 37524, 37540, 37556, 37572, 37589, 37606, 37622, 37639, 37655, 37671, 37687, 37704, 37721, 37752, 37768, 37783, 37799, 37816, 37833, 37849, 37865, 37882, 37898, 37914, 37931, 37947, 37963, 37979, 37995, 38011, 38027, 38043, 38059, 38075, 38091, 38122, 38169, 38202, 38218, 38235, 38252, 38269, 38302, 38319, 38336, 38369, 38402, 38434, 38466, 39051, 39082, 39099, 39553, 39628, 39644, 40219, 40574, 40634, 40663, 40694, 41442, 42148, 42235, 42350, 42379, 42394, 42423, 42438, 42466, 42537, ...], ('NORTE', 'ÓLEO DIESEL'): [42625, 42626, 42627, 42628, 42629, 42630, 42631, 42652, 42653, 42654, 42655, 42656, 42657, 42658, 42679, 42680, 42681, 42682, 42683, 42684, 42685, 42706, 42707, 42708, 42709, 42710, 42711, 42712, 42733, 42734, 42735, 42736, 42737, 42738, 42739, 42760, 42761, 42762, 42763, 42764, 42765, 42766, 42787, 42788, 42789, 42790, 42791, 42792, 42793, 42814, 42815, 42816, 42817, 42818, 42819, 42820, 42841, 42842, 42843, 42844, 42845, 42846, 42847, 42868, 42869, 42870, 42871, 42872, 42873, 42874, 42895, 42896, 42897, 42898, 42899, 42900, 42901, 42922, 42923, 42924, 42925, 42926, 42927, 42928, 42949, 42950, 42951, 42952, 42953, 42954, 42955, 42976, 42977, 42978, 42979, 42980, 42981, 42982, 43003, 43004, ...], ('NORTE', 'ÓLEO DIESEL S10'): [54705, 54709, 54830, 54837, 54844, 54969, 54978, 54986, 55111, 55113, 55122, 55130, 55257, 55267, 55275, 55399, 55401, 55410, 55418, 55422, 55543, 55545, 55554, 55562, 55566, 55686, 55688, 55697, 55705, 55709, 55829, 55831, 55840, 55848, 55849, 55853, 55975, 55977, 55986, 55994, 55995, 55999, 56121, 56123, 56124, 56133, 56141, 56142, 56146, 56269, 56271, 56272, 56281, 56289, 56290, 56294, 56414, 56416, 56417, 56426, 56434, 56435, 56439, 56559, 56561, 56562, 56571, 56579, 56580, 56584, 56704, 56706, 56707, 56716, 56724, 56725, 56729, 56848, 56850, 56851, 56861, 56869, 56870, 56874, 56996, 56998, 56999, 57009, 57017, 57018, 57022, 57142, 57144, 57145, 57155, 57163, 57164, 57168, 57287, 57289, ...], ('SUDESTE', 'ETANOL HIDRATADO'): [20, 21, 22, 23, 47, 48, 49, 50, 74, 75, 76, 77, 101, 102, 103, 104, 128, 129, 130, 131, 155, 156, 157, 158, 182, 183, 184, 185, 209, 210, 211, 212, 236, 237, 238, 239, 263, 264, 265, 266, 290, 291, 292, 293, 317, 318, 319, 320, 344, 345, 346, 347, 371, 372, 373, 374, 398, 399, 400, 401, 425, 426, 427, 428, 452, 453, 454, 455, 479, 480, 481, 482, 506, 507, 508, 509, 533, 534, 535, 536, 560, 561, 562, 563, 587, 588, 589, 590, 614, 615, 616, 617, 641, 642, 643, 644, 668, 669, 670, 671, ...], ('SUDESTE', 'GASOLINA COMUM'): [12000, 12001, 12002, 12003, 12027, 12028, 12029, 12030, 12054, 12055, 12056, 12057, 12081, 12082, 12083, 12084, 12108, 12109, 12110, 12111, 12135, 12136, 12137, 12138, 12162, 12163, 12164, 12165, 12189, 12190, 12191, 12192, 12216, 12217, 12218, 12219, 12243, 12244, 12245, 12246, 12270, 12271, 12272, 12273, 12297, 12298, 12299, 12300, 12324, 12325, 12326, 12327, 12351, 12352, 12353, 12354, 12378, 12379, 12380, 12381, 12405, 12406, 12407, 12408, 12432, 12433, 12434, 12435, 12459, 12460, 12461, 12462, 12486, 12487, 12488, 12489, 12513, 12514, 12515, 12516, 12540, 12541, 12542, 12543, 12567, 12568, 12569, 12570, 12594, 12595, 12596, 12597, 12621, 12622, 12623, 12624, 12648, 12649, 12650, 12651, ...], ('SUDESTE', 'GLP'): [24039, 24040, 24041, 24042, 24066, 24067, 24068, 24069, 24093, 24094, 24095, 24096, 24120, 24121, 24122, 24123, 24147, 24148, 24149, 24150, 24174, 24175, 24176, 24177, 24201, 24202, 24203, 24204, 24228, 24229, 24230, 24231, 24255, 24256, 24257, 24258, 24282, 24283, 24284, 24285, 24309, 24310, 24311, 24312, 24336, 24337, 24338, 24339, 24363, 24364, 24365, 24366, 24390, 24391, 24392, 24393, 24417, 24418, 24419, 24420, 24444, 24445, 24446, 24447, 24471, 24472, 24473, 24474, 24498, 24499, 24500, 24501, 24525, 24526, 24527, 24528, 24551, 24552, 24553, 24554, 24578, 24579, 24580, 24581, 24605, 24606, 24607, 24608, 24632, 24633, 24634, 24635, 24659, 24660, 24661, 24662, 24686, 24687, 24688, 24689, ...], ('SUDESTE', 'GNV'): [35900, 35901, 35902, 35903, 35915, 35916, 35917, 35918, 35930, 35931, 35932, 35933, 35945, 35946, 35947, 35948, 35960, 35961, 35962, 35963, 35975, 35976, 35977, 35978, 35990, 35991, 35992, 35993, 36005, 36006, 36007, 36008, 36020, 36021, 36022, 36023, 36035, 36036, 36037, 36038, 36050, 36051, 36052, 36053, 36065, 36066, 36067, 36068, 36080, 36081, 36082, 36083, 36095, 36096, 36097, 36098, 36110, 36111, 36112, 36113, 36125, 36126, 36127, 36128, 36140, 36141, 36142, 36143, 36155, 36156, 36157, 36158, 36170, 36171, 36172, 36173, 36185, 36186, 36187, 36188, 36200, 36201, 36202, 36203, 36215, 36216, 36217, 36218, 36230, 36231, 36232, 36233, 36245, 36246, 36247, 36248, 36260, 36261, 36262, 36263, ...], ('SUDESTE', 'ÓLEO DIESEL'): [42632, 42633, 42634, 42635, 42659, 42660, 42661, 42662, 42686, 42687, 42688, 42689, 42713, 42714, 42715, 42716, 42740, 42741, 42742, 42743, 42767, 42768, 42769, 42770, 42794, 42795, 42796, 42797, 42821, 42822, 42823, 42824, 42848, 42849, 42850, 42851, 42875, 42876, 42877, 42878, 42902, 42903, 42904, 42905, 42929, 42930, 42931, 42932, 42956, 42957, 42958, 42959, 42983, 42984, 42985, 42986, 43010, 43011, 43012, 43013, 43037, 43038, 43039, 43040, 43064, 43065, 43066, 43067, 43091, 43092, 43093, 43094, 43118, 43119, 43120, 43121, 43145, 43146, 43147, 43148, 43172, 43173, 43174, 43175, 43199, 43200, 43201, 43202, 43226, 43227, 43228, 43229, 43253, 43254, 43255, 43256, 43280, 43281, 43282, 43283, ...], ('SUDESTE', 'ÓLEO DIESEL S10'): [54704, 54711, 54836, 54841, 54846, 54972, 54977, 54983, 54988, 55116, 55121, 55127, 55132, 55261, 55266, 55272, 55277, 55404, 55409, 55415, 55420, 55548, 55553, 55559, 55564, 55691, 55696, 55702, 55707, 55834, 55839, 55845, 55851, 55980, 55985, 55991, 55997, 56127, 56132, 56138, 56144, 56275, 56280, 56286, 56292, 56420, 56425, 56431, 56437, 56565, 56570, 56576, 56582, 56710, 56715, 56721, 56727, 56855, 56860, 56866, 56872, 57003, 57008, 57014, 57020, 57149, 57154, 57160, 57166, 57294, 57299, 57305, 57311, 57441, 57446, 57452, 57458, 57587, 57592, 57598, 57604, 57733, 57738, 57744, 57750, 57880, 57885, 57891, 57897, 58026, 58031, 58037, 58043, 58173, 58178, 58184, 58190, 58316, 58321, 58327, ...], ('SUL', 'ETANOL HIDRATADO'): [24, 25, 26, 51, 52, 53, 78, 79, 80, 105, 106, 107, 132, 133, 134, 159, 160, 161, 186, 187, 188, 213, 214, 215, 240, 241, 242, 267, 268, 269, 294, 295, 296, 321, 322, 323, 348, 349, 350, 375, 376, 377, 402, 403, 404, 429, 430, 431, 456, 457, 458, 483, 484, 485, 510, 511, 512, 537, 538, 539, 564, 565, 566, 591, 592, 593, 618, 619, 620, 645, 646, 647, 672, 673, 674, 699, 700, 701, 726, 727, 728, 753, 754, 755, 780, 781, 782, 807, 808, 809, 834, 835, 836, 861, 862, 863, 888, 889, 890, 915, ...], ('SUL', 'GASOLINA COMUM'): [12004, 12005, 12006, 12031, 12032, 12033, 12058, 12059, 12060, 12085, 12086, 12087, 12112, 12113, 12114, 12139, 12140, 12141, 12166, 12167, 12168, 12193, 12194, 12195, 12220, 12221, 12222, 12247, 12248, 12249, 12274, 12275, 12276, 12301, 12302, 12303, 12328, 12329, 12330, 12355, 12356, 12357, 12382, 12383, 12384, 12409, 12410, 12411, 12436, 12437, 12438, 12463, 12464, 12465, 12490, 12491, 12492, 12517, 12518, 12519, 12544, 12545, 12546, 12571, 12572, 12573, 12598, 12599, 12600, 12625, 12626, 12627, 12652, 12653, 12654, 12679, 12680, 12681, 12706, 12707, 12708, 12733, 12734, 12735, 12760, 12761, 12762, 12787, 12788, 12789, 12814, 12815, 12816, 12841, 12842, 12843, 12868, 12869, 12870, 12895, ...], ('SUL', 'GLP'): [24043, 24044, 24045, 24070, 24071, 24072, 24097, 24098, 24099, 24124, 24125, 24126, 24151, 24152, 24153, 24178, 24179, 24180, 24205, 24206, 24207, 24232, 24233, 24234, 24259, 24260, 24261, 24286, 24287, 24288, 24313, 24314, 24315, 24340, 24341, 24342, 24367, 24368, 24369, 24394, 24395, 24396, 24421, 24422, 24423, 24448, 24449, 24450, 24475, 24476, 24477, 24502, 24503, 24504, 24529, 24530, 24531, 24555, 24556, 24557, 24582, 24583, 24584, 24609, 24610, 24611, 24636, 24637, 24638, 24663, 24664, 24665, 24690, 24691, 24692, 24716, 24717, 24718, 24743, 24744, 24745, 24770, 24771, 24772, 24797, 24798, 24799, 24824, 24825, 24826, 24851, 24852, 24853, 24878, 24879, 24880, 24905, 24906, 24907, 24932, ...], ('SUL', 'GNV'): [35904, 35905, 35906, 35919, 35920, 35921, 35934, 35935, 35936, 35949, 35950, 35951, 35964, 35965, 35966, 35979, 35980, 35981, 35994, 35995, 35996, 36009, 36010, 36011, 36024, 36025, 36026, 36039, 36040, 36041, 36054, 36055, 36056, 36069, 36070, 36071, 36084, 36085, 36086, 36099, 36100, 36101, 36114, 36115, 36116, 36129, 36130, 36131, 36144, 36145, 36146, 36159, 36160, 36161, 36174, 36175, 36176, 36189, 36190, 36191, 36204, 36205, 36206, 36219, 36220, 36221, 36234, 36235, 36236, 36249, 36250, 36251, 36264, 36265, 36266, 36280, 36281, 36282, 36295, 36296, 36297, 36310, 36311, 36312, 36326, 36327, 36328, 36342, 36343, 36344, 36357, 36358, 36359, 36372, 36373, 36374, 36387, 36388, 36389, 36402, ...], ('SUL', 'ÓLEO DIESEL'): [42636, 42637, 42638, 42663, 42664, 42665, 42690, 42691, 42692, 42717, 42718, 42719, 42744, 42745, 42746, 42771, 42772, 42773, 42798, 42799, 42800, 42825, 42826, 42827, 42852, 42853, 42854, 42879, 42880, 42881, 42906, 42907, 42908, 42933, 42934, 42935, 42960, 42961, 42962, 42987, 42988, 42989, 43014, 43015, 43016, 43041, 43042, 43043, 43068, 43069, 43070, 43095, 43096, 43097, 43122, 43123, 43124, 43149, 43150, 43151, 43176, 43177, 43178, 43203, 43204, 43205, 43230, 43231, 43232, 43257, 43258, 43259, 43284, 43285, 43286, 43311, 43312, 43313, 43338, 43339, 43340, 43365, 43366, 43367, 43392, 43393, 43394, 43419, 43420, 43421, 43446, 43447, 43448, 43473, 43474, 43475, 43500, 43501, 43502, 43527, ...], ('SUL', 'ÓLEO DIESEL S10'): [54708, 54710, 54838, 54843, 54845, 54980, 54985, 54987, 55124, 55129, 55131, 55269, 55274, 55276, 55412, 55417, 55419, 55556, 55561, 55563, 55699, 55704, 55706, 55842, 55847, 55850, 55988, 55993, 55996, 56135, 56140, 56143, 56283, 56288, 56291, 56428, 56433, 56436, 56573, 56578, 56581, 56718, 56723, 56726, 56863, 56868, 56871, 57011, 57016, 57019, 57157, 57162, 57165, 57302, 57307, 57310, 57449, 57454, 57457, 57595, 57600, 57603, 57741, 57746, 57749, 57888, 57893, 57896, 58034, 58039, 58042, 58181, 58186, 58189, 58324, 58329, 58332, 58468, 58473, 58476, 58614, 58619, 58622, 58757, 58762, 58765, 58901, 58906, 58909, 59047, 59052, 59055, 59191, 59196, 59199, 59336, 59341, 59344, 59480, 59485, ...]}" ] }, "execution_count": 232, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos.groups" ] }, { "cell_type": "code", "execution_count": 233, "id": "infrared-attention", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
REGIÃOPRODUTO
CENTRO OESTEETANOL HIDRATADO155.5144142.1356700.1119921.9265222.4333030.3347420.0556791.8009270.0822781.6294482.0093260.0498516.5070472011.434017
GASOLINA COMUM155.4473523.0774760.1041052.8667323.3386570.4130810.0336342.6643950.0571652.5534512.8249490.0215496.5076582011.430759
GLP202.11394448.1767472.91121940.93696955.24474810.1443820.05778338.0323653.02461732.14299843.4516890.0766076.4909622011.428341
GNV3.7591501.8563120.0326351.8244891.8850870.4678690.0161501.3884430.0208911.3703231.4074660.0141266.4085012010.829988
ÓLEO DIESEL131.9403322.4812860.0815402.3104972.6862050.2692930.0321172.2119930.0498742.1068892.3236830.0219956.5076582011.430759
ÓLEO DIESEL S1076.0545453.2947520.1089763.0706253.5593990.3757260.0325772.9190260.0732332.7792363.0400200.0248296.3297522015.970248
NORDESTEETANOL HIDRATADO154.1437702.3202660.1154492.0994882.6540450.3000060.0520532.0202600.0908951.7999902.2297820.0468306.5058192011.421516
GASOLINA COMUM174.0516783.0018870.1081042.7804053.2774360.4003370.0363572.6015500.0561392.4875782.7643450.0215656.5010622011.431262
GLP127.29407241.9660902.66771336.14214047.7011059.9518400.06045132.0142502.52798627.49339536.7138450.0769616.5173172011.185335
GNV17.4980681.8817220.0614861.8206602.0387150.5175940.0321381.3641280.1196901.2153881.5224370.0983746.4903402011.103168
ÓLEO DIESEL135.5361852.3469500.0693012.2036872.5348090.2339810.0294012.1129690.0480332.0173122.2230880.0221076.5010622011.430676
ÓLEO DIESEL S1093.8571903.0419660.0918812.8511213.3040490.3260300.0300662.7159360.0654082.5945162.8653620.0240486.3179422015.759894
NORTEETANOL HIDRATADO47.7313122.5116240.1230972.3317522.8491550.3621310.0503142.1494940.0940581.9833082.3201920.0464506.5116862011.228511
GASOLINA COMUM77.8376653.1495010.1403392.9569463.5401740.4543510.0451722.6951510.0677742.5822372.8519140.0252256.5001832011.438141
GLP91.76722447.0655722.81108642.18552354.1032338.6606370.05938338.4049351.73408534.77373841.9602610.0442726.5027222011.399850
GNV1.3786012.0843990.0077492.0791032.0913210.3718480.0030251.7125510.0129591.7042181.7244620.0060256.4855972012.016461
ÓLEO DIESEL68.1359562.5710480.1055902.4003412.8311890.3237950.0412242.2472530.0607852.1357172.3662000.0268736.4980792011.441537
ÓLEO DIESEL S1040.4952673.3162310.1279273.1284943.6459340.4171510.0386692.8990790.0824052.7648063.0472000.0280426.3541312015.786145
SUDESTEETANOL HIDRATADO1038.7201152.1636210.1344471.8106692.6299520.3008500.0641111.8627710.1076421.5405472.1793840.0602876.5014342011.426522
GASOLINA COMUM1051.9092363.0005650.1220242.6984063.4632770.3618580.0411052.6387080.0661992.4381812.8829380.0249516.5006372011.433121
GLP757.15588142.0815443.11719233.29757051.31981210.9526030.07082931.1289412.74124524.08911939.8739580.0875556.4985662011.435448
GNV81.8394931.7160740.1307301.5480302.1234040.4785670.0751991.2375070.1369021.0546921.4876190.1271566.4780012011.001760
ÓLEO DIESEL771.3009552.3396990.0826702.1188812.6598660.2619300.0347982.0777690.0517811.9315992.2560560.0239546.5006372011.433121
ÓLEO DIESEL S10419.7435143.0561940.1097652.7654173.4578920.3622850.0353972.6939090.0788232.4894782.9246800.0289696.3180132015.762046
SULETANOL HIDRATADO454.8899282.2681560.1235951.9471682.6723930.3167480.0559451.9514080.1121081.6345122.2406060.0620756.5019122011.427539
GASOLINA COMUM495.9723872.9725690.1177792.6778283.3404630.3714590.0393082.6011100.0646112.4324312.8261010.0245646.5012742011.430331
GLP487.43149843.4903183.40816034.93909553.35233910.4845700.07514733.0057483.46126725.79168042.0295540.1026316.5160052011.409731
GNV21.2427591.8656120.0653621.7796902.0469010.4782050.0325991.3874080.1135101.2332941.5122270.0825026.4207482010.783570
ÓLEO DIESEL364.1703482.3322930.0818692.1249732.6112230.2767430.0341382.0555500.0537711.9264972.2070070.0252236.5012742011.430331
ÓLEO DIESEL S10230.2835972.9817750.1102492.7074393.3664090.3684390.0364092.6133360.0814752.4383622.8143470.0308716.3181822015.755929
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 155.514414 \n", " GASOLINA COMUM 155.447352 \n", " GLP 202.113944 \n", " GNV 3.759150 \n", " ÓLEO DIESEL 131.940332 \n", " ÓLEO DIESEL S10 76.054545 \n", "NORDESTE ETANOL HIDRATADO 154.143770 \n", " GASOLINA COMUM 174.051678 \n", " GLP 127.294072 \n", " GNV 17.498068 \n", " ÓLEO DIESEL 135.536185 \n", " ÓLEO DIESEL S10 93.857190 \n", "NORTE ETANOL HIDRATADO 47.731312 \n", " GASOLINA COMUM 77.837665 \n", " GLP 91.767224 \n", " GNV 1.378601 \n", " ÓLEO DIESEL 68.135956 \n", " ÓLEO DIESEL S10 40.495267 \n", "SUDESTE ETANOL HIDRATADO 1038.720115 \n", " GASOLINA COMUM 1051.909236 \n", " GLP 757.155881 \n", " GNV 81.839493 \n", " ÓLEO DIESEL 771.300955 \n", " ÓLEO DIESEL S10 419.743514 \n", "SUL ETANOL HIDRATADO 454.889928 \n", " GASOLINA COMUM 495.972387 \n", " GLP 487.431498 \n", " GNV 21.242759 \n", " ÓLEO DIESEL 364.170348 \n", " ÓLEO DIESEL S10 230.283597 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 2.135670 0.111992 \n", " GASOLINA COMUM 3.077476 0.104105 \n", " GLP 48.176747 2.911219 \n", " GNV 1.856312 0.032635 \n", " ÓLEO DIESEL 2.481286 0.081540 \n", " ÓLEO DIESEL S10 3.294752 0.108976 \n", "NORDESTE ETANOL HIDRATADO 2.320266 0.115449 \n", " GASOLINA COMUM 3.001887 0.108104 \n", " GLP 41.966090 2.667713 \n", " GNV 1.881722 0.061486 \n", " ÓLEO DIESEL 2.346950 0.069301 \n", " ÓLEO DIESEL S10 3.041966 0.091881 \n", "NORTE ETANOL HIDRATADO 2.511624 0.123097 \n", " GASOLINA COMUM 3.149501 0.140339 \n", " GLP 47.065572 2.811086 \n", " GNV 2.084399 0.007749 \n", " ÓLEO DIESEL 2.571048 0.105590 \n", " ÓLEO DIESEL S10 3.316231 0.127927 \n", "SUDESTE ETANOL HIDRATADO 2.163621 0.134447 \n", " GASOLINA COMUM 3.000565 0.122024 \n", " GLP 42.081544 3.117192 \n", " GNV 1.716074 0.130730 \n", " ÓLEO DIESEL 2.339699 0.082670 \n", " ÓLEO DIESEL S10 3.056194 0.109765 \n", "SUL ETANOL HIDRATADO 2.268156 0.123595 \n", " GASOLINA COMUM 2.972569 0.117779 \n", " GLP 43.490318 3.408160 \n", " GNV 1.865612 0.065362 \n", " ÓLEO DIESEL 2.332293 0.081869 \n", " ÓLEO DIESEL S10 2.981775 0.110249 \n", "\n", " PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 1.926522 2.433303 \n", " GASOLINA COMUM 2.866732 3.338657 \n", " GLP 40.936969 55.244748 \n", " GNV 1.824489 1.885087 \n", " ÓLEO DIESEL 2.310497 2.686205 \n", " ÓLEO DIESEL S10 3.070625 3.559399 \n", "NORDESTE ETANOL HIDRATADO 2.099488 2.654045 \n", " GASOLINA COMUM 2.780405 3.277436 \n", " GLP 36.142140 47.701105 \n", " GNV 1.820660 2.038715 \n", " ÓLEO DIESEL 2.203687 2.534809 \n", " ÓLEO DIESEL S10 2.851121 3.304049 \n", "NORTE ETANOL HIDRATADO 2.331752 2.849155 \n", " GASOLINA COMUM 2.956946 3.540174 \n", " GLP 42.185523 54.103233 \n", " GNV 2.079103 2.091321 \n", " ÓLEO DIESEL 2.400341 2.831189 \n", " ÓLEO DIESEL S10 3.128494 3.645934 \n", "SUDESTE ETANOL HIDRATADO 1.810669 2.629952 \n", " GASOLINA COMUM 2.698406 3.463277 \n", " GLP 33.297570 51.319812 \n", " GNV 1.548030 2.123404 \n", " ÓLEO DIESEL 2.118881 2.659866 \n", " ÓLEO DIESEL S10 2.765417 3.457892 \n", "SUL ETANOL HIDRATADO 1.947168 2.672393 \n", " GASOLINA COMUM 2.677828 3.340463 \n", " GLP 34.939095 53.352339 \n", " GNV 1.779690 2.046901 \n", " ÓLEO DIESEL 2.124973 2.611223 \n", " ÓLEO DIESEL S10 2.707439 3.366409 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 0.334742 0.055679 \n", " GASOLINA COMUM 0.413081 0.033634 \n", " GLP 10.144382 0.057783 \n", " GNV 0.467869 0.016150 \n", " ÓLEO DIESEL 0.269293 0.032117 \n", " ÓLEO DIESEL S10 0.375726 0.032577 \n", "NORDESTE ETANOL HIDRATADO 0.300006 0.052053 \n", " GASOLINA COMUM 0.400337 0.036357 \n", " GLP 9.951840 0.060451 \n", " GNV 0.517594 0.032138 \n", " ÓLEO DIESEL 0.233981 0.029401 \n", " ÓLEO DIESEL S10 0.326030 0.030066 \n", "NORTE ETANOL HIDRATADO 0.362131 0.050314 \n", " GASOLINA COMUM 0.454351 0.045172 \n", " GLP 8.660637 0.059383 \n", " GNV 0.371848 0.003025 \n", " ÓLEO DIESEL 0.323795 0.041224 \n", " ÓLEO DIESEL S10 0.417151 0.038669 \n", "SUDESTE ETANOL HIDRATADO 0.300850 0.064111 \n", " GASOLINA COMUM 0.361858 0.041105 \n", " GLP 10.952603 0.070829 \n", " GNV 0.478567 0.075199 \n", " ÓLEO DIESEL 0.261930 0.034798 \n", " ÓLEO DIESEL S10 0.362285 0.035397 \n", "SUL ETANOL HIDRATADO 0.316748 0.055945 \n", " GASOLINA COMUM 0.371459 0.039308 \n", " GLP 10.484570 0.075147 \n", " GNV 0.478205 0.032599 \n", " ÓLEO DIESEL 0.276743 0.034138 \n", " ÓLEO DIESEL S10 0.368439 0.036409 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 1.800927 \n", " GASOLINA COMUM 2.664395 \n", " GLP 38.032365 \n", " GNV 1.388443 \n", " ÓLEO DIESEL 2.211993 \n", " ÓLEO DIESEL S10 2.919026 \n", "NORDESTE ETANOL HIDRATADO 2.020260 \n", " GASOLINA COMUM 2.601550 \n", " GLP 32.014250 \n", " GNV 1.364128 \n", " ÓLEO DIESEL 2.112969 \n", " ÓLEO DIESEL S10 2.715936 \n", "NORTE ETANOL HIDRATADO 2.149494 \n", " GASOLINA COMUM 2.695151 \n", " GLP 38.404935 \n", " GNV 1.712551 \n", " ÓLEO DIESEL 2.247253 \n", " ÓLEO DIESEL S10 2.899079 \n", "SUDESTE ETANOL HIDRATADO 1.862771 \n", " GASOLINA COMUM 2.638708 \n", " GLP 31.128941 \n", " GNV 1.237507 \n", " ÓLEO DIESEL 2.077769 \n", " ÓLEO DIESEL S10 2.693909 \n", "SUL ETANOL HIDRATADO 1.951408 \n", " GASOLINA COMUM 2.601110 \n", " GLP 33.005748 \n", " GNV 1.387408 \n", " ÓLEO DIESEL 2.055550 \n", " ÓLEO DIESEL S10 2.613336 \n", "\n", " DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 0.082278 \n", " GASOLINA COMUM 0.057165 \n", " GLP 3.024617 \n", " GNV 0.020891 \n", " ÓLEO DIESEL 0.049874 \n", " ÓLEO DIESEL S10 0.073233 \n", "NORDESTE ETANOL HIDRATADO 0.090895 \n", " GASOLINA COMUM 0.056139 \n", " GLP 2.527986 \n", " GNV 0.119690 \n", " ÓLEO DIESEL 0.048033 \n", " ÓLEO DIESEL S10 0.065408 \n", "NORTE ETANOL HIDRATADO 0.094058 \n", " GASOLINA COMUM 0.067774 \n", " GLP 1.734085 \n", " GNV 0.012959 \n", " ÓLEO DIESEL 0.060785 \n", " ÓLEO DIESEL S10 0.082405 \n", "SUDESTE ETANOL HIDRATADO 0.107642 \n", " GASOLINA COMUM 0.066199 \n", " GLP 2.741245 \n", " GNV 0.136902 \n", " ÓLEO DIESEL 0.051781 \n", " ÓLEO DIESEL S10 0.078823 \n", "SUL ETANOL HIDRATADO 0.112108 \n", " GASOLINA COMUM 0.064611 \n", " GLP 3.461267 \n", " GNV 0.113510 \n", " ÓLEO DIESEL 0.053771 \n", " ÓLEO DIESEL S10 0.081475 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 1.629448 \n", " GASOLINA COMUM 2.553451 \n", " GLP 32.142998 \n", " GNV 1.370323 \n", " ÓLEO DIESEL 2.106889 \n", " ÓLEO DIESEL S10 2.779236 \n", "NORDESTE ETANOL HIDRATADO 1.799990 \n", " GASOLINA COMUM 2.487578 \n", " GLP 27.493395 \n", " GNV 1.215388 \n", " ÓLEO DIESEL 2.017312 \n", " ÓLEO DIESEL S10 2.594516 \n", "NORTE ETANOL HIDRATADO 1.983308 \n", " GASOLINA COMUM 2.582237 \n", " GLP 34.773738 \n", " GNV 1.704218 \n", " ÓLEO DIESEL 2.135717 \n", " ÓLEO DIESEL S10 2.764806 \n", "SUDESTE ETANOL HIDRATADO 1.540547 \n", " GASOLINA COMUM 2.438181 \n", " GLP 24.089119 \n", " GNV 1.054692 \n", " ÓLEO DIESEL 1.931599 \n", " ÓLEO DIESEL S10 2.489478 \n", "SUL ETANOL HIDRATADO 1.634512 \n", " GASOLINA COMUM 2.432431 \n", " GLP 25.791680 \n", " GNV 1.233294 \n", " ÓLEO DIESEL 1.926497 \n", " ÓLEO DIESEL S10 2.438362 \n", "\n", " PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 2.009326 \n", " GASOLINA COMUM 2.824949 \n", " GLP 43.451689 \n", " GNV 1.407466 \n", " ÓLEO DIESEL 2.323683 \n", " ÓLEO DIESEL S10 3.040020 \n", "NORDESTE ETANOL HIDRATADO 2.229782 \n", " GASOLINA COMUM 2.764345 \n", " GLP 36.713845 \n", " GNV 1.522437 \n", " ÓLEO DIESEL 2.223088 \n", " ÓLEO DIESEL S10 2.865362 \n", "NORTE ETANOL HIDRATADO 2.320192 \n", " GASOLINA COMUM 2.851914 \n", " GLP 41.960261 \n", " GNV 1.724462 \n", " ÓLEO DIESEL 2.366200 \n", " ÓLEO DIESEL S10 3.047200 \n", "SUDESTE ETANOL HIDRATADO 2.179384 \n", " GASOLINA COMUM 2.882938 \n", " GLP 39.873958 \n", " GNV 1.487619 \n", " ÓLEO DIESEL 2.256056 \n", " ÓLEO DIESEL S10 2.924680 \n", "SUL ETANOL HIDRATADO 2.240606 \n", " GASOLINA COMUM 2.826101 \n", " GLP 42.029554 \n", " GNV 1.512227 \n", " ÓLEO DIESEL 2.207007 \n", " ÓLEO DIESEL S10 2.814347 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 0.049851 6.507047 \n", " GASOLINA COMUM 0.021549 6.507658 \n", " GLP 0.076607 6.490962 \n", " GNV 0.014126 6.408501 \n", " ÓLEO DIESEL 0.021995 6.507658 \n", " ÓLEO DIESEL S10 0.024829 6.329752 \n", "NORDESTE ETANOL HIDRATADO 0.046830 6.505819 \n", " GASOLINA COMUM 0.021565 6.501062 \n", " GLP 0.076961 6.517317 \n", " GNV 0.098374 6.490340 \n", " ÓLEO DIESEL 0.022107 6.501062 \n", " ÓLEO DIESEL S10 0.024048 6.317942 \n", "NORTE ETANOL HIDRATADO 0.046450 6.511686 \n", " GASOLINA COMUM 0.025225 6.500183 \n", " GLP 0.044272 6.502722 \n", " GNV 0.006025 6.485597 \n", " ÓLEO DIESEL 0.026873 6.498079 \n", " ÓLEO DIESEL S10 0.028042 6.354131 \n", "SUDESTE ETANOL HIDRATADO 0.060287 6.501434 \n", " GASOLINA COMUM 0.024951 6.500637 \n", " GLP 0.087555 6.498566 \n", " GNV 0.127156 6.478001 \n", " ÓLEO DIESEL 0.023954 6.500637 \n", " ÓLEO DIESEL S10 0.028969 6.318013 \n", "SUL ETANOL HIDRATADO 0.062075 6.501912 \n", " GASOLINA COMUM 0.024564 6.501274 \n", " GLP 0.102631 6.516005 \n", " GNV 0.082502 6.420748 \n", " ÓLEO DIESEL 0.025223 6.501274 \n", " ÓLEO DIESEL S10 0.030871 6.318182 \n", "\n", " ANO \n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 2011.434017 \n", " GASOLINA COMUM 2011.430759 \n", " GLP 2011.428341 \n", " GNV 2010.829988 \n", " ÓLEO DIESEL 2011.430759 \n", " ÓLEO DIESEL S10 2015.970248 \n", "NORDESTE ETANOL HIDRATADO 2011.421516 \n", " GASOLINA COMUM 2011.431262 \n", " GLP 2011.185335 \n", " GNV 2011.103168 \n", " ÓLEO DIESEL 2011.430676 \n", " ÓLEO DIESEL S10 2015.759894 \n", "NORTE ETANOL HIDRATADO 2011.228511 \n", " GASOLINA COMUM 2011.438141 \n", " GLP 2011.399850 \n", " GNV 2012.016461 \n", " ÓLEO DIESEL 2011.441537 \n", " ÓLEO DIESEL S10 2015.786145 \n", "SUDESTE ETANOL HIDRATADO 2011.426522 \n", " GASOLINA COMUM 2011.433121 \n", " GLP 2011.435448 \n", " GNV 2011.001760 \n", " ÓLEO DIESEL 2011.433121 \n", " ÓLEO DIESEL S10 2015.762046 \n", "SUL ETANOL HIDRATADO 2011.427539 \n", " GASOLINA COMUM 2011.430331 \n", " GLP 2011.409731 \n", " GNV 2010.783570 \n", " ÓLEO DIESEL 2011.430331 \n", " ÓLEO DIESEL S10 2015.755929 " ] }, "execution_count": 233, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos.mean()" ] }, { "cell_type": "code", "execution_count": 234, "id": "particular-diana", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 2.135670\n", " GASOLINA COMUM 3.077476\n", " GLP 48.176747\n", " GNV 1.856312\n", " ÓLEO DIESEL 2.481286\n", " ÓLEO DIESEL S10 3.294752\n", "NORDESTE ETANOL HIDRATADO 2.320266\n", " GASOLINA COMUM 3.001887\n", " GLP 41.966090\n", " GNV 1.881722\n", " ÓLEO DIESEL 2.346950\n", " ÓLEO DIESEL S10 3.041966\n", "NORTE ETANOL HIDRATADO 2.511624\n", " GASOLINA COMUM 3.149501\n", " GLP 47.065572\n", " GNV 2.084399\n", " ÓLEO DIESEL 2.571048\n", " ÓLEO DIESEL S10 3.316231\n", "SUDESTE ETANOL HIDRATADO 2.163621\n", " GASOLINA COMUM 3.000565\n", " GLP 42.081544\n", " GNV 1.716074\n", " ÓLEO DIESEL 2.339699\n", " ÓLEO DIESEL S10 3.056194\n", "SUL ETANOL HIDRATADO 2.268156\n", " GASOLINA COMUM 2.972569\n", " GLP 43.490318\n", " GNV 1.865612\n", " ÓLEO DIESEL 2.332293\n", " ÓLEO DIESEL S10 2.981775\n", "Name: PREÇO MÉDIO REVENDA, dtype: float64" ] }, "execution_count": 234, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos['PREÇO MÉDIO REVENDA'].mean()" ] }, { "cell_type": "code", "execution_count": 236, "id": "pointed-latter", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
countmeanstdmin25%50%75%max
REGIÃOPRODUTO
CENTRO OESTEETANOL HIDRATADO3122.02.1356700.5614651.1621.714002.00052.479003.598
GASOLINA COMUM3134.03.0774760.6152901.9362.667252.85653.459754.963
GLP3098.048.17674715.20404528.79137.3330042.838555.9042599.357
GNV847.01.8563120.4238611.0971.569001.74902.168003.239
ÓLEO DIESEL3134.02.4812860.6269301.4352.033002.24653.019004.162
ÓLEO DIESEL S101210.03.2947520.4212342.3052.924253.35403.619004.200
NORDESTEETANOL HIDRATADO7046.02.3202660.6043741.1811.825002.18602.670003.927
GASOLINA COMUM7063.03.0018870.6406961.9492.584002.74103.424504.951
GLP6410.041.96609012.06374328.36733.2287536.855048.3510079.630
GNV5176.01.8817220.5229960.9751.596001.80052.011253.811
ÓLEO DIESEL7061.02.3469500.6057051.3131.900002.08202.867004.010
ÓLEO DIESEL S103032.03.0419660.4415502.1302.600003.08653.338004.027
NORTEETANOL HIDRATADO5177.02.5116240.6467811.2262.033002.33902.896004.102
GASOLINA COMUM5464.03.1495010.6412491.9952.704752.93303.584755.362
GLP5327.047.06557214.55374828.08636.3295042.311054.0750087.270
GNV243.02.0843990.6222291.3991.399002.06002.650003.240
ÓLEO DIESEL5465.02.5710480.6509941.4502.086002.33903.082004.774
ÓLEO DIESEL S102324.03.3162310.5290442.1932.883003.31553.653004.878
SUDESTEETANOL HIDRATADO3137.02.1636210.6514860.7661.692002.04302.567004.115
GASOLINA COMUM3140.03.0005650.6985731.8882.502002.79303.451505.119
GLP3137.042.08154411.52473828.02633.6360038.280049.2590079.192
GNV2841.01.7160740.4620980.9961.424001.66301.904003.399
ÓLEO DIESEL3140.02.3396990.5886411.3561.876002.08252.825003.994
ÓLEO DIESEL S101349.03.0561940.4183962.1802.650003.09103.386004.080
SULETANOL HIDRATADO2353.02.2681560.7028770.9221.721002.11302.601004.287
GASOLINA COMUM2354.02.9725690.6235571.9612.543002.73153.342254.953
GLP2343.043.49031811.64075529.44034.7925039.976048.7335072.088
GNV1899.01.8656120.4907031.1681.499001.70202.159503.476
ÓLEO DIESEL2354.02.3322930.5278451.3741.951002.09002.784503.800
ÓLEO DIESEL S101012.02.9817750.3654702.1512.663002.99103.252003.815
\n", "
" ], "text/plain": [ " count mean std min 25% \\\n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 3122.0 2.135670 0.561465 1.162 1.71400 \n", " GASOLINA COMUM 3134.0 3.077476 0.615290 1.936 2.66725 \n", " GLP 3098.0 48.176747 15.204045 28.791 37.33300 \n", " GNV 847.0 1.856312 0.423861 1.097 1.56900 \n", " ÓLEO DIESEL 3134.0 2.481286 0.626930 1.435 2.03300 \n", " ÓLEO DIESEL S10 1210.0 3.294752 0.421234 2.305 2.92425 \n", "NORDESTE ETANOL HIDRATADO 7046.0 2.320266 0.604374 1.181 1.82500 \n", " GASOLINA COMUM 7063.0 3.001887 0.640696 1.949 2.58400 \n", " GLP 6410.0 41.966090 12.063743 28.367 33.22875 \n", " GNV 5176.0 1.881722 0.522996 0.975 1.59600 \n", " ÓLEO DIESEL 7061.0 2.346950 0.605705 1.313 1.90000 \n", " ÓLEO DIESEL S10 3032.0 3.041966 0.441550 2.130 2.60000 \n", "NORTE ETANOL HIDRATADO 5177.0 2.511624 0.646781 1.226 2.03300 \n", " GASOLINA COMUM 5464.0 3.149501 0.641249 1.995 2.70475 \n", " GLP 5327.0 47.065572 14.553748 28.086 36.32950 \n", " GNV 243.0 2.084399 0.622229 1.399 1.39900 \n", " ÓLEO DIESEL 5465.0 2.571048 0.650994 1.450 2.08600 \n", " ÓLEO DIESEL S10 2324.0 3.316231 0.529044 2.193 2.88300 \n", "SUDESTE ETANOL HIDRATADO 3137.0 2.163621 0.651486 0.766 1.69200 \n", " GASOLINA COMUM 3140.0 3.000565 0.698573 1.888 2.50200 \n", " GLP 3137.0 42.081544 11.524738 28.026 33.63600 \n", " GNV 2841.0 1.716074 0.462098 0.996 1.42400 \n", " ÓLEO DIESEL 3140.0 2.339699 0.588641 1.356 1.87600 \n", " ÓLEO DIESEL S10 1349.0 3.056194 0.418396 2.180 2.65000 \n", "SUL ETANOL HIDRATADO 2353.0 2.268156 0.702877 0.922 1.72100 \n", " GASOLINA COMUM 2354.0 2.972569 0.623557 1.961 2.54300 \n", " GLP 2343.0 43.490318 11.640755 29.440 34.79250 \n", " GNV 1899.0 1.865612 0.490703 1.168 1.49900 \n", " ÓLEO DIESEL 2354.0 2.332293 0.527845 1.374 1.95100 \n", " ÓLEO DIESEL S10 1012.0 2.981775 0.365470 2.151 2.66300 \n", "\n", " 50% 75% max \n", "REGIÃO PRODUTO \n", "CENTRO OESTE ETANOL HIDRATADO 2.0005 2.47900 3.598 \n", " GASOLINA COMUM 2.8565 3.45975 4.963 \n", " GLP 42.8385 55.90425 99.357 \n", " GNV 1.7490 2.16800 3.239 \n", " ÓLEO DIESEL 2.2465 3.01900 4.162 \n", " ÓLEO DIESEL S10 3.3540 3.61900 4.200 \n", "NORDESTE ETANOL HIDRATADO 2.1860 2.67000 3.927 \n", " GASOLINA COMUM 2.7410 3.42450 4.951 \n", " GLP 36.8550 48.35100 79.630 \n", " GNV 1.8005 2.01125 3.811 \n", " ÓLEO DIESEL 2.0820 2.86700 4.010 \n", " ÓLEO DIESEL S10 3.0865 3.33800 4.027 \n", "NORTE ETANOL HIDRATADO 2.3390 2.89600 4.102 \n", " GASOLINA COMUM 2.9330 3.58475 5.362 \n", " GLP 42.3110 54.07500 87.270 \n", " GNV 2.0600 2.65000 3.240 \n", " ÓLEO DIESEL 2.3390 3.08200 4.774 \n", " ÓLEO DIESEL S10 3.3155 3.65300 4.878 \n", "SUDESTE ETANOL HIDRATADO 2.0430 2.56700 4.115 \n", " GASOLINA COMUM 2.7930 3.45150 5.119 \n", " GLP 38.2800 49.25900 79.192 \n", " GNV 1.6630 1.90400 3.399 \n", " ÓLEO DIESEL 2.0825 2.82500 3.994 \n", " ÓLEO DIESEL S10 3.0910 3.38600 4.080 \n", "SUL ETANOL HIDRATADO 2.1130 2.60100 4.287 \n", " GASOLINA COMUM 2.7315 3.34225 4.953 \n", " GLP 39.9760 48.73350 72.088 \n", " GNV 1.7020 2.15950 3.476 \n", " ÓLEO DIESEL 2.0900 2.78450 3.800 \n", " ÓLEO DIESEL S10 2.9910 3.25200 3.815 " ] }, "execution_count": 236, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos['PREÇO MÉDIO REVENDA'].describe()" ] }, { "cell_type": "markdown", "id": "fifteen-values", "metadata": {}, "source": [ "
\n", "\n", "`.agg`: **agrega (roda)** uma série de funções para os elementos de um dataframe ou de grupos de um dataframe." ] }, { "cell_type": "code", "execution_count": 238, "id": "overall-kitty", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
01.02.03.0
14.05.06.0
27.08.09.0
3NaNNaNNaN
\n", "
" ], "text/plain": [ " A B C\n", "0 1.0 2.0 3.0\n", "1 4.0 5.0 6.0\n", "2 7.0 8.0 9.0\n", "3 NaN NaN NaN" ] }, "execution_count": 238, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df = pd.DataFrame([[1, 2, 3],\n", " [4, 5, 6],\n", " [7, 8, 9],\n", " [None, None, None]],\n", " columns=['A', 'B', 'C'])\n", "df" ] }, { "cell_type": "code", "execution_count": 240, "id": "sticky-envelope", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
ABC
sum12.015.018.0
min1.02.03.0
\n", "
" ], "text/plain": [ " A B C\n", "sum 12.0 15.0 18.0\n", "min 1.0 2.0 3.0" ] }, "execution_count": 240, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.agg([sum, min]) # ignora o NaN" ] }, { "cell_type": "code", "execution_count": 242, "id": "prompt-karen", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 242, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos = data_final.groupby('REGIÃO')\n", "grupos" ] }, { "cell_type": "code", "execution_count": 243, "id": "measured-navigation", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
minmax
REGIÃO
CENTRO OESTE1.09799.357
NORDESTE0.97579.630
NORTE1.22687.270
SUDESTE0.76679.192
SUL0.92272.088
\n", "
" ], "text/plain": [ " min max\n", "REGIÃO \n", "CENTRO OESTE 1.097 99.357\n", "NORDESTE 0.975 79.630\n", "NORTE 1.226 87.270\n", "SUDESTE 0.766 79.192\n", "SUL 0.922 72.088" ] }, "execution_count": 243, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Computa o menor e maior valor do 'PREÇO MÉDIO REVENDA' para cada região (grupo)\n", "grupos['PREÇO MÉDIO REVENDA'].agg([min, max])" ] }, { "cell_type": "markdown", "id": "passive-assistant", "metadata": {}, "source": [ "

6. Ordenação

\n", "
" ] }, { "cell_type": "code", "execution_count": 246, "id": "elegant-bathroom", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
0João205.0
1Maria2110.0
2José196.0
3Alice2010.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "0 João 20 5.0\n", "1 Maria 21 10.0\n", "2 José 19 6.0\n", "3 Alice 20 10.0" ] }, "execution_count": 246, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas = pd.DataFrame({\n", " 'nome': ['João', 'Maria', 'José', 'Alice'],\n", " 'idade': [20, 21, 19, 20],\n", " 'nota_final': [5.0, 10.0, 6.0, 10.0]\n", "})\n", "notas" ] }, { "cell_type": "markdown", "id": "palestinian-intensity", "metadata": {}, "source": [ "`.sort_values()`: ordena valores ao longo de um eixo." ] }, { "cell_type": "code", "execution_count": 247, "id": "waiting-theater", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
0João205.0
2José196.0
1Maria2110.0
3Alice2010.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "0 João 20 5.0\n", "2 José 19 6.0\n", "1 Maria 21 10.0\n", "3 Alice 20 10.0" ] }, "execution_count": 247, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas.sort_values(by='nota_final')" ] }, { "cell_type": "markdown", "id": "contrary-richards", "metadata": {}, "source": [ "Por padrão, o método retorna uma cópia dos dados ordenados em **ordem crescente (ascendente)**. Podemos alterar isso pelo argumento `ascending`." ] }, { "cell_type": "code", "execution_count": 250, "id": "plain-sociology", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
1Maria2110.0
3Alice2010.0
2José196.0
0João205.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "1 Maria 21 10.0\n", "3 Alice 20 10.0\n", "2 José 19 6.0\n", "0 João 20 5.0" ] }, "execution_count": 250, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas.sort_values(by='nota_final', ascending=False)" ] }, { "cell_type": "markdown", "id": "wicked-interference", "metadata": {}, "source": [ "
\n", "\n", "Podemos ordenar a partir de **mais de uma coluna**:" ] }, { "cell_type": "code", "execution_count": 252, "id": "impossible-brighton", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
3Alice2010.0
1Maria2110.0
2José196.0
0João205.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "3 Alice 20 10.0\n", "1 Maria 21 10.0\n", "2 José 19 6.0\n", "0 João 20 5.0" ] }, "execution_count": 252, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas.sort_values(by=['nota_final', 'nome'], ascending=[False, True])" ] }, { "cell_type": "markdown", "id": "harmful-potential", "metadata": {}, "source": [ "Ordena os registros, primeiramente, pela coluna 'nota_final' em **ordem descrente**.
\n", "Então, reordena os registros _\"empatados\"_, ou seja, com a **mesma nota final**, em _ordem alfabética_ (ordem crescente)." ] }, { "cell_type": "markdown", "id": "palestinian-record", "metadata": {}, "source": [ "
\n", "\n", "Note que o dataframe original **não foi alterado** após a ordenação." ] }, { "cell_type": "code", "execution_count": 253, "id": "according-assist", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
0João205.0
1Maria2110.0
2José196.0
3Alice2010.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "0 João 20 5.0\n", "1 Maria 21 10.0\n", "2 José 19 6.0\n", "3 Alice 20 10.0" ] }, "execution_count": 253, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas" ] }, { "cell_type": "markdown", "id": "alpine-basin", "metadata": {}, "source": [ "Para alterá-lo, use o argumento `inplace=True`:" ] }, { "cell_type": "code", "execution_count": 254, "id": "eight-elder", "metadata": {}, "outputs": [], "source": [ "notas.sort_values(by=['nota_final', 'nome'], ascending=[False, True], inplace=True)" ] }, { "cell_type": "code", "execution_count": 255, "id": "pressed-information", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nomeidadenota_final
3Alice2010.0
1Maria2110.0
2José196.0
0João205.0
\n", "
" ], "text/plain": [ " nome idade nota_final\n", "3 Alice 20 10.0\n", "1 Maria 21 10.0\n", "2 José 19 6.0\n", "0 João 20 5.0" ] }, "execution_count": 255, "metadata": {}, "output_type": "execute_result" } ], "source": [ "notas" ] }, { "cell_type": "markdown", "id": "vital-pocket", "metadata": {}, "source": [ "

7. Exercícios

\n", "
" ] }, { "cell_type": "markdown", "id": "imperial-invitation", "metadata": {}, "source": [ "Vamos aplicar os conceitos que vimos em alguns exercícios.
\n", "Para isso, utilizaremos o dataset de _preços de combustíveis no Brasil_." ] }, { "cell_type": "code", "execution_count": 271, "id": "pharmaceutical-loading", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.2400.0660.9410.0770.74411.031700.08252004
...............................................................
1033872019-06-232019-06-29NORDESTERIO GRANDE DO NORTEGNV7R$/m33.5740.0653.4993.6900.8180.0182.7560.0002.75602.756000.00062019
1033882019-06-232019-06-29SULRIO GRANDE DO SULGNV23R$/m33.4010.1293.2303.7890.9500.0382.4510.4021.98422.866100.16462019
1033892019-06-232019-06-29SULSANTA CATARINAGNV24R$/m32.9120.1902.6993.4990.9140.0651.9980.0001.99811.998100.00062019
1033902019-06-232019-06-29SUDESTESAO PAULOGNV52R$/m33.0200.2292.6993.4900.6460.0762.3740.1652.01792.509300.07062019
1033912019-06-232019-06-29NORDESTESERGIPEGNV4R$/m33.6970.0053.6893.6991.1790.0012.5180.0002.51752.517500.00062019
\n", "

103392 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "103387 2019-06-23 2019-06-29 NORDESTE RIO GRANDE DO NORTE \n", "103388 2019-06-23 2019-06-29 SUL RIO GRANDE DO SUL \n", "103389 2019-06-23 2019-06-29 SUL SANTA CATARINA \n", "103390 2019-06-23 2019-06-29 SUDESTE SAO PAULO \n", "103391 2019-06-23 2019-06-29 NORDESTE SERGIPE \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "103387 GNV 7 R$/m3 \n", "103388 GNV 23 R$/m3 \n", "103389 GNV 24 R$/m3 \n", "103390 GNV 52 R$/m3 \n", "103391 GNV 4 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "103387 3.574 0.065 3.499 \n", "103388 3.401 0.129 3.230 \n", "103389 2.912 0.190 2.699 \n", "103390 3.020 0.229 2.699 \n", "103391 3.697 0.005 3.689 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "... ... ... ... \n", "103387 3.690 0.818 0.018 \n", "103388 3.789 0.950 0.038 \n", "103389 3.499 0.914 0.065 \n", "103390 3.490 0.646 0.076 \n", "103391 3.699 1.179 0.001 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "103387 2.756 0.000 \n", "103388 2.451 0.402 \n", "103389 1.998 0.000 \n", "103390 2.374 0.165 \n", "103391 2.518 0.000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "... ... ... \n", "103387 2.7560 2.75600 \n", "103388 1.9842 2.86610 \n", "103389 1.9981 1.99810 \n", "103390 2.0179 2.50930 \n", "103391 2.5175 2.51750 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "103387 0.000 6 2019 \n", "103388 0.164 6 2019 \n", "103389 0.000 6 2019 \n", "103390 0.070 6 2019 \n", "103391 0.000 6 2019 \n", "\n", "[103392 rows x 20 columns]" ] }, "execution_count": 271, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final" ] }, { "cell_type": "markdown", "id": "painted-chemistry", "metadata": {}, "source": [ "Como há apenas medições de janeiro a junho para o ano de 2019, resolvemos **remover os dados** deste ano da análise." ] }, { "cell_type": "code", "execution_count": 272, "id": "devoted-american", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.2400.0660.9410.0770.74411.031700.08252004
...............................................................
997342018-12-302019-01-05SUDESTERIO DE JANEIROGNV122R$/m33.0800.2622.7983.9990.6990.0852.3810.1612.16702.869700.068122018
997352018-12-302019-01-05NORDESTERIO GRANDE DO NORTEGNV10R$/m33.4650.0603.3703.5900.7590.0172.7060.0002.70592.705900.000122018
997362018-12-302019-01-05SULRIO GRANDE DO SULGNV16R$/m33.4020.1033.1993.4991.2960.0302.1060.2491.87752.372400.118122018
997372018-12-302019-01-05SULSANTA CATARINAGNV15R$/m32.9440.1242.7903.1990.6700.0422.2740.2831.87382.274000.124122018
997382018-12-302019-01-05SUDESTESAO PAULOGNV41R$/m32.3530.4511.9993.4290.4670.1921.8860.2501.64002.332000.133122018
\n", "

99739 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "99734 2018-12-30 2019-01-05 SUDESTE RIO DE JANEIRO \n", "99735 2018-12-30 2019-01-05 NORDESTE RIO GRANDE DO NORTE \n", "99736 2018-12-30 2019-01-05 SUL RIO GRANDE DO SUL \n", "99737 2018-12-30 2019-01-05 SUL SANTA CATARINA \n", "99738 2018-12-30 2019-01-05 SUDESTE SAO PAULO \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "99734 GNV 122 R$/m3 \n", "99735 GNV 10 R$/m3 \n", "99736 GNV 16 R$/m3 \n", "99737 GNV 15 R$/m3 \n", "99738 GNV 41 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "99734 3.080 0.262 2.798 \n", "99735 3.465 0.060 3.370 \n", "99736 3.402 0.103 3.199 \n", "99737 2.944 0.124 2.790 \n", "99738 2.353 0.451 1.999 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "... ... ... ... \n", "99734 3.999 0.699 0.085 \n", "99735 3.590 0.759 0.017 \n", "99736 3.499 1.296 0.030 \n", "99737 3.199 0.670 0.042 \n", "99738 3.429 0.467 0.192 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "99734 2.381 0.161 \n", "99735 2.706 0.000 \n", "99736 2.106 0.249 \n", "99737 2.274 0.283 \n", "99738 1.886 0.250 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "... ... ... \n", "99734 2.1670 2.86970 \n", "99735 2.7059 2.70590 \n", "99736 1.8775 2.37240 \n", "99737 1.8738 2.27400 \n", "99738 1.6400 2.33200 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "99734 0.068 12 2018 \n", "99735 0.000 12 2018 \n", "99736 0.118 12 2018 \n", "99737 0.124 12 2018 \n", "99738 0.133 12 2018 \n", "\n", "[99739 rows x 20 columns]" ] }, "execution_count": 272, "metadata": {}, "output_type": "execute_result" } ], "source": [ "data_final.query('ANO != 2019')" ] }, { "cell_type": "markdown", "id": "changing-conservative", "metadata": {}, "source": [ "Note que temos um novo dataframe com 99739 linhas." ] }, { "cell_type": "code", "execution_count": 273, "id": "fleet-parallel", "metadata": {}, "outputs": [], "source": [ "df = data_final.query('ANO != 2019')" ] }, { "cell_type": "code", "execution_count": 274, "id": "closed-induction", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
02004-05-092004-05-15CENTRO OESTEDISTRITO FEDERALETANOL HIDRATADO127R$/l1.2880.0161.1901.3500.4630.0120.8250.1100.42010.966600.13352004
12004-05-092004-05-15CENTRO OESTEGOIASETANOL HIDRATADO387R$/l1.1620.1140.8901.4490.3990.0980.7630.0880.50131.050000.11552004
22004-05-092004-05-15CENTRO OESTEMATO GROSSOETANOL HIDRATADO192R$/l1.3890.0971.1801.7600.4190.0700.9700.0950.56141.161000.09852004
32004-05-092004-05-15CENTRO OESTEMATO GROSSO DO SULETANOL HIDRATADO162R$/l1.2620.0701.0901.5090.4320.0550.8300.1190.59911.222420.14352004
42004-05-092004-05-15NORDESTEALAGOASETANOL HIDRATADO103R$/l1.1810.0781.0501.4000.2400.0660.9410.0770.74411.031700.08252004
...............................................................
997342018-12-302019-01-05SUDESTERIO DE JANEIROGNV122R$/m33.0800.2622.7983.9990.6990.0852.3810.1612.16702.869700.068122018
997352018-12-302019-01-05NORDESTERIO GRANDE DO NORTEGNV10R$/m33.4650.0603.3703.5900.7590.0172.7060.0002.70592.705900.000122018
997362018-12-302019-01-05SULRIO GRANDE DO SULGNV16R$/m33.4020.1033.1993.4991.2960.0302.1060.2491.87752.372400.118122018
997372018-12-302019-01-05SULSANTA CATARINAGNV15R$/m32.9440.1242.7903.1990.6700.0422.2740.2831.87382.274000.124122018
997382018-12-302019-01-05SUDESTESAO PAULOGNV41R$/m32.3530.4511.9993.4290.4670.1921.8860.2501.64002.332000.133122018
\n", "

99739 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO \\\n", "0 2004-05-09 2004-05-15 CENTRO OESTE DISTRITO FEDERAL \n", "1 2004-05-09 2004-05-15 CENTRO OESTE GOIAS \n", "2 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO \n", "3 2004-05-09 2004-05-15 CENTRO OESTE MATO GROSSO DO SUL \n", "4 2004-05-09 2004-05-15 NORDESTE ALAGOAS \n", "... ... ... ... ... \n", "99734 2018-12-30 2019-01-05 SUDESTE RIO DE JANEIRO \n", "99735 2018-12-30 2019-01-05 NORDESTE RIO GRANDE DO NORTE \n", "99736 2018-12-30 2019-01-05 SUL RIO GRANDE DO SUL \n", "99737 2018-12-30 2019-01-05 SUL SANTA CATARINA \n", "99738 2018-12-30 2019-01-05 SUDESTE SAO PAULO \n", "\n", " PRODUTO NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA \\\n", "0 ETANOL HIDRATADO 127 R$/l \n", "1 ETANOL HIDRATADO 387 R$/l \n", "2 ETANOL HIDRATADO 192 R$/l \n", "3 ETANOL HIDRATADO 162 R$/l \n", "4 ETANOL HIDRATADO 103 R$/l \n", "... ... ... ... \n", "99734 GNV 122 R$/m3 \n", "99735 GNV 10 R$/m3 \n", "99736 GNV 16 R$/m3 \n", "99737 GNV 15 R$/m3 \n", "99738 GNV 41 R$/m3 \n", "\n", " PREÇO MÉDIO REVENDA DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA \\\n", "0 1.288 0.016 1.190 \n", "1 1.162 0.114 0.890 \n", "2 1.389 0.097 1.180 \n", "3 1.262 0.070 1.090 \n", "4 1.181 0.078 1.050 \n", "... ... ... ... \n", "99734 3.080 0.262 2.798 \n", "99735 3.465 0.060 3.370 \n", "99736 3.402 0.103 3.199 \n", "99737 2.944 0.124 2.790 \n", "99738 2.353 0.451 1.999 \n", "\n", " PREÇO MÁXIMO REVENDA MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "0 1.350 0.463 0.012 \n", "1 1.449 0.399 0.098 \n", "2 1.760 0.419 0.070 \n", "3 1.509 0.432 0.055 \n", "4 1.400 0.240 0.066 \n", "... ... ... ... \n", "99734 3.999 0.699 0.085 \n", "99735 3.590 0.759 0.017 \n", "99736 3.499 1.296 0.030 \n", "99737 3.199 0.670 0.042 \n", "99738 3.429 0.467 0.192 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "0 0.825 0.110 \n", "1 0.763 0.088 \n", "2 0.970 0.095 \n", "3 0.830 0.119 \n", "4 0.941 0.077 \n", "... ... ... \n", "99734 2.381 0.161 \n", "99735 2.706 0.000 \n", "99736 2.106 0.249 \n", "99737 2.274 0.283 \n", "99738 1.886 0.250 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "0 0.4201 0.96660 \n", "1 0.5013 1.05000 \n", "2 0.5614 1.16100 \n", "3 0.5991 1.22242 \n", "4 0.7441 1.03170 \n", "... ... ... \n", "99734 2.1670 2.86970 \n", "99735 2.7059 2.70590 \n", "99736 1.8775 2.37240 \n", "99737 1.8738 2.27400 \n", "99738 1.6400 2.33200 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "0 0.133 5 2004 \n", "1 0.115 5 2004 \n", "2 0.098 5 2004 \n", "3 0.143 5 2004 \n", "4 0.082 5 2004 \n", "... ... ... ... \n", "99734 0.068 12 2018 \n", "99735 0.000 12 2018 \n", "99736 0.118 12 2018 \n", "99737 0.124 12 2018 \n", "99738 0.133 12 2018 \n", "\n", "[99739 rows x 20 columns]" ] }, "execution_count": 274, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df" ] }, { "cell_type": "markdown", "id": "familiar-panic", "metadata": {}, "source": [ "### 7.1 Qual a quantidade de registros de cada produto em cada região?" ] }, { "cell_type": "code", "execution_count": 275, "id": "victorian-tumor", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "" ] }, "execution_count": 275, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos = df.groupby('PRODUTO')\n", "grupos" ] }, { "cell_type": "code", "execution_count": 278, "id": "bacterial-triumph", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
REGIÃO
PRODUTOREGIÃO
ETANOL HIDRATADONORDESTE6821
NORTE5021
SUDESTE3039
CENTRO OESTE3022
SUL2278
GASOLINA COMUMNORDESTE6838
NORTE5289
SUDESTE3040
CENTRO OESTE3034
SUL2279
GLPNORDESTE6185
NORTE5152
SUDESTE3037
CENTRO OESTE2998
SUL2268
GNVNORDESTE5030
SUDESTE2772
SUL1847
CENTRO OESTE825
NORTE233
ÓLEO DIESELNORDESTE6836
NORTE5290
SUDESTE3040
CENTRO OESTE3034
SUL2279
ÓLEO DIESEL S10NORDESTE2807
NORTE2149
SUDESTE1249
CENTRO OESTE1110
SUL937
\n", "
" ], "text/plain": [ " REGIÃO\n", "PRODUTO REGIÃO \n", "ETANOL HIDRATADO NORDESTE 6821\n", " NORTE 5021\n", " SUDESTE 3039\n", " CENTRO OESTE 3022\n", " SUL 2278\n", "GASOLINA COMUM NORDESTE 6838\n", " NORTE 5289\n", " SUDESTE 3040\n", " CENTRO OESTE 3034\n", " SUL 2279\n", "GLP NORDESTE 6185\n", " NORTE 5152\n", " SUDESTE 3037\n", " CENTRO OESTE 2998\n", " SUL 2268\n", "GNV NORDESTE 5030\n", " SUDESTE 2772\n", " SUL 1847\n", " CENTRO OESTE 825\n", " NORTE 233\n", "ÓLEO DIESEL NORDESTE 6836\n", " NORTE 5290\n", " SUDESTE 3040\n", " CENTRO OESTE 3034\n", " SUL 2279\n", "ÓLEO DIESEL S10 NORDESTE 2807\n", " NORTE 2149\n", " SUDESTE 1249\n", " CENTRO OESTE 1110\n", " SUL 937" ] }, "execution_count": 278, "metadata": {}, "output_type": "execute_result" } ], "source": [ "grupos['REGIÃO'].value_counts().to_frame()" ] }, { "cell_type": "markdown", "id": "ruled-waste", "metadata": {}, "source": [ "### 7.2 Como os preços da Gasolina Comum em São Paulo variaram em 2018?" ] }, { "cell_type": "code", "execution_count": 281, "id": "personalized-charity", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
923192018-01-072018-01-13SUDESTESAO PAULOGASOLINA COMUM1641R$/l3.9880.1563.4994.5990.4110.0393.5770.1042.9903.95100.02912018
924652018-01-142018-01-20SUDESTESAO PAULOGASOLINA COMUM1648R$/l4.0020.1553.5494.4990.4120.0393.5900.1022.9903.90140.02812018
926102018-01-212018-01-27SUDESTESAO PAULOGASOLINA COMUM1648R$/l4.0060.1603.4994.8990.4100.0403.5960.1022.9903.90140.02812018
927552018-01-282018-02-03SUDESTESAO PAULOGASOLINA COMUM1644R$/l4.0190.1563.5794.6990.4230.0393.5960.1072.9243.95370.03012018
929012018-02-042018-02-10SUDESTESAO PAULOGASOLINA COMUM1646R$/l4.0040.1573.5794.5970.4160.0393.5880.1022.9903.95370.02822018
\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "92319 2018-01-07 2018-01-13 SUDESTE SAO PAULO GASOLINA COMUM \n", "92465 2018-01-14 2018-01-20 SUDESTE SAO PAULO GASOLINA COMUM \n", "92610 2018-01-21 2018-01-27 SUDESTE SAO PAULO GASOLINA COMUM \n", "92755 2018-01-28 2018-02-03 SUDESTE SAO PAULO GASOLINA COMUM \n", "92901 2018-02-04 2018-02-10 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "92319 1641 R$/l 3.988 \n", "92465 1648 R$/l 4.002 \n", "92610 1648 R$/l 4.006 \n", "92755 1644 R$/l 4.019 \n", "92901 1646 R$/l 4.004 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "92319 0.156 3.499 4.599 \n", "92465 0.155 3.549 4.499 \n", "92610 0.160 3.499 4.899 \n", "92755 0.156 3.579 4.699 \n", "92901 0.157 3.579 4.597 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "92319 0.411 0.039 \n", "92465 0.412 0.039 \n", "92610 0.410 0.040 \n", "92755 0.423 0.039 \n", "92901 0.416 0.039 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "92319 3.577 0.104 \n", "92465 3.590 0.102 \n", "92610 3.596 0.102 \n", "92755 3.596 0.107 \n", "92901 3.588 0.102 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "92319 2.990 3.9510 \n", "92465 2.990 3.9014 \n", "92610 2.990 3.9014 \n", "92755 2.924 3.9537 \n", "92901 2.990 3.9537 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "92319 0.029 1 2018 \n", "92465 0.028 1 2018 \n", "92610 0.028 1 2018 \n", "92755 0.030 1 2018 \n", "92901 0.028 2 2018 " ] }, "execution_count": 281, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_sp_2018 = df.query('PRODUTO == \"GASOLINA COMUM\" and ESTADO == \"SAO PAULO\" and ANO == 2018')\n", "gasolina_sp_2018.head()" ] }, { "cell_type": "code", "execution_count": 282, "id": "figured-gnome", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(52, 20)" ] }, "execution_count": 282, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_sp_2018.shape" ] }, { "cell_type": "markdown", "id": "negative-fellowship", "metadata": {}, "source": [ "#### **Estatísticas Descritivas**" ] }, { "cell_type": "code", "execution_count": 283, "id": "generic-tablet", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
NÚMERO DE POSTOS PESQUISADOSPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
count52.00000052.00000052.00000052.00000052.00000052.00000052.00000052.00000052.00000052.0000052.00000052.00000052.00000052.0
mean1610.2115384.2027690.1755003.6715004.9757500.4424810.0417503.7602880.1096543.312954.1394540.0290966.6153852018.0
std213.6274320.1806720.0179550.1638080.2111980.0632710.0039650.1636640.0107120.266840.1958970.0024603.4706270.0
min102.0000003.9700000.1500003.3690004.4990000.3660000.0340003.5630000.0870002.924003.8875000.0230001.0000002018.0
25%1639.0000004.0080000.1597503.4990004.8990000.4045000.0390003.6202500.1020002.990003.9657750.0280004.0000002018.0
50%1642.0000004.2020000.1730003.6790004.9990000.4215000.0400003.7565000.1080003.350004.0955000.0290007.0000002018.0
75%1644.0000004.3362500.1890003.7840005.0990000.4702500.0440003.8622500.1162503.532504.2590000.0300009.2500002018.0
max1649.0000004.5120000.2160003.9690005.2990000.6400000.0510004.0850000.1440003.760004.5510000.03700012.0000002018.0
\n", "
" ], "text/plain": [ " NÚMERO DE POSTOS PESQUISADOS PREÇO MÉDIO REVENDA \\\n", "count 52.000000 52.000000 \n", "mean 1610.211538 4.202769 \n", "std 213.627432 0.180672 \n", "min 102.000000 3.970000 \n", "25% 1639.000000 4.008000 \n", "50% 1642.000000 4.202000 \n", "75% 1644.000000 4.336250 \n", "max 1649.000000 4.512000 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "count 52.000000 52.000000 52.000000 \n", "mean 0.175500 3.671500 4.975750 \n", "std 0.017955 0.163808 0.211198 \n", "min 0.150000 3.369000 4.499000 \n", "25% 0.159750 3.499000 4.899000 \n", "50% 0.173000 3.679000 4.999000 \n", "75% 0.189000 3.784000 5.099000 \n", "max 0.216000 3.969000 5.299000 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "count 52.000000 52.000000 \n", "mean 0.442481 0.041750 \n", "std 0.063271 0.003965 \n", "min 0.366000 0.034000 \n", "25% 0.404500 0.039000 \n", "50% 0.421500 0.040000 \n", "75% 0.470250 0.044000 \n", "max 0.640000 0.051000 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "count 52.000000 52.000000 \n", "mean 3.760288 0.109654 \n", "std 0.163664 0.010712 \n", "min 3.563000 0.087000 \n", "25% 3.620250 0.102000 \n", "50% 3.756500 0.108000 \n", "75% 3.862250 0.116250 \n", "max 4.085000 0.144000 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "count 52.00000 52.000000 \n", "mean 3.31295 4.139454 \n", "std 0.26684 0.195897 \n", "min 2.92400 3.887500 \n", "25% 2.99000 3.965775 \n", "50% 3.35000 4.095500 \n", "75% 3.53250 4.259000 \n", "max 3.76000 4.551000 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "count 52.000000 52.000000 52.0 \n", "mean 0.029096 6.615385 2018.0 \n", "std 0.002460 3.470627 0.0 \n", "min 0.023000 1.000000 2018.0 \n", "25% 0.028000 4.000000 2018.0 \n", "50% 0.029000 7.000000 2018.0 \n", "75% 0.030000 9.250000 2018.0 \n", "max 0.037000 12.000000 2018.0 " ] }, "execution_count": 283, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_sp_2018.describe()" ] }, { "cell_type": "code", "execution_count": 286, "id": "narrative-governor", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PREÇO MÉDIO REVENDA
count52.000000
mean4.202769
std0.180672
min3.970000
25%4.008000
50%4.202000
75%4.336250
max4.512000
\n", "
" ], "text/plain": [ " PREÇO MÉDIO REVENDA\n", "count 52.000000\n", "mean 4.202769\n", "std 0.180672\n", "min 3.970000\n", "25% 4.008000\n", "50% 4.202000\n", "75% 4.336250\n", "max 4.512000" ] }, "execution_count": 286, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_sp_2018['PREÇO MÉDIO REVENDA'].describe().to_frame()" ] }, { "cell_type": "markdown", "id": "valuable-skirt", "metadata": {}, "source": [ "### 7.3 Como os preços da Gasolina Comum e do Etanol em São Paulo variaram em 2018?" ] }, { "cell_type": "code", "execution_count": 288, "id": "herbal-birmingham", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
922382018-01-072018-01-13SUDESTESAO PAULOETANOL HIDRATADO1664R$/l2.8330.1392.4493.3990.3380.0492.4950.0922.18422.88330.03712018
923192018-01-072018-01-13SUDESTESAO PAULOGASOLINA COMUM1641R$/l3.9880.1563.4994.5990.4110.0393.5770.1042.99003.95100.02912018
923842018-01-142018-01-20SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.8680.1342.3993.3990.3310.0472.5370.0872.26002.84710.03412018
924652018-01-142018-01-20SUDESTESAO PAULOGASOLINA COMUM1648R$/l4.0020.1553.5494.4990.4120.0393.5900.1022.99003.90140.02812018
925292018-01-212018-01-27SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.8740.1352.3993.3990.3240.0472.5500.0951.69002.97220.03712018
...............................................................
994102018-12-162018-12-22SUDESTESAO PAULOGASOLINA COMUM1637R$/l4.1290.2013.6995.0990.4900.0493.6390.1103.35003.98920.030122018
994722018-12-232018-12-29SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.6440.1632.1493.6990.3050.0622.3390.0942.00672.74430.040122018
995532018-12-232018-12-29SUDESTESAO PAULOGASOLINA COMUM1641R$/l4.1290.2013.6994.9990.4840.0493.6450.1073.35003.98920.029122018
996172018-12-302019-01-05SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.6430.1612.2593.6990.3030.0612.3400.0971.90722.79570.041122018
996982018-12-302019-01-05SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.1130.2013.5994.9990.5030.0493.6100.1003.35003.95850.028122018
\n", "

104 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "92238 2018-01-07 2018-01-13 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92319 2018-01-07 2018-01-13 SUDESTE SAO PAULO GASOLINA COMUM \n", "92384 2018-01-14 2018-01-20 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92465 2018-01-14 2018-01-20 SUDESTE SAO PAULO GASOLINA COMUM \n", "92529 2018-01-21 2018-01-27 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "99410 2018-12-16 2018-12-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "99472 2018-12-23 2018-12-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99553 2018-12-23 2018-12-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "99617 2018-12-30 2019-01-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99698 2018-12-30 2019-01-05 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "92238 1664 R$/l 2.833 \n", "92319 1641 R$/l 3.988 \n", "92384 1661 R$/l 2.868 \n", "92465 1648 R$/l 4.002 \n", "92529 1662 R$/l 2.874 \n", "... ... ... ... \n", "99410 1637 R$/l 4.129 \n", "99472 1662 R$/l 2.644 \n", "99553 1641 R$/l 4.129 \n", "99617 1661 R$/l 2.643 \n", "99698 1643 R$/l 4.113 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "92238 0.139 2.449 3.399 \n", "92319 0.156 3.499 4.599 \n", "92384 0.134 2.399 3.399 \n", "92465 0.155 3.549 4.499 \n", "92529 0.135 2.399 3.399 \n", "... ... ... ... \n", "99410 0.201 3.699 5.099 \n", "99472 0.163 2.149 3.699 \n", "99553 0.201 3.699 4.999 \n", "99617 0.161 2.259 3.699 \n", "99698 0.201 3.599 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "92238 0.338 0.049 \n", "92319 0.411 0.039 \n", "92384 0.331 0.047 \n", "92465 0.412 0.039 \n", "92529 0.324 0.047 \n", "... ... ... \n", "99410 0.490 0.049 \n", "99472 0.305 0.062 \n", "99553 0.484 0.049 \n", "99617 0.303 0.061 \n", "99698 0.503 0.049 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "92238 2.495 0.092 \n", "92319 3.577 0.104 \n", "92384 2.537 0.087 \n", "92465 3.590 0.102 \n", "92529 2.550 0.095 \n", "... ... ... \n", "99410 3.639 0.110 \n", "99472 2.339 0.094 \n", "99553 3.645 0.107 \n", "99617 2.340 0.097 \n", "99698 3.610 0.100 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "92238 2.1842 2.8833 \n", "92319 2.9900 3.9510 \n", "92384 2.2600 2.8471 \n", "92465 2.9900 3.9014 \n", "92529 1.6900 2.9722 \n", "... ... ... \n", "99410 3.3500 3.9892 \n", "99472 2.0067 2.7443 \n", "99553 3.3500 3.9892 \n", "99617 1.9072 2.7957 \n", "99698 3.3500 3.9585 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "92238 0.037 1 2018 \n", "92319 0.029 1 2018 \n", "92384 0.034 1 2018 \n", "92465 0.028 1 2018 \n", "92529 0.037 1 2018 \n", "... ... ... ... \n", "99410 0.030 12 2018 \n", "99472 0.040 12 2018 \n", "99553 0.029 12 2018 \n", "99617 0.041 12 2018 \n", "99698 0.028 12 2018 \n", "\n", "[104 rows x 20 columns]" ] }, "execution_count": 288, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.query('(PRODUTO == \"GASOLINA COMUM\" or PRODUTO == \"ETANOL HIDRATADO\") and ESTADO == \"SAO PAULO\" and ANO == 2018')" ] }, { "cell_type": "code", "execution_count": 291, "id": "statutory-moses", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
922382018-01-072018-01-13SUDESTESAO PAULOETANOL HIDRATADO1664R$/l2.8330.1392.4493.3990.3380.0492.4950.0922.18422.88330.03712018
923192018-01-072018-01-13SUDESTESAO PAULOGASOLINA COMUM1641R$/l3.9880.1563.4994.5990.4110.0393.5770.1042.99003.95100.02912018
923842018-01-142018-01-20SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.8680.1342.3993.3990.3310.0472.5370.0872.26002.84710.03412018
924652018-01-142018-01-20SUDESTESAO PAULOGASOLINA COMUM1648R$/l4.0020.1553.5494.4990.4120.0393.5900.1022.99003.90140.02812018
925292018-01-212018-01-27SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.8740.1352.3993.3990.3240.0472.5500.0951.69002.97220.03712018
...............................................................
994102018-12-162018-12-22SUDESTESAO PAULOGASOLINA COMUM1637R$/l4.1290.2013.6995.0990.4900.0493.6390.1103.35003.98920.030122018
994722018-12-232018-12-29SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.6440.1632.1493.6990.3050.0622.3390.0942.00672.74430.040122018
995532018-12-232018-12-29SUDESTESAO PAULOGASOLINA COMUM1641R$/l4.1290.2013.6994.9990.4840.0493.6450.1073.35003.98920.029122018
996172018-12-302019-01-05SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.6430.1612.2593.6990.3030.0612.3400.0971.90722.79570.041122018
996982018-12-302019-01-05SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.1130.2013.5994.9990.5030.0493.6100.1003.35003.95850.028122018
\n", "

104 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "92238 2018-01-07 2018-01-13 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92319 2018-01-07 2018-01-13 SUDESTE SAO PAULO GASOLINA COMUM \n", "92384 2018-01-14 2018-01-20 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92465 2018-01-14 2018-01-20 SUDESTE SAO PAULO GASOLINA COMUM \n", "92529 2018-01-21 2018-01-27 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "99410 2018-12-16 2018-12-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "99472 2018-12-23 2018-12-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99553 2018-12-23 2018-12-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "99617 2018-12-30 2019-01-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99698 2018-12-30 2019-01-05 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "92238 1664 R$/l 2.833 \n", "92319 1641 R$/l 3.988 \n", "92384 1661 R$/l 2.868 \n", "92465 1648 R$/l 4.002 \n", "92529 1662 R$/l 2.874 \n", "... ... ... ... \n", "99410 1637 R$/l 4.129 \n", "99472 1662 R$/l 2.644 \n", "99553 1641 R$/l 4.129 \n", "99617 1661 R$/l 2.643 \n", "99698 1643 R$/l 4.113 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "92238 0.139 2.449 3.399 \n", "92319 0.156 3.499 4.599 \n", "92384 0.134 2.399 3.399 \n", "92465 0.155 3.549 4.499 \n", "92529 0.135 2.399 3.399 \n", "... ... ... ... \n", "99410 0.201 3.699 5.099 \n", "99472 0.163 2.149 3.699 \n", "99553 0.201 3.699 4.999 \n", "99617 0.161 2.259 3.699 \n", "99698 0.201 3.599 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "92238 0.338 0.049 \n", "92319 0.411 0.039 \n", "92384 0.331 0.047 \n", "92465 0.412 0.039 \n", "92529 0.324 0.047 \n", "... ... ... \n", "99410 0.490 0.049 \n", "99472 0.305 0.062 \n", "99553 0.484 0.049 \n", "99617 0.303 0.061 \n", "99698 0.503 0.049 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "92238 2.495 0.092 \n", "92319 3.577 0.104 \n", "92384 2.537 0.087 \n", "92465 3.590 0.102 \n", "92529 2.550 0.095 \n", "... ... ... \n", "99410 3.639 0.110 \n", "99472 2.339 0.094 \n", "99553 3.645 0.107 \n", "99617 2.340 0.097 \n", "99698 3.610 0.100 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "92238 2.1842 2.8833 \n", "92319 2.9900 3.9510 \n", "92384 2.2600 2.8471 \n", "92465 2.9900 3.9014 \n", "92529 1.6900 2.9722 \n", "... ... ... \n", "99410 3.3500 3.9892 \n", "99472 2.0067 2.7443 \n", "99553 3.3500 3.9892 \n", "99617 1.9072 2.7957 \n", "99698 3.3500 3.9585 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "92238 0.037 1 2018 \n", "92319 0.029 1 2018 \n", "92384 0.034 1 2018 \n", "92465 0.028 1 2018 \n", "92529 0.037 1 2018 \n", "... ... ... ... \n", "99410 0.030 12 2018 \n", "99472 0.040 12 2018 \n", "99553 0.029 12 2018 \n", "99617 0.041 12 2018 \n", "99698 0.028 12 2018 \n", "\n", "[104 rows x 20 columns]" ] }, "execution_count": 291, "metadata": {}, "output_type": "execute_result" } ], "source": [ "lista_de_estados = [\"GASOLINA COMUM\", \"ETANOL HIDRATADO\"]\n", "df.query('PRODUTO in @lista_de_estados and ESTADO == \"SAO PAULO\" and ANO == 2018')" ] }, { "cell_type": "code", "execution_count": 292, "id": "familiar-pregnancy", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
DATA INICIALDATA FINALREGIÃOESTADOPRODUTONÚMERO DE POSTOS PESQUISADOSUNIDADE DE MEDIDAPREÇO MÉDIO REVENDADESVIO PADRÃO REVENDAPREÇO MÍNIMO REVENDAPREÇO MÁXIMO REVENDAMARGEM MÉDIA REVENDACOEF DE VARIAÇÃO REVENDAPREÇO MÉDIO DISTRIBUIÇÃODESVIO PADRÃO DISTRIBUIÇÃOPREÇO MÍNIMO DISTRIBUIÇÃOPREÇO MÁXIMO DISTRIBUIÇÃOCOEF DE VARIAÇÃO DISTRIBUIÇÃOMÊSANO
922382018-01-072018-01-13SUDESTESAO PAULOETANOL HIDRATADO1664R$/l2.8330.1392.4493.3990.3380.0492.4950.0922.18422.88330.03712018
923192018-01-072018-01-13SUDESTESAO PAULOGASOLINA COMUM1641R$/l3.9880.1563.4994.5990.4110.0393.5770.1042.99003.95100.02912018
923842018-01-142018-01-20SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.8680.1342.3993.3990.3310.0472.5370.0872.26002.84710.03412018
924652018-01-142018-01-20SUDESTESAO PAULOGASOLINA COMUM1648R$/l4.0020.1553.5494.4990.4120.0393.5900.1022.99003.90140.02812018
925292018-01-212018-01-27SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.8740.1352.3993.3990.3240.0472.5500.0951.69002.97220.03712018
...............................................................
994102018-12-162018-12-22SUDESTESAO PAULOGASOLINA COMUM1637R$/l4.1290.2013.6995.0990.4900.0493.6390.1103.35003.98920.030122018
994722018-12-232018-12-29SUDESTESAO PAULOETANOL HIDRATADO1662R$/l2.6440.1632.1493.6990.3050.0622.3390.0942.00672.74430.040122018
995532018-12-232018-12-29SUDESTESAO PAULOGASOLINA COMUM1641R$/l4.1290.2013.6994.9990.4840.0493.6450.1073.35003.98920.029122018
996172018-12-302019-01-05SUDESTESAO PAULOETANOL HIDRATADO1661R$/l2.6430.1612.2593.6990.3030.0612.3400.0971.90722.79570.041122018
996982018-12-302019-01-05SUDESTESAO PAULOGASOLINA COMUM1643R$/l4.1130.2013.5994.9990.5030.0493.6100.1003.35003.95850.028122018
\n", "

104 rows × 20 columns

\n", "
" ], "text/plain": [ " DATA INICIAL DATA FINAL REGIÃO ESTADO PRODUTO \\\n", "92238 2018-01-07 2018-01-13 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92319 2018-01-07 2018-01-13 SUDESTE SAO PAULO GASOLINA COMUM \n", "92384 2018-01-14 2018-01-20 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "92465 2018-01-14 2018-01-20 SUDESTE SAO PAULO GASOLINA COMUM \n", "92529 2018-01-21 2018-01-27 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "... ... ... ... ... ... \n", "99410 2018-12-16 2018-12-22 SUDESTE SAO PAULO GASOLINA COMUM \n", "99472 2018-12-23 2018-12-29 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99553 2018-12-23 2018-12-29 SUDESTE SAO PAULO GASOLINA COMUM \n", "99617 2018-12-30 2019-01-05 SUDESTE SAO PAULO ETANOL HIDRATADO \n", "99698 2018-12-30 2019-01-05 SUDESTE SAO PAULO GASOLINA COMUM \n", "\n", " NÚMERO DE POSTOS PESQUISADOS UNIDADE DE MEDIDA PREÇO MÉDIO REVENDA \\\n", "92238 1664 R$/l 2.833 \n", "92319 1641 R$/l 3.988 \n", "92384 1661 R$/l 2.868 \n", "92465 1648 R$/l 4.002 \n", "92529 1662 R$/l 2.874 \n", "... ... ... ... \n", "99410 1637 R$/l 4.129 \n", "99472 1662 R$/l 2.644 \n", "99553 1641 R$/l 4.129 \n", "99617 1661 R$/l 2.643 \n", "99698 1643 R$/l 4.113 \n", "\n", " DESVIO PADRÃO REVENDA PREÇO MÍNIMO REVENDA PREÇO MÁXIMO REVENDA \\\n", "92238 0.139 2.449 3.399 \n", "92319 0.156 3.499 4.599 \n", "92384 0.134 2.399 3.399 \n", "92465 0.155 3.549 4.499 \n", "92529 0.135 2.399 3.399 \n", "... ... ... ... \n", "99410 0.201 3.699 5.099 \n", "99472 0.163 2.149 3.699 \n", "99553 0.201 3.699 4.999 \n", "99617 0.161 2.259 3.699 \n", "99698 0.201 3.599 4.999 \n", "\n", " MARGEM MÉDIA REVENDA COEF DE VARIAÇÃO REVENDA \\\n", "92238 0.338 0.049 \n", "92319 0.411 0.039 \n", "92384 0.331 0.047 \n", "92465 0.412 0.039 \n", "92529 0.324 0.047 \n", "... ... ... \n", "99410 0.490 0.049 \n", "99472 0.305 0.062 \n", "99553 0.484 0.049 \n", "99617 0.303 0.061 \n", "99698 0.503 0.049 \n", "\n", " PREÇO MÉDIO DISTRIBUIÇÃO DESVIO PADRÃO DISTRIBUIÇÃO \\\n", "92238 2.495 0.092 \n", "92319 3.577 0.104 \n", "92384 2.537 0.087 \n", "92465 3.590 0.102 \n", "92529 2.550 0.095 \n", "... ... ... \n", "99410 3.639 0.110 \n", "99472 2.339 0.094 \n", "99553 3.645 0.107 \n", "99617 2.340 0.097 \n", "99698 3.610 0.100 \n", "\n", " PREÇO MÍNIMO DISTRIBUIÇÃO PREÇO MÁXIMO DISTRIBUIÇÃO \\\n", "92238 2.1842 2.8833 \n", "92319 2.9900 3.9510 \n", "92384 2.2600 2.8471 \n", "92465 2.9900 3.9014 \n", "92529 1.6900 2.9722 \n", "... ... ... \n", "99410 3.3500 3.9892 \n", "99472 2.0067 2.7443 \n", "99553 3.3500 3.9892 \n", "99617 1.9072 2.7957 \n", "99698 3.3500 3.9585 \n", "\n", " COEF DE VARIAÇÃO DISTRIBUIÇÃO MÊS ANO \n", "92238 0.037 1 2018 \n", "92319 0.029 1 2018 \n", "92384 0.034 1 2018 \n", "92465 0.028 1 2018 \n", "92529 0.037 1 2018 \n", "... ... ... ... \n", "99410 0.030 12 2018 \n", "99472 0.040 12 2018 \n", "99553 0.029 12 2018 \n", "99617 0.041 12 2018 \n", "99698 0.028 12 2018 \n", "\n", "[104 rows x 20 columns]" ] }, "execution_count": 292, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_etanol_sp_2018 = df.query('PRODUTO in [\"GASOLINA COMUM\", \"ETANOL HIDRATADO\"] and ESTADO == \"SAO PAULO\" and ANO == 2018')\n", "gasolina_etanol_sp_2018" ] }, { "cell_type": "code", "execution_count": 293, "id": "comparable-uncle", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
PREÇO MÉDIO REVENDA
count104.000000
mean3.457337
std0.766239
min2.393000
25%2.726000
50%3.431000
75%4.199000
max4.512000
\n", "
" ], "text/plain": [ " PREÇO MÉDIO REVENDA\n", "count 104.000000\n", "mean 3.457337\n", "std 0.766239\n", "min 2.393000\n", "25% 2.726000\n", "50% 3.431000\n", "75% 4.199000\n", "max 4.512000" ] }, "execution_count": 293, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# considerando os preços do etanol e da gasolina juntos, teremos essas estatística descritivas \n", "gasolina_etanol_sp_2018['PREÇO MÉDIO REVENDA'].describe().to_frame()" ] }, { "cell_type": "code", "execution_count": 294, "id": "ordinary-bacteria", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
countmeanstdmin25%50%75%max
PRODUTO
ETANOL HIDRATADO52.02.7119040.1413652.3932.63152.7202.838252.892
GASOLINA COMUM52.04.2027690.1806723.9704.00804.2024.336254.512
\n", "
" ], "text/plain": [ " count mean std min 25% 50% 75% \\\n", "PRODUTO \n", "ETANOL HIDRATADO 52.0 2.711904 0.141365 2.393 2.6315 2.720 2.83825 \n", "GASOLINA COMUM 52.0 4.202769 0.180672 3.970 4.0080 4.202 4.33625 \n", "\n", " max \n", "PRODUTO \n", "ETANOL HIDRATADO 2.892 \n", "GASOLINA COMUM 4.512 " ] }, "execution_count": 294, "metadata": {}, "output_type": "execute_result" } ], "source": [ "gasolina_etanol_sp_2018.groupby('PRODUTO')['PREÇO MÉDIO REVENDA'].describe()" ] }, { "cell_type": "markdown", "id": "horizontal-finger", "metadata": {}, "source": [ "

8. Assuntos para continuar os estudos

\n", "
\n", "\n", "- join\n", "- concat\n", "- plot\n", "- data cleaning" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.8.5" } }, "nbformat": 4, "nbformat_minor": 5 }