{"cells":[{"cell_type":"markdown","metadata":{"tags":[],"id":"zj7hBDWosuws"},"source":["# Primera Entrega del Proyecto Final\n","\n","Dataset a usar: [Encuesta de viajes y turismo de los hogares en Argentina](https://datos.yvera.gob.ar/dataset/encuesta-de-viajes-y-turismo-de-los-hogares-evyth-microdatos)\n","\n","[Más información](https://datos.yvera.gob.ar/dataset/945e10f1-eee7-48a2-b0ef-8aff11df8814/resource/f41af122-ca31-4654-907b-a9cd57b80651/download/evyth-data.pdf)"]},{"cell_type":"markdown","metadata":{"cell_id":"a18869fe26a94da882d48aefe23d9844","deepnote_cell_type":"markdown","id":"p2Rkx6Q1uWU6"},"source":["# Abstract\n","\n","La economía argentina ha enfrentado desafíos significativos en los últimos tiempos, lo que ha llevado a una disminución en el poder adquisitivo de la población y ha generado dificultades para acceder a experiencias vacacionales en destinos internacionales. Como consecuencia directa, muchos ciudadanos han optado por buscar opciones más accesibles y cercanas, redescubriendo la riqueza y variedad de lugares turísticos dentro del territorio nacional.\n","\n","Esta tendencia al alza en el turismo interno ha resultado beneficiosa para el desarrollo de la industria turística local, impulsando la generación de empleo y el crecimiento económico en diferentes regiones del país. Además, ha permitido potenciar la valoración y promoción del patrimonio cultural, natural e histórico de Argentina, fomentando el sentimiento de pertenencia y orgullo entre sus habitantes.\n","\n","No obstante, es importante destacar que este fenómeno también ha generado retos y desafíos, como la necesidad de mejorar la infraestructura y los servicios turísticos para satisfacer la creciente demanda interna. Asimismo, se requiere un enfoque sostenible y responsable para preservar los recursos naturales y culturales, garantizando que el turismo interno sea una opción viable y sustentable a largo plazo.\n","\n","En conclusión, la crisis económica que ha afectado a los argentinos ha impulsado un cambio en las preferencias vacacionales, promoviendo un aumento significativo en el turismo interno como alternativa a los viajes al extranjero. Esta tendencia ha demostrado ser una oportunidad para el desarrollo y valorización de los atractivos nacionales, aunque implica la necesidad de abordar de manera adecuada los desafíos que se presentan para asegurar un turismo interno próspero y sustentable en el futuro.\n","\n","El dataset que se utilizará en este proyecto proviene del Sistema de Información Turística de la Argentina. Consiste en un agrupamiento de encuestas que tiene como objetivo medir la evolución de los viajes realizados por los hogares argentinos, sus características y computar aspectos socio-demográficos que permitan caracterizar a los turistas residentes."]},{"cell_type":"markdown","source":["# Introducción"],"metadata":{"id":"VgVdmHaHfn1o"}},{"cell_type":"markdown","source":["## Objetivo\n","\n","La finalidad de este proyecto es crear un modelo de Machine Learning que permita agrupar a los turistas internos en Argentina en diferentes grupos socio-demográficos según características en común que tengan.\n","\n","## Contexto Comercial\n","\n","Frente al aumento del turismo interno que enfrenta el país debido a la crisis económica, el Miniterio de Turismo propuso realizar mejoras de infraestructura que permitan brindar una mejor experiencia a todos los turistas alrededor del país.\n","\n","Para hacer esto, determinaron que la mejor manera de realizar estas mejoras es ir atacando el problema por área. Es por esto que decidieron contratar a un científico de datos, con la finalidad de separar a los turistas interior en diferentes grupos socio-demográficos, de tal forma que a partir de estas separaciones se puedan brindar soluciones de infraestructura mucho más efectivas en el país.\n","\n","## Problema Comercial\n","\n","En base al dataset a utilizar se busca resolver los siguientes problemas:\n","\n","* ¿Es el dataset suficiente y efectivo para realizar una agrupación socio-demográfica de los turistas internos?\n","\n","* ¿Qué aspectos son más relevantes a la hora de definir estos grupos?\n","\n","## Contexto Analítico\n","\n","El trabajo será realizado sobre un archivo .CSV que contiene datos sobre diferentes atributos económicos, sociales y culturales de los turistas internos. Complementario a esto, tenemos otro archivo .CSV que brinda información sobre las diferentes variables presentes en el dataset principal.\n","\n","Como queremos agrupar a los turistas en base a los atributos en el dataset, sin tener alguna variable específica que los defina y clasifique a cada uno, podemos decir que estamos ante un problema de aprendizaje no supervisado."],"metadata":{"id":"mtvE5EKZBAjV"}},{"cell_type":"markdown","metadata":{"id":"43__mqwnsuwu"},"source":["# Librerías"]},{"cell_type":"code","execution_count":null,"metadata":{"cell_id":"d4e376c7158f4c2592d185b039f2449c","deepnote_cell_type":"code","id":"62wzCfpUu6zN","tags":[]},"outputs":[],"source":["import numpy as np\n","import pandas as pd\n","import matplotlib as mpl\n","import matplotlib.pyplot as plt\n","import seaborn as sns\n","mpl.style.use('bmh')"]},{"cell_type":"markdown","metadata":{"id":"n0mlZHKvsuwx"},"source":["# Extracción del Dataset"]},{"cell_type":"markdown","source":["Para comenzar a trabajar los datos, disponemos de dos archivos. El primero, el cual contiene el dataset propiamente dicho. El segundo, contiene definiciones con respecto a los valores aplicados al dataset."],"metadata":{"id":"TZF6qyc782e4"}},{"cell_type":"code","execution_count":null,"metadata":{"cell_id":"dcfdd748e5a24e948e4de38b475359c0","colab":{"base_uri":"https://localhost:8080/","height":280},"deepnote_cell_type":"code","executionInfo":{"elapsed":14186,"status":"ok","timestamp":1690501798582,"user":{"displayName":"Franco Giordano","userId":"11864357500095360887"},"user_tz":180},"id":"KRx0P-JXu9oc","outputId":"17ada33e-b2b6-48f2-bfab-ea0a0e69289b","tags":[]},"outputs":[{"output_type":"execute_result","data":{"text/plain":[" id_hogar id_viajes miembro anio trimestre region_origen \\\n","0 71 41201 1 2012 1 2 \n","1 71 41201 2 2012 1 2 \n","2 71 41201 4 2012 1 2 \n","3 71 41201 3 2012 1 2 \n","4 71 61201 3 2012 1 2 \n","\n"," aglomerado_origen region_destino provincia_destino localidad_destino \\\n","0 33 3 6 Mar del Tuyú \n","1 33 3 6 Mar del Tuyú \n","2 33 3 6 Mar del Tuyú \n","3 33 3 6 Mar del Tuyú \n","4 33 3 6 Reta \n","\n"," ... p006 p006_agrup p007 nivel_ed cond_act p013 j_sexo j_edad \\\n","0 ... 54 4 2.0 7 1 2 1 3 \n","1 ... 56 4 2.0 4 1 3 1 3 \n","2 ... 27 2 2.0 9 1 3 1 3 \n","3 ... 23 2 1.0 8 1 2 1 3 \n","4 ... 23 2 1.0 8 1 2 1 3 \n","\n"," j_nivel_ed j_cond_act \n","0 4 1 \n","1 4 1 \n","2 4 1 \n","3 4 1 \n","4 4 1 \n","\n","[5 rows x 88 columns]"],"text/html":["\n","\n","
\n"," | id_hogar | \n","id_viajes | \n","miembro | \n","anio | \n","trimestre | \n","region_origen | \n","aglomerado_origen | \n","region_destino | \n","provincia_destino | \n","localidad_destino | \n","... | \n","p006 | \n","p006_agrup | \n","p007 | \n","nivel_ed | \n","cond_act | \n","p013 | \n","j_sexo | \n","j_edad | \n","j_nivel_ed | \n","j_cond_act | \n","
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n","71 | \n","41201 | \n","1 | \n","2012 | \n","1 | \n","2 | \n","33 | \n","3 | \n","6 | \n","Mar del Tuyú | \n","... | \n","54 | \n","4 | \n","2.0 | \n","7 | \n","1 | \n","2 | \n","1 | \n","3 | \n","4 | \n","1 | \n","
1 | \n","71 | \n","41201 | \n","2 | \n","2012 | \n","1 | \n","2 | \n","33 | \n","3 | \n","6 | \n","Mar del Tuyú | \n","... | \n","56 | \n","4 | \n","2.0 | \n","4 | \n","1 | \n","3 | \n","1 | \n","3 | \n","4 | \n","1 | \n","
2 | \n","71 | \n","41201 | \n","4 | \n","2012 | \n","1 | \n","2 | \n","33 | \n","3 | \n","6 | \n","Mar del Tuyú | \n","... | \n","27 | \n","2 | \n","2.0 | \n","9 | \n","1 | \n","3 | \n","1 | \n","3 | \n","4 | \n","1 | \n","
3 | \n","71 | \n","41201 | \n","3 | \n","2012 | \n","1 | \n","2 | \n","33 | \n","3 | \n","6 | \n","Mar del Tuyú | \n","... | \n","23 | \n","2 | \n","1.0 | \n","8 | \n","1 | \n","2 | \n","1 | \n","3 | \n","4 | \n","1 | \n","
4 | \n","71 | \n","61201 | \n","3 | \n","2012 | \n","1 | \n","2 | \n","33 | \n","3 | \n","6 | \n","Reta | \n","... | \n","23 | \n","2 | \n","1.0 | \n","8 | \n","1 | \n","2 | \n","1 | \n","3 | \n","4 | \n","1 | \n","
5 rows × 88 columns
\n","\n"," | variable | \n","descripcion | \n","
---|---|---|
0 | \n","id_hogar | \n","Código de identificación único de hogares | \n","
1 | \n","id_viajes | \n","Código de identificación único de viajes | \n","
2 | \n","miembro | \n","Número de miembro en el hogar | \n","
3 | \n","anio | \n","Año | \n","
4 | \n","trimestre | \n","Trimestre | \n","
... | \n","... | \n","... | \n","
456 | \n","p013 | \n","Tipo de cobertura de salud | \n","
462 | \n","j_sexo | \n","Sexo del jefe o jefa del hogar | \n","
465 | \n","j_edad | \n","Edad del jefe o jefa del hogar | \n","
470 | \n","j_nivel_ed | \n","Máximo nivel educativo del jefe o jefa del hogar | \n","
475 | \n","j_cond_act | \n","Condición de actividad del jefe o jefa del hogar | \n","
89 rows × 2 columns
\n","