{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Atherosclerosis - Disease lethality prediction\n", "\n", "With this notebook we give a brief introduction to feature engineering on relational data with *many columns.* We discuss why feature engineering on such data is *particularly challenging* and what we can do to overcome these problems.\n", "\n", "Summary:\n", "\n", "- Prediction type: __Binary classification__\n", "- Domain: __Health__\n", "- Prediction target: __Mortality within one year__ \n", "- Source data: __146 columns in 2 tables, 22 MB__\n", "- Population size: __28433__" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Feature engineering and the curse of dimensionality\n", "\n", "### The problem\n", "\n", "To illustrate the point, we give a simplified example based on the real data used in the analysis below. When we engineer features from relational data, we usually write something like this:\n", "\n", "```sql\n", "SELECT AVG(t2.HDL)\n", "FROM population_training t1\n", "LEFT JOIN contr t2\n", "ON t1.ICO = t2.ICO\n", "WHERE t1.AGE >= 60 AND t1.ALKOHOL IN ('1', '2')\n", "GROUP BY t1.ICO;\n", "```\n", "\n", "Think about that for a second. This feature aggregates high-density lipoprotein (HDL) cholesterol values recorded during control dates conditional on age and alcohol consumption. We arbitrarily choose both, the column to aggregate over *(HDL)* and the set of columns to construct conditions on *(AGE* and *ALKOHOL)* out of a greater set of 146 columns.\n", "\n", "Every column that we have can either be aggregated (here *HDL)* or it can be used for our conditions (here *AGE* and *ALKOHOL)*. That means if we have *n* columns to aggregate, we can potentially build conditions for $n$ other columns. In other words, the computational complexity is $n^2$ in the number of columns.\n", "\n", "Note that this problem occurs regardless of whether you automate feature engineering or you do it by hand. The size of the search space is $n^2$ in the number of columns in either case, unless you can rule out something a-priori.\n", "\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### The solution\n", "\n", "So when we have relational data sets with many columns, what do we do? The answer is to write different features. Specifically, suppose we had features like this:\n", "\n", "```sql\n", "SELECT AVG(\n", " CASE WHEN t1.AGE >= THEN weight1\n", " CASE WHEN t1.ALKOHOL IN ('1', '2') THEN weight2\n", " END\n", ")\n", "FROM population_training t1\n", "LEFT JOIN contr t2\n", "ON t1.ICO = t2.ICO\n", "GROUP BY t1.ICO;\n", "```\n", "\n", "*weight1* and *weight2* are learnable weights. An algorithm that generates features like this can only use columns for conditions, it is not allowed to aggregate columns – and it doesn't need to do so.\n", "\n", "That means the computational complexity is linear instead of quadratic. For data sets with a large number of columns this can make all the difference in the world. For instance, if you have 100 columns the size of the search space of the second approach is only 1% of the size of the search space of the first one.\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Background\n", "\n", "To illustrate the problem of dimensionality in predictive analytics on relational data, we use the STULONG 1 dataset. It is a longitudinal study of atherosclerosis patients.\n", "\n", "One of its defining features is that it contains many columns, which makes it a good candidate to illustrate the problem discussed in this notebook.\n", "\n", "The are some academic studies related to this dataset:\n", "\n", "* https://www.researchgate.net/publication/228572841_Mining_episode_rules_in_STULONG_dataset\n", "* https://citeseerx.ist.psu.edu/doc_view/pid/3a9cb05b77b631b6fcbe253eb93e053ba8c0719c\n", "\n", "The way these studies handle the large number of columns in the data set is to divide the columns into subgroups and then handling each subgroup separately. Even though this is one way to overcome the curse of dimensionality, it is not a very satisfying approach. We would like to be able to handle a large number of columns at once.\n", "\n", "\n", "The analysis is based on the STULONG 1 dataset. It is publicly available and can be downloaded the [the CTU Prague Relational Learning Repository](https://relational.fit.cvut.cz/dataset/Atherosclerosis) (Now residing at [relational-data.org](https://relational-data.org/dataset/Atherosclerosis).).\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Analysis" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Let's get started with the analysis and set up your session:" ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [], "source": [ "%pip install -q \"getml==1.5.0\" \"featuretools==1.31.0\" \"tsfresh==0.20.3\" \"matplotlib==3.9.2\" \"ipywidgets==8.1.5\"" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "getML API version: 1.5.0\n", "\n" ] } ], "source": [ "import matplotlib.pyplot as plt\n", "\n", "import getml\n", "\n", "%matplotlib inline \n", "\n", "print(f\"getML API version: {getml.__version__}\\n\")" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Launching ./getML --allow-push-notifications=true --allow-remote-ips=true --home-directory=/home/user --in-memory=true --install=false --launch-browser=true --log=false --token=token in /home/user/.getML/getml-1.5.0-x64-linux...\n", "Launched the getML Engine. The log output will be stored in /home/user/.getML/logs/20240912133457.log.\n", "\u001b[2K Loading pipelines... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
Connected to project 'atherosclerosis'.\n",
       "
\n" ], "text/plain": [ "Connected to project \u001b[32m'atherosclerosis'\u001b[0m.\n" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "getml.engine.launch(allow_remote_ips=True, token='token')\n", "getml.engine.set_project('atherosclerosis')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 1. Loading data\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 1.1 Download from source\n", "\n", "Downloading the raw data and convert it into a prediction ready format takes time. To get to the getML model building as fast as possible, we prepared the data for you and excluded the code from this notebook. It is made available in the example notebook featuring the full analysis." ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [], "source": [ "population, contr = getml.datasets.load_atherosclerosis()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 1.2 Prepare data for getML\n", "\n", "The `getml.datasets.load_atherosclerosis` method took care of the entire data lifting:\n", "* Downloads csv's from our servers in python\n", "* Converts csv's to getML [DataFrames](https://docs.getml.com/latest/api/getml.data.DataFrame.html#getml.data.DataFrame)\n", "* Sets [roles](https://docs.getml.com/latest/user_guide/annotating_data/annotating_data.html#roles) to columns inside getML DataFrames" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "__Data visualization__\n", "\n", "The original data (image below) model is condensed into 2 tables: \n", "\n", "* A population table *population_{train/test/validate}*, based on `death` table\n", "* A peripheral table: `contr`." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "__Death:__ population table\n", "\n", "* Reference Date: Period of time from 1976 to 1999\n", "* Target: If the patient dies within one year after each reference date\n" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nameREFERENCE_DATEENTRY_DATE ICOTARGETKONSKUP STAV VZDELANI ZODPOV TELAKTZA AKTPOZAM DOPRAVA DOPRATRV ALKOHOL BOLHR BOLDK DUSNOST MOC RARISK OBEZRISK KOURRISK HTRISK CHOLRISK KOURENI DOBAKOUR BYVKURAK PIVOMN VINOMN LIHMN KAVA CAJ CUKR VYSKA VAHA SYST1 DIAST1 SYST2 DIAST2 TRIC SUBSC CHLST TRIGL AGEPARTICIPATION ROKNAR ROKVSTUP MESVSTUP PIVO7 PIVO10 PIVO12 VINO LIHOV IM IML HT HTD HTL ICT DIABET DIABD DIABL HYPLIP HYPLD HYPLL IMTRV HTTRV DIABTRV HYPLTRV DENUMR MESUMR ROKUMR PRICUMR DUMMY YEARICTL ICTTRV DEATH_DATE
role time_stamptime_stampjoin_keytargetcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumericalnumerical numericalunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_stringunused_stringunused_string
unit time stamptime stamp
01977-01-011976-10-0110001\n", " 0 \n", " 413112362111100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 9 \n", " \n", " 2 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 169 \n", " \n", " 71 \n", " \n", " 120 \n", " \n", " 85 \n", " \n", " 120 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 209 \n", " \n", " 86 \n", " \n", " 48 \n", " \n", " -1899 \n", " \n", " 29 \n", " \n", " 1976 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1977 \n", " NULLNULLNULL
11978-01-011976-10-0110001\n", " 0 \n", " 413112362111100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 9 \n", " \n", " 2 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 169 \n", " \n", " 71 \n", " \n", " 120 \n", " \n", " 85 \n", " \n", " 120 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 209 \n", " \n", " 86 \n", " \n", " 49 \n", " \n", " -1898 \n", " \n", " 29 \n", " \n", " 1976 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1978 \n", " NULLNULLNULL
21979-01-011976-10-0110001\n", " 0 \n", " 413112362111100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 9 \n", " \n", " 2 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 169 \n", " \n", " 71 \n", " \n", " 120 \n", " \n", " 85 \n", " \n", " 120 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 209 \n", " \n", " 86 \n", " \n", " 50 \n", " \n", " -1897 \n", " \n", " 29 \n", " \n", " 1976 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1979 \n", " NULLNULLNULL
31980-01-011976-10-0110001\n", " 0 \n", " 413112362111100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 9 \n", " \n", " 2 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 169 \n", " \n", " 71 \n", " \n", " 120 \n", " \n", " 85 \n", " \n", " 120 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 209 \n", " \n", " 86 \n", " \n", " 51 \n", " \n", " -1896 \n", " \n", " 29 \n", " \n", " 1976 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1980 \n", " NULLNULLNULL
41981-01-011976-10-0110001\n", " 0 \n", " 413112362111100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 9 \n", " \n", " 2 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 169 \n", " \n", " 71 \n", " \n", " 120 \n", " \n", " 85 \n", " \n", " 120 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 209 \n", " \n", " 86 \n", " \n", " 52 \n", " \n", " -1895 \n", " \n", " 29 \n", " \n", " 1976 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1981 \n", " NULLNULLNULL
.........\n", " ... \n", " ......................................................\n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " .........
284281995-01-011977-03-0130065\n", " 0 \n", " 522312152322100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 3 \n", " \n", " 4 \n", " \n", " 7 \n", " \n", " 1 \n", " \n", " 5 \n", " \n", " 2 \n", " \n", " 179 \n", " \n", " 69 \n", " \n", " 110 \n", " \n", " 80 \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " 10 \n", " \n", " 18 \n", " \n", " 235 \n", " \n", " 733 \n", " \n", " 67 \n", " \n", " -1882 \n", " \n", " 28 \n", " \n", " 1977 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " 9 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1995 \n", " NULLNULLNULL
284291996-01-011977-03-0130065\n", " 0 \n", " 522312152322100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 3 \n", " \n", " 4 \n", " \n", " 7 \n", " \n", " 1 \n", " \n", " 5 \n", " \n", " 2 \n", " \n", " 179 \n", " \n", " 69 \n", " \n", " 110 \n", " \n", " 80 \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " 10 \n", " \n", " 18 \n", " \n", " 235 \n", " \n", " 733 \n", " \n", " 68 \n", " \n", " -1881 \n", " \n", " 28 \n", " \n", " 1977 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " 9 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1996 \n", " NULLNULLNULL
284301997-01-011977-03-0130065\n", " 0 \n", " 522312152322100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 3 \n", " \n", " 4 \n", " \n", " 7 \n", " \n", " 1 \n", " \n", " 5 \n", " \n", " 2 \n", " \n", " 179 \n", " \n", " 69 \n", " \n", " 110 \n", " \n", " 80 \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " 10 \n", " \n", " 18 \n", " \n", " 235 \n", " \n", " 733 \n", " \n", " 69 \n", " \n", " -1880 \n", " \n", " 28 \n", " \n", " 1977 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " 9 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1997 \n", " NULLNULLNULL
284311998-01-011977-03-0130065\n", " 0 \n", " 522312152322100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 3 \n", " \n", " 4 \n", " \n", " 7 \n", " \n", " 1 \n", " \n", " 5 \n", " \n", " 2 \n", " \n", " 179 \n", " \n", " 69 \n", " \n", " 110 \n", " \n", " 80 \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " 10 \n", " \n", " 18 \n", " \n", " 235 \n", " \n", " 733 \n", " \n", " 70 \n", " \n", " -1879 \n", " \n", " 28 \n", " \n", " 1977 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " 9 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1998 \n", " NULLNULLNULL
284321999-01-011977-03-0130065\n", " 0 \n", " 522312152322100100\n", " 4 \n", " \n", " 10 \n", " \n", " nan \n", " \n", " 3 \n", " \n", " 4 \n", " \n", " 7 \n", " \n", " 1 \n", " \n", " 5 \n", " \n", " 2 \n", " \n", " 179 \n", " \n", " 69 \n", " \n", " 110 \n", " \n", " 80 \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " 10 \n", " \n", " 18 \n", " \n", " 235 \n", " \n", " 733 \n", " \n", " 71 \n", " \n", " -1878 \n", " \n", " 28 \n", " \n", " 1977 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " 9 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " 1999 \n", " NULLNULLNULL
\n", "\n", "

\n", " 28433 rows x 76 columns
\n", " memory usage: 15.27 MB
\n", " name: population
\n", " type: getml.DataFrame
\n", " \n", "

\n" ], "text/plain": [ " name REFERENCE_DATE ENTRY_DATE ICO TARGET ... DUMMY YEAR ICTL ICTTRV \n", " role time_stamp time_stamp join_key target ... unused_float unused_float unused_string unused_string\n", " unit time stamp time stamp ... \n", " 0 1977-01-01 1976-10-01 10001 0 ... 1 1977 NULL NULL \n", " 1 1978-01-01 1976-10-01 10001 0 ... 1 1978 NULL NULL \n", " 2 1979-01-01 1976-10-01 10001 0 ... 1 1979 NULL NULL \n", " 3 1980-01-01 1976-10-01 10001 0 ... 1 1980 NULL NULL \n", " 4 1981-01-01 1976-10-01 10001 0 ... 1 1981 NULL NULL \n", " ... ... ... ... ... ... ... ... \n", "28428 1995-01-01 1977-03-01 30065 0 ... 1 1995 NULL NULL \n", "28429 1996-01-01 1977-03-01 30065 0 ... 1 1996 NULL NULL \n", "28430 1997-01-01 1977-03-01 30065 0 ... 1 1997 NULL NULL \n", "28431 1998-01-01 1977-03-01 30065 0 ... 1 1998 NULL NULL \n", "28432 1999-01-01 1977-03-01 30065 0 ... 1 1999 NULL NULL \n", "\n", " name DEATH_DATE \n", " role unused_string\n", " unit \n", " 0 NULL \n", " 1 NULL \n", " 2 NULL \n", " 3 NULL \n", " 4 NULL \n", " ... \n", "28428 NULL \n", "28429 NULL \n", "28430 NULL \n", "28431 NULL \n", "28432 NULL \n", "\n", "\n", "28433 rows x 76 columns\n", "memory usage: 15.27 MB\n", "type: getml.DataFrame" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "population" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "__Contr:__ peripheral table\n", "\n" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
nameCONTROL_DATE ICOZMTELAKT AKTPOZAM ZMDIET LEKTLAK ZMKOUR POCCIG PRACNES JINAONE BOLHR BOLDK DUSN HODNSK HYPERD HYPCHL HYPTGL HMOT CHLST HDL HDLMG LDL ROKVYS MESVYS PORADK ZMCHARZA LEKCHOL SRDCE HYPERT CEVMOZ DIAB HODN0 ROK0 HODN1 ROK1 HODN2 ROK2 HODN3 ROK3 HODN4 ROK4 HODN11 ROK11 HODN12 ROK12 HODN13 ROK13 HODN14 ROK14 HODN15 ROK15 HODN21 ROK21 HODN23 ROK23 SYST DIAST TRIC SUBSC HYPERSD HYPERS CHLSTMG TRIGL TRIGLMG MOC GLYKEMIE KYSMOC
role time_stampjoin_keycategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalcategoricalnumericalnumericalnumericalnumericalnumericalunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_floatunused_float
unit time stamp
01977-09-0110001321220121112222\n", " 71 \n", " \n", " 5.61\n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1977 \n", " \n", " 9 \n", " \n", " 1 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 130 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 12 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 217 \n", " \n", " 1.22\n", " \n", " 108 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
11979-01-01100011112102NULL1212222\n", " 72 \n", " \n", " 6 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1979 \n", " \n", " 1 \n", " \n", " 2 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 140 \n", " \n", " 90 \n", " \n", " 4 \n", " \n", " 11 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 232 \n", " \n", " 4.4\n", " \n", " 389 \n", " \n", " 3 \n", " \n", " nan \n", " \n", " nan \n", "
21980-04-01100012112102NULL2112222\n", " 71 \n", " \n", " 6.23\n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1980 \n", " \n", " 4 \n", " \n", " 3 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 130 \n", " \n", " 90 \n", " \n", " 5 \n", " \n", " 22 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 241 \n", " \n", " 1.51\n", " \n", " 134 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
31982-01-0110001211210121112222\n", " 74 \n", " \n", " 5.2\n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1982 \n", " \n", " 1 \n", " \n", " 4 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 150 \n", " \n", " 100 \n", " \n", " 9 \n", " \n", " 18 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 201 \n", " \n", " 1.42\n", " \n", " 126 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
41983-02-01100012212102NULL1212222\n", " 73 \n", " \n", " 6.08\n", " \n", " 1.47\n", " \n", " 57 \n", " \n", " 4.15\n", " \n", " 1983 \n", " \n", " 2 \n", " \n", " 5 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 165 \n", " \n", " 105 \n", " \n", " 7 \n", " \n", " 15 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 235 \n", " \n", " 0.99\n", " \n", " 88 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
...................................................\n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", " \n", " ... \n", "
105671987-10-01203582212102NULL4113222\n", " 85 \n", " \n", " 4.89\n", " \n", " 0.98\n", " \n", " 38 \n", " \n", " 3.11\n", " \n", " 1987 \n", " \n", " 10 \n", " \n", " 1 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 189 \n", " \n", " 1.74\n", " \n", " 154 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
105681987-11-012035922121142NULL1113222\n", " 80 \n", " \n", " 4.5\n", " \n", " 0.98\n", " \n", " 38 \n", " \n", " 3.16\n", " \n", " 1987 \n", " \n", " 11 \n", " \n", " 1 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 100 \n", " \n", " 70 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 174 \n", " \n", " 0.79\n", " \n", " 70 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
105691987-10-01203602252102NULL2123222\n", " 95 \n", " \n", " 5.51\n", " \n", " 1.29\n", " \n", " 50 \n", " \n", " 3.68\n", " \n", " 1987 \n", " \n", " 10 \n", " \n", " 1 \n", " \n", " 40 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 120 \n", " \n", " 80 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 213 \n", " \n", " 1.18\n", " \n", " 104 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
105701987-10-01203621212102NULL6413222\n", " 56 \n", " \n", " 4.89\n", " \n", " 3 \n", " \n", " 116 \n", " \n", " 1.51\n", " \n", " 1987 \n", " \n", " 10 \n", " \n", " 1 \n", " \n", " 40 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 140 \n", " \n", " 85 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 189 \n", " \n", " 0.82\n", " \n", " 73 \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
105711978-09-013003721123152NULL4124221\n", " 72 \n", " \n", " 5.61\n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1978 \n", " \n", " 9 \n", " \n", " 1 \n", " \n", " 20 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 0 \n", " \n", " 0 \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " nan \n", " \n", " 125 \n", " \n", " 90 \n", " \n", " 9 \n", " \n", " 17 \n", " \n", " 2 \n", " \n", " 2 \n", " \n", " 217 \n", " \n", " nan \n", " \n", " nan \n", " \n", " 1 \n", " \n", " nan \n", " \n", " nan \n", "
\n", "\n", "

\n", " 10572 rows x 67 columns
\n", " memory usage: 4.99 MB
\n", " name: contr
\n", " type: getml.DataFrame
\n", " \n", "

\n" ], "text/plain": [ " name CONTROL_DATE ICO ZMTELAKT AKTPOZAM ... TRIGL TRIGLMG MOC GLYKEMIE\n", " role time_stamp join_key categorical categorical ... unused_float unused_float unused_float unused_float\n", " unit time stamp ... \n", " 0 1977-09-01 10001 3 2 ... 1.22 108 1 nan \n", " 1 1979-01-01 10001 1 1 ... 4.4 389 3 nan \n", " 2 1980-04-01 10001 2 1 ... 1.51 134 1 nan \n", " 3 1982-01-01 10001 2 1 ... 1.42 126 1 nan \n", " 4 1983-02-01 10001 2 2 ... 0.99 88 1 nan \n", " ... ... ... ... ... ... ... ...\n", "10567 1987-10-01 20358 2 2 ... 1.74 154 1 nan \n", "10568 1987-11-01 20359 2 2 ... 0.79 70 1 nan \n", "10569 1987-10-01 20360 2 2 ... 1.18 104 1 nan \n", "10570 1987-10-01 20362 1 2 ... 0.82 73 1 nan \n", "10571 1978-09-01 30037 2 1 ... nan nan 1 nan \n", "\n", " name KYSMOC\n", " role unused_float\n", " unit \n", " 0 nan \n", " 1 nan \n", " 2 nan \n", " 3 nan \n", " 4 nan \n", " ...\n", "10567 nan \n", "10568 nan \n", "10569 nan \n", "10570 nan \n", "10571 nan \n", "\n", "\n", "10572 rows x 67 columns\n", "memory usage: 4.99 MB\n", "type: getml.DataFrame" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "contr" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 1.3 Define relational model\n", "\n", "To start with relational learning, we need to specify an abstract data model. Here, we use the [high-level star schema API](https://docs.getml.com/latest/api/getml.data.StarSchema.html) that allows us to define the abstract data model and construct a [container](https://docs.getml.com/latest/api/getml.data.Container.html) with the concrete data at one-go. While a simple `StarSchema` indeed works in many cases, it is not sufficient for more complex data models like schoflake schemas, where you would have to define the data model and construct the container in separate steps, by utilzing getML's [full-fledged data model](https://docs.getml.com/latest/api/getml.data.DataModel.html) and [container](https://docs.getml.com/latest/api/getml.data.Container.html) APIs respectively." ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [], "source": [ "split = getml.data.split.random(train=0.7, test=0.3)" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "data": { "text/html": [ "data model\n", "
\n", "
diagram
\n", "
contrpopulationICO = ICOCONTROL_DATE <= REFERENCE_DATE
\n", "
\n", "\n", "
\n", "
staging
\n", " \n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
data framesstaging table
0populationPOPULATION__STAGING_TABLE_1
1contrCONTR__STAGING_TABLE_2
\n", "
\n", " \n", "container\n", "
\n", "
\n", "
population
\n", " \n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
subsetname rowstype
0testpopulation8557View
1trainpopulation19876View
\n", "
\n", "
\n", "
peripheral
\n", " \n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
name rowstype
0contr10572DataFrame
\n", "
\n", "
" ], "text/plain": [ "data model\n", "\n", " population:\n", " columns:\n", " - KONSKUP: categorical\n", " - STAV: categorical\n", " - VZDELANI: categorical\n", " - ZODPOV: categorical\n", " - TELAKTZA: categorical\n", " - ...\n", "\n", " joins:\n", " - right: 'contr'\n", " on: (population.ICO, contr.ICO)\n", " time_stamps: (population.REFERENCE_DATE, contr.CONTROL_DATE)\n", " relationship: 'many-to-many'\n", " lagged_targets: False\n", "\n", " contr:\n", " columns:\n", " - ZMTELAKT: categorical\n", " - AKTPOZAM: categorical\n", " - ZMDIET: categorical\n", " - LEKTLAK: categorical\n", " - ZMKOUR: categorical\n", " - ...\n", "\n", "\n", "container\n", "\n", " population\n", " subset name rows type\n", " 0 test population 8557 View\n", " 1 train population 19876 View\n", "\n", " peripheral\n", " name rows type \n", " 0 contr 10572 DataFrame" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "star_schema = getml.data.StarSchema(population, split=split)\n", "\n", "star_schema.join(\n", " contr,\n", " on=\"ICO\",\n", " time_stamps=(\"REFERENCE_DATE\", \"CONTROL_DATE\")\n", ")\n", "\n", "star_schema" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### 2. Predictive modeling\n", "\n", "We loaded the data, defined the roles, units and the abstract data model. Next, we create a getML pipeline for relational learning." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 2.1 Fitting the pipeline\n", "\n", "To illustrate the problem of computational complexity, we fit two getML pipelines using different feature learning algorithms:\n", "\n", "The first pipeline uses `RelMT` and the second pipeline uses `Relboost`. To demonstrate the power of feature ensembling, we build a third pipeline that uses both algorithms. At the end, we compare the runtime and predictive accuracies of all three pipelines." ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [], "source": [ "relmt = getml.feature_learning.RelMT(\n", " num_features=30,\n", " loss_function=getml.feature_learning.loss_functions.CrossEntropyLoss,\n", " num_threads=1\n", ")\n", "\n", "relboost = getml.feature_learning.Relboost(\n", " num_features=60,\n", " loss_function=getml.feature_learning.loss_functions.CrossEntropyLoss,\n", " min_num_samples=500,\n", " max_depth=2,\n", " num_threads=1\n", ")\n", "\n", "feature_selector = getml.predictors.XGBoostClassifier()\n", "\n", "xgboost = getml.predictors.XGBoostClassifier(\n", " max_depth=5,\n", " reg_lambda=100.0,\n", " learning_rate=0.1\n", ")" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Pipeline(data_model='population',\n",
       "         feature_learners=['RelMT'],\n",
       "         feature_selectors=['XGBoostClassifier'],\n",
       "         include_categorical=True,\n",
       "         loss_function='CrossEntropyLoss',\n",
       "         peripheral=['contr'],\n",
       "         predictors=['XGBoostClassifier'],\n",
       "         preprocessors=[],\n",
       "         share_selected_features=0.8,\n",
       "         tags=['relmt'])
" ], "text/plain": [ "Pipeline(data_model='population',\n", " feature_learners=['RelMT'],\n", " feature_selectors=['XGBoostClassifier'],\n", " include_categorical=True,\n", " loss_function='CrossEntropyLoss',\n", " peripheral=['contr'],\n", " predictors=['XGBoostClassifier'],\n", " preprocessors=[],\n", " share_selected_features=0.8,\n", " tags=['relmt'])" ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe1 = getml.pipeline.Pipeline(\n", " tags=[\"relmt\"],\n", " data_model=star_schema.data_model,\n", " feature_learners=relmt,\n", " feature_selectors=feature_selector,\n", " share_selected_features=0.8,\n", " predictors=xgboost,\n", " include_categorical=True\n", ")\n", "\n", "pipe1" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Pipeline(data_model='population',\n",
       "         feature_learners=['Relboost'],\n",
       "         feature_selectors=['XGBoostClassifier'],\n",
       "         include_categorical=True,\n",
       "         loss_function='CrossEntropyLoss',\n",
       "         peripheral=['contr'],\n",
       "         predictors=['XGBoostClassifier'],\n",
       "         preprocessors=[],\n",
       "         share_selected_features=0.8,\n",
       "         tags=['relboost'])
" ], "text/plain": [ "Pipeline(data_model='population',\n", " feature_learners=['Relboost'],\n", " feature_selectors=['XGBoostClassifier'],\n", " include_categorical=True,\n", " loss_function='CrossEntropyLoss',\n", " peripheral=['contr'],\n", " predictors=['XGBoostClassifier'],\n", " preprocessors=[],\n", " share_selected_features=0.8,\n", " tags=['relboost'])" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe2 = getml.pipeline.Pipeline(\n", " tags=[\"relboost\"],\n", " data_model=star_schema.data_model,\n", " feature_learners=relboost,\n", " feature_selectors=feature_selector,\n", " share_selected_features=0.8, \n", " predictors=xgboost,\n", " include_categorical=True\n", ")\n", "\n", "pipe2" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "We begin with RelMT. Features generated by RelMT suffer from quadratic complexity. Luckily, the number of columns is not too high, so it is still manageble." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "It always a good idea to check before fitting. There is one minor warning: This warning means that about 12% of patients never appear in CONTR (presumably because they never showed up to their health check-ups)." ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Checking data model...\n",
       "
\n" ], "text/plain": [ "Checking data model\u001b[33m...\u001b[0m\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Checking... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
The pipeline check generated 1 issues labeled INFO and 0 issues labeled WARNING.\n",
       "
\n" ], "text/plain": [ "The pipeline check generated \u001b[1;36m1\u001b[0m issues labeled INFO and \u001b[1;36m0\u001b[0m issues labeled WARNING.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "data": { "text/html": [ "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
typelabel message
0INFOFOREIGN KEYS NOT FOUNDWhen joining POPULATION__STAGING_TABLE_1 and CONTR__STAGING_TABLE_2 over 'ICO' and 'ICO', there are no corresponding entries for 12.291205% of entries in 'ICO' in 'POPULATION__STAGING_TABLE_1'. You might want to double-check your join keys.
" ], "text/plain": [ " type label message \n", "0 INFO FOREIGN KEYS NOT FOUND When joining POPULATION__STAGING..." ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe1.check(star_schema.train)" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Checking data model...\n",
       "
\n" ], "text/plain": [ "Checking data model\u001b[33m...\u001b[0m\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
The pipeline check generated 1 issues labeled INFO and 0 issues labeled WARNING.\n",
       "
\n" ], "text/plain": [ "The pipeline check generated \u001b[1;36m1\u001b[0m issues labeled INFO and \u001b[1;36m0\u001b[0m issues labeled WARNING.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "data": { "text/html": [ "
To see the issues in full, run .check() on the pipeline.\n",
       "
\n" ], "text/plain": [ "To see the issues in full, run \u001b[1;35m.check\u001b[0m\u001b[1m(\u001b[0m\u001b[1m)\u001b[0m on the pipeline.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K RelMT: Training features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 07:02\n", "\u001b[2K RelMT: Building features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:01\n", "\u001b[2K XGBoost: Training as feature selector... ━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:02\n", "\u001b[2K XGBoost: Training as predictor... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:04\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
Trained pipeline.\n",
       "
\n" ], "text/plain": [ "Trained pipeline.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "Time taken: 0:07:11.228924.\n", "\n" ] }, { "data": { "text/html": [ "
Pipeline(data_model='population',\n",
       "         feature_learners=['RelMT'],\n",
       "         feature_selectors=['XGBoostClassifier'],\n",
       "         include_categorical=True,\n",
       "         loss_function='CrossEntropyLoss',\n",
       "         peripheral=['contr'],\n",
       "         predictors=['XGBoostClassifier'],\n",
       "         preprocessors=[],\n",
       "         share_selected_features=0.8,\n",
       "         tags=['relmt', 'container-5Vksxn'])
" ], "text/plain": [ "Pipeline(data_model='population',\n", " feature_learners=['RelMT'],\n", " feature_selectors=['XGBoostClassifier'],\n", " include_categorical=True,\n", " loss_function='CrossEntropyLoss',\n", " peripheral=['contr'],\n", " predictors=['XGBoostClassifier'],\n", " preprocessors=[],\n", " share_selected_features=0.8,\n", " tags=['relmt', 'container-5Vksxn'])" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe1.fit(star_schema.train)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Let's see how well Relboost does. This algorithm has linear complexity in the number of columns." ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Checking data model...\n",
       "
\n" ], "text/plain": [ "Checking data model\u001b[33m...\u001b[0m\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Checking... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
The pipeline check generated 1 issues labeled INFO and 0 issues labeled WARNING.\n",
       "
\n" ], "text/plain": [ "The pipeline check generated \u001b[1;36m1\u001b[0m issues labeled INFO and \u001b[1;36m0\u001b[0m issues labeled WARNING.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "data": { "text/html": [ "
To see the issues in full, run .check() on the pipeline.\n",
       "
\n" ], "text/plain": [ "To see the issues in full, run \u001b[1;35m.check\u001b[0m\u001b[1m(\u001b[0m\u001b[1m)\u001b[0m on the pipeline.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Relboost: Training features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:22\n", "\u001b[2K Relboost: Building features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:03\n", "\u001b[2K XGBoost: Training as feature selector... ━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:02\n", "\u001b[2K XGBoost: Training as predictor... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:03\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "
Trained pipeline.\n",
       "
\n" ], "text/plain": [ "Trained pipeline.\n" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "Time taken: 0:00:31.813144.\n", "\n" ] }, { "data": { "text/html": [ "
Pipeline(data_model='population',\n",
       "         feature_learners=['Relboost'],\n",
       "         feature_selectors=['XGBoostClassifier'],\n",
       "         include_categorical=True,\n",
       "         loss_function='CrossEntropyLoss',\n",
       "         peripheral=['contr'],\n",
       "         predictors=['XGBoostClassifier'],\n",
       "         preprocessors=[],\n",
       "         share_selected_features=0.8,\n",
       "         tags=['relboost', 'container-5Vksxn'])
" ], "text/plain": [ "Pipeline(data_model='population',\n", " feature_learners=['Relboost'],\n", " feature_selectors=['XGBoostClassifier'],\n", " include_categorical=True,\n", " loss_function='CrossEntropyLoss',\n", " peripheral=['contr'],\n", " predictors=['XGBoostClassifier'],\n", " preprocessors=[],\n", " share_selected_features=0.8,\n", " tags=['relboost', 'container-5Vksxn'])" ] }, "execution_count": 14, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe2.fit(star_schema.train)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Note that this runs through in under a minute. This demonstrates the power of computational complexity theory. If we had more columns, the difference between these two algorithms would become even more noticable." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 2.2 Model evaluation" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Preprocessing... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K RelMT: Building features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
date time set usedtargetaccuracy auccross entropy
02024-09-12 13:09:44trainTARGET0.98910.89040.0507
12024-09-12 13:10:17testTARGET0.98670.71430.06851
" ], "text/plain": [ " date time set used target accuracy auc cross entropy\n", "0 2024-09-12 13:09:44 train TARGET 0.9891 0.8904 0.0507 \n", "1 2024-09-12 13:10:17 test TARGET 0.9867 0.7143 0.06851" ] }, "execution_count": 15, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe1.score(star_schema.test)" ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "\u001b[2K Staging... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Preprocessing... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:00\n", "\u001b[2K Relboost: Building features... ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 100% • 00:01\n", "\u001b[?25h" ] }, { "data": { "text/html": [ "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
date time set usedtargetaccuracy auccross entropy
02024-09-12 13:10:16trainTARGET0.98780.89120.0538
12024-09-12 13:10:19testTARGET0.98670.71070.06748
" ], "text/plain": [ " date time set used target accuracy auc cross entropy\n", "0 2024-09-12 13:10:16 train TARGET 0.9878 0.8912 0.0538 \n", "1 2024-09-12 13:10:19 test TARGET 0.9867 0.7107 0.06748" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe2.score(star_schema.test)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 2.3 Studying the features\n", "\n", "It is always a good idea to study the features generated by the algorithms." ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "names, correlations = pipe2.features.correlations()\n", "\n", "plt.subplots(figsize=(20, 10))\n", "\n", "plt.bar(names, correlations)\n", "\n", "plt.title(\"feature correlations\")\n", "plt.grid(True)\n", "plt.xlabel(\"features\")\n", "plt.ylabel(\"correlations\")\n", "plt.xticks(rotation='vertical')\n", "\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "names, importances = pipe2.features.importances()\n", "\n", "plt.subplots(figsize=(20, 10))\n", "\n", "plt.bar(names, importances)\n", "\n", "plt.title(\"feature importances\")\n", "plt.grid(True)\n", "plt.xlabel(\"features\")\n", "plt.ylabel(\"importances\")\n", "plt.xticks(rotation='vertical')\n", "\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "As we can see from these figures we need many features to get a good result. No single feature is very correlated with the target and the feature importance is not concentrated on a small number of features (as is often the case with other data sets).\n", "\n", "This implies that the many columns in the data set are actually needed. The reason we emphasize that is that we sometimes see data sets with many columns, but after analyzing them we find and only a handful of these columns are actually needed. This is not one of these times.\n", "\n", "The most important features look like this:" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "data": { "text/markdown": [ "```sql\n", "DROP TABLE IF EXISTS \"FEATURE_1_7\";\n", "\n", "CREATE TABLE \"FEATURE_1_7\" AS\n", "SELECT SUM( \n", " CASE\n", " WHEN ( t1.\"trigl\" > 447.000000 ) AND ( t1.\"age\" > 57.000000 ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 36.71734233772222 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * -36.03237447465777 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -4.140363438871325 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 2.866334536889667 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * -3.474866798512964 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * 42.97484465396469 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * 37.67135620384678 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 41.49696018116632 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 1.728682170938833 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 2.532893582104208 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * -0.6526932998438458 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 2.189892170970478 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.3401612628322462 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -1.979165210528913 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 1.57192359403996 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -6.18176175433044 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 12.22343448214527 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.2971207012537834 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -0.09941197254629983 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 10.85819048719916 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * 81.75340957666666 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * -2.926904989988034e-06 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * 1.154718952316122e-06 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.1333271764688622 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -0.2306312557846993 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.490138288302913 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 9.056133763122926 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.01190990485510771 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -1.626971839941278e-08 + 4.4320403142502030e+01\n", " WHEN ( t1.\"trigl\" > 447.000000 ) AND ( t1.\"age\" <= 57.000000 OR t1.\"age\" IS NULL ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 68.9362363063014 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * -49.72699167016215 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -16.57345552532797 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 93.14809820598344 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * 66.54704537730123 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * 6.98997936976407 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * -25.37270111467802 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 44.97434463952945 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * -11.97758628053244 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * -14.41189734039584 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * 9.201053407268812 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 6.60642275226787 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.2798793062603677 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -8.618828438293468 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 2.610294450622261 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * 0.05980697404869816 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * -22.03705030242565 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.08847429025390953 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -0.01251193674433636 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 4.86187301570697 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * -137.3954135916799 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * 4.20106983933724e-06 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * -8.388379539806533e-06 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.1237910720450438 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * 3.651474792793678 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.3361774904051968 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * -141.5557739425682 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.7515251196140998 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * 6.744845044264805e-09 + 8.4141958089744847e+01\n", " WHEN ( t1.\"trigl\" <= 447.000000 OR t1.\"trigl\" IS NULL ) AND ( t2.\"ldl\" > 6.589412 ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 4.324545000639816 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * 6.394011893899877 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -0.00772340630819322 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 13.07564436701492 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * 14.71174562700868 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * -13.02469603877145 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * -20.75690206999771 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * -42.59571735654135 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 4.547061088931812 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 1.552658882464771 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * 1.317608177040875 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 1.785126658763984 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * -2.546946347046458 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -0.470414693564651 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 1.623116203255628 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -6.40858643038764 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 4.130064218077451 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * -0.1989132193311207 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * 0.2263022952597863 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 1.197285989581476 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * 19.06271270018097 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * -6.382150275518887e-07 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * 2.775023256741417e-07 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * -1.286757301370443 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -16.40518752403113 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * 2.904438249194144 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 641.5020896438801 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * 0.1447675001171414 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -7.562988930726452e-09 + -9.0812299642137955e+00\n", " WHEN ( t1.\"trigl\" <= 447.000000 OR t1.\"trigl\" IS NULL ) AND ( t2.\"ldl\" <= 6.589412 OR t2.\"ldl\" IS NULL ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 6.861948102582569e-05 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * 0.01745941706076835 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -0.006563506280726456 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 0.002370132374868186 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * -0.01446308909963534 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * -0.01721180426547575 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * 0.0202459283752464 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 0.009776762328480083 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 0.001186532318472517 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 0.001436166322912831 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * -0.00414449771250642 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * -0.001658868199165182 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.002557569464948623 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * 0.002437793550397995 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * -6.174045506422857e-05 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -0.007499631525141079 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 0.002113558511703661 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.0001341535907906942 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -1.630868859521257e-05 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 0.002356506859856778 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * -0.02444683750177154 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * 2.117099967782411e-09 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * -2.945219991878199e-10 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.003574474413349186 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -0.003244489062109498 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.03710669507874064 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 0.088384351075893 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.00342765294998646 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -2.444170025832969e-09 + -2.5882564116851187e-01\n", " ELSE NULL\n", " END\n", ") AS \"feature_1_7\",\n", " t1.rowid AS rownum\n", "FROM \"POPULATION__STAGING_TABLE_1\" t1\n", "INNER JOIN \"CONTR__STAGING_TABLE_2\" t2\n", "ON t1.\"ico\" = t2.\"ico\"\n", "WHERE t2.\"control_date\" <= t1.\"reference_date\"\n", "GROUP BY t1.rowid;\n", "```" ], "text/plain": [ "'DROP TABLE IF EXISTS \"FEATURE_1_7\";\\n\\nCREATE TABLE \"FEATURE_1_7\" AS\\nSELECT SUM( \\n CASE\\n WHEN ( t1.\"trigl\" > 447.000000 ) AND ( t1.\"age\" > 57.000000 ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 36.71734233772222 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * -36.03237447465777 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -4.140363438871325 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 2.866334536889667 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * -3.474866798512964 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * 42.97484465396469 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * 37.67135620384678 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 41.49696018116632 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 1.728682170938833 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 2.532893582104208 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * -0.6526932998438458 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 2.189892170970478 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.3401612628322462 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -1.979165210528913 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 1.57192359403996 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -6.18176175433044 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 12.22343448214527 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.2971207012537834 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -0.09941197254629983 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 10.85819048719916 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * 81.75340957666666 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * -2.926904989988034e-06 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * 1.154718952316122e-06 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.1333271764688622 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -0.2306312557846993 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.490138288302913 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 9.056133763122926 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.01190990485510771 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -1.626971839941278e-08 + 4.4320403142502030e+01\\n WHEN ( t1.\"trigl\" > 447.000000 ) AND ( t1.\"age\" <= 57.000000 OR t1.\"age\" IS NULL ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 68.9362363063014 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * -49.72699167016215 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -16.57345552532797 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 93.14809820598344 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * 66.54704537730123 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * 6.98997936976407 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * -25.37270111467802 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 44.97434463952945 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * -11.97758628053244 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * -14.41189734039584 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * 9.201053407268812 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 6.60642275226787 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.2798793062603677 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -8.618828438293468 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 2.610294450622261 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * 0.05980697404869816 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * -22.03705030242565 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.08847429025390953 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -0.01251193674433636 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 4.86187301570697 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * -137.3954135916799 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * 4.20106983933724e-06 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * -8.388379539806533e-06 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.1237910720450438 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * 3.651474792793678 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.3361774904051968 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * -141.5557739425682 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.7515251196140998 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * 6.744845044264805e-09 + 8.4141958089744847e+01\\n WHEN ( t1.\"trigl\" <= 447.000000 OR t1.\"trigl\" IS NULL ) AND ( t2.\"ldl\" > 6.589412 ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 4.324545000639816 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * 6.394011893899877 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -0.00772340630819322 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 13.07564436701492 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * 14.71174562700868 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * -13.02469603877145 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * -20.75690206999771 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * -42.59571735654135 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 4.547061088931812 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 1.552658882464771 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * 1.317608177040875 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * 1.785126658763984 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * -2.546946347046458 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * -0.470414693564651 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * 1.623116203255628 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -6.40858643038764 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 4.130064218077451 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * -0.1989132193311207 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * 0.2263022952597863 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 1.197285989581476 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * 19.06271270018097 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * -6.382150275518887e-07 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * 2.775023256741417e-07 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * -1.286757301370443 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -16.40518752403113 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * 2.904438249194144 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 641.5020896438801 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * 0.1447675001171414 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -7.562988930726452e-09 + -9.0812299642137955e+00\\n WHEN ( t1.\"trigl\" <= 447.000000 OR t1.\"trigl\" IS NULL ) AND ( t2.\"ldl\" <= 6.589412 OR t2.\"ldl\" IS NULL ) THEN COALESCE( t1.\"koureni\" - 3.392245777122775, 0.0 ) * 6.861948102582569e-05 + COALESCE( t1.\"dobakour\" - 6.958281373993878, 0.0 ) * 0.01745941706076835 + COALESCE( t1.\"byvkurak\" - 1.664097041151797, 0.0 ) * -0.006563506280726456 + COALESCE( t1.\"pivomn\" - 1.800816233987076, 0.0 ) * 0.002370132374868186 + COALESCE( t1.\"vinomn\" - 4.290329894569776, 0.0 ) * -0.01446308909963534 + COALESCE( t1.\"lihmn\" - 6.945697766693119, 0.0 ) * -0.01721180426547575 + COALESCE( t1.\"kava\" - 1.912708309715452, 0.0 ) * 0.0202459283752464 + COALESCE( t1.\"caj\" - 4.734043759210974, 0.0 ) * 0.009776762328480083 + COALESCE( t1.\"cukr\" - 4.523523410044213, 0.0 ) * 0.001186532318472517 + COALESCE( t1.\"vyska\" - 174.5359936515134, 0.0 ) * 0.001436166322912831 + COALESCE( t1.\"vaha\" - 79.88028568189547, 0.0 ) * -0.00414449771250642 + COALESCE( t1.\"syst1\" - 132.0999886634168, 0.0 ) * -0.001658868199165182 + COALESCE( t1.\"diast1\" - 83.57759891168801, 0.0 ) * 0.002557569464948623 + COALESCE( t1.\"syst2\" - 129.4103843101689, 0.0 ) * 0.002437793550397995 + COALESCE( t1.\"diast2\" - 83.1808185013037, 0.0 ) * -6.174045506422857e-05 + COALESCE( t1.\"tric\" - 9.403355628613536, 0.0 ) * -0.007499631525141079 + COALESCE( t1.\"subsc\" - 18.14816914182066, 0.0 ) * 0.002113558511703661 + COALESCE( t1.\"chlst\" - 232.3951932887428, 0.0 ) * 0.0001341535907906942 + COALESCE( t1.\"trigl\" - 134.7867588708763, 0.0 ) * -1.630868859521257e-05 + COALESCE( t1.\"age\" - 58.58485432490647, 0.0 ) * 0.002356506859856778 + COALESCE( t1.\"participation\" - -1887.385670558893, 0.0 ) * -0.02444683750177154 + COALESCE( t1.\"reference_date\" - 615908174.0392246, 0.0 ) * 2.117099967782411e-09 + COALESCE( t1.\"entry_date\" - 230998436.6398368, 0.0 ) * -2.945219991878199e-10 + COALESCE( t2.\"hmot\" - 81.23347313760735, 0.0 ) * 0.003574474413349186 + COALESCE( t2.\"hdlmg\" - 35.52386658677851, 0.0 ) * -0.003244489062109498 + COALESCE( t2.\"chlst\" - 5.894816257239805, 0.0 ) * -0.03710669507874064 + COALESCE( t2.\"hdl\" - 0.916622728180551, 0.0 ) * 0.088384351075893 + COALESCE( t2.\"ldl\" - 2.466835430397438, 0.0 ) * -0.00342765294998646 + COALESCE( t2.\"control_date\" - 533547919.9520671, 0.0 ) * -2.444170025832969e-09 + -2.5882564116851187e-01\\n ELSE NULL\\n END\\n) AS \"feature_1_7\",\\n t1.rowid AS rownum\\nFROM \"POPULATION__STAGING_TABLE_1\" t1\\nINNER JOIN \"CONTR__STAGING_TABLE_2\" t2\\nON t1.\"ico\" = t2.\"ico\"\\nWHERE t2.\"control_date\" <= t1.\"reference_date\"\\nGROUP BY t1.rowid;'" ] }, "execution_count": 19, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe1.features.to_sql()[pipe1.features.sort(by=\"importances\")[0].name]" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "data": { "text/markdown": [ "```sql\n", "DROP TABLE IF EXISTS \"FEATURE_1_37\";\n", "\n", "CREATE TABLE \"FEATURE_1_37\" AS\n", "SELECT AVG( \n", " CASE\n", " WHEN ( t1.\"reference_date\" - t2.\"control_date\" > 352382400.000000 ) AND ( t1.\"entry_date\" > 231194988.679245 ) THEN 1.67596291761292\n", " WHEN ( t1.\"reference_date\" - t2.\"control_date\" > 352382400.000000 ) AND ( t1.\"entry_date\" <= 231194988.679245 OR t1.\"entry_date\" IS NULL ) THEN -0.1053239490875762\n", " WHEN ( t1.\"reference_date\" - t2.\"control_date\" <= 352382400.000000 OR t1.\"reference_date\" IS NULL OR t2.\"control_date\" IS NULL ) AND ( t2.\"poccig\" IN ( '20' ) ) THEN 0.7547001150541075\n", " WHEN ( t1.\"reference_date\" - t2.\"control_date\" <= 352382400.000000 OR t1.\"reference_date\" IS NULL OR t2.\"control_date\" IS NULL ) AND ( t2.\"poccig\" NOT IN ( '20' ) OR t2.\"poccig\" IS NULL ) THEN -0.4272755600104092\n", " ELSE NULL\n", " END\n", ") AS \"feature_1_37\",\n", " t1.rowid AS rownum\n", "FROM \"POPULATION__STAGING_TABLE_1\" t1\n", "INNER JOIN \"CONTR__STAGING_TABLE_2\" t2\n", "ON t1.\"ico\" = t2.\"ico\"\n", "WHERE t2.\"control_date\" <= t1.\"reference_date\"\n", "GROUP BY t1.rowid;\n", "```" ], "text/plain": [ "'DROP TABLE IF EXISTS \"FEATURE_1_37\";\\n\\nCREATE TABLE \"FEATURE_1_37\" AS\\nSELECT AVG( \\n CASE\\n WHEN ( t1.\"reference_date\" - t2.\"control_date\" > 352382400.000000 ) AND ( t1.\"entry_date\" > 231194988.679245 ) THEN 1.67596291761292\\n WHEN ( t1.\"reference_date\" - t2.\"control_date\" > 352382400.000000 ) AND ( t1.\"entry_date\" <= 231194988.679245 OR t1.\"entry_date\" IS NULL ) THEN -0.1053239490875762\\n WHEN ( t1.\"reference_date\" - t2.\"control_date\" <= 352382400.000000 OR t1.\"reference_date\" IS NULL OR t2.\"control_date\" IS NULL ) AND ( t2.\"poccig\" IN ( \\'20\\' ) ) THEN 0.7547001150541075\\n WHEN ( t1.\"reference_date\" - t2.\"control_date\" <= 352382400.000000 OR t1.\"reference_date\" IS NULL OR t2.\"control_date\" IS NULL ) AND ( t2.\"poccig\" NOT IN ( \\'20\\' ) OR t2.\"poccig\" IS NULL ) THEN -0.4272755600104092\\n ELSE NULL\\n END\\n) AS \"feature_1_37\",\\n t1.rowid AS rownum\\nFROM \"POPULATION__STAGING_TABLE_1\" t1\\nINNER JOIN \"CONTR__STAGING_TABLE_2\" t2\\nON t1.\"ico\" = t2.\"ico\"\\nWHERE t2.\"control_date\" <= t1.\"reference_date\"\\nGROUP BY t1.rowid;'" ] }, "execution_count": 20, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pipe2.features.to_sql()[pipe2.features.sort(by=\"importances\")[1].name]" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### 2.4 Productionization\n", "\n", "It is possible to productionize the pipeline by transpiling the features into production-ready SQL code. Please also refer to getML's `sqlite3` and `spark` modules." ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [], "source": [ "# Creates a folder named atherosclerosis_pipeline containing\n", "# the SQL code.\n", "pipe2.features.to_sql().save(\"atherosclerosis_pipeline\", remove=True)" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [], "source": [ "pipe2.features.to_sql(dialect=getml.pipeline.dialect.spark_sql).save(\"atherosclerosis_pipeline_spark\", remove=True)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "getml.engine.shutdown()" ] }, { "cell_type": "markdown", "metadata": { "editable": true, "slideshow": { "slide_type": "" }, "tags": [] }, "source": [ "### 3. Conclusion\n", "\n", "The runtime benchmark between RelMT & Relboost on the same dataset demonstrates the problem of computational complexity in practice. We find that RelMT takes four times as long as Relboost to learn fewer features.\n", "\n", "The purpose of this notebook has been to illustrate the problem of the curse of dimensionality when engineering features from datasets with many columns.\n", "\n", "The most important thing to remember is that this problem exists regardless of whether you engineer your features manually or using algorithms. Whether you like it or not: If you write your features in the traditional way, your search space grows quadratically with the number of columns." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.4" }, "toc": { "base_numbering": 1 }, "vscode": { "interpreter": { "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6" } } }, "nbformat": 4, "nbformat_minor": 4 }