{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "![KTS logo](https://raw.githubusercontent.com/konodyuk/kts/master/docs/static/banner_alpha.png)\n",
    "# Feature Engineering Guide"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">DASHBOARD</div>\n",
       "<div class=\"kts-annotation\" style=\"\">features</div>\n",
       "<div class=\"kts-pool\"><input type=\"checkbox\" class=\"kts-check\" id=\"243580376\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"243580376\">simple_feature</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"243580376\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">simple_feature</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">simple_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"s1\">&#39;is_male&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"p\">(</span><span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">Sex</span> <span class=\"o\">==</span> <span class=\"s1\">&#39;male&#39;</span><span class=\"p\">)</span> <span class=\"o\">+</span> <span class=\"mi\">0</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"917674584\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"917674584\">interactions</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">GENERIC FEATURE</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"917674584\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">interactions</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">left</span><span class=\"o\">=</span><span class=\"s2\">&quot;Pclass&quot;</span><span class=\"p\">,</span> <span class=\"n\">right</span><span class=\"o\">=</span><span class=\"s2\">&quot;SibSp&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">interactions</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_add_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">+</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_sub_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_mul_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">*</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"97308044\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"97308044\">num_aggs</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">GENERIC FEATURE</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"97308044\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">num_aggs</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">Descriptions are also supported.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">col</span><span class=\"o\">=</span><span class=\"s2\">&quot;Parch&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">num_aggs</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"sd\">&quot;&quot;&quot;Descriptions are also supported.&quot;&quot;&quot;</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">pd</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">(</span><span class=\"n\">index</span><span class=\"o\">=</span><span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">index</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">mean</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">mean</span><span class=\"p\">()</span>\n",
       "    <span class=\"n\">std</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">std</span><span class=\"p\">()</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_div_mean&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">/</span> <span class=\"n\">mean</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_sub_div_mean&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">mean</span><span class=\"p\">)</span> <span class=\"o\">/</span> <span class=\"n\">mean</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_div_std&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">/</span> <span class=\"n\">std</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"573126970\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"573126970\">tfidf</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">GENERIC FEATURE</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"573126970\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">tfidf</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">col</span><span class=\"o\">=</span><span class=\"s1\">&#39;Name&#39;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">tfidf</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"k\">if</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">train</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">TfidfVectorizer</span><span class=\"p\">(</span><span class=\"n\">analyzer</span><span class=\"o\">=</span><span class=\"s1\">&#39;char&#39;</span><span class=\"p\">,</span> <span class=\"n\">ngram_range</span><span class=\"o\">=</span><span class=\"p\">(</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">3</span><span class=\"p\">),</span> <span class=\"n\">max_features</span><span class=\"o\">=</span><span class=\"mi\">5</span><span class=\"p\">)</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">fit_transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "        <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">enc</span>\n",
       "    <span class=\"k\">else</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span><span class=\"o\">.</span><span class=\"n\">todense</span><span class=\"p\">()</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">requirements</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\"><tt>sklearn==0.20.2</tt></div></div>\n",
       "        </div></div>\n",
       "<div class=\"kts-annotation\" style=\"\">helpers</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">You've got no helpers so far.</div>\n",
       "<div><style scoped>\n",
       "\n",
       ".kts {\n",
       "  line-height: 1.6;\n",
       "}\n",
       ".kts * {\n",
       "  box-sizing: content-box;\n",
       "}\n",
       ".kts-wrapper {\n",
       "  display: inline-flex;\n",
       "  flex-direction: column;\n",
       "  background-color: #edf1fb;\n",
       "  padding: 10px;\n",
       "  border-radius: 20px;\n",
       "}\n",
       ".kts-wrapper-border {\n",
       "  border: 0px solid #f7f8fc;\n",
       "}\n",
       ".kts-pool {\n",
       "  display: flex;\n",
       "  flex-wrap: wrap;\n",
       "  background-color: #f7f8fc;\n",
       "  padding: 5px;\n",
       "  border-radius: 20px;\n",
       "  margin: 5px;\n",
       "}\n",
       ".kts-field {\n",
       "  text-align: left;\n",
       "  border-radius: 15px;\n",
       "  padding: 5px 15px;\n",
       "  margin: 5px;\n",
       "  display: inline-block;\n",
       "}\n",
       ".kts-field-bg {\n",
       "  background-color: #f7f8fc;\n",
       "}\n",
       ".kts-field-bold {\n",
       "  font-weight: bold;\n",
       "}\n",
       ".kts-field-third {\n",
       "  color: #FF7500;\n",
       "}\n",
       ".kts-field-accent {\n",
       "  color: #000;\n",
       "}\n",
       ".kts-field-bg:hover {\n",
       "  background-color: #fff;\n",
       "}\n",
       ".kts-annotation {\n",
       "  text-align: left;\n",
       "  margin-left: 20px;\n",
       "  margin-bottom: -5px;\n",
       "  display: inline-block;\n",
       "  color: #FF7500;\n",
       "}\n",
       ".kts-title {\n",
       "  text-align: center;\n",
       "  display: inline-block;\n",
       "  font-weight: bold;\n",
       "  color: #FF7500;\n",
       "}\n",
       ".kts-code {\n",
       "  background-color: #f7f8fc;\n",
       "  text-align: left;\n",
       "  border-radius: 15px;\n",
       "  padding: 0.5em 15px;\n",
       "  margin: 5px;\n",
       "  color: white;\n",
       "  display: inline-block;\n",
       "}\n",
       ".kts-code:hover {\n",
       "  background-color: #fff;\n",
       "}\n",
       ".kts-code > pre {\n",
       "  background-color: #f7f8fc;\n",
       "  overflow: auto;\n",
       "  white-space: pre-wrap;\n",
       "}\n",
       ".kts-code:hover > pre {\n",
       "  background-color: #fff;\n",
       "}\n",
       ".kts-output {\n",
       "  background-color: #f7f8fc;\n",
       "  text-align: left;\n",
       "  border-radius: 15px;\n",
       "  padding: 5px 15px;\n",
       "  margin: 5px;\n",
       "  font-weight: bold;\n",
       "  font-family: monospace;\n",
       "  color: #000;\n",
       "  overflow: auto;\n",
       "  max-height: 4.8em;\n",
       "  display: flex;\n",
       "  flex-direction: column-reverse;\n",
       "}\n",
       "\n",
       ".kts-df {\n",
       "  background-color: #f7f8fc;\n",
       "  text-align: left;\n",
       "  border-radius: 15px;\n",
       "  padding: 5px 15px;\n",
       "  margin: 5px;\n",
       "  display: inline-block;\n",
       "  color: #000;\n",
       "}\n",
       "\n",
       ".kts-title-with-cross {\n",
       "  display: grid;\n",
       "  grid-template-columns: 1em auto 1em;\n",
       "  margin-left: 5px;\n",
       "  margin-right: 5px;\n",
       "}\n",
       ".kts-cross-circle {\n",
       "  background-color: #f7f8fc;\n",
       "  width: 1em;\n",
       "  height: 1em;\n",
       "  position: relative;\n",
       "  border-radius: 50%;\n",
       "  cursor: pointer;\n",
       "  z-index: 2;\n",
       "  margin-top: 2px;\n",
       "  max-width: none;\n",
       "}\n",
       ".kts-cross-before,\n",
       ".kts-cross-after {\n",
       "  background-color: #FF7500;\n",
       "  content: '';\n",
       "  position: absolute;\n",
       "  width: 0.75em;\n",
       "  height: 2px;\n",
       "  border-radius: 0;\n",
       "  top: calc((1em - 2px) / 2);\n",
       "  z-index: 0;\n",
       "}\n",
       ".kts-cross-before {\n",
       "  -webkit-transform: rotate(-45deg);\n",
       "  -moz-transform: rotate(-45deg);\n",
       "  transform: rotate(-45deg);\n",
       "  left: calc(1em / 8);\n",
       "}\n",
       ".kts-cross-after {\n",
       "  -webkit-transform: rotate(-135deg);\n",
       "  -moz-transform: rotate(-135deg);\n",
       "  transform: rotate(-135deg);\n",
       "  right: calc(1em / 8);\n",
       "}\n",
       "\n",
       "#kts-hidden {\n",
       "  display: none\n",
       "}\n",
       ".kts-thumbnail {\n",
       "  margin: 0;\n",
       "  cursor: pointer;\n",
       "}\n",
       ".kts-thumbnail-first {\n",
       "  background-color: #edf1fb;\n",
       "}\n",
       ".kts-thumbnail-second {\n",
       "  background-color: #f7f8fc;\n",
       "}\n",
       "#kts-collapsible {\n",
       "  -webkit-transition: max-height 1.0s, padding 0.7s; \n",
       "  -moz-transition: max-height 1.0s, padding 0.7s; \n",
       "  -ms-transition: max-height 1.0s, padding 0.7s; \n",
       "  -o-transition: max-height 1.0s, padding 0.7s; \n",
       "  transition: max-height 1.0s, padding 0.7s;  \n",
       "  \n",
       "  padding: 0;\n",
       "  margin: 2px;\n",
       "  align-self: flex-start;\n",
       "  max-height: 100px;\n",
       "  overflow: hidden;\n",
       "}\n",
       ".kts-check {\n",
       "  display: none;\n",
       "}\n",
       ".kts-check:checked + #kts-collapsible {\n",
       "  padding: 10px;\n",
       "  max-height: 3000px;\n",
       "}\n",
       ".kts-check:checked + #kts-collapsible > #kts-hidden {\n",
       "  display: inline-flex;\n",
       "}\n",
       ".kts-check:checked + #kts-collapsible > .kts-thumbnail {\n",
       "  display: none;\n",
       "}\n",
       ".kts-check:checked + .kts-wrapper-border {\n",
       "  border: 2px solid #f7f8fc;\n",
       "}\n",
       ".kts-check-outer {\n",
       "  display: none;\n",
       "}\n",
       ".kts-check-outer:checked + #kts-collapsible {\n",
       "  padding: 10px;\n",
       "  max-height: 3000px;\n",
       "}\n",
       ".kts-check-outer:checked + #kts-collapsible > #kts-hidden {\n",
       "  display: inline-flex;\n",
       "}\n",
       ".kts-check-outer:checked + #kts-collapsible > .kts-thumbnail {\n",
       "  display: none;\n",
       "}\n",
       ".kts-check-outer:checked + .kts-wrapper-border {\n",
       "  border: 2px solid #f7f8fc;\n",
       "}\n",
       ".kts-inner-wrapper {\n",
       "  flex-direction: column;\n",
       "}\n",
       "\n",
       ".kts-progressbar-wrapper {\n",
       "  display: flex;\n",
       "  flex-direction: row;\n",
       "  align-items: center;\n",
       "  height: 1.6em;\n",
       "}\n",
       "\n",
       ".kts-progressbar-outer {\n",
       "  box-sizing: padding-box;\n",
       "  display: flex;\n",
       "  flex-direction: row;\n",
       "  background-color: #f7f8fc;\n",
       "  align-items: center;\n",
       "  padding: 3px;\n",
       "  border-radius: 15px;\n",
       "  width: 100%;\n",
       "}\n",
       "\n",
       ".kts-progressbar-inner {\n",
       "  background-color: #FF7500;\n",
       "  height: 0.7em;\n",
       "  border-radius: 15px;\n",
       "}\n",
       "\n",
       ".kts-hbar-container {\n",
       "  display: block;\n",
       "  position: relative;\n",
       "  height: min(calc(100% - 3px), 1.5em);\n",
       "  margin: 2px;\n",
       "}\n",
       ".kts-hbar {\n",
       "  position: absolute;\n",
       "  display: inline-block;\n",
       "  background-color: #FF7500;\n",
       "  text-align: left;\n",
       "  height: 100%;\n",
       "  border-radius: 15px;\n",
       "}\n",
       ".kts-hbar-line {\n",
       "  position: absolute;\n",
       "  display: inline-block;\n",
       "  background-color: #000;\n",
       "  text-align: left;\n",
       "  height: 1px;\n",
       "  top: 50%;\n",
       "}\n",
       "\n",
       ".kts-inner-column {\n",
       "  display: flex;\n",
       "  flex-direction: column;\n",
       "  padding: auto;\n",
       "}\n",
       ".kts-row {\n",
       "  display: flex;\n",
       "  flex-direction: row;\n",
       "}\n",
       "\n",
       ".kts-hoverable-line, .kts-hoverable-line * {\n",
       "  pointer-events: all;\n",
       "  transition: all 0.1s ease-out;\n",
       "}\n",
       "\n",
       ".kts-hoverable-line:hover * {\n",
       "  stroke: #ff0;\n",
       "  stroke-width: 10;\n",
       "}\n",
       "\n",
       "</style></div>\n",
       "\n",
       "<div><style scoped>\n",
       "<style>\n",
       ".kts .kts-code .hll { background-color: #ffffcc }\n",
       ".kts .kts-code .c { color: #8f5902; font-style: italic } /* Comment */\n",
       ".kts .kts-code .err { color: #a40000; border: 1px solid #ef2929 } /* Error */\n",
       ".kts .kts-code .g { color: #000000 } /* Generic */\n",
       ".kts .kts-code .k { color: #204a87; font-weight: bold } /* Keyword */\n",
       ".kts .kts-code .l { color: #000000 } /* Literal */\n",
       ".kts .kts-code .n { color: #000000 } /* Name */\n",
       ".kts .kts-code .o { color: #ce5c00; font-weight: bold } /* Operator */\n",
       ".kts .kts-code .x { color: #000000 } /* Other */\n",
       ".kts .kts-code .p { color: #000000; font-weight: bold } /* Punctuation */\n",
       ".kts .kts-code .ch { color: #8f5902; font-style: italic } /* Comment.Hashbang */\n",
       ".kts .kts-code .cm { color: #8f5902; font-style: italic } /* Comment.Multiline */\n",
       ".kts .kts-code .cp { color: #8f5902; font-style: italic } /* Comment.Preproc */\n",
       ".kts .kts-code .cpf { color: #8f5902; font-style: italic } /* Comment.PreprocFile */\n",
       ".kts .kts-code .c1 { color: #8f5902; font-style: italic } /* Comment.Single */\n",
       ".kts .kts-code .cs { color: #8f5902; font-style: italic } /* Comment.Special */\n",
       ".kts .kts-code .gd { color: #a40000 } /* Generic.Deleted */\n",
       ".kts .kts-code .ge { color: #000000; font-style: italic } /* Generic.Emph */\n",
       ".kts .kts-code .gr { color: #ef2929 } /* Generic.Error */\n",
       ".kts .kts-code .gh { color: #000080; font-weight: bold } /* Generic.Heading */\n",
       ".kts .kts-code .gi { color: #00A000 } /* Generic.Inserted */\n",
       ".kts .kts-code .go { color: #000000; font-style: italic } /* Generic.Output */\n",
       ".kts .kts-code .gp { color: #8f5902 } /* Generic.Prompt */\n",
       ".kts .kts-code .gs { color: #000000; font-weight: bold } /* Generic.Strong */\n",
       ".kts .kts-code .gu { color: #800080; font-weight: bold } /* Generic.Subheading */\n",
       ".kts .kts-code .gt { color: #a40000; font-weight: bold } /* Generic.Traceback */\n",
       ".kts .kts-code .kc { color: #204a87; font-weight: bold } /* Keyword.Constant */\n",
       ".kts .kts-code .kd { color: #204a87; font-weight: bold } /* Keyword.Declaration */\n",
       ".kts .kts-code .kn { color: #204a87; font-weight: bold } /* Keyword.Namespace */\n",
       ".kts .kts-code .kp { color: #204a87; font-weight: bold } /* Keyword.Pseudo */\n",
       ".kts .kts-code .kr { color: #204a87; font-weight: bold } /* Keyword.Reserved */\n",
       ".kts .kts-code .kt { color: #204a87; font-weight: bold } /* Keyword.Type */\n",
       ".kts .kts-code .ld { color: #000000 } /* Literal.Date */\n",
       ".kts .kts-code .m { color: #0000cf; font-weight: bold } /* Literal.Number */\n",
       ".kts .kts-code .s { color: #4e9a06 } /* Literal.String */\n",
       ".kts .kts-code .na { color: #c4a000 } /* Name.Attribute */\n",
       ".kts .kts-code .nb { color: #204a87 } /* Name.Builtin */\n",
       ".kts .kts-code .nc { color: #000000 } /* Name.Class */\n",
       ".kts .kts-code .no { color: #000000 } /* Name.Constant */\n",
       ".kts .kts-code .nd { color: #5c35cc; font-weight: bold } /* Name.Decorator */\n",
       ".kts .kts-code .ni { color: #ce5c00 } /* Name.Entity */\n",
       ".kts .kts-code .ne { color: #cc0000; font-weight: bold } /* Name.Exception */\n",
       ".kts .kts-code .nf { color: #000000 } /* Name.Function */\n",
       ".kts .kts-code .nl { color: #f57900 } /* Name.Label */\n",
       ".kts .kts-code .nn { color: #000000 } /* Name.Namespace */\n",
       ".kts .kts-code .nx { color: #000000 } /* Name.Other */\n",
       ".kts .kts-code .py { color: #000000 } /* Name.Property */\n",
       ".kts .kts-code .nt { color: #204a87; font-weight: bold } /* Name.Tag */\n",
       ".kts .kts-code .nv { color: #000000 } /* Name.Variable */\n",
       ".kts .kts-code .ow { color: #204a87; font-weight: bold } /* Operator.Word */\n",
       ".kts .kts-code .w { color: #f8f8f8; text-decoration: underline } /* Text.Whitespace */\n",
       ".kts .kts-code .mb { color: #0000cf; font-weight: bold } /* Literal.Number.Bin */\n",
       ".kts .kts-code .mf { color: #0000cf; font-weight: bold } /* Literal.Number.Float */\n",
       ".kts .kts-code .mh { color: #0000cf; font-weight: bold } /* Literal.Number.Hex */\n",
       ".kts .kts-code .mi { color: #0000cf; font-weight: bold } /* Literal.Number.Integer */\n",
       ".kts .kts-code .mo { color: #0000cf; font-weight: bold } /* Literal.Number.Oct */\n",
       ".kts .kts-code .sa { color: #4e9a06 } /* Literal.String.Affix */\n",
       ".kts .kts-code .sb { color: #4e9a06 } /* Literal.String.Backtick */\n",
       ".kts .kts-code .sc { color: #4e9a06 } /* Literal.String.Char */\n",
       ".kts .kts-code .dl { color: #4e9a06 } /* Literal.String.Delimiter */\n",
       ".kts .kts-code .sd { color: #8f5902; font-style: italic } /* Literal.String.Doc */\n",
       ".kts .kts-code .s2 { color: #4e9a06 } /* Literal.String.Double */\n",
       ".kts .kts-code .se { color: #4e9a06 } /* Literal.String.Escape */\n",
       ".kts .kts-code .sh { color: #4e9a06 } /* Literal.String.Heredoc */\n",
       ".kts .kts-code .si { color: #4e9a06 } /* Literal.String.Interpol */\n",
       ".kts .kts-code .sx { color: #4e9a06 } /* Literal.String.Other */\n",
       ".kts .kts-code .sr { color: #4e9a06 } /* Literal.String.Regex */\n",
       ".kts .kts-code .s1 { color: #4e9a06 } /* Literal.String.Single */\n",
       ".kts .kts-code .ss { color: #4e9a06 } /* Literal.String.Symbol */\n",
       ".kts .kts-code .bp { color: #3465a4 } /* Name.Builtin.Pseudo */\n",
       ".kts .kts-code .fm { color: #000000 } /* Name.Function.Magic */\n",
       ".kts .kts-code .vc { color: #000000 } /* Name.Variable.Class */\n",
       ".kts .kts-code .vg { color: #000000 } /* Name.Variable.Global */\n",
       ".kts .kts-code .vi { color: #000000 } /* Name.Variable.Instance */\n",
       ".kts .kts-code .vm { color: #000000 } /* Name.Variable.Magic */\n",
       ".kts .kts-code .il { color: #0000cf; font-weight: bold } /* Literal.Number.Integer.Long */\n",
       "</style>\n",
       "\n",
       "</style></div>\n",
       "</div></div>"
      ],
      "text/plain": [
       "<kts.ui.dashboard.Dashboard at 0x1a3b0ff28>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "import pandas as pd\n",
    "import numpy as np\n",
    "np.random.seed(0)\n",
    "\n",
    "import kts\n",
    "from kts import *"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "train = pd.read_csv('../input/train.csv', index_col='PassengerId')\n",
    "test = pd.read_csv('../input/test.csv', index_col='PassengerId')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Survived</th>\n",
       "      <th>Pclass</th>\n",
       "      <th>Name</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Age</th>\n",
       "      <th>SibSp</th>\n",
       "      <th>Parch</th>\n",
       "      <th>Ticket</th>\n",
       "      <th>Fare</th>\n",
       "      <th>Cabin</th>\n",
       "      <th>Embarked</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>3</td>\n",
       "      <td>Braund, Mr. Owen Harris</td>\n",
       "      <td>male</td>\n",
       "      <td>22.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>A/5 21171</td>\n",
       "      <td>7.2500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>Cumings, Mrs. John Bradley (Florence Briggs Th...</td>\n",
       "      <td>female</td>\n",
       "      <td>38.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>PC 17599</td>\n",
       "      <td>71.2833</td>\n",
       "      <td>C85</td>\n",
       "      <td>C</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>3</td>\n",
       "      <td>Heikkinen, Miss. Laina</td>\n",
       "      <td>female</td>\n",
       "      <td>26.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>STON/O2. 3101282</td>\n",
       "      <td>7.9250</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>Futrelle, Mrs. Jacques Heath (Lily May Peel)</td>\n",
       "      <td>female</td>\n",
       "      <td>35.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>113803</td>\n",
       "      <td>53.1000</td>\n",
       "      <td>C123</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0</td>\n",
       "      <td>3</td>\n",
       "      <td>Allen, Mr. William Henry</td>\n",
       "      <td>male</td>\n",
       "      <td>35.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>373450</td>\n",
       "      <td>8.0500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             Survived  Pclass  \\\n",
       "PassengerId                     \n",
       "1                   0       3   \n",
       "2                   1       1   \n",
       "3                   1       3   \n",
       "4                   1       1   \n",
       "5                   0       3   \n",
       "\n",
       "                                                          Name     Sex   Age  \\\n",
       "PassengerId                                                                    \n",
       "1                                      Braund, Mr. Owen Harris    male  22.0   \n",
       "2            Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0   \n",
       "3                                       Heikkinen, Miss. Laina  female  26.0   \n",
       "4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0   \n",
       "5                                     Allen, Mr. William Henry    male  35.0   \n",
       "\n",
       "             SibSp  Parch            Ticket     Fare Cabin Embarked  \n",
       "PassengerId                                                          \n",
       "1                1      0         A/5 21171   7.2500   NaN        S  \n",
       "2                1      0          PC 17599  71.2833   C85        C  \n",
       "3                0      0  STON/O2. 3101282   7.9250   NaN        S  \n",
       "4                1      0            113803  53.1000  C123        S  \n",
       "5                0      0            373450   8.0500   NaN        S  "
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "train.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Use `kts.save` to put objects or dataframes to user cache:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "kts.save(train, 'train')\n",
    "kts.save(test, 'test')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "toc-hr-collapsed": false
   },
   "source": [
    "## Modular Feature Engineering in 30 seconds\n",
    "\n",
    "Instead of sequentially adding new columns to one dataframe, you define functions called feature blocks, which take a raw dataframe as input and produce a new dataframe containing only new columns. Then these blocks are collected into feature sets. Such encapsulation enables your features to be computed in parallel, cached, and automatically applied during inference stage, making your experiments executable end-to-end out of the box.\n",
    "\n",
    "<div style=\"margin-left: 10%; margin-right: 10%; margin-top: 50px;\">\n",
    "<img src=\"https://raw.githubusercontent.com/konodyuk/kts/master/docs/static/modularity_diagram.png\" style=\"width: 600px;\"/>\n",
    "</div>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Feature block is defined as a function taking one dataframe as an argument and returning a dataframe, too. Indices of input and output should be identical:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "3            a\n",
       "4            a\n",
       "5            a"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "def dummy_feature_a(df):\n",
    "    res = pd.DataFrame(index=df.index)\n",
    "    res['a'] = 'a'\n",
    "    return res\n",
    "\n",
    "dummy_feature_a(train[:2])\n",
    "dummy_feature_a(train[2:5])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "`@preview(frame, size_1, size_2, ...)` does almost the same thing as above: it runs your feature constructor on `frame.head(size_1), frame.head(size_2), ...`.\n",
    "\n",
    "\n",
    "*In addition, you can test out parallel execution. By default all of your features will be parallel, but if you want to change this behavior, use `parallel=False`.*"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">dummy_feature_a</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div>\n",
       "<div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b91160>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a\n",
       "3            a\n",
       "4            a\n",
       "5            a"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 2, 5, parallel=True)\n",
    "def dummy_feature_a(df):\n",
    "    res = stl.empty_like(df)  # kts.stl is a standard library of feature constructors. Now you need to know\n",
    "    res['a'] = 'a'            # only that stl.empty_like(df) is identical to pd.DataFrame(index=df.index)\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Feature blocks usually consist of more than one feature:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">dummy_feature_age_mean</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div>\n",
       "<div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b91e80>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Age</th>\n",
       "      <th>mean</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>22.0</td>\n",
       "      <td>28.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>38.0</td>\n",
       "      <td>28.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>26.0</td>\n",
       "      <td>28.666667</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "              Age       mean\n",
       "PassengerId                 \n",
       "1            22.0  28.666667\n",
       "2            38.0  28.666667\n",
       "3            26.0  28.666667"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Age</th>\n",
       "      <th>mean</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>22.0</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>38.0</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>26.0</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>35.0</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>35.0</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>6</td>\n",
       "      <td>NaN</td>\n",
       "      <td>31.2</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "              Age  mean\n",
       "PassengerId            \n",
       "1            22.0  31.2\n",
       "2            38.0  31.2\n",
       "3            26.0  31.2\n",
       "4            35.0  31.2\n",
       "5            35.0  31.2\n",
       "6             NaN  31.2"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 3, 6)\n",
    "def dummy_feature_age_mean(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['Age'] = df['Age']\n",
    "    res['mean'] = df['Age'].mean()\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Functions are registered and converted into feature constructors using `@feature` decorator:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [],
   "source": [
    "@feature\n",
    "def dummy_feature_a(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['a'] = 'a'\n",
    "    return res\n",
    "\n",
    "@feature\n",
    "def dummy_feature_bcd(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['b'] = 'b'\n",
    "    res['c'] = 'c'\n",
    "    res['d'] = 'd'\n",
    "    return res\n",
    "\n",
    "@feature\n",
    "def dummy_feature_age_mean(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['mean'] = df['Age'].mean()\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Then a feature set is defined by a list of feature constructors. Use slicing syntax to preview it:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">dummy_feature_a</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">dummy_feature_bcd</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">dummy_feature_age_mean</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3773dd8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "      <th>b</th>\n",
       "      <th>c</th>\n",
       "      <th>d</th>\n",
       "      <th>mean</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>31</td>\n",
       "      <td>a</td>\n",
       "      <td>b</td>\n",
       "      <td>c</td>\n",
       "      <td>d</td>\n",
       "      <td>44.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>32</td>\n",
       "      <td>a</td>\n",
       "      <td>b</td>\n",
       "      <td>c</td>\n",
       "      <td>d</td>\n",
       "      <td>44.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>33</td>\n",
       "      <td>a</td>\n",
       "      <td>b</td>\n",
       "      <td>c</td>\n",
       "      <td>d</td>\n",
       "      <td>44.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>34</td>\n",
       "      <td>a</td>\n",
       "      <td>b</td>\n",
       "      <td>c</td>\n",
       "      <td>d</td>\n",
       "      <td>44.666667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>35</td>\n",
       "      <td>a</td>\n",
       "      <td>b</td>\n",
       "      <td>c</td>\n",
       "      <td>d</td>\n",
       "      <td>44.666667</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a  b  c  d       mean\n",
       "PassengerId                       \n",
       "31           a  b  c  d  44.666667\n",
       "32           a  b  c  d  44.666667\n",
       "33           a  b  c  d  44.666667\n",
       "34           a  b  c  d  44.666667\n",
       "35           a  b  c  d  44.666667"
      ]
     },
     "execution_count": 9,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "dummy_fs = FeatureSet([dummy_feature_a, dummy_feature_bcd, dummy_feature_age_mean], train_frame=train)\n",
    "dummy_fs[30:35]"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Let's clean up our namespace a bit:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [],
   "source": [
    "delete(dummy_feature_a, force=True)\n",
    "delete(dummy_feature_bcd, force=True)\n",
    "delete(dummy_feature_age_mean, force=True)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Now let's get to the real things.  "
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Decorators\n",
    "\n",
    "\n",
    "Almost all of the functions that you'll use have rich docstrings with examples. \n",
    "Although it is not necessary, I'll demonstrate them throughout this tutorial.\n",
    "<!-- Decorators are the most frequently used part of KTS API. Don't be confused by decorators and use cases that you haven't seen yet, as they'll be shown in  -->\n",
    "Let's first take a closer look at the decorators that you have already seen. \n",
    "Don't be confused if you can't understand something, as it will be better explained in the [Feature Types](#Feature-Types) section."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### @preview"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">PREVIEW DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">preview</span><span class=\"p\">(</span><span class=\"n\">frame</span><span class=\"p\">,</span> <span class=\"n\">sizes</span><span class=\"p\">,</span> <span class=\"n\">parallel</span><span class=\"p\">,</span> <span class=\"n\">train</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Runs a feature constructor several times to let you make sure it works correctly<br><br>Sequentially passes frame.head(size) to your feature constructor<br>for each provided size.<br>Generic features can also be previewed, in this case they'll be<br>initialized using their default arguments.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">frame</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">a dataframe to be used for testing your feature</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">*sizes</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">one or more ints, sizes of input dataframes</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">parallel</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">whether to preview as a parallel feature constructor</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">train</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">df.train flag value to be passed to the feature constructor</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@preview</span><span class=\"p\">(</span><span class=\"n\">train</span><span class=\"p\">,</span> <span class=\"mi\">2</span><span class=\"p\">,</span> <span class=\"mi\">3</span><span class=\"p\">,</span> <span class=\"n\">parallel</span><span class=\"o\">=</span><span class=\"bp\">False</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">some_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"s1\">&#39;col&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"o\">...</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@preview</span><span class=\"p\">(</span><span class=\"n\">train</span><span class=\"p\">,</span> <span class=\"mi\">200</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">some_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">mean_encode</span><span class=\"p\">([</span><span class=\"s1\">&#39;Parch&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@preview</span><span class=\"p\">(</span><span class=\"n\">train</span><span class=\"p\">,</span> <span class=\"mi\">100</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">left</span><span class=\"o\">=</span><span class=\"s2\">&quot;Age&quot;</span><span class=\"p\">,</span> <span class=\"n\">right</span><span class=\"o\">=</span><span class=\"s2\">&quot;SibSp&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">numeric_interactions</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_add_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">+</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_sub_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_mul_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">*</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.api.decorators.preview(frame, *sizes, parallel=True, train=True)>"
      ]
     },
     "execution_count": 11,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "preview"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### @feature"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">FEATURE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">feature</span><span class=\"p\">(</span><span class=\"n\">args</span><span class=\"p\">,</span> <span class=\"n\">cache</span><span class=\"p\">,</span> <span class=\"n\">parallel</span><span class=\"p\">,</span> <span class=\"n\">verbose</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Registers a function as a feature constructor and saves it<br><br>Can be used both with and without flags.<br>Note that generic feature constructors should be<br>additionally registered using this decorator.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">cache</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">whether to cache calls and avoid recomputing</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">parallel</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">whether to run in parallel with other parallel FCs</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">verbose</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">whether to print logs and show progress</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@feature</span><span class=\"p\">(</span><span class=\"n\">parallel</span><span class=\"o\">=</span><span class=\"bp\">False</span><span class=\"p\">,</span> <span class=\"n\">verbose</span><span class=\"o\">=</span><span class=\"bp\">False</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">some_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"o\">...</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@feature</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">some_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"o\">...</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@feature</span>\n",
       "<span class=\"o\">...</span> <span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">param</span><span class=\"o\">=</span><span class=\"s1\">&#39;default&#39;</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">generic_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"o\">...</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.api.decorators.feature(*args, cache=True, parallel=True, verbose=True)>"
      ]
     },
     "execution_count": 12,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "feature"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### @generic"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 13,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">GENERIC DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">generic</span><span class=\"p\">(</span><span class=\"n\">kwargs</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Creates a generic feature constructor<br><br>Generic features are parametrized feature constructors.<br><br>Note that this decorator does not register your function<br>and you should add @feature to save it.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">**kwargs</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">arguments and their default values</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A generic feature constructor.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@feature</span>\n",
       "<span class=\"o\">...</span> <span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">left</span><span class=\"o\">=</span><span class=\"s2\">&quot;Age&quot;</span><span class=\"p\">,</span> <span class=\"n\">right</span><span class=\"o\">=</span><span class=\"s2\">&quot;SibSp&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">numeric_interactions</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_add_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">+</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_sub_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_mul_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">*</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"kn\">from</span> <span class=\"nn\">itertools</span> <span class=\"kn\">import</span> <span class=\"n\">combinations</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">fs</span> <span class=\"o\">=</span> <span class=\"n\">FeatureSet</span><span class=\"p\">([</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">numeric_interactions</span><span class=\"p\">(</span><span class=\"n\">left</span><span class=\"p\">,</span> <span class=\"n\">right</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">for</span> <span class=\"n\">left</span><span class=\"p\">,</span> <span class=\"n\">right</span> <span class=\"ow\">in</span> <span class=\"n\">combinations</span><span class=\"p\">([</span><span class=\"s1\">&#39;Parch&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;SibSp&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">],</span> <span class=\"n\">r</span><span class=\"o\">=</span><span class=\"mi\">2</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span> <span class=\"p\">],</span> <span class=\"o\">...</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.api.decorators.generic(**kwargs)>"
      ]
     },
     "execution_count": 13,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "generic"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### delete"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 14,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">DELETE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">delete</span><span class=\"p\">(</span><span class=\"n\">feature_or_helper</span><span class=\"p\">,</span> <span class=\"n\">force</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Deletes given feature or helper from lists and clears cache<br><br>Feature constructors are deleted along with their cache.<br>Generic feature constructors are also fully deleted.<br>As some STL features produce cache, you can also remove it<br>by passing an STL feature as an argument. The STL feature itself won't be removed.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">feature_or_helper</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">an instance to be removed</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">force</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">force deletion without any warnings and confirmations</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">delete</span><span class=\"p\">(</span><span class=\"n\">incorrect_feature</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">delete</span><span class=\"p\">(</span><span class=\"n\">old_helper</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">delete</span><span class=\"p\">(</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">mean_encode</span><span class=\"p\">(</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">))</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">delete</span><span class=\"p\">(</span><span class=\"n\">generic_feature</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.api.decorators.delete(feature_or_helper:Union[kts.core.feature_constructor.parallel.ParallelFeatureConstructor, kts.core.feature_constructor.generic.GenericFeatureConstructor, kts.api.helper.Helper], force=False)>"
      ]
     },
     "execution_count": 14,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "delete"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Feature Types\n",
    "\n",
    "### Regular Features\n",
    "\n",
    "This type of FCs should already look quite familiar:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">simple_feature</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b917b8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>is_male</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             is_male\n",
       "PassengerId         \n",
       "1                  1\n",
       "2                  0\n",
       "3                  0\n",
       "4                  0\n",
       "5                  1"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def simple_feature(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['is_male'] = (df.Sex == 'male') + 0\n",
    "    return res"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 16,
   "metadata": {},
   "outputs": [],
   "source": [
    "@feature\n",
    "def simple_feature(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['is_male'] = (df.Sex == 'male') + 0\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Feature constructors can print anything to stdout and it will be shown in your report in real time, even if your features are computed in separate processes:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_stdout</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div>\n",
       "<div class=\"kts-output\"><div></div>\n",
       "<div>[17:34:13.126] some logs</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b91438>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 2)\n",
    "def feature_with_stdout(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['a'] = 'a'\n",
    "    print('some logs')\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Use `kts.pbar` to track progress of long-running features:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 18,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_pbar</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">3s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a378ec88>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "import time\n",
    "\n",
    "@preview(train, 2)\n",
    "def feature_with_pbar(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['a'] = 'a'\n",
    "    for i in pbar(['a', 'b', 'c']):\n",
    "        time.sleep(1)\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "They can also be nested and titled:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_nested_pbar</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">9s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_nested_pbar - a</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">3s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_nested_pbar - b</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">3s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_with_nested_pbar - c</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">3s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a378e470>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>a</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             a\n",
       "PassengerId   \n",
       "1            a\n",
       "2            a"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 2)\n",
    "def feature_with_nested_pbar(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res['a'] = 'a'\n",
    "    for i in pbar(['a', 'b', 'c']):\n",
    "        for j in pbar(range(6), title=i):\n",
    "            time.sleep(0.5)\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Features Using External Frames\n",
    "\n",
    "Sometimes datasets consist of more than one dataframe. To get an external dataframe into you feature constructor's scope, you need to save it with `kts.save()` and then use the following syntax:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">feature_using_external</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div>\n",
       "<div class=\"kts-output\"><div></div>\n",
       "<div>[17:34:25.902] DataFrame</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">1s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f5f8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Pclass</th>\n",
       "      <th>somefeat</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>3</td>\n",
       "      <td>6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>3</td>\n",
       "      <td>6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>3</td>\n",
       "      <td>6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>6</td>\n",
       "      <td>3</td>\n",
       "      <td>6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>7</td>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             Pclass  somefeat\n",
       "PassengerId                  \n",
       "1                 3         6\n",
       "2                 1         4\n",
       "3                 3         6\n",
       "4                 1         4\n",
       "5                 3         6\n",
       "6                 3         6\n",
       "7                 1         4"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "external = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6]})\n",
    "kts.save(external, 'external')\n",
    "\n",
    "@preview(train, 7)\n",
    "def feature_using_external(df, somename='external'):\n",
    "    \"\"\"\n",
    "    To get an external dataframe, you should set its name in user cache as a default value.\n",
    "    Inside it will look like a usual dataframe.\n",
    "    \"\"\"\n",
    "    print(somename.__class__.__name__)\n",
    "    time.sleep(1)  # a short delay to receive stdout\n",
    "    res = stl.empty_like(df)\n",
    "    res['Pclass'] = df['Pclass']\n",
    "    res['somefeat'] = somename.set_index('a').loc[df['Pclass']]['b'].values\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Stateful Features\n",
    "\n",
    "Some features may need their state to be saved between training and inference stages. In this case you can use `df.train` or `df._train` to identify which stage it is and `df.state` or `df._state` as a dictionary to write and read the state:\n",
    "\n",
    "*Unfortunately, so far you can preview only training stage using @preview. Later we'll add @preview_train_test to emulate both stages.*"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stateful_feature</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div>\n",
       "<div class=\"kts-output\"><div></div>\n",
       "<div>[17:34:27.039] this is a training stage</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a378e6a0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Age</th>\n",
       "      <th>age_std</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>22.0</td>\n",
       "      <td>-0.294872</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>38.0</td>\n",
       "      <td>0.217949</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>26.0</td>\n",
       "      <td>-0.166667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>35.0</td>\n",
       "      <td>0.121795</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>35.0</td>\n",
       "      <td>0.121795</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "              Age   age_std\n",
       "PassengerId                \n",
       "1            22.0 -0.294872\n",
       "2            38.0  0.217949\n",
       "3            26.0 -0.166667\n",
       "4            35.0  0.121795\n",
       "5            35.0  0.121795"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def stateful_feature(df):\n",
    "    \"\"\"A simple standardizer\"\"\"\n",
    "    res = stl.empty_like(df)\n",
    "    if df.train:\n",
    "        print('this is a training stage')\n",
    "        df.state['mean'] = df['Age'].mean()\n",
    "        df.state['std'] = df['Age'].std()\n",
    "    mean = df.state['mean']\n",
    "    std = df.state['mean']\n",
    "    res['Age'] = df['Age']\n",
    "    res['age_std'] = (df['Age'] - mean) / std\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Generic Features\n",
    "\n",
    "You can also create reusable functions with `@generic(arg1=default, arg2=default, ...)`. For preview, default arguments are used."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">interactions__Pclass_SibSp</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0fef0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Pclass_add_SibSp</th>\n",
       "      <th>Pclass_sub_SibSp</th>\n",
       "      <th>Pclass_mul_SibSp</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>4</td>\n",
       "      <td>2</td>\n",
       "      <td>3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>3</td>\n",
       "      <td>3</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>3</td>\n",
       "      <td>3</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             Pclass_add_SibSp  Pclass_sub_SibSp  Pclass_mul_SibSp\n",
       "PassengerId                                                      \n",
       "1                           4                 2                 3\n",
       "2                           2                 0                 1\n",
       "3                           3                 3                 0\n",
       "4                           2                 0                 1\n",
       "5                           3                 3                 0"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "@generic(left=\"Pclass\", right=\"SibSp\")\n",
    "def interactions(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res[f\"{left}_add_{right}\"] = df[left] + df[right]\n",
    "    res[f\"{left}_sub_{right}\"] = df[left] - df[right]\n",
    "    res[f\"{left}_mul_{right}\"] = df[left] * df[right]\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Let's register a couple of generic features:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "metadata": {},
   "outputs": [],
   "source": [
    "@feature\n",
    "@generic(left=\"Pclass\", right=\"SibSp\")\n",
    "def interactions(df):\n",
    "    res = stl.empty_like(df)\n",
    "    res[f\"{left}_add_{right}\"] = df[left] + df[right]\n",
    "    res[f\"{left}_sub_{right}\"] = df[left] - df[right]\n",
    "    res[f\"{left}_mul_{right}\"] = df[left] * df[right]\n",
    "    return res"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {},
   "outputs": [],
   "source": [
    "@feature\n",
    "@generic(col=\"Parch\")\n",
    "def num_aggs(df):\n",
    "    \"\"\"Descriptions are also supported.\"\"\"\n",
    "    res = pd.DataFrame(index=df.index)\n",
    "    mean = df[col].mean()\n",
    "    std = df[col].std()\n",
    "    res[f\"{col}_div_mean\"] = df[col] / mean\n",
    "    res[f\"{col}_sub_div_mean\"] = (df[col] - mean) / mean\n",
    "    res[f\"{col}_div_std\"] = df[col] / std\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "A combination of generic and stateful feature. It also returns a numpy array instead of dataframe. In this case, KTS will attach input index to result dataframe automatically."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">tfidf__Name</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x11e96b240>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>tfidf__Name_0</th>\n",
       "      <th>tfidf__Name_1</th>\n",
       "      <th>tfidf__Name_2</th>\n",
       "      <th>tfidf__Name_3</th>\n",
       "      <th>tfidf__Name_4</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>0.508281</td>\n",
       "      <td>0.338854</td>\n",
       "      <td>0.185575</td>\n",
       "      <td>0.742300</td>\n",
       "      <td>0.203426</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0.593616</td>\n",
       "      <td>0.197872</td>\n",
       "      <td>0.433463</td>\n",
       "      <td>0.541828</td>\n",
       "      <td>0.356369</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0.464173</td>\n",
       "      <td>0.464173</td>\n",
       "      <td>0.508413</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.557318</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>0.603771</td>\n",
       "      <td>0.301886</td>\n",
       "      <td>0.661317</td>\n",
       "      <td>0.220439</td>\n",
       "      <td>0.241644</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0.631088</td>\n",
       "      <td>0.420725</td>\n",
       "      <td>0.460825</td>\n",
       "      <td>0.460825</td>\n",
       "      <td>0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>6</td>\n",
       "      <td>0.508984</td>\n",
       "      <td>0.508984</td>\n",
       "      <td>0.278748</td>\n",
       "      <td>0.557496</td>\n",
       "      <td>0.305561</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>7</td>\n",
       "      <td>0.779844</td>\n",
       "      <td>0.259948</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.569447</td>\n",
       "      <td>0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>8</td>\n",
       "      <td>0.395067</td>\n",
       "      <td>0.526756</td>\n",
       "      <td>0.288481</td>\n",
       "      <td>0.288481</td>\n",
       "      <td>0.632461</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>9</td>\n",
       "      <td>0.605911</td>\n",
       "      <td>0.302956</td>\n",
       "      <td>0.442440</td>\n",
       "      <td>0.331830</td>\n",
       "      <td>0.485000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>10</td>\n",
       "      <td>0.449865</td>\n",
       "      <td>0.449865</td>\n",
       "      <td>0.492741</td>\n",
       "      <td>0.246371</td>\n",
       "      <td>0.540139</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             tfidf__Name_0  tfidf__Name_1  tfidf__Name_2  tfidf__Name_3  \\\n",
       "PassengerId                                                               \n",
       "1                 0.508281       0.338854       0.185575       0.742300   \n",
       "2                 0.593616       0.197872       0.433463       0.541828   \n",
       "3                 0.464173       0.464173       0.508413       0.000000   \n",
       "4                 0.603771       0.301886       0.661317       0.220439   \n",
       "5                 0.631088       0.420725       0.460825       0.460825   \n",
       "6                 0.508984       0.508984       0.278748       0.557496   \n",
       "7                 0.779844       0.259948       0.000000       0.569447   \n",
       "8                 0.395067       0.526756       0.288481       0.288481   \n",
       "9                 0.605911       0.302956       0.442440       0.331830   \n",
       "10                0.449865       0.449865       0.492741       0.246371   \n",
       "\n",
       "             tfidf__Name_4  \n",
       "PassengerId                 \n",
       "1                 0.203426  \n",
       "2                 0.356369  \n",
       "3                 0.557318  \n",
       "4                 0.241644  \n",
       "5                 0.000000  \n",
       "6                 0.305561  \n",
       "7                 0.000000  \n",
       "8                 0.632461  \n",
       "9                 0.485000  \n",
       "10                0.540139  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "from sklearn.feature_extraction.text import TfidfVectorizer\n",
    "\n",
    "@preview(train, 10)\n",
    "@generic(col='Name')\n",
    "def tfidf(df):\n",
    "    if df.train:\n",
    "        enc = TfidfVectorizer(analyzer='char', ngram_range=(1, 3), max_features=5)\n",
    "        res = enc.fit_transform(df[col])\n",
    "        df.state['enc'] = enc\n",
    "    else:\n",
    "        enc = df.state['enc']\n",
    "        res = enc.transform(df[col])\n",
    "    return res.todense()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Don't forget to change `@preview` to `@feature` to register generics:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 26,
   "metadata": {},
   "outputs": [],
   "source": [
    "@feature\n",
    "@generic(col='Name')\n",
    "def tfidf(df):\n",
    "    if df.train:\n",
    "        enc = TfidfVectorizer(analyzer='char', ngram_range=(1, 3), max_features=5)\n",
    "        res = enc.fit_transform(df[col])\n",
    "        df.state['enc'] = enc\n",
    "    else:\n",
    "        enc = df.state['enc']\n",
    "        res = enc.transform(df[col])\n",
    "    return res.todense()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 27,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">GENERIC FEATURE</div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">tfidf</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">col</span><span class=\"o\">=</span><span class=\"s1\">&#39;Name&#39;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">tfidf</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"k\">if</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">train</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">TfidfVectorizer</span><span class=\"p\">(</span><span class=\"n\">analyzer</span><span class=\"o\">=</span><span class=\"s1\">&#39;char&#39;</span><span class=\"p\">,</span> <span class=\"n\">ngram_range</span><span class=\"o\">=</span><span class=\"p\">(</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">3</span><span class=\"p\">),</span> <span class=\"n\">max_features</span><span class=\"o\">=</span><span class=\"mi\">5</span><span class=\"p\">)</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">fit_transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "        <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">enc</span>\n",
       "    <span class=\"k\">else</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span><span class=\"o\">.</span><span class=\"n\">todense</span><span class=\"p\">()</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">requirements</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\"><tt>sklearn==0.20.2</tt></div></div></div>"
      ],
      "text/plain": [
       "<kts.core.feature_constructor.generic.Generic(tfidf) at 0x1a3b0f7b8>"
      ]
     },
     "execution_count": 27,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "tfidf"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Note that KTS added sklearn to dependencies. Right now it is not very useful, but later it may be used to dockerize experiments automatically."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Standard Library\n",
    "\n",
    "KTS provides the most essential feature constructors as a standard library, i.e. `kts.stl` submodule. All of the STL features have rich docstrings."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.empty_like"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">EMPTY_LIKE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Returns an empty dataframe, preserving only index</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"nd\">@feature</span>\n",
       "<span class=\"o\">...</span> <span class=\"k\">def</span> <span class=\"nf\">some_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"s1\">&#39;col&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"o\">...</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "stl.empty_like"
      ]
     },
     "execution_count": 28,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.empty_like"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b2e588>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "Empty KTSFrame\n",
       "Columns: []\n",
       "Index: [1, 2, 3, 4, 5]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def preview_stl(df):\n",
    "    return stl.empty_like(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.identity"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 30,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">IDENTITY DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Returns its input</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">fs</span> <span class=\"o\">=</span> <span class=\"n\">FeatureSet</span><span class=\"p\">([</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">identity</span><span class=\"p\">,</span> <span class=\"n\">one_feature</span><span class=\"p\">,</span> <span class=\"n\">another_feature</span><span class=\"p\">],</span> <span class=\"o\">...</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"k\">assert</span> <span class=\"nb\">all</span><span class=\"p\">((</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">identity</span> <span class=\"o\">&amp;</span> <span class=\"p\">[</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">)</span> <span class=\"o\">==</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">select</span><span class=\"p\">([</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">))</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"k\">assert</span> <span class=\"nb\">all</span><span class=\"p\">((</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">identity</span> <span class=\"o\">-</span> <span class=\"p\">[</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">)</span> <span class=\"o\">==</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">drop</span><span class=\"p\">([</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">))</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "stl.identity"
      ]
     },
     "execution_count": 30,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.identity"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 31,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b2e908>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Survived</th>\n",
       "      <th>Pclass</th>\n",
       "      <th>Name</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Age</th>\n",
       "      <th>SibSp</th>\n",
       "      <th>Parch</th>\n",
       "      <th>Ticket</th>\n",
       "      <th>Fare</th>\n",
       "      <th>Cabin</th>\n",
       "      <th>Embarked</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>3</td>\n",
       "      <td>Braund, Mr. Owen Harris</td>\n",
       "      <td>male</td>\n",
       "      <td>22.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>A/5 21171</td>\n",
       "      <td>7.2500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>Cumings, Mrs. John Bradley (Florence Briggs Th...</td>\n",
       "      <td>female</td>\n",
       "      <td>38.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>PC 17599</td>\n",
       "      <td>71.2833</td>\n",
       "      <td>C85</td>\n",
       "      <td>C</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>3</td>\n",
       "      <td>Heikkinen, Miss. Laina</td>\n",
       "      <td>female</td>\n",
       "      <td>26.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>STON/O2. 3101282</td>\n",
       "      <td>7.9250</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>Futrelle, Mrs. Jacques Heath (Lily May Peel)</td>\n",
       "      <td>female</td>\n",
       "      <td>35.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>113803</td>\n",
       "      <td>53.1000</td>\n",
       "      <td>C123</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0</td>\n",
       "      <td>3</td>\n",
       "      <td>Allen, Mr. William Henry</td>\n",
       "      <td>male</td>\n",
       "      <td>35.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>373450</td>\n",
       "      <td>8.0500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             Survived  Pclass  \\\n",
       "PassengerId                     \n",
       "1                   0       3   \n",
       "2                   1       1   \n",
       "3                   1       3   \n",
       "4                   1       1   \n",
       "5                   0       3   \n",
       "\n",
       "                                                          Name     Sex   Age  \\\n",
       "PassengerId                                                                    \n",
       "1                                      Braund, Mr. Owen Harris    male  22.0   \n",
       "2            Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0   \n",
       "3                                       Heikkinen, Miss. Laina  female  26.0   \n",
       "4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0   \n",
       "5                                     Allen, Mr. William Henry    male  35.0   \n",
       "\n",
       "             SibSp  Parch            Ticket     Fare Cabin Embarked  \n",
       "PassengerId                                                          \n",
       "1                1      0         A/5 21171   7.2500   NaN        S  \n",
       "2                1      0          PC 17599  71.2833   C85        C  \n",
       "3                0      0  STON/O2. 3101282   7.9250   NaN        S  \n",
       "4                1      0            113803  53.1000  C123        S  \n",
       "5                0      0            373450   8.0500   NaN        S  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def preview_stl(df):\n",
    "    return stl.identity(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.select"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 32,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">SELECT DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">select</span><span class=\"p\">(</span><span class=\"n\">columns</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Selects columns from a dataframe. Identical to df[columns]</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns to select</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor selecting given columns from input dataframe.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"k\">assert</span> <span class=\"nb\">all</span><span class=\"p\">(</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">select</span><span class=\"p\">([</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">)</span> <span class=\"o\">==</span> <span class=\"n\">df</span><span class=\"p\">[[</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">]])</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.select(columns:List[str]) -> kts.core.feature_constructor.base.Selector>"
      ]
     },
     "execution_count": 32,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.select"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 33,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f2b0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Name</th>\n",
       "      <th>Sex</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>Braund, Mr. Owen Harris</td>\n",
       "      <td>male</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>Cumings, Mrs. John Bradley (Florence Briggs Th...</td>\n",
       "      <td>female</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>Heikkinen, Miss. Laina</td>\n",
       "      <td>female</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>Futrelle, Mrs. Jacques Heath (Lily May Peel)</td>\n",
       "      <td>female</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>Allen, Mr. William Henry</td>\n",
       "      <td>male</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                                          Name     Sex\n",
       "PassengerId                                                           \n",
       "1                                      Braund, Mr. Owen Harris    male\n",
       "2            Cumings, Mrs. John Bradley (Florence Briggs Th...  female\n",
       "3                                       Heikkinen, Miss. Laina  female\n",
       "4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)  female\n",
       "5                                     Allen, Mr. William Henry    male"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def preview_stl(df):\n",
    "    return stl.select(['Name', 'Sex'])(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.drop"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 34,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">DROP DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">drop</span><span class=\"p\">(</span><span class=\"n\">columns</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Drops columns from a dataframe. Identical to df.drop(columns, axis=1)</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns to drop</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor dropping given columns from input dataframe.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"k\">assert</span> <span class=\"nb\">all</span><span class=\"p\">(</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">drop</span><span class=\"p\">([</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">])(</span><span class=\"n\">df</span><span class=\"p\">)</span> <span class=\"o\">==</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">drop</span><span class=\"p\">([</span><span class=\"s1\">&#39;a&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;b&#39;</span><span class=\"p\">],</span> <span class=\"n\">axis</span><span class=\"o\">=</span><span class=\"mi\">1</span><span class=\"p\">))</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.drop(columns:List[str]) -> kts.core.feature_constructor.base.Dropper>"
      ]
     },
     "execution_count": 34,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.drop"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 35,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f4a8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Pclass</th>\n",
       "      <th>Name</th>\n",
       "      <th>Sex</th>\n",
       "      <th>Age</th>\n",
       "      <th>SibSp</th>\n",
       "      <th>Parch</th>\n",
       "      <th>Ticket</th>\n",
       "      <th>Fare</th>\n",
       "      <th>Cabin</th>\n",
       "      <th>Embarked</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>3</td>\n",
       "      <td>Braund, Mr. Owen Harris</td>\n",
       "      <td>male</td>\n",
       "      <td>22.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>A/5 21171</td>\n",
       "      <td>7.2500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>Cumings, Mrs. John Bradley (Florence Briggs Th...</td>\n",
       "      <td>female</td>\n",
       "      <td>38.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>PC 17599</td>\n",
       "      <td>71.2833</td>\n",
       "      <td>C85</td>\n",
       "      <td>C</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>3</td>\n",
       "      <td>Heikkinen, Miss. Laina</td>\n",
       "      <td>female</td>\n",
       "      <td>26.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>STON/O2. 3101282</td>\n",
       "      <td>7.9250</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>Futrelle, Mrs. Jacques Heath (Lily May Peel)</td>\n",
       "      <td>female</td>\n",
       "      <td>35.0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>113803</td>\n",
       "      <td>53.1000</td>\n",
       "      <td>C123</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>3</td>\n",
       "      <td>Allen, Mr. William Henry</td>\n",
       "      <td>male</td>\n",
       "      <td>35.0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>373450</td>\n",
       "      <td>8.0500</td>\n",
       "      <td>NaN</td>\n",
       "      <td>S</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             Pclass                                               Name  \\\n",
       "PassengerId                                                              \n",
       "1                 3                            Braund, Mr. Owen Harris   \n",
       "2                 1  Cumings, Mrs. John Bradley (Florence Briggs Th...   \n",
       "3                 3                             Heikkinen, Miss. Laina   \n",
       "4                 1       Futrelle, Mrs. Jacques Heath (Lily May Peel)   \n",
       "5                 3                           Allen, Mr. William Henry   \n",
       "\n",
       "                Sex   Age  SibSp  Parch            Ticket     Fare Cabin  \\\n",
       "PassengerId                                                                \n",
       "1              male  22.0      1      0         A/5 21171   7.2500   NaN   \n",
       "2            female  38.0      1      0          PC 17599  71.2833   C85   \n",
       "3            female  26.0      0      0  STON/O2. 3101282   7.9250   NaN   \n",
       "4            female  35.0      1      0            113803  53.1000  C123   \n",
       "5              male  35.0      0      0            373450   8.0500   NaN   \n",
       "\n",
       "            Embarked  \n",
       "PassengerId           \n",
       "1                  S  \n",
       "2                  C  \n",
       "3                  S  \n",
       "4                  S  \n",
       "5                  S  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def preview_stl(df):\n",
    "    return stl.drop(['Survived'])(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.concat"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 36,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">CONCAT DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">concat</span><span class=\"p\">(</span><span class=\"n\">feature_constructors</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Concatenates feature constructors</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">feature_constructors</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of feature constructors</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A single feature constructor whose output contains columns from each of the given features.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"kn\">from</span> <span class=\"nn\">category_encoders</span> <span class=\"kn\">import</span> <span class=\"n\">WOEEncoder</span><span class=\"p\">,</span> <span class=\"n\">CatBoostEncoder</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">concat</span><span class=\"p\">([</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">select</span><span class=\"p\">(</span><span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">]),</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">WOEEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">),</span>\n",
       "<span class=\"o\">...</span>     <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">CatBoostEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">),</span>\n",
       "<span class=\"o\">...</span> <span class=\"p\">])</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.concat(feature_constructors:List[kts.core.feature_constructor.base.BaseFeatureConstructor]) -> kts.stl.backend.Concat>"
      ]
     },
     "execution_count": 36,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.concat"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 37,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">2s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">simple_feature</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">tfidf__Name</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f2b0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Name</th>\n",
       "      <th>Sex</th>\n",
       "      <th>is_male</th>\n",
       "      <th>tfidf__Name_0</th>\n",
       "      <th>tfidf__Name_1</th>\n",
       "      <th>tfidf__Name_2</th>\n",
       "      <th>tfidf__Name_3</th>\n",
       "      <th>tfidf__Name_4</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>Braund, Mr. Owen Harris</td>\n",
       "      <td>male</td>\n",
       "      <td>1</td>\n",
       "      <td>0.497477</td>\n",
       "      <td>0.331651</td>\n",
       "      <td>0.165826</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.784236</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>Cumings, Mrs. John Bradley (Florence Briggs Th...</td>\n",
       "      <td>female</td>\n",
       "      <td>0</td>\n",
       "      <td>0.610662</td>\n",
       "      <td>0.203554</td>\n",
       "      <td>0.407108</td>\n",
       "      <td>0.240666</td>\n",
       "      <td>0.601665</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>Heikkinen, Miss. Laina</td>\n",
       "      <td>female</td>\n",
       "      <td>0</td>\n",
       "      <td>0.546402</td>\n",
       "      <td>0.546402</td>\n",
       "      <td>0.546402</td>\n",
       "      <td>0.323011</td>\n",
       "      <td>0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>Futrelle, Mrs. Jacques Heath (Lily May Peel)</td>\n",
       "      <td>female</td>\n",
       "      <td>0</td>\n",
       "      <td>0.544245</td>\n",
       "      <td>0.272122</td>\n",
       "      <td>0.544245</td>\n",
       "      <td>0.536227</td>\n",
       "      <td>0.214491</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>Allen, Mr. William Henry</td>\n",
       "      <td>male</td>\n",
       "      <td>1</td>\n",
       "      <td>0.447424</td>\n",
       "      <td>0.298283</td>\n",
       "      <td>0.298283</td>\n",
       "      <td>0.705332</td>\n",
       "      <td>0.352666</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                                          Name     Sex  \\\n",
       "PassengerId                                                              \n",
       "1                                      Braund, Mr. Owen Harris    male   \n",
       "2            Cumings, Mrs. John Bradley (Florence Briggs Th...  female   \n",
       "3                                       Heikkinen, Miss. Laina  female   \n",
       "4                 Futrelle, Mrs. Jacques Heath (Lily May Peel)  female   \n",
       "5                                     Allen, Mr. William Henry    male   \n",
       "\n",
       "             is_male  tfidf__Name_0  tfidf__Name_1  tfidf__Name_2  \\\n",
       "PassengerId                                                         \n",
       "1                  1       0.497477       0.331651       0.165826   \n",
       "2                  0       0.610662       0.203554       0.407108   \n",
       "3                  0       0.546402       0.546402       0.546402   \n",
       "4                  0       0.544245       0.272122       0.544245   \n",
       "5                  1       0.447424       0.298283       0.298283   \n",
       "\n",
       "             tfidf__Name_3  tfidf__Name_4  \n",
       "PassengerId                                \n",
       "1                 0.000000       0.784236  \n",
       "2                 0.240666       0.601665  \n",
       "3                 0.323011       0.000000  \n",
       "4                 0.536227       0.214491  \n",
       "5                 0.705332       0.352666  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 5)\n",
    "def preview_stl(df):\n",
    "    res = stl.concat([\n",
    "        stl.select(['Sex', 'Name']),\n",
    "        simple_feature,\n",
    "        tfidf('Name')\n",
    "    ])(df)\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.apply"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 38,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">APPLY DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nb\">apply</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">,</span> <span class=\"n\">func</span><span class=\"p\">,</span> <span class=\"n\">parts</span><span class=\"p\">,</span> <span class=\"n\">optimize</span><span class=\"p\">,</span> <span class=\"n\">verbose</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Applies a function row-wise in parallel. Identical to df.apply(func, axis=1)</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">df</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">input dataframe</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">func</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">function taking a pd.Series as input and returning a single value</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">parts</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">number of parts to split the dataframe into. May be greater than the number of cores</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">optimize</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">if set to True, then the dataframe won't be partitioned if its size is less than 100</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">verbose</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">whether to show a progress bar for each process</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A dataframe whose only column contains the result of calling func for each row.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"k\">def</span> <span class=\"nf\">func</span><span class=\"p\">(</span><span class=\"n\">row</span><span class=\"p\">):</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">if</span> <span class=\"n\">row</span><span class=\"o\">.</span><span class=\"n\">Embarked</span> <span class=\"o\">==</span> <span class=\"s1\">&#39;S&#39;</span><span class=\"p\">:</span>\n",
       "<span class=\"o\">...</span>         <span class=\"k\">return</span> <span class=\"n\">row</span><span class=\"o\">.</span><span class=\"n\">SibSp</span>\n",
       "<span class=\"o\">...</span>     <span class=\"k\">return</span> <span class=\"n\">row</span><span class=\"o\">.</span><span class=\"n\">Age</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">apply</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">,</span> <span class=\"n\">func</span><span class=\"p\">,</span> <span class=\"n\">parts</span><span class=\"o\">=</span><span class=\"mi\">7</span><span class=\"p\">,</span> <span class=\"n\">verbose</span><span class=\"o\">=</span><span class=\"bp\">True</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.apply(df:pandas.core.frame.DataFrame, func:Callable, parts:Union[int, NoneType]=None, optimize:bool=True, verbose:bool=False) -> pandas.core.frame.DataFrame>"
      ]
     },
     "execution_count": 38,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.apply"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 39,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">19s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_0_100</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_100_200</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_200_300</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_300_400</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_400_500</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_500_600</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">stl_apply_600_700</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">10s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b2e3c8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>col</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>38.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>696</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>697</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>698</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>699</td>\n",
       "      <td>49.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>700</td>\n",
       "      <td>0.0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>700 rows × 1 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "              col\n",
       "PassengerId      \n",
       "1             1.0\n",
       "2            38.0\n",
       "3             0.0\n",
       "4             1.0\n",
       "5             0.0\n",
       "...           ...\n",
       "696           0.0\n",
       "697           0.0\n",
       "698           NaN\n",
       "699          49.0\n",
       "700           0.0\n",
       "\n",
       "[700 rows x 1 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 700, parallel=True)\n",
    "def preview_stl(df):\n",
    "    def func(row):\n",
    "        \"\"\"A regular row-wise function with any logic.\"\"\"\n",
    "        time.sleep(0.1)\n",
    "        if row.Embarked == 'S':\n",
    "            return row.SibSp\n",
    "        return row.Age\n",
    "    res = stl.empty_like(df)\n",
    "    res['col'] = stl.apply(df, func, parts=7, verbose=True)\n",
    "    return res"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.category_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 40,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">CATEGORY_ENCODE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">encoder</span><span class=\"p\">,</span> <span class=\"n\">columns</span><span class=\"p\">,</span> <span class=\"n\">targets</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Encodes categorical features in parallel<br><br>Performs both simple category encoding, such as one-hot, and various target encoding techniques.<br>In case if target columns are provided, each pair (encoded column, target column) from cartesian product of<br>both lists is encoded using encoder.<br><br>Runs encoders returning one column (e.g. TargetEncoder, WOEEncoder)<br>or fixed number of columns (HashingEncoder, BaseNEncoder) in parallel,<br>whereas encoders whose number of output columns depends on count of unique values (HelmertEncoder, OneHotEncoder)<br>are run in the main process to avoid result serialization overhead.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">encoder</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">an instance of encoder from category_encoders package with predefined parameters</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of encoded columns. Treats string as a list of length 1</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">targets</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of target columns. Should be provided if encoder uses target. Treats string as a list of length 1</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor returning a concatenation of resulting columns.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"kn\">from</span> <span class=\"nn\">category_encoders</span> <span class=\"kn\">import</span> <span class=\"n\">WOEEncoder</span><span class=\"p\">,</span> <span class=\"n\">TargetEncoder</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">WOEEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">TargetEncoder</span><span class=\"p\">(</span><span class=\"n\">smoothing</span><span class=\"o\">=</span><span class=\"mi\">3</span><span class=\"p\">),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">])</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">WOEEncoder</span><span class=\"p\">(</span><span class=\"n\">sigma</span><span class=\"o\">=</span><span class=\"mf\">0.1</span><span class=\"p\">,</span> <span class=\"n\">regularization</span><span class=\"o\">=</span><span class=\"mf\">0.5</span><span class=\"p\">),</span> <span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.category_encode(encoder, columns:Union[List[str], str], targets:Union[List[str], str, NoneType]=None) -> kts.stl.backend.CategoryEncoder>"
      ]
     },
     "execution_count": 40,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.category_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 41,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0fcc0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Cabin_ce_Survived_CatBoostEncoder_random_state_0_sigma_3</th>\n",
       "      <th>Embarked_ce_Survived_CatBoostEncoder_random_state_0_sigma_3</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>2.579784</td>\n",
       "      <td>2.579784</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0.902193</td>\n",
       "      <td>0.902193</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0.806924</td>\n",
       "      <td>0.806924</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>3.166299</td>\n",
       "      <td>3.629659</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>3.103257</td>\n",
       "      <td>3.978111</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>96</td>\n",
       "      <td>1.096301</td>\n",
       "      <td>1.090039</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>97</td>\n",
       "      <td>0.422915</td>\n",
       "      <td>0.485321</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>98</td>\n",
       "      <td>2.606621</td>\n",
       "      <td>2.848815</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>99</td>\n",
       "      <td>0.479063</td>\n",
       "      <td>0.475339</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>100</td>\n",
       "      <td>0.783394</td>\n",
       "      <td>0.780401</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>100 rows × 2 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "             Cabin_ce_Survived_CatBoostEncoder_random_state_0_sigma_3  \\\n",
       "PassengerId                                                             \n",
       "1                                                     2.579784          \n",
       "2                                                     0.902193          \n",
       "3                                                     0.806924          \n",
       "4                                                     3.166299          \n",
       "5                                                     3.103257          \n",
       "...                                                        ...          \n",
       "96                                                    1.096301          \n",
       "97                                                    0.422915          \n",
       "98                                                    2.606621          \n",
       "99                                                    0.479063          \n",
       "100                                                   0.783394          \n",
       "\n",
       "             Embarked_ce_Survived_CatBoostEncoder_random_state_0_sigma_3  \n",
       "PassengerId                                                               \n",
       "1                                                     2.579784            \n",
       "2                                                     0.902193            \n",
       "3                                                     0.806924            \n",
       "4                                                     3.629659            \n",
       "5                                                     3.978111            \n",
       "...                                                        ...            \n",
       "96                                                    1.090039            \n",
       "97                                                    0.485321            \n",
       "98                                                    2.848815            \n",
       "99                                                    0.475339            \n",
       "100                                                   0.780401            \n",
       "\n",
       "[100 rows x 2 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "from category_encoders import CatBoostEncoder, WOEEncoder, TargetEncoder\n",
    "\n",
    "@preview(train, 100)\n",
    "def preview_stl(df):\n",
    "    encoder = CatBoostEncoder(sigma=3, random_state=0)\n",
    "    return stl.category_encode(encoder, columns=['Cabin', 'Embarked'], targets='Survived')(df)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 42,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b917b8>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Survived</th>\n",
       "      <th>Cabin</th>\n",
       "      <th>Cabin_ce_Survived_CatBoostEncoder_random_state_0</th>\n",
       "      <th>Cabin_ce_Survived_WOEEncoder</th>\n",
       "      <th>Cabin_ce_Survived_TargetEncoder</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.410000</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>1</td>\n",
       "      <td>C85</td>\n",
       "      <td>0.410000</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.205000</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>C123</td>\n",
       "      <td>0.410000</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.470000</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>96</td>\n",
       "      <td>0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.351410</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>97</td>\n",
       "      <td>0</td>\n",
       "      <td>A5</td>\n",
       "      <td>0.410000</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>98</td>\n",
       "      <td>1</td>\n",
       "      <td>D10 D12</td>\n",
       "      <td>0.410000</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>99</td>\n",
       "      <td>1</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.346962</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>100</td>\n",
       "      <td>0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.355125</td>\n",
       "      <td>-0.253322</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>100 rows × 5 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "             Survived    Cabin  \\\n",
       "PassengerId                      \n",
       "1                   0      NaN   \n",
       "2                   1      C85   \n",
       "3                   1      NaN   \n",
       "4                   1     C123   \n",
       "5                   0      NaN   \n",
       "...               ...      ...   \n",
       "96                  0      NaN   \n",
       "97                  0       A5   \n",
       "98                  1  D10 D12   \n",
       "99                  1      NaN   \n",
       "100                 0      NaN   \n",
       "\n",
       "             Cabin_ce_Survived_CatBoostEncoder_random_state_0  \\\n",
       "PassengerId                                                     \n",
       "1                                                    0.410000   \n",
       "2                                                    0.410000   \n",
       "3                                                    0.205000   \n",
       "4                                                    0.410000   \n",
       "5                                                    0.470000   \n",
       "...                                                       ...   \n",
       "96                                                   0.351410   \n",
       "97                                                   0.410000   \n",
       "98                                                   0.410000   \n",
       "99                                                   0.346962   \n",
       "100                                                  0.355125   \n",
       "\n",
       "             Cabin_ce_Survived_WOEEncoder  Cabin_ce_Survived_TargetEncoder  \n",
       "PassengerId                                                                 \n",
       "1                               -0.253322                             0.35  \n",
       "2                                0.000000                             0.41  \n",
       "3                               -0.253322                             0.35  \n",
       "4                                0.000000                             0.41  \n",
       "5                               -0.253322                             0.35  \n",
       "...                                   ...                              ...  \n",
       "96                              -0.253322                             0.35  \n",
       "97                               0.000000                             0.41  \n",
       "98                               0.000000                             0.41  \n",
       "99                              -0.253322                             0.35  \n",
       "100                             -0.253322                             0.35  \n",
       "\n",
       "[100 rows x 5 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 100)\n",
    "def preview_stl(df):\n",
    "    return stl.concat([\n",
    "        stl.select(['Cabin', 'Survived']),\n",
    "        stl.category_encode(CatBoostEncoder(random_state=0), columns='Cabin', targets='Survived'),\n",
    "        stl.category_encode(WOEEncoder(), columns='Cabin', targets='Survived'),\n",
    "        stl.category_encode(TargetEncoder(), columns='Cabin', targets='Survived'),\n",
    "    ])(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.mean_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 43,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">MEAN_ENCODE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">mean_encode</span><span class=\"p\">(</span><span class=\"n\">columns</span><span class=\"p\">,</span> <span class=\"n\">targets</span><span class=\"p\">,</span> <span class=\"n\">smoothing</span><span class=\"p\">,</span> <span class=\"n\">min_samples_leaf</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Performs mean target encoding in parallel<br><br>An alias to stl.category_encode(TargetEncoder(smoothing, min_samples_leaf), columns, targets).</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of encoded columns. Treats string as a list of length 1</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">targets</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of target columns. Should be provided if encoder uses target. Treats string as a list of length 1</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">smoothing</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">smoothing effect to balance categorical average vs prior.<br>Higher value means stronger regularization.<br>The value must be strictly bigger than 0.</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">min_samples_leaf</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">minimum samples to take category average into account.</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor performing mean encoding for each pair (column, target) and returning the concatenation.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">mean_encoding</span><span class=\"p\">([</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">])</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">mean_encoding</span><span class=\"p\">([</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">,</span> <span class=\"n\">smoothing</span><span class=\"o\">=</span><span class=\"mf\">1.5</span><span class=\"p\">,</span> <span class=\"n\">min_samples_leaf</span><span class=\"o\">=</span><span class=\"mi\">5</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.mean_encode(columns:Union[List[str], str], targets:Union[List[str], str], smoothing:float=1.0, min_samples_leaf:int=1) -> kts.stl.backend.CategoryEncoder>"
      ]
     },
     "execution_count": 43,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.mean_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 44,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f9b0>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Cabin_ce_Survived_TargetEncoder_smoothing_3.0</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>96</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>97</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>98</td>\n",
       "      <td>0.41</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>99</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>100</td>\n",
       "      <td>0.35</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>100 rows × 1 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "             Cabin_ce_Survived_TargetEncoder_smoothing_3.0\n",
       "PassengerId                                               \n",
       "1                                                     0.35\n",
       "2                                                     0.41\n",
       "3                                                     0.35\n",
       "4                                                     0.41\n",
       "5                                                     0.35\n",
       "...                                                    ...\n",
       "96                                                    0.35\n",
       "97                                                    0.41\n",
       "98                                                    0.41\n",
       "99                                                    0.35\n",
       "100                                                   0.35\n",
       "\n",
       "[100 rows x 1 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 100)\n",
    "def preview_stl(df):\n",
    "    \"\"\"An alias for stl.category_encode(TargetEncoder())\"\"\"\n",
    "    return stl.mean_encode('Cabin', 'Survived', smoothing=3)(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### stl.one_hot_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 45,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">ONE_HOT_ENCODE DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">one_hot_encode</span><span class=\"p\">(</span><span class=\"n\">columns</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Performs simple one-hot encoding<br><br>An alias to stl.category_encode(OneHotEncoder(), columns).</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">columns</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of columns to be encoded. Treats string as a list of length 1</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">returns</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">A feature constructor returning a concatenation of one-hot encoding of each column.</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">one_hot_encode</span><span class=\"p\">([</span><span class=\"s1\">&#39;Sex&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">])</span>\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">one_hot_encode</span><span class=\"p\">(</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div>"
      ],
      "text/plain": [
       "<function kts.stl.api.one_hot_encode(columns:Union[List[str], str]) -> kts.stl.backend.CategoryEncoder>"
      ]
     },
     "execution_count": 45,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "stl.one_hot_encode"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 46,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">preview_stl</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f940>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Embarked_ce_OneHotEncoder_0</th>\n",
       "      <th>Embarked_ce_OneHotEncoder_1</th>\n",
       "      <th>Embarked_ce_OneHotEncoder_2</th>\n",
       "      <th>Embarked_ce_OneHotEncoder_3</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>96</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>97</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>98</td>\n",
       "      <td>0</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>99</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>100</td>\n",
       "      <td>1</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>100 rows × 4 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "             Embarked_ce_OneHotEncoder_0  Embarked_ce_OneHotEncoder_1  \\\n",
       "PassengerId                                                             \n",
       "1                                      1                            0   \n",
       "2                                      0                            1   \n",
       "3                                      1                            0   \n",
       "4                                      1                            0   \n",
       "5                                      1                            0   \n",
       "...                                  ...                          ...   \n",
       "96                                     1                            0   \n",
       "97                                     0                            1   \n",
       "98                                     0                            1   \n",
       "99                                     1                            0   \n",
       "100                                    1                            0   \n",
       "\n",
       "             Embarked_ce_OneHotEncoder_2  Embarked_ce_OneHotEncoder_3  \n",
       "PassengerId                                                            \n",
       "1                                      0                            0  \n",
       "2                                      0                            0  \n",
       "3                                      0                            0  \n",
       "4                                      0                            0  \n",
       "5                                      0                            0  \n",
       "...                                  ...                          ...  \n",
       "96                                     0                            0  \n",
       "97                                     0                            0  \n",
       "98                                     0                            0  \n",
       "99                                     0                            0  \n",
       "100                                    0                            0  \n",
       "\n",
       "[100 rows x 4 columns]"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "@preview(train, 100, parallel=False)  # One hot encoder produces a lot of columns, but is computationally cheap, that's why we don't compute it in parallel\n",
    "def preview_stl(df):\n",
    "    \"\"\"An alias for stl.category_encode(OneHotEncoder())\"\"\"\n",
    "    return stl.one_hot_encode('Embarked')(df)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Feature Set"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 47,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class='kts'><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">FEATURESET DOCS</div>\n",
       "<div class=\"kts-annotation\" style=\"\">signature</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">FeatureSet</span><span class=\"p\">(</span><span class=\"n\">before_split</span><span class=\"p\">,</span> <span class=\"n\">after_split</span><span class=\"p\">,</span> <span class=\"n\">train_frame</span><span class=\"p\">,</span> <span class=\"n\">test_frame</span><span class=\"p\">,</span> <span class=\"n\">targets</span><span class=\"p\">,</span> <span class=\"n\">auxiliary</span><span class=\"p\">,</span> <span class=\"n\">description</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"\">Collects and computes feature constructors</div>\n",
       "<div class=\"kts-annotation\" style=\"\">params</div>\n",
       "<div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-columns: auto auto; padding-left: 0px; padding-right: 0px; justify-content: start;;\"><div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">before_split</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of regular features</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">after_split</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of stateful features which may leak target if computed before split.<br>They are run in Single Validation mode, i.e. for each fold they are fit using training objects<br>and then applied to validation objects in inference mode.</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">train_frame</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">a dataframe to perform training on. Should contain unique indices for each object.</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">targets</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of target columns in case of a multilabel task, or a single string otherwise.<br>Target columns may be computed. In this case the corresponding feature constructors<br>should be passed to before_split list.</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">auxiliary</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">list of auxiliary columns, such as datetime, groups or whatever else can be used<br>for setting up your validation. These columns can be utilized by overriding Validator.<br>As well as targets, auxiliary columns may be computed.</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-third\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">description</div><div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding-bottom: 0px; padding-top: 0px; margin-bottom: 0px;\">any notes about this feature set.</div>\n",
       "</div>\n",
       "<div class=\"kts-annotation\" style=\"\">examples</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">fs</span> <span class=\"o\">=</span> <span class=\"n\">FeatureSet</span><span class=\"p\">([</span><span class=\"n\">feature_1</span><span class=\"p\">,</span> <span class=\"n\">feature_2</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"n\">single_validation_feature</span><span class=\"p\">],</span>\n",
       "<span class=\"o\">...</span>                  <span class=\"n\">train_frame</span><span class=\"o\">=</span><span class=\"n\">train</span><span class=\"p\">,</span> <span class=\"n\">targets</span><span class=\"o\">=</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">fs</span> <span class=\"o\">=</span> <span class=\"n\">FeatureSet</span><span class=\"p\">([</span><span class=\"n\">feature_1</span><span class=\"p\">,</span> <span class=\"n\">feature_2</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"n\">single_validation_feature</span><span class=\"p\">],</span>\n",
       "<span class=\"o\">...</span>                  <span class=\"n\">train_frame</span><span class=\"o\">=</span><span class=\"n\">train</span><span class=\"p\">,</span>\n",
       "<span class=\"o\">...</span>                  <span class=\"n\">targets</span><span class=\"o\">=</span><span class=\"p\">[</span><span class=\"s1\">&#39;Target1&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Target2&#39;</span><span class=\"p\">],</span> <span class=\"n\">auxiliary</span><span class=\"o\">=</span><span class=\"p\">[</span><span class=\"s1\">&#39;date&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;metric_group&#39;</span><span class=\"p\">])</span>\n",
       "\n",
       "<span class=\"o\">&gt;&gt;&gt;</span> <span class=\"n\">fs</span> <span class=\"o\">=</span> <span class=\"n\">FeatureSet</span><span class=\"p\">([</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">select</span><span class=\"p\">([</span><span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Fare&#39;</span><span class=\"p\">])],</span> <span class=\"p\">[</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">mean_encode</span><span class=\"p\">([</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Parch&#39;</span><span class=\"p\">],</span> <span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)],</span>\n",
       "<span class=\"o\">...</span>                  <span class=\"n\">train_frame</span><span class=\"o\">=</span><span class=\"n\">train</span><span class=\"p\">,</span> <span class=\"n\">targets</span><span class=\"o\">=</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div></div></div></div>"
      ],
      "text/plain": [
       "kts.core.feature_set.FeatureSet"
      ]
     },
     "execution_count": 47,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "FeatureSet"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 48,
   "metadata": {},
   "outputs": [],
   "source": [
    "fs = FeatureSet([simple_feature, interactions('Pclass', 'Age'), num_aggs('Fare'), tfidf('Name')], \n",
    "                [stl.category_encode(TargetEncoder(), 'Embarked', 'Survived'), \n",
    "                 stl.category_encode(WOEEncoder(), 'Embarked', 'Survived')],\n",
    "                train_frame=train,\n",
    "                targets='Survived')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Each feature set is given a unique identifier. It also contains source code of all the features right in its repr:"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 49,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\" kts-wrapper\" style=\"\"><div class=\"kts-title\" style=\"\">FEATURE SET</div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">FSBWBXEK</div>\n",
       "<div class=\"kts-annotation\" style=\"\">features</div>\n",
       "<div class=\"kts-pool\"><input type=\"checkbox\" class=\"kts-check\" id=\"977814209\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"977814209\">simple_feature</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"977814209\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">simple_feature</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">simple_feature</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"s1\">&#39;is_male&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"p\">(</span><span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">Sex</span> <span class=\"o\">==</span> <span class=\"s1\">&#39;male&#39;</span><span class=\"p\">)</span> <span class=\"o\">+</span> <span class=\"mi\">0</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"179207654\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"179207654\">interactions</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"179207654\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">interactions('Pclass', 'Age')</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">An instance of generic feature constructor <tt>interactions</tt></div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">interactions</span><span class=\"p\">(</span><span class=\"s1\">&#39;Pclass&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">additional source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">left</span><span class=\"o\">=</span><span class=\"s2\">&quot;Pclass&quot;</span><span class=\"p\">,</span> <span class=\"n\">right</span><span class=\"o\">=</span><span class=\"s2\">&quot;SibSp&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">interactions</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">empty_like</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_add_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">+</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_sub_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{left}_mul_{right}&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">left</span><span class=\"p\">]</span> <span class=\"o\">*</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">right</span><span class=\"p\">]</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"267012647\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"267012647\">num_aggs</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"267012647\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">num_aggs('Fare')</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">An instance of generic feature constructor <tt>num_aggs</tt></div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">num_aggs</span><span class=\"p\">(</span><span class=\"s1\">&#39;Fare&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">additional source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">col</span><span class=\"o\">=</span><span class=\"s2\">&quot;Parch&quot;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">num_aggs</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"sd\">&quot;&quot;&quot;Descriptions are also supported.&quot;&quot;&quot;</span>\n",
       "    <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">pd</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">(</span><span class=\"n\">index</span><span class=\"o\">=</span><span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">index</span><span class=\"p\">)</span>\n",
       "    <span class=\"n\">mean</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">mean</span><span class=\"p\">()</span>\n",
       "    <span class=\"n\">std</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">std</span><span class=\"p\">()</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_div_mean&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">/</span> <span class=\"n\">mean</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_sub_div_mean&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">-</span> <span class=\"n\">mean</span><span class=\"p\">)</span> <span class=\"o\">/</span> <span class=\"n\">mean</span>\n",
       "    <span class=\"n\">res</span><span class=\"p\">[</span><span class=\"n\">f</span><span class=\"s2\">&quot;{col}_div_std&quot;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">]</span> <span class=\"o\">/</span> <span class=\"n\">std</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"124102743\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"124102743\">tfidf</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"124102743\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">tfidf('Name')</div>\n",
       "<div class=\"kts-annotation\" style=\"\">description</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">An instance of generic feature constructor <tt>tfidf</tt></div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">tfidf</span><span class=\"p\">(</span><span class=\"s1\">&#39;Name&#39;</span><span class=\"p\">)</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">additional source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"nd\">@feature</span>\n",
       "<span class=\"nd\">@generic</span><span class=\"p\">(</span><span class=\"n\">col</span><span class=\"o\">=</span><span class=\"s1\">&#39;Name&#39;</span><span class=\"p\">)</span>\n",
       "<span class=\"k\">def</span> <span class=\"nf\">tfidf</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">):</span>\n",
       "    <span class=\"k\">if</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">train</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">TfidfVectorizer</span><span class=\"p\">(</span><span class=\"n\">analyzer</span><span class=\"o\">=</span><span class=\"s1\">&#39;char&#39;</span><span class=\"p\">,</span> <span class=\"n\">ngram_range</span><span class=\"o\">=</span><span class=\"p\">(</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">3</span><span class=\"p\">),</span> <span class=\"n\">max_features</span><span class=\"o\">=</span><span class=\"mi\">5</span><span class=\"p\">)</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">fit_transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "        <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"n\">enc</span>\n",
       "    <span class=\"k\">else</span><span class=\"p\">:</span>\n",
       "        <span class=\"n\">enc</span> <span class=\"o\">=</span> <span class=\"n\">df</span><span class=\"o\">.</span><span class=\"n\">state</span><span class=\"p\">[</span><span class=\"s1\">&#39;enc&#39;</span><span class=\"p\">]</span>\n",
       "        <span class=\"n\">res</span> <span class=\"o\">=</span> <span class=\"n\">enc</span><span class=\"o\">.</span><span class=\"n\">transform</span><span class=\"p\">(</span><span class=\"n\">df</span><span class=\"p\">[</span><span class=\"n\">col</span><span class=\"p\">])</span>\n",
       "    <span class=\"k\">return</span> <span class=\"n\">res</span><span class=\"o\">.</span><span class=\"n\">todense</span><span class=\"p\">()</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">requirements</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\"><tt>sklearn==0.20.2</tt></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"987744430\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"987744430\">stl.category_encode</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"987744430\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">stl.category_encode(TargetEncoder(), ['Embarked'], ['Survived'])</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">TargetEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">])</span>\n",
       "</pre></div></div>\n",
       "        </div>\n",
       "<input type=\"checkbox\" class=\"kts-check\" id=\"292249176\"/>\n",
       "            <div class=\"kts-wrapper \" id=\"kts-collapsible\"><label class=\"kts-field kts-field-bold kts-field-bg kts-field-accent kts-thumbnail-first kts-thumbnail\" style=\"\" for=\"292249176\">stl.category_encode</label><div class=\"kts-inner-wrapper\" id=\"kts-hidden\"><div class=\"kts-title-with-cross\">\n",
       "            <div></div>\n",
       "            <div class=\"kts-title\">FEATURE CONSTRUCTOR</div>\n",
       "            <label class=\"kts-cross-circle\" for=\"292249176\">\n",
       "                <div class=\"kts-cross-before\"></div>\n",
       "                <div class=\"kts-cross-after\"></div>\n",
       "            </label>\n",
       "        </div>\n",
       "<div class=\"kts-annotation\" style=\"\">name</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\">stl.category_encode(WOEEncoder(), ['Embarked'], ['Survived'])</div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">WOEEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">])</span>\n",
       "</pre></div></div>\n",
       "        </div></div>\n",
       "<div class=\"kts-annotation\" style=\"\">source</div>\n",
       "<div class=\"kts-code\"><pre style=\"margin: 0px; padding: 0px;\"><span class=\"n\">FeatureSet</span><span class=\"p\">([</span><span class=\"n\">simple_feature</span><span class=\"p\">,</span>\n",
       "            <span class=\"n\">interactions</span><span class=\"p\">(</span><span class=\"s1\">&#39;Pclass&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;Age&#39;</span><span class=\"p\">),</span>\n",
       "            <span class=\"n\">num_aggs</span><span class=\"p\">(</span><span class=\"s1\">&#39;Fare&#39;</span><span class=\"p\">),</span>\n",
       "            <span class=\"n\">tfidf</span><span class=\"p\">(</span><span class=\"s1\">&#39;Name&#39;</span><span class=\"p\">)],</span>\n",
       "           <span class=\"p\">[</span><span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">TargetEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">]),</span>\n",
       "            <span class=\"n\">stl</span><span class=\"o\">.</span><span class=\"n\">category_encode</span><span class=\"p\">(</span><span class=\"n\">WOEEncoder</span><span class=\"p\">(),</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Embarked&#39;</span><span class=\"p\">],</span> <span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">])],</span>\n",
       "           <span class=\"n\">targets</span><span class=\"o\">=</span><span class=\"p\">[</span><span class=\"s1\">&#39;Survived&#39;</span><span class=\"p\">],</span>\n",
       "           <span class=\"n\">auxiliary</span><span class=\"o\">=</span><span class=\"p\">[])</span>\n",
       "</pre></div>\n",
       "<div class=\"kts-annotation\" style=\"\">requirements</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-bg kts-field-accent\" style=\"\"><tt>sklearn==0.20.2</tt></div></div></div>"
      ],
      "text/plain": [
       "<kts.core.feature_set.FeatureSet at 0x1a3aa8a90>"
      ]
     },
     "execution_count": 49,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "fs"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Use slicing to preview your feature sets. Slicing calls are not cached and do not leak dataframes to IPython namespace, so you can run them as many times as you need. For stateful features, slicing calls always trigger a training stage."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 50,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div class=\"kts\"><div class=\"kts-wrapper\" style=\"display: inline-grid; grid-template-rows: auto auto;\"><div class=\"kts-title\" style=\"margin-bottom: 5px;\">COMPUTING FEATURES</div><div  style=\"display: inline-grid; grid-template-columns: auto auto ;\"><div class=\"kts-annotation\" style=\"text-align: right; margin-bottom: 3px; margin-right: 5px;\">feature</div><div class=\"kts-annotation\" style=\"margin-bottom: 3px; margin-left: 5px;\">progress</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">simple_feature</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">interactions__Pclass_Age</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">num_aggs__Fare</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; text-align: right; margin: 2px;\">tfidf__Name</div><div class=\"kts-inner-column\"><div class=\"kts-row\"><div class=\"kts-inner-column\"><div class=\"kts-progressbar-wrapper\" style=\"margin-top: 3px; width: 450px;\"><div class=\"kts-progressbar-outer\"><div class=\"kts-progressbar-inner\" style=\"width: 100%;\"></div></div></div></div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\">0s</div>\n",
       "<div class=\"kts-field kts-field-bold kts-field-accent\" style=\"padding: 0px 5px; margin: 2px; width: 7em;\"></div></div></div>\n",
       "</div></div></div>"
      ],
      "text/plain": [
       "<kts.ui.feature_computing_report.FeatureComputingReport at 0x1a3b0f668>"
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>is_male</th>\n",
       "      <th>Pclass_add_Age</th>\n",
       "      <th>Pclass_sub_Age</th>\n",
       "      <th>Pclass_mul_Age</th>\n",
       "      <th>Fare_div_mean</th>\n",
       "      <th>Fare_sub_div_mean</th>\n",
       "      <th>Fare_div_std</th>\n",
       "      <th>tfidf__Name_0</th>\n",
       "      <th>tfidf__Name_1</th>\n",
       "      <th>tfidf__Name_2</th>\n",
       "      <th>tfidf__Name_3</th>\n",
       "      <th>tfidf__Name_4</th>\n",
       "      <th>Embarked_ce_Survived_TargetEncoder</th>\n",
       "      <th>Embarked_ce_Survived_WOEEncoder</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>PassengerId</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td>1</td>\n",
       "      <td>1</td>\n",
       "      <td>25.0</td>\n",
       "      <td>-19.0</td>\n",
       "      <td>66.0</td>\n",
       "      <td>0.268312</td>\n",
       "      <td>-0.731688</td>\n",
       "      <td>0.307178</td>\n",
       "      <td>0.508281</td>\n",
       "      <td>0.338854</td>\n",
       "      <td>0.185575</td>\n",
       "      <td>0.742300</td>\n",
       "      <td>0.203426</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>2</td>\n",
       "      <td>0</td>\n",
       "      <td>39.0</td>\n",
       "      <td>-37.0</td>\n",
       "      <td>38.0</td>\n",
       "      <td>2.638088</td>\n",
       "      <td>1.638088</td>\n",
       "      <td>3.020231</td>\n",
       "      <td>0.593616</td>\n",
       "      <td>0.197872</td>\n",
       "      <td>0.433463</td>\n",
       "      <td>0.541828</td>\n",
       "      <td>0.356369</td>\n",
       "      <td>0.865529</td>\n",
       "      <td>1.098612</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>3</td>\n",
       "      <td>0</td>\n",
       "      <td>29.0</td>\n",
       "      <td>-23.0</td>\n",
       "      <td>78.0</td>\n",
       "      <td>0.293292</td>\n",
       "      <td>-0.706708</td>\n",
       "      <td>0.335778</td>\n",
       "      <td>0.464173</td>\n",
       "      <td>0.464173</td>\n",
       "      <td>0.508413</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.557318</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>4</td>\n",
       "      <td>0</td>\n",
       "      <td>36.0</td>\n",
       "      <td>-34.0</td>\n",
       "      <td>35.0</td>\n",
       "      <td>1.965151</td>\n",
       "      <td>0.965151</td>\n",
       "      <td>2.249815</td>\n",
       "      <td>0.603771</td>\n",
       "      <td>0.301886</td>\n",
       "      <td>0.661317</td>\n",
       "      <td>0.220439</td>\n",
       "      <td>0.241644</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>5</td>\n",
       "      <td>1</td>\n",
       "      <td>38.0</td>\n",
       "      <td>-32.0</td>\n",
       "      <td>105.0</td>\n",
       "      <td>0.297918</td>\n",
       "      <td>-0.702082</td>\n",
       "      <td>0.341074</td>\n",
       "      <td>0.631088</td>\n",
       "      <td>0.420725</td>\n",
       "      <td>0.460825</td>\n",
       "      <td>0.460825</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>6</td>\n",
       "      <td>1</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>0.313029</td>\n",
       "      <td>-0.686971</td>\n",
       "      <td>0.358373</td>\n",
       "      <td>0.508984</td>\n",
       "      <td>0.508984</td>\n",
       "      <td>0.278748</td>\n",
       "      <td>0.557496</td>\n",
       "      <td>0.305561</td>\n",
       "      <td>0.500000</td>\n",
       "      <td>0.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>7</td>\n",
       "      <td>1</td>\n",
       "      <td>55.0</td>\n",
       "      <td>-53.0</td>\n",
       "      <td>54.0</td>\n",
       "      <td>1.919353</td>\n",
       "      <td>0.919353</td>\n",
       "      <td>2.197383</td>\n",
       "      <td>0.779844</td>\n",
       "      <td>0.259948</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.569447</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>8</td>\n",
       "      <td>1</td>\n",
       "      <td>5.0</td>\n",
       "      <td>1.0</td>\n",
       "      <td>6.0</td>\n",
       "      <td>0.779954</td>\n",
       "      <td>-0.220046</td>\n",
       "      <td>0.892935</td>\n",
       "      <td>0.395067</td>\n",
       "      <td>0.526756</td>\n",
       "      <td>0.288481</td>\n",
       "      <td>0.288481</td>\n",
       "      <td>0.632461</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>9</td>\n",
       "      <td>0</td>\n",
       "      <td>30.0</td>\n",
       "      <td>-24.0</td>\n",
       "      <td>81.0</td>\n",
       "      <td>0.412027</td>\n",
       "      <td>-0.587973</td>\n",
       "      <td>0.471711</td>\n",
       "      <td>0.605911</td>\n",
       "      <td>0.302956</td>\n",
       "      <td>0.442440</td>\n",
       "      <td>0.331830</td>\n",
       "      <td>0.485000</td>\n",
       "      <td>0.428748</td>\n",
       "      <td>-0.223144</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td>10</td>\n",
       "      <td>0</td>\n",
       "      <td>16.0</td>\n",
       "      <td>-12.0</td>\n",
       "      <td>28.0</td>\n",
       "      <td>1.112875</td>\n",
       "      <td>0.112875</td>\n",
       "      <td>1.274082</td>\n",
       "      <td>0.449865</td>\n",
       "      <td>0.449865</td>\n",
       "      <td>0.492741</td>\n",
       "      <td>0.246371</td>\n",
       "      <td>0.540139</td>\n",
       "      <td>0.865529</td>\n",
       "      <td>1.098612</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "             is_male  Pclass_add_Age  Pclass_sub_Age  Pclass_mul_Age  \\\n",
       "PassengerId                                                            \n",
       "1                  1            25.0           -19.0            66.0   \n",
       "2                  0            39.0           -37.0            38.0   \n",
       "3                  0            29.0           -23.0            78.0   \n",
       "4                  0            36.0           -34.0            35.0   \n",
       "5                  1            38.0           -32.0           105.0   \n",
       "6                  1             NaN             NaN             NaN   \n",
       "7                  1            55.0           -53.0            54.0   \n",
       "8                  1             5.0             1.0             6.0   \n",
       "9                  0            30.0           -24.0            81.0   \n",
       "10                 0            16.0           -12.0            28.0   \n",
       "\n",
       "             Fare_div_mean  Fare_sub_div_mean  Fare_div_std  tfidf__Name_0  \\\n",
       "PassengerId                                                                  \n",
       "1                 0.268312          -0.731688      0.307178       0.508281   \n",
       "2                 2.638088           1.638088      3.020231       0.593616   \n",
       "3                 0.293292          -0.706708      0.335778       0.464173   \n",
       "4                 1.965151           0.965151      2.249815       0.603771   \n",
       "5                 0.297918          -0.702082      0.341074       0.631088   \n",
       "6                 0.313029          -0.686971      0.358373       0.508984   \n",
       "7                 1.919353           0.919353      2.197383       0.779844   \n",
       "8                 0.779954          -0.220046      0.892935       0.395067   \n",
       "9                 0.412027          -0.587973      0.471711       0.605911   \n",
       "10                1.112875           0.112875      1.274082       0.449865   \n",
       "\n",
       "             tfidf__Name_1  tfidf__Name_2  tfidf__Name_3  tfidf__Name_4  \\\n",
       "PassengerId                                                               \n",
       "1                 0.338854       0.185575       0.742300       0.203426   \n",
       "2                 0.197872       0.433463       0.541828       0.356369   \n",
       "3                 0.464173       0.508413       0.000000       0.557318   \n",
       "4                 0.301886       0.661317       0.220439       0.241644   \n",
       "5                 0.420725       0.460825       0.460825       0.000000   \n",
       "6                 0.508984       0.278748       0.557496       0.305561   \n",
       "7                 0.259948       0.000000       0.569447       0.000000   \n",
       "8                 0.526756       0.288481       0.288481       0.632461   \n",
       "9                 0.302956       0.442440       0.331830       0.485000   \n",
       "10                0.449865       0.492741       0.246371       0.540139   \n",
       "\n",
       "             Embarked_ce_Survived_TargetEncoder  \\\n",
       "PassengerId                                       \n",
       "1                                      0.428748   \n",
       "2                                      0.865529   \n",
       "3                                      0.428748   \n",
       "4                                      0.428748   \n",
       "5                                      0.428748   \n",
       "6                                      0.500000   \n",
       "7                                      0.428748   \n",
       "8                                      0.428748   \n",
       "9                                      0.428748   \n",
       "10                                     0.865529   \n",
       "\n",
       "             Embarked_ce_Survived_WOEEncoder  \n",
       "PassengerId                                   \n",
       "1                                  -0.223144  \n",
       "2                                   1.098612  \n",
       "3                                  -0.223144  \n",
       "4                                  -0.223144  \n",
       "5                                  -0.223144  \n",
       "6                                   0.000000  \n",
       "7                                  -0.223144  \n",
       "8                                  -0.223144  \n",
       "9                                  -0.223144  \n",
       "10                                  1.098612  "
      ]
     },
     "execution_count": 50,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "fs[:10]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 51,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.1"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}