{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "
\n",
"\n",
"Avrupa Futbol Takımlarının Regresyon (Regression)
Modeli İle Analizi -Scikit-learn\n",
"\n",
"
\n",
"\n",
"Gerekli Küphanelerin İçe Aktarımı
\n",
"\n",
"Veritabanından Veriyi Pandas DataFrame'ine Çekme\n",
"
| \n", " | id | \n", "player_fifa_api_id | \n", "player_api_id | \n", "date | \n", "overall_rating | \n", "potential | \n", "preferred_foot | \n", "attacking_work_rate | \n", "defensive_work_rate | \n", "crossing | \n", "... | \n", "vision | \n", "penalties | \n", "marking | \n", "standing_tackle | \n", "sliding_tackle | \n", "gk_diving | \n", "gk_handling | \n", "gk_kicking | \n", "gk_positioning | \n", "gk_reflexes | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "1 | \n", "218353 | \n", "505942 | \n", "2016-02-18 00:00:00 | \n", "67.0 | \n", "71.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "69.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
| 1 | \n", "2 | \n", "218353 | \n", "505942 | \n", "2015-11-19 00:00:00 | \n", "67.0 | \n", "71.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "69.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
| 2 | \n", "3 | \n", "218353 | \n", "505942 | \n", "2015-09-21 00:00:00 | \n", "62.0 | \n", "66.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "66.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
| 3 | \n", "4 | \n", "218353 | \n", "505942 | \n", "2015-03-20 00:00:00 | \n", "61.0 | \n", "65.0 | \n", "right | \n", "medium | \n", "medium | \n", "48.0 | \n", "... | \n", "53.0 | \n", "47.0 | \n", "62.0 | \n", "63.0 | \n", "66.0 | \n", "5.0 | \n", "10.0 | \n", "9.0 | \n", "7.0 | \n", "7.0 | \n", "
| 4 | \n", "5 | \n", "218353 | \n", "505942 | \n", "2007-02-22 00:00:00 | \n", "61.0 | \n", "65.0 | \n", "right | \n", "medium | \n", "medium | \n", "48.0 | \n", "... | \n", "53.0 | \n", "47.0 | \n", "62.0 | \n", "63.0 | \n", "66.0 | \n", "5.0 | \n", "10.0 | \n", "9.0 | \n", "7.0 | \n", "7.0 | \n", "
5 rows × 42 columns
\n", "
\n",
"\n",
"Analizde Kullanacağımız Özellikleri (Features) Tanımlama\n",
"
\n",
"\n",
"Y (Target-Sonuç) Tanımlama\n",
"
\n",
"Data Temizleme
\n",
"\n",
"Özellikleri (Features) ve Target Değerlerini Ayrıştıma\n",
"
| \n", " | overall_rating | \n", "
|---|---|
| 0 | \n", "67.0 | \n", "
| 1 | \n", "67.0 | \n", "
| 2 | \n", "62.0 | \n", "
| 3 | \n", "61.0 | \n", "
| 4 | \n", "61.0 | \n", "
| 5 | \n", "74.0 | \n", "
| 6 | \n", "74.0 | \n", "
| 7 | \n", "73.0 | \n", "
| 8 | \n", "73.0 | \n", "
| 9 | \n", "73.0 | \n", "
| 10 | \n", "73.0 | \n", "
| 11 | \n", "74.0 | \n", "
| 12 | \n", "73.0 | \n", "
| 13 | \n", "71.0 | \n", "
| 14 | \n", "71.0 | \n", "
| 15 | \n", "71.0 | \n", "
| 16 | \n", "70.0 | \n", "
| 17 | \n", "70.0 | \n", "
| 18 | \n", "70.0 | \n", "
| 19 | \n", "70.0 | \n", "
| 20 | \n", "70.0 | \n", "
| 21 | \n", "70.0 | \n", "
| 22 | \n", "69.0 | \n", "
| 23 | \n", "69.0 | \n", "
| 24 | \n", "69.0 | \n", "
| 25 | \n", "69.0 | \n", "
| 26 | \n", "69.0 | \n", "
| 27 | \n", "69.0 | \n", "
| 28 | \n", "69.0 | \n", "
| 29 | \n", "68.0 | \n", "
| 30 | \n", "65.0 | \n", "
| 31 | \n", "64.0 | \n", "
| 32 | \n", "54.0 | \n", "
| 33 | \n", "51.0 | \n", "
| 34 | \n", "52.0 | \n", "
| 35 | \n", "47.0 | \n", "
| 36 | \n", "53.0 | \n", "
| 37 | \n", "53.0 | \n", "
| 38 | \n", "65.0 | \n", "
| 39 | \n", "66.0 | \n", "
| 40 | \n", "66.0 | \n", "
| 41 | \n", "67.0 | \n", "
| 42 | \n", "68.0 | \n", "
| 43 | \n", "68.0 | \n", "
| 44 | \n", "68.0 | \n", "
| 45 | \n", "69.0 | \n", "
| 46 | \n", "70.0 | \n", "
| 47 | \n", "71.0 | \n", "
| 48 | \n", "70.0 | \n", "
| 49 | \n", "70.0 | \n", "
\n",
"\n",
"Dataset' i Eğitim (Train) ve Test Kümelerine Ayrıma
\n",
"\n",
"(1) Lineer Regresyon (Linear Regression): \n",
"
\n",
"\n",
"Lineer Regresyon Modeli İle Tahmin Yapma\n",
"
\n",
"\n",
"Tahmin Edilmesi Gereken Sonuç (Target) Değerinin Ortalamısı Nedir? \n",
"
| \n", " | overall_rating | \n", "
|---|---|
| count | \n", "59517.000000 | \n", "
| mean | \n", "68.635818 | \n", "
| std | \n", "7.041297 | \n", "
| min | \n", "33.000000 | \n", "
| 25% | \n", "64.000000 | \n", "
| 50% | \n", "69.000000 | \n", "
| 75% | \n", "73.000000 | \n", "
| max | \n", "94.000000 | \n", "
\n",
"\n",
"Lineer Regresyon Modelinin Doğruluğunu Root Mean Square Error Kullanarak Bulma\n",
"\n",
"
\n",
"\n",
"(2) Karar Ağacı (Decision Tree):\n",
"
\n",
"\n",
"Karar Ağacı Modeli İle Tahmin Yapma\n",
"
\n",
"\n",
"For comparision: What is the mean of the expected target value in test set ?\n",
"
| \n", " | overall_rating | \n", "
|---|---|
| count | \n", "59517.000000 | \n", "
| mean | \n", "68.635818 | \n", "
| std | \n", "7.041297 | \n", "
| min | \n", "33.000000 | \n", "
| 25% | \n", "64.000000 | \n", "
| 50% | \n", "69.000000 | \n", "
| 75% | \n", "73.000000 | \n", "
| max | \n", "94.000000 | \n", "
\n",
"\n",
"Karar Ağacı Modelinin Doğruluğunu Root Mean Square Error Kullanarak Bulma\n",
"\n",
"