{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "
\n",
"\n",
"Avrupa Futbol Takımlarının Regresyon (Regression)
Modeli İle Analizi -Scikit-learn\n",
"\n",
"
\n",
"\n",
"Gerekli Küphanelerin İçe Aktarımı
\n",
"\n",
"Veritabanından Veriyi Pandas DataFrame'ine Çekme\n",
"
\n", " | id | \n", "player_fifa_api_id | \n", "player_api_id | \n", "date | \n", "overall_rating | \n", "potential | \n", "preferred_foot | \n", "attacking_work_rate | \n", "defensive_work_rate | \n", "crossing | \n", "... | \n", "vision | \n", "penalties | \n", "marking | \n", "standing_tackle | \n", "sliding_tackle | \n", "gk_diving | \n", "gk_handling | \n", "gk_kicking | \n", "gk_positioning | \n", "gk_reflexes | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "1 | \n", "218353 | \n", "505942 | \n", "2016-02-18 00:00:00 | \n", "67.0 | \n", "71.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "69.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
1 | \n", "2 | \n", "218353 | \n", "505942 | \n", "2015-11-19 00:00:00 | \n", "67.0 | \n", "71.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "69.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
2 | \n", "3 | \n", "218353 | \n", "505942 | \n", "2015-09-21 00:00:00 | \n", "62.0 | \n", "66.0 | \n", "right | \n", "medium | \n", "medium | \n", "49.0 | \n", "... | \n", "54.0 | \n", "48.0 | \n", "65.0 | \n", "66.0 | \n", "69.0 | \n", "6.0 | \n", "11.0 | \n", "10.0 | \n", "8.0 | \n", "8.0 | \n", "
3 | \n", "4 | \n", "218353 | \n", "505942 | \n", "2015-03-20 00:00:00 | \n", "61.0 | \n", "65.0 | \n", "right | \n", "medium | \n", "medium | \n", "48.0 | \n", "... | \n", "53.0 | \n", "47.0 | \n", "62.0 | \n", "63.0 | \n", "66.0 | \n", "5.0 | \n", "10.0 | \n", "9.0 | \n", "7.0 | \n", "7.0 | \n", "
4 | \n", "5 | \n", "218353 | \n", "505942 | \n", "2007-02-22 00:00:00 | \n", "61.0 | \n", "65.0 | \n", "right | \n", "medium | \n", "medium | \n", "48.0 | \n", "... | \n", "53.0 | \n", "47.0 | \n", "62.0 | \n", "63.0 | \n", "66.0 | \n", "5.0 | \n", "10.0 | \n", "9.0 | \n", "7.0 | \n", "7.0 | \n", "
5 rows × 42 columns
\n", "
\n",
"\n",
"Analizde Kullanacağımız Özellikleri (Features) Tanımlama\n",
"
\n",
"\n",
"Y (Target-Sonuç) Tanımlama\n",
"
\n",
"Data Temizleme
\n",
"\n",
"Özellikleri (Features) ve Target Değerlerini Ayrıştıma\n",
"
\n", " | overall_rating | \n", "
---|---|
0 | \n", "67.0 | \n", "
1 | \n", "67.0 | \n", "
2 | \n", "62.0 | \n", "
3 | \n", "61.0 | \n", "
4 | \n", "61.0 | \n", "
5 | \n", "74.0 | \n", "
6 | \n", "74.0 | \n", "
7 | \n", "73.0 | \n", "
8 | \n", "73.0 | \n", "
9 | \n", "73.0 | \n", "
10 | \n", "73.0 | \n", "
11 | \n", "74.0 | \n", "
12 | \n", "73.0 | \n", "
13 | \n", "71.0 | \n", "
14 | \n", "71.0 | \n", "
15 | \n", "71.0 | \n", "
16 | \n", "70.0 | \n", "
17 | \n", "70.0 | \n", "
18 | \n", "70.0 | \n", "
19 | \n", "70.0 | \n", "
20 | \n", "70.0 | \n", "
21 | \n", "70.0 | \n", "
22 | \n", "69.0 | \n", "
23 | \n", "69.0 | \n", "
24 | \n", "69.0 | \n", "
25 | \n", "69.0 | \n", "
26 | \n", "69.0 | \n", "
27 | \n", "69.0 | \n", "
28 | \n", "69.0 | \n", "
29 | \n", "68.0 | \n", "
30 | \n", "65.0 | \n", "
31 | \n", "64.0 | \n", "
32 | \n", "54.0 | \n", "
33 | \n", "51.0 | \n", "
34 | \n", "52.0 | \n", "
35 | \n", "47.0 | \n", "
36 | \n", "53.0 | \n", "
37 | \n", "53.0 | \n", "
38 | \n", "65.0 | \n", "
39 | \n", "66.0 | \n", "
40 | \n", "66.0 | \n", "
41 | \n", "67.0 | \n", "
42 | \n", "68.0 | \n", "
43 | \n", "68.0 | \n", "
44 | \n", "68.0 | \n", "
45 | \n", "69.0 | \n", "
46 | \n", "70.0 | \n", "
47 | \n", "71.0 | \n", "
48 | \n", "70.0 | \n", "
49 | \n", "70.0 | \n", "
\n",
"\n",
"Dataset' i Eğitim (Train) ve Test Kümelerine Ayrıma
\n",
"\n",
"(1) Lineer Regresyon (Linear Regression): \n",
"
\n",
"\n",
"Lineer Regresyon Modeli İle Tahmin Yapma\n",
"
\n",
"\n",
"Tahmin Edilmesi Gereken Sonuç (Target) Değerinin Ortalamısı Nedir? \n",
"
\n", " | overall_rating | \n", "
---|---|
count | \n", "59517.000000 | \n", "
mean | \n", "68.635818 | \n", "
std | \n", "7.041297 | \n", "
min | \n", "33.000000 | \n", "
25% | \n", "64.000000 | \n", "
50% | \n", "69.000000 | \n", "
75% | \n", "73.000000 | \n", "
max | \n", "94.000000 | \n", "
\n",
"\n",
"Lineer Regresyon Modelinin Doğruluğunu Root Mean Square Error Kullanarak Bulma\n",
"\n",
"
\n",
"\n",
"(2) Karar Ağacı (Decision Tree):\n",
"
\n",
"\n",
"Karar Ağacı Modeli İle Tahmin Yapma\n",
"
\n",
"\n",
"For comparision: What is the mean of the expected target value in test set ?\n",
"
\n", " | overall_rating | \n", "
---|---|
count | \n", "59517.000000 | \n", "
mean | \n", "68.635818 | \n", "
std | \n", "7.041297 | \n", "
min | \n", "33.000000 | \n", "
25% | \n", "64.000000 | \n", "
50% | \n", "69.000000 | \n", "
75% | \n", "73.000000 | \n", "
max | \n", "94.000000 | \n", "
\n",
"\n",
"Karar Ağacı Modelinin Doğruluğunu Root Mean Square Error Kullanarak Bulma\n",
"\n",
"