{ "cells": [ { "cell_type": "markdown", "metadata": { "collapsed": true }, "source": [ "
\n",
"\n",
"Karar Ağaçları (Decision Tree) Kullanarak Hava Durumu \n",
"Sınıflandırması
\n",
"scikit-learn\n",
"
\n",
"
\n",
"Günlük Hava Durumu Analizi
\n",
"\n",
"Gerekli Kütüphanelerin İçe Aktarılması
\n",
"\n",
"CSV Dosyası ile Pandas DataFrame oluşturma
Hakkında
\n", "\n", " | number | \n", "air_pressure_9am | \n", "air_temp_9am | \n", "avg_wind_direction_9am | \n", "avg_wind_speed_9am | \n", "max_wind_direction_9am | \n", "max_wind_speed_9am | \n", "rain_accumulation_9am | \n", "rain_duration_9am | \n", "relative_humidity_9am | \n", "relative_humidity_3pm | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "0 | \n", "918.060000 | \n", "74.822000 | \n", "271.100000 | \n", "2.080354 | \n", "295.400000 | \n", "2.863283 | \n", "0.00 | \n", "0.0 | \n", "42.420000 | \n", "36.160000 | \n", "
1 | \n", "1 | \n", "917.347688 | \n", "71.403843 | \n", "101.935179 | \n", "2.443009 | \n", "140.471548 | \n", "3.533324 | \n", "0.00 | \n", "0.0 | \n", "24.328697 | \n", "19.426597 | \n", "
2 | \n", "2 | \n", "923.040000 | \n", "60.638000 | \n", "51.000000 | \n", "17.067852 | \n", "63.700000 | \n", "22.100967 | \n", "0.00 | \n", "20.0 | \n", "8.900000 | \n", "14.460000 | \n", "
3 | \n", "3 | \n", "920.502751 | \n", "70.138895 | \n", "198.832133 | \n", "4.337363 | \n", "211.203341 | \n", "5.190045 | \n", "0.00 | \n", "0.0 | \n", "12.189102 | \n", "12.742547 | \n", "
4 | \n", "4 | \n", "921.160000 | \n", "44.294000 | \n", "277.800000 | \n", "1.856660 | \n", "136.500000 | \n", "2.863283 | \n", "8.90 | \n", "14730.0 | \n", "92.410000 | \n", "76.740000 | \n", "
5 | \n", "5 | \n", "915.300000 | \n", "78.404000 | \n", "182.800000 | \n", "9.932014 | \n", "189.000000 | \n", "10.983375 | \n", "0.02 | \n", "170.0 | \n", "35.130000 | \n", "33.930000 | \n", "
6 | \n", "6 | \n", "915.598868 | \n", "70.043304 | \n", "177.875407 | \n", "3.745587 | \n", "186.606696 | \n", "4.589632 | \n", "0.00 | \n", "0.0 | \n", "10.657422 | \n", "21.385657 | \n", "
7 | \n", "7 | \n", "918.070000 | \n", "51.710000 | \n", "242.400000 | \n", "2.527742 | \n", "271.600000 | \n", "3.646212 | \n", "0.00 | \n", "0.0 | \n", "80.470000 | \n", "74.920000 | \n", "
8 | \n", "8 | \n", "920.080000 | \n", "80.582000 | \n", "40.700000 | \n", "4.518619 | \n", "63.000000 | \n", "5.883152 | \n", "0.00 | \n", "0.0 | \n", "29.580000 | \n", "24.030000 | \n", "
9 | \n", "9 | \n", "915.010000 | \n", "47.498000 | \n", "163.100000 | \n", "4.943637 | \n", "195.900000 | \n", "6.576604 | \n", "0.00 | \n", "0.0 | \n", "88.600000 | \n", "68.050000 | \n", "
\n", " | number | \n", "air_pressure_9am | \n", "air_temp_9am | \n", "avg_wind_direction_9am | \n", "avg_wind_speed_9am | \n", "max_wind_direction_9am | \n", "max_wind_speed_9am | \n", "rain_accumulation_9am | \n", "rain_duration_9am | \n", "relative_humidity_9am | \n", "relative_humidity_3pm | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|
16 | \n", "16 | \n", "917.890000 | \n", "NaN | \n", "169.200000 | \n", "2.192201 | \n", "196.800000 | \n", "2.930391 | \n", "0.000 | \n", "0.000000 | \n", "48.990000 | \n", "51.190000 | \n", "
111 | \n", "111 | \n", "915.290000 | \n", "58.820000 | \n", "182.600000 | \n", "15.613841 | \n", "189.000000 | \n", "NaN | \n", "0.000 | \n", "0.000000 | \n", "21.500000 | \n", "29.690000 | \n", "
177 | \n", "177 | \n", "915.900000 | \n", "NaN | \n", "183.300000 | \n", "4.719943 | \n", "189.900000 | \n", "5.346287 | \n", "0.000 | \n", "0.000000 | \n", "29.260000 | \n", "46.500000 | \n", "
262 | \n", "262 | \n", "923.596607 | \n", "58.380598 | \n", "47.737753 | \n", "10.636273 | \n", "67.145843 | \n", "13.671423 | \n", "0.000 | \n", "NaN | \n", "17.990876 | \n", "16.461685 | \n", "
277 | \n", "277 | \n", "920.480000 | \n", "62.600000 | \n", "194.400000 | \n", "2.751436 | \n", "NaN | \n", "3.869906 | \n", "0.000 | \n", "0.000000 | \n", "52.580000 | \n", "54.030000 | \n", "
334 | \n", "334 | \n", "916.230000 | \n", "75.740000 | \n", "149.100000 | \n", "2.751436 | \n", "187.500000 | \n", "4.183078 | \n", "NaN | \n", "1480.000000 | \n", "31.880000 | \n", "32.900000 | \n", "
358 | \n", "358 | \n", "917.440000 | \n", "58.514000 | \n", "55.100000 | \n", "10.021491 | \n", "NaN | \n", "12.705819 | \n", "0.000 | \n", "0.000000 | \n", "13.880000 | \n", "25.930000 | \n", "
361 | \n", "361 | \n", "920.444946 | \n", "65.801845 | \n", "49.823346 | \n", "21.520177 | \n", "61.886944 | \n", "25.549112 | \n", "NaN | \n", "40.364018 | \n", "12.278715 | \n", "7.618649 | \n", "
381 | \n", "381 | \n", "918.480000 | \n", "66.542000 | \n", "90.900000 | \n", "3.467257 | \n", "89.400000 | \n", "4.406772 | \n", "NaN | \n", "0.000000 | \n", "20.640000 | \n", "14.350000 | \n", "
409 | \n", "409 | \n", "NaN | \n", "67.853833 | \n", "65.880616 | \n", "4.328594 | \n", "78.570923 | \n", "5.216734 | \n", "0.000 | \n", "0.000000 | \n", "18.487385 | \n", "20.356594 | \n", "
517 | \n", "517 | \n", "920.570000 | \n", "53.600000 | \n", "100.100000 | \n", "4.697574 | \n", "NaN | \n", "6.285801 | \n", "4.712 | \n", "14842.000000 | \n", "79.880000 | \n", "84.530000 | \n", "
519 | \n", "519 | \n", "916.250000 | \n", "55.670000 | \n", "176.400000 | \n", "6.666081 | \n", "188.200000 | \n", "NaN | \n", "0.000 | \n", "0.000000 | \n", "72.550000 | \n", "74.390000 | \n", "
546 | \n", "546 | \n", "NaN | \n", "42.746000 | \n", "251.100000 | \n", "12.929513 | \n", "274.400000 | \n", "17.604718 | \n", "14.627 | \n", "7825.000000 | \n", "87.870000 | \n", "70.770000 | \n", "
620 | \n", "620 | \n", "921.200000 | \n", "56.786000 | \n", "192.300000 | \n", "9.551734 | \n", "201.400000 | \n", "11.005745 | \n", "NaN | \n", "0.000000 | \n", "59.790000 | \n", "77.750000 | \n", "
625 | \n", "625 | \n", "912.400000 | \n", "50.774000 | \n", "171.600000 | \n", "NaN | \n", "181.400000 | \n", "4.831790 | \n", "0.000 | \n", "0.000000 | \n", "86.840000 | \n", "64.740000 | \n", "
656 | \n", "656 | \n", "920.830000 | \n", "66.344000 | \n", "NaN | \n", "15.457255 | \n", "189.400000 | \n", "16.486248 | \n", "0.000 | \n", "0.000000 | \n", "23.770000 | \n", "51.630000 | \n", "
670 | \n", "670 | \n", "910.920000 | \n", "48.362000 | \n", "156.500000 | \n", "NaN | \n", "177.500000 | \n", "16.128337 | \n", "4.970 | \n", "10560.000000 | \n", "80.560000 | \n", "88.220000 | \n", "
672 | \n", "672 | \n", "922.448945 | \n", "72.863773 | \n", "NaN | \n", "3.682370 | \n", "214.196160 | \n", "4.849450 | \n", "0.000 | \n", "0.000000 | \n", "16.753670 | \n", "17.804720 | \n", "
705 | \n", "705 | \n", "911.900000 | \n", "59.072000 | \n", "199.800000 | \n", "1.275056 | \n", "239.500000 | \n", "1.834291 | \n", "NaN | \n", "0.000000 | \n", "77.630000 | \n", "59.130000 | \n", "
731 | \n", "731 | \n", "922.970166 | \n", "51.391847 | \n", "33.810942 | \n", "NaN | \n", "59.290089 | \n", "11.111555 | \n", "0.000 | \n", "4.735034 | \n", "34.807753 | \n", "18.418179 | \n", "
737 | \n", "737 | \n", "917.895130 | \n", "76.804690 | \n", "104.771020 | \n", "1.632705 | \n", "97.178763 | \n", "NaN | \n", "0.000 | \n", "0.000000 | \n", "13.771311 | \n", "16.792455 | \n", "
788 | \n", "788 | \n", "917.923442 | \n", "73.249717 | \n", "42.101739 | \n", "4.132698 | \n", "64.284969 | \n", "5.345258 | \n", "0.000 | \n", "NaN | \n", "6.939692 | \n", "18.793825 | \n", "
840 | \n", "840 | \n", "918.043767 | \n", "NaN | \n", "181.774042 | \n", "0.964376 | \n", "185.618601 | \n", "1.570007 | \n", "0.000 | \n", "0.000000 | \n", "11.911222 | \n", "18.154358 | \n", "
848 | \n", "848 | \n", "915.250000 | \n", "37.562000 | \n", "246.500000 | \n", "11.587349 | \n", "258.700000 | \n", "NaN | \n", "3.171 | \n", "2891.000000 | \n", "91.000000 | \n", "90.780000 | \n", "
861 | \n", "861 | \n", "919.065408 | \n", "NaN | \n", "172.303728 | \n", "2.639600 | \n", "193.058141 | \n", "3.326949 | \n", "0.000 | \n", "0.000000 | \n", "12.497839 | \n", "13.438518 | \n", "
869 | \n", "869 | \n", "NaN | \n", "45.104000 | \n", "259.000000 | \n", "3.265932 | \n", "275.000000 | \n", "4.026492 | \n", "0.000 | \n", "80.000000 | \n", "85.270000 | \n", "90.260000 | \n", "
998 | \n", "998 | \n", "914.140000 | \n", "71.240000 | \n", "NaN | \n", "1.722444 | \n", "232.900000 | \n", "2.326418 | \n", "0.000 | \n", "0.000000 | \n", "24.200000 | \n", "41.380000 | \n", "
1031 | \n", "1031 | \n", "922.669195 | \n", "NaN | \n", "47.946284 | \n", "7.969686 | \n", "65.770066 | \n", "10.262337 | \n", "0.000 | \n", "0.000000 | \n", "18.920805 | \n", "19.641841 | \n", "
1035 | \n", "1035 | \n", "919.670000 | \n", "77.576000 | \n", "171.800000 | \n", "6.554234 | \n", "191.000000 | \n", "8.164831 | \n", "0.000 | \n", "NaN | \n", "56.860000 | \n", "50.650000 | \n", "
1063 | \n", "1063 | \n", "917.300185 | \n", "65.790001 | \n", "NaN | \n", "1.879553 | \n", "222.498226 | \n", "2.692862 | \n", "0.000 | \n", "0.000000 | \n", "14.972668 | \n", "20.966267 | \n", "
1066 | \n", "1066 | \n", "919.564869 | \n", "73.726732 | \n", "68.704694 | \n", "3.551777 | \n", "102.571616 | \n", "4.861315 | \n", "NaN | \n", "0.000000 | \n", "11.657314 | \n", "17.331823 | \n", "
\n",
"\n",
"Gereksiz Veri'den Kurtulalım
\n",
"\n",
"Temizleme işleminden sonra kalan satır sayısı?
\n",
"Sınıflandırma İşlemi
\n",
"\n",
"Sonucu 'y' de sakla.\n",
"
\n", " | high_humidity_label | \n", "
---|---|
0 | \n", "1 | \n", "
1 | \n", "0 | \n", "
2 | \n", "0 | \n", "
3 | \n", "0 | \n", "
4 | \n", "1 | \n", "
\n",
"\n",
"Saat 3'teki Nem miktarını bulmak için Saat 9'daki sensor değerlerini kullanalım\n",
"
\n",
"\n",
"\n",
"Test ve Eğitim(Train) Kümeleri Oluşturma \n",
"\n",
"
\n",
"\n",
"Fit on Train Set\n",
"
\n",
"\n",
"Test Kümesinden Çıkarım Yapma\n",
"\n",
"
\n",
"\n",
"Başarı Oranını Hesaplama\n",
"