{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# কোডে প্রথম মডেল এবং প্রেডিকশন " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "এই পুরো জুপিটার স্ক্রিপ্টটা পাওয়া যাবে এই লিংকে \n", "https://github.com/raqueeb/ml-python/blob/master/1st-model.ipynb" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "এস্টিমেটরের কাজের ধাপের পুরো কোড এখানে। না বুঝলে আবার ফিরে যান \"এস্টিমেটরের কাজের ধাপ\" চ্যাপ্টারে। " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "মনে রাখুন এই ধাপগুলো, দরকার হবে সবসময় " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "প্রথমে কিছু লাইব্রেরি ইমপোর্ট করে নেই " ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "collapsed": true }, "outputs": [], "source": [ "import numpy as np" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "collapsed": true }, "outputs": [], "source": [ "import pandas as pd" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "ডাটাসেটগুলো ইমপোর্ট করে নিয়ে আসি " ] }, { "cell_type": "code", "execution_count": 3, "metadata": { "collapsed": true }, "outputs": [], "source": [ "from sklearn import datasets" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "আইরিস ডাটাসেট লোড করে নেই " ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "collapsed": true }, "outputs": [], "source": [ "iris = datasets.load_iris()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "ফিচার ম্যাট্রিক্স স্টোর করছি বড় \"X\"এ, রেসপন্স ভেক্টর রাখছি \"y\" তে " ] }, { "cell_type": "code", "execution_count": 5, "metadata": { "collapsed": true }, "outputs": [], "source": [ "X = iris.data\n", "y = iris.target" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "ক্লাসিফায়ার ইমপোর্ট করে নিয়ে আসছি " ] }, { "cell_type": "code", "execution_count": 6, "metadata": { "collapsed": true }, "outputs": [], "source": [ "from sklearn.neighbors import KNeighborsClassifier" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "আমাদের নেইবার সংখ্যা ১" ] }, { "cell_type": "code", "execution_count": 7, "metadata": { "collapsed": true }, "outputs": [], "source": [ "knn = KNeighborsClassifier(n_neighbors=1)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "প্রথম মডেল তৈরি " ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',\n", " metric_params=None, n_jobs=1, n_neighbors=1, p=2,\n", " weights='uniform')" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "knn.fit(X, y)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "প্রথম প্রেডিকশন, আমাদের ডাটাসেটের বাইরের ডাটা দিয়ে " ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([2])" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "knn.predict([[3, 5, 4, 2]])" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Predicted target name: ['virginica']\n" ] } ], "source": [ "print(\"Predicted target name:\",\n", " iris['target_names'][knn.predict([[3, 5, 4, 2]])])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "অথবা আমরা এভাবে করতে পারি, আপনার মতো করে তৈরি করুন ইচ্ছেমতো " ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "X_new.shape: (1, 4)\n" ] } ], "source": [ "X_new = np.array([[3, 5, 4, 2]])\n", "print(\"X_new.shape:\", X_new.shape)" ] }, { "cell_type": "code", "execution_count": 12, "metadata": { "collapsed": true }, "outputs": [], "source": [ "mypredict = knn.predict(X_new)" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Prediction: [2]\n", "Predicted target name: ['virginica']\n" ] } ], "source": [ "print(\"Prediction:\", mypredict)\n", "print(\"Predicted target name:\",\n", " iris['target_names'][mypredict])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "ধাপগুলো নিয়ে ধারণা পরিষ্কার তো? এখন যদি আমরা দুটো \"আউট অফ স্যাম্পল\" ডেটা নিয়ে কাজ করতাম, তাহলে কি করতাম আমরা?" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([2, 1])" ] }, "execution_count": 14, "metadata": {}, "output_type": "execute_result" } ], "source": [ "X_new = [[3, 5, 4, 2], [5, 4, 3, 2]]\n", "knn.predict(X_new)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "এখানে আমরা ব্যবহার করেছি \"কে নিয়ারেস্ট নেইবার্স\" ক্লাসিফায়ার। আচ্ছা, আমাদের যদি নেইবার ৩ হয়? তাহলে আগের সিস্টেমে পাল্টে দিলাম n_neighbors=3" ] }, { "cell_type": "code", "execution_count": 15, "metadata": { "collapsed": true }, "outputs": [], "source": [ "knn = KNeighborsClassifier(n_neighbors=3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "মডেলে ফিট করি ডাটা " ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',\n", " metric_params=None, n_jobs=1, n_neighbors=3, p=2,\n", " weights='uniform')" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "knn.fit(X, y)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "প্রেডিক্ট করি আগের ভ্যালুগুলোকে " ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([1, 1])" ] }, "execution_count": 17, "metadata": {}, "output_type": "execute_result" } ], "source": [ "knn.predict(X_new)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "দেখেছেন কী অবস্থা? পাল্টে গেছে প্রেডিকশন ভ্যালু। নিশ্চয়ই ক্লাসিফায়ারের কোন ভ্যালুতে মডেল ভালো কাজ করবে সেটা জানলে ব্যাপারটা আরো ভালো হতো। সেটা জানতেই তো এতো গল্প। " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "কেমন হয় অন্য ক্লাসিফায়ার দিয়ে দেখলে? \"লিনিয়ার রিগ্রেশন\" কাজ করে কন্টিনিউয়াস ভাল্যুর (যেমন, আমাদের বয়স বা বেতন) ওপর। সে হিসেবে লজিস্টিক (হ্যাঁ অথবা না, তিন ক্যাটেগরির ফুল) রিগ্রেশন ব্যবহার করা যেতে পারে এখানে। আগের মতোই একই জিনিস করবো আমরা। মডেল হিসেবে ব্যবহার করবো LogisticRegressionকে। সেটা ইমপোর্ট হবে sklearn.linear_model মডিউল থেকে। LogisticRegression() ক্লাসকে পাঠিয়ে দিচ্ছি lr অবজেক্ট। আপনার ঈচ্ছেমতো নাম দিন এই অবজেক্ট হিসেবে। " ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([2, 0])" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "from sklearn.linear_model import LogisticRegression\n", "lr = LogisticRegression()\n", "lr.fit(X, y)\n", "lr.predict(X_new)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "দেখেছেন কী অবস্থা? পাল্টে গেছে প্রেডিকশন। এর মানে হচ্ছে আমাদের ব্যবহৃত ক্লাসিফায়ারগুলোর কাজের মধ্যে অনেক ফারাক আছে। সেকারণে আউটকামও ভিন্ন। কোন কাজে কোন ক্লাসিফায়ার ভালো, সেটার ধারণায় আসবে আস্তে আস্তে।" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.3" } }, "nbformat": 4, "nbformat_minor": 2 }