পরিচিতি
মেশিন লার্নিং (Machine Learning) হলো এমন একটি প্রযুক্তি যার মাধ্যমে কম্পিউটার কোনো ডেটা বা তথ্য দেখে নিজে থেকে শিখতে পারে এবং ভবিষ্যতে কী ঘটতে পারে তা অনুমান (predict) করতে পারে। এই টিউটোরিয়ালে আমরা পাইথন ব্যবহার করে খুব সহজ একটি মেশিন লার্নিং মডেল তৈরি করা শিখব। এর নাম হলো 'সিম্পল লিনিয়ার রিগ্রেশন' (Simple Linear Regression)। আমরা দেখব কীভাবে বাড়ির আয়তন (area) থেকে সেটির দাম কত হতে পারে, তা কম্পিউটারকে দিয়ে বের করানো যায়।
লিনিয়ার রিগ্রেশন কী?
[ভিডিও রেফারেন্স: https://www.youtube.com/watch?v=8jazNUpO3lQ]
সহজ কথায় বলতে গেলে, লিনিয়ার রিগ্রেশন হলো একটি গাণিতিক পদ্ধতি। ধরুন, আপনার কাছে কিছু বাড়ির আয়তন এবং সেগুলোর দামের তালিকা আছে। আপনি যদি একটি গ্রাফ পেপারে এগুলোকে বিন্দু (point) আকারে আঁকেন, তবে সব বিন্দু দিয়ে একটি সরলরেখা টেনে সেগুলোর ট্রেন্ড বা প্রবণতা বোঝা যায়।
- সহজ ব্যাখ্যা: যখন আমরা দেখি যে বাড়ির আয়তন বাড়লে দামও বাড়ে, তখন আমরা একটি সরলরেখা টেনে সেই সম্পর্কটি বোঝার চেষ্টা করি। একেই বলে লিনিয়ার রিগ্রেশন। এই রেখাটি ব্যবহার করে আমরা নতুন কোনো বাড়ির আয়তন জানা থাকলে তার দাম কত হবে, তা আন্দাজ করতে পারি।
গাণিতিক সমীকরণ (y = mx + b)
মেশিন লার্নিং মডেলে কম্পিউটার মূলত একটি গণিতের সূত্র অনুসরণ করে: y = mx + b
এখানে:
-
y (Dependent Variable): এটি হলো বাড়ির দাম (যা আমরা বের করতে চাই)।
-
x (Independent Variable): এটি হলো বাড়ির আয়তন (যা আমাদের জানা আছে)।
-
m (Slope/Gradient): এটি নির্দেশ করে প্রতি বর্গফুট আয়তন বাড়লে দাম কতটা বাড়বে।
-
b (Intercept): এটি হলো শুরুর দিকের দামের একটি স্থানাঙ্ক।
পাইথন কোডিং ও প্রয়োগ
মেশিন লার্নিং মডেল তৈরির জন্য আমরা Scikit-learn লাইব্রেরি ব্যবহার করব।
Python
import pandas as pd
from sklearn import linear_model
# ১. ডেটা ফাইল লোড করা
df = pd.read_csv('homeprices.csv')
# ২. মডেল তৈরি করা
model = linear_model.LinearRegression()
# ৩. মডেল ট্রেন করা (Training)
# এখানে আয়তনকে (area) ইনপুট হিসেবে দিচ্ছি
model.fit(df[['area']], df.price)
# ৪. দাম প্রেডিক্ট করা (Prediction)
# যেমন: ৩০০০ বর্গফুটের বাড়ির দাম কত?
prediction = model.predict([[3300]])
print(prediction)
কোডের ব্যাখ্যা: ১. pd.read_csv: এটি আপনার এক্সেল বা সিএসভি (CSV) ফাইল থেকে তথ্যগুলো পাইথনে নিয়ে আসে। ২. model.fit: এটি হলো মডেলকে শেখানোর ধাপ। কম্পিউটার এখানে আপনার দেওয়া ডেটা থেকে আয়তন ও দামের সম্পর্ক বুঝে নেয়। ৩. model.predict: এই কমান্ডটি ব্যবহার করে আমরা অজানাকে জানতে পারি। এখানে ৩০০০ বর্গফুট আয়তন দেওয়ার সাথে সাথে মডেল আমাদের একটি দাম প্রেডিক্ট করে দিচ্ছে।
বিশ্লেষণ ও পরামর্শ
আমরা কী শিখলাম? এই টিউটোরিয়ালটি মূলত মেশিন লার্নিংয়ের একদম প্রাথমিক ভিত্তি। লিনিয়ার রিগ্রেশন দিয়ে আমরা খুব সহজেই কোনো নির্দিষ্ট তথ্যের ভিত্তিতে ভবিষ্যৎবাণী করতে পারি। এটি শুধু বাড়ির দাম নয়, বরং শেয়ার বাজার, তাপমাত্রা, কিংবা বিক্রির হিসাব বের করার ক্ষেত্রেও ব্যবহার করা যায়।
বাস্তবতা ও পরামর্শ: ১. ডেটার মান: আপনার কাছে যত বেশি এবং সঠিক তথ্য থাকবে, মডেল তত নির্ভুলভাবে দাম বলতে পারবে। ২. প্র্যাকটিস: শুধু ভিডিও দেখে শেখা সম্ভব নয়, তাই ভিডিও ডেসক্রিপশনে দেওয়া লিঙ্ক থেকে ডেটাসেট ডাউনলোড করে নিজের পিসিতে কোড চালিয়ে দেখা জরুরি। ৩. ভবিষ্যৎ ধাপ: এই মডেলটি একটি ভেরিয়েবলের (শুধু আয়তন) ওপর ভিত্তি করে কাজ করে। ভবিষ্যতে আপনি আয়তনের পাশাপাশি বাড়ির বয়স বা লোকেশন যুক্ত করে আরও নিখুঁত মডেল তৈরি করতে পারবেন।
আপনার লার্নিং জার্নিতে এটি একটি দারুণ শুরু! ধৈর্য ধরে ছোট ছোট প্রজেক্ট করলে আপনি দ্রুত দক্ষ হয়ে উঠবেন।
[
Machine Learning Tutorial Python - 2: Linear Regression Single Variable
codebasics · 1.5M views
](http://www.youtube.com/watch?v=8jazNUpO3lQ)

মন্তব্যসমূহ
একটি মন্তব্য পোস্ট করুন
আপনার সমস্যাটি কমেন্ট করে আমাদের জানান :-d