সরাসরি প্রধান সামগ্রীতে চলে যান

লিনিয়ার রিগ্রেশন: সহজ কথায় মূল ধারণা ও গণিত

ভিডিওটির নির্দিষ্ট অংশ (০২:১০:১২ থেকে ০২:২২:৩০) অনুযায়ী 'Linear Regression' এর মূল বিষয়গুলো সহজ বাংলায় নিচে তুলে ধরা হলো।

Introduction

লিনিয়ার রিগ্রেশন (Linear Regression) হলো মেশিন লার্নিংয়ের একদম প্রাথমিক এবং শক্তিশালী একটি অ্যালগরিদম। যখন আমরা এক বা একাধিক তথ্যের (Features) ওপর ভিত্তি করে কোনো একটি সংখ্যা বা মান প্রেডিক্ট (ভবিষ্যদ্বাণী) করতে চাই, তখন এটি ব্যবহার করা হয়। যেমন: কারো উচ্চতা দেখে তার ওজন কত হতে পারে তা ধারণা করা। এই ভিডিওতে লিনিয়ার রিগ্রেশনের পেছনের গণিত এবং এটি কীভাবে কাজ করে তা খুব সহজভাবে বোঝানো হয়েছে।


১. লিনিয়ার রিগ্রেশন কী?

সহজ কথায় বলতে গেলে, লিনিয়ার রিগ্রেশন হলো কতগুলো ডেটা পয়েন্টের মাঝখান দিয়ে এমন একটি সরলরেখা (Straight line) টানা, যা ডেটাগুলোর সাধারণ প্রবণতা বা ট্রেন্ড বোঝাতে পারে।

ভিডিও রেফারেন্স: [02:10:15]

বিস্তারিত: মনে করো তোমার কাছে কিছু ডেটা আছে—একদিকে মানুষের উচ্চতা আর অন্যদিকে তাদের ওজন। তুমি যদি এগুলো গ্রাফে বসাও, দেখবে উচ্চতা বাড়লে সাধারণত ওজনও বাড়ছে। লিনিয়ার রিগ্রেশন এই পয়েন্টগুলোর ভেতর দিয়ে একটা 'বেস্ট ফিট' লাইন টানে। এই লাইনটি ব্যবহার করে আমরা ভবিষ্যতে কোনো নতুন মানুষের উচ্চতা জানা থাকলে তার সম্ভাব্য ওজন কত হতে পারে তা বলে দিতে পারি।


২. মূল গাণিতিক সূত্র (The Equation)

লিনিয়ার রিগ্রেশনের প্রাণ হলো একটি সরলরেখার সমীকরণ।

ভিডিও রেফারেন্স: [02:12:45]

কোডিং ও গাণিতিক রূপ: মেশিন লার্নিংয়ে আমরা সাধারণত এই সূত্রটি দেখি:

y=wx+b

এখানে:

  • y (Dependent Variable): যা আমরা প্রেডিক্ট করতে চাই (যেমন: ওজন)।

  • x (Independent Variable): যে তথ্যের ওপর ভিত্তি করে প্রেডিক্ট করছি (যেমন: উচ্চতা)।

  • w (Weight/Slope): এটি ঠিক করে লাইনটি কতটা খাড়া হবে।

  • b (Bias/Intercept): এটি ঠিক করে লাইনটি y অক্ষের কোথায় টাচ করবে।

সহজ ব্যাখ্যা (Beginner Level):

  • Weight (w): ধরো w এর মান ২। এর মানে হলো উচ্চতা ১ ইউনিট বাড়লে ওজন ২ ইউনিট বাড়বে। এটা হলো প্রভাবের পরিমাণ।

  • Bias (b): এটি একটি বেস ভ্যালু। যদি উচ্চতা ০ হয়, তাও আমাদের মডেলে একটা শুরুর মান থাকে, সেটাই b।


৩. লস ফাংশন (Loss Function - Mean Squared Error)

আমাদের টানা লাইনটি কতটা নির্ভুল তা বোঝার জন্য 'লস ফাংশন' ব্যবহার করা হয়।

ভিডিও রেফারেন্স: [02:15:30]

বিস্তারিত: আমরা যখন একটা লাইন টানি, তখন সব ডেটা পয়েন্ট একদম লাইনের ওপর থাকে না। আসল মান (Actual value) আর আমাদের প্রেডিক্ট করা লাইনের মানের মধ্যে যে দূরত্ব বা পার্থক্য থাকে, তাকেই বলা হয় Error বা Residual

মেশিন লার্নিংয়ে আমরা সব এররকে বর্গ (Square) করি এবং তাদের গড় (Mean) বের করি। একেই বলে Mean Squared Error (MSE)। আমাদের লক্ষ্য থাকে এই লস বা ভুলের পরিমাণ যতটা সম্ভব কমিয়ে আনা।


৪. গ্রেডিয়েন্ট ডিসেন্ট (Gradient Descent)

মেশিন কীভাবে শেখে? সে আসলে w এবং b এর এমন মান খুঁজে বের করার চেষ্টা করে যাতে লস সবচেয়ে কম হয়।

ভিডিও রেফারেন্স: [02:18:20]

বিস্তারিত: গ্রেডিয়েন্ট ডিসেন্টকে কল্পনা করো একটা পাহাড়ে আছ আর তোমাকে উপত্যকার সবচেয়ে নিচের বিন্দুতে নামতে হবে। মেশিন ছোট ছোট ধাপে w এবং b এর মান পরিবর্তন করতে থাকে যতক্ষণ না সে সবচেয়ে কম লস বা ভুলের বিন্দুতে পৌঁছায়।


৫. মাল্টিপল লিনিয়ার রিগ্রেশন (Multiple Linear Regression)

সবসময় তো আর একটা তথ্যের ওপর ভিত্তি করে রেজাল্ট আসে না। বাস্তব জীবনে অনেকগুলো ফ্যাক্টর থাকে।

ভিডিও রেফারেন্স: [02:20:50]

বিস্তারিত: যখন একের অধিক x বা ফিচার থাকে (যেমন: ওজন প্রেডিক্ট করতে উচ্চতা, বয়স এবং প্রতিদিনের ক্যালরি গ্রহণ—সবগুলোই দরকার), তখন একে বলে মাল্টিপল লিনিয়ার রিগ্রেশন। এর সূত্রটি হয়:

y=w1x1+w2x2+w3x3+...+b


কঠিন শব্দের সহজ ব্যাখ্যা (Glossary for Beginners)

১. Feature (ফিচার): যে তথ্যগুলো ইনপুট হিসেবে দেওয়া হয় (যেমন: উচ্চতা)। 2. Target/Label (টার্গেট): যে মানটি আমরা বের করতে চাই (যেমন: ওজন)। 3. Slope (ঢাল): লাইনটি কতটা হেলে আছে তার পরিমাপ। 4. Convergence (কনভারজেন্স): যখন মডেলটি লস কমিয়ে সবচেয়ে ভালো অবস্থানে পৌঁছায়।


Analysis & Thinking

কনটেন্ট ক্রিয়েটর এই ভিডিওর মাধ্যমে বোঝাতে চেয়েছেন যে, লিনিয়ার রিগ্রেশন কেবল গণিত নয়, এটি ডেটার ভেতরের সম্পর্ক খোঁজার একটি উপায়।

  • বাস্তবতা: লিনিয়ার রিগ্রেশন তখনই ভালো কাজ করে যখন তথ্যের মধ্যে সরাসরি বা লিনিয়ার সম্পর্ক থাকে। বাস্তব জীবনে সব ডেটা সরলরেখায় চলে না, সেক্ষেত্রে 'পলিনিমিয়াল রিগ্রেশন' বা অন্য জটিল মডেল বেশি কার্যকর হতে পারে।

  • পরামর্শ: শুরুতে লিনিয়ার রিগ্রেশন শেখার সময় গণিতের চেয়ে এর ব্যবহারের ওপর বেশি গুরুত্ব দেওয়া উচিত। বিশেষ করে লস ফাংশন এবং গ্রেডিয়েন্ট ডিসেন্ট কীভাবে কাজ করে তা বুঝলে যেকোনো মেশিন লার্নিং অ্যালগরিদম বোঝা সহজ হয়ে যায়।

  • বিকল্প: ডেটা যদি খুব বেশি জটিল হয়, তবে রেন্ডম ফরেস্ট (Random Forest) বা নিউরাল নেটওয়ার্ক (Neural Network) ভালো রেজাল্ট দিতে পারে, কিন্তু লিনিয়ার রিগ্রেশনের মতো ইন্টারপ্রিটিবিলিটি (সহজে ব্যাখ্যা করার ক্ষমতা) অন্যগুলোতে পাওয়া কঠিন।

[

Machine Learning for Everybody – Full Course

freeCodeCamp.org · 9.4M views

](http://www.youtube.com/watch?v=i_LwzRVP7bg)

মন্তব্যসমূহ

এই ব্লগটি থেকে জনপ্রিয় পোস্টগুলি

সিজ্জিন (Sijjin) vs ইল্লিয়িন (Illiyin) পার্থক্য Difference

Sijjin (سِجِّين) এবং Illiyin (عِلِّيِّين) —এ দুটি শব্দ কুরআনে এসেছে এবং দুটোই মানুষের আমলনামা সংরক্ষণ সম্পর্কিত স্থানকে নির্দেশ করে। ১. সিজ্জিন (Sijjin) সিজ্জিন হলো পাপীদের (কাফের, মুনাফিক ও দুরাচারীদের) আমলনামা সংরক্ষণের স্থান। এটি সাত তলদেশের নীচে এক কারাগার বা অন্ধকার জগতে অবস্থিত বলে উল্লেখ রয়েছে। সূরা আল-মুতাফফিফীন (৮৩:৭-৯) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْفُجَّارِ لَفِي سِجِّينٍ ۝ وَمَا أَدْرَاكَ مَا سِجِّينٌ ۝ كِتَابٌ مَرْقُومٌ" অর্থ: "না, পাপীদের আমলনামা সিজ্জিনে সংরক্ষিত। তুমি কি জানো, সিজ্জিন কী? এটি এক লিখিত দলিল।" সিজ্জিনকে একটি কারাগার, সংকীর্ণ স্থান, বা নিচের স্তরে অবস্থিত এক অন্ধকার দুনিয়া হিসেবে ব্যাখ্যা করা হয়। ২. ইল্লিয়িন (Illiyin) ইল্লিয়িন হলো সৎকর্মশীলদের (মুমিন ও নেককারদের) আমলনামা সংরক্ষণের স্থান । এটি সপ্তম আসমানের ওপরে সংরক্ষিত এক সম্মানিত স্থান। সূরা আল-মুতাফফিফীন (৮৩:১৮-২১) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْأَبْرَارِ لَفِي عِلِّيِّينَ ۝ وَمَا أَدْرَاكَ مَا عِلِّيُّونَ ۝ كِتَابٌ مَرْقُومٌ ۝ يَش...

তারাবিহ সমগ্র - প্রথম আলো

রামাদান ২০২৪ উপলক্ষে প্রথম আলোর নিয়মিত আয়োজন - খতমে তারাবিহ'র সূরা গুলো নিয়ে সংক্ষিপ্ত আলোচনা'র লিংক  নিচে দেওয়া হলো।  লিংকে ক্লিক করলেই আপনাকে আলোচনা তে নিয়ে যাবে। তারাবিহ: ১ | একটি খুন ও গাভি নিয়ে বনি ইসরাইলের বাড়াবাড়ি তারাবিহ: ২ | নারীর মর্যাদা ও অধিকার এবং অলৌকিক তিন ঘটনা তারাবিহ: ৩ | যে ১৪ নারীকে বিয়ে করা হারাম তারাবিতে: ১২ | মহানবী (সা.)–এর আকাশভ্রমণ এবং আসহাবে কাহাফের কাহিনি

রেডমি নোট ৯ এর বিস্তারিত | Redmi Note 9 in Bangla

৩০ এপ্রিল, ২০২০ এ শাওমির ঘোষনা আসে এই ফোনটি নিয়ে। কিন্তু ফোনটি মার্কেটে আসে মে মাসের শেষের দিকে৷ করোনার কারনে ফোনটি বাংলাদেশে আসতে আরো সময় নেয়। বর্তমানে বাংলাদেশে আন অফিশিয়াল ভাবে ফোনটি পাওয়া যাচ্ছে৷ বাংলাদেশে অফিশিয়াল ভাবে এখনো ফোনটি আসার তথ্য নেয়৷ চলুন ফোনটি নিয়ে বিস্তারিত আলোচনা করা যাক। শাওমি নোট সিরিজের ফোন বের করে এদের রেডমি নামে সাব ব্যান্ড৷ এদের কাজ হল এই নোট সিরিজ নিয়ে কাজ করা৷ প্রতিবছর নোট সিরিজের ১/২ টা ফোন বাজারে আসে। সাথে সেই ফোন গুলার বিভিন্ন ভার্সন (যেমন - র‍্যাম ও রমের ভিত্তিতে) বাজারে আসে। এই বছরও তারা রেডমি সিরিজের নোট ৯ বাজারে আনে। এই বছর হয়তো এই সিরিজের আরো ফোন বাজারে আসবে। ডিস্পলেঃ ফোনটির ডিসপ্লে সাইজ ৬.৫৩ ইঞ্চি। এতে আইপিএস এলসিডি ডিসপ্লে ব্যবহার করা হয়েছে। এই ফোনের ডিসপ্লে প্রটেকশন হিসেবে আছে গরিলা গ্লাস ফাইভ। স্ক্রিন আর ফোনের বডির অনুপাত প্রায় ৮৩.৫%। এই ফোনের ডিসপ্লে ফুলএইচডি মানে ১০৮০পি। এই ডিস্পলের দৈর্ঘ্য ১৯.৫ একক এবং প্রস্থ হল ৯ একক। এত বড় ফোনের কারনে এই ফোনের পিপি আই ডেনসিটি ৩৯৫। যা একটু কম। প্লাটফর্মঃ এই ফোনের অপারেটিং সিস্টেম এন্ড্রয়েড ১০ এবং এর...