সরাসরি প্রধান সামগ্রীতে চলে যান

ইমেজ ক্লাসিফিকেশন মডেল তৈরি ও প্রশিক্ষণ

ভূমিকা

এই ভিডিওটিতে আমরা দেখবো কিভাবে একটি ইমেজ ক্লাসিফিকেশন মডেলকে প্রশিক্ষণ (Train) দিতে হয়। সহজ কথায়, আমাদের কাছে থাকা ছবিগুলো থেকে কম্পিউটারকে শেখানো যে, কোন ছবিটিতে কোন ব্যক্তি আছেন। এখানে আমরা ডাটাগুলোকে প্রসেস করা, মডেল নির্বাচন, এবং মডেলটি কতটা নির্ভুলভাবে কাজ করছে তা যাচাই করার প্রক্রিয়া শিখবো।


ডাটা প্রিপারেশন বা প্রস্তুতি

রেফারেন্স: [00:00] থেকে [01:03]

মডেলকে প্রশিক্ষণ দেওয়ার আগে ডাটা ঠিকঠাক করা খুব জরুরি। ভিডিওতে দেখানো হয়েছে কিভাবে ছবিগুলো থেকে একটি ডিকশনারি বা তালিকার মতো স্ট্রাকচার তৈরি করা হয়েছে।

  • সহজ ব্যাখ্যা: এখানে ইমেজগুলোকে সংখ্যায় রূপান্তর করা হয়েছে। কম্পিউটার সরাসরি ছবি বোঝে না, তাই সেগুলোকে ছোট ছোট ডাটা পয়েন্টের (Array) তালিকা হিসেবে সাজানো হয়েছে। যাতে মডেল বুঝতে পারে একটি ছবিতে কী কী বৈশিষ্ট্য আছে।

মডেল নির্বাচন ও প্রশিক্ষণ (SVM)

রেফারেন্স: [01:03] থেকে [04:43]

এখানে Support Vector Machine (SVM) নামক একটি অ্যালগরিদম ব্যবহার করা হয়েছে। এটি সাধারণত ক্লাসিফিকেশনের কাজে খুব ভালো ফলাফল দেয়।

  • পাইপলাইন (Pipeline): ডাটাকে স্কেল (Scale) করার জন্য পাইপলাইন ব্যবহার করা হয়েছে।

  • কোড উদাহরণ:

Python

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

# পাইপলাইন তৈরি এবং মডেল ফিট করা
pipe = make_pipeline(StandardScaler(), SVC())
pipe.fit(X_train, y_train) 
  • ব্যাখ্যা: StandardScaler ডাটাগুলোকে একটি নির্দিষ্ট স্কেলে নিয়ে আসে যাতে কম্পিউটার দ্রুত শিখতে পারে। pipe.fit কমান্ডটি মডেলটিকে প্রশিক্ষণ দেয়।

মডেলের দক্ষতা যাচাই (Classification Report)

রেফারেন্স: [04:43] থেকে [07:01]

মডেলটি কেমন কাজ করছে তা বোঝার জন্য আমরা Classification Report ব্যবহার করি।

  • Precision: আমি যখন কোনো ছবিকে নির্দিষ্ট কারো বলছি, তখন সেটির কত শতাংশ সত্যি।

  • Recall: বাস্তবে যতগুলো ছবি ছিল, তার মধ্যে কতগুলোকে আমি সঠিকভাবে চিনতে পেরেছি।

  • F1 Score: Precision এবং Recall-এর সমন্বিত স্কোর, যা দিয়ে মডেলের সামগ্রিক মান বোঝা যায়।


হাইপার প্যারামিটার টিউনিং (GridSearch CV)

রেফারেন্স: [07:01] থেকে [12:45]

মডেলকে সেরা করার জন্য বিভিন্ন প্যারামিটার ট্রায়াল দেওয়া হয়। একে বলে GridSearch CV বা হাইপার প্যারামিটার টিউনিং। এটি লুপ চালিয়ে বারবার পরীক্ষা করে দেখে কোন সেটিংসে মডেলটি সবচেয়ে ভালো ফল দিচ্ছে।


কনফিউশন ম্যাট্রিক্স (Confusion Matrix)

রেফারেন্স: [15:33] থেকে [17:47]

এটি একটি টেবিল বা গ্রাফ যা আমাদের দেখায় মডেল কোথায় ভুল করছে। কোন ব্যক্তিকে ভুল করে অন্যজন মনে করছে, তা এখানে পরিষ্কার দেখা যায়। এটি মডেলের ভুলগুলো খুঁজে বের করার জন্য খুবই কার্যকরী।


মডেল সংরক্ষণ (Save Model)

রেফারেন্স: [17:47] থেকে [19:11]

মডেলটি তৈরি হয়ে গেলে সেটিকে পরে ব্যবহারের জন্য সংরক্ষণ করা হয়। এখানে joblib লাইব্রেরি ব্যবহার করে মডেলটিকে একটি ফাইলে সেভ করা হয়েছে।

  • কোড উদাহরণ:

Python

import joblib
# মডেল সেভ করা
joblib.dump(best_classifier, 'saved_model.pkl') 
  • ব্যাখ্যা: এটি মডেলটিকে একটি ফাইল হিসেবে সেভ করে, যা পরে কোনো ওয়েবসাইট বা অ্যাপ্লিকেশনে সরাসরি ব্যবহার করা যায়।

বিশ্লেষণ ও পরামর্শ

সারাংশ: এই ভিডিওতে একজন ডেটা সায়েন্টিস্ট কিভাবে প্রজেক্ট শুরু থেকে শেষ পর্যন্ত নিয়ে যান তার একটি বাস্তব চিত্র পাওয়া গেল। তিনি শুধু মডেল তৈরি করেননি, বরং সেটি কতটা নিখুঁত তা যাচাই করেছেন এবং পরবর্তী ধাপে ব্যবহারের জন্য সংরক্ষণ করেছেন।

বাস্তবতা ও सुझाव: ১. বাস্তব জীবনে মডেলের একুরেসি বা নির্ভুলতা ৯৫% এর উপরে রাখার চেষ্টা করা উচিত। ২. এখানে SVM ভালো কাজ করলেও, ভবিষ্যতে আরও জটিল প্রজেক্টের জন্য Deep Learning (CNN) ব্যবহার করা অনেক বেশি কার্যকর হতে পারে। ৩. আপনার যদি কোনো মডেল থাকে, সেটি যাচাই করার জন্য সবসময় আলাদা 'Test Dataset' ব্যবহার করবেন, যেন নতুন ছবির ওপর সেটি পরীক্ষা করা যায়।

এই ভিডিওটি নতুনদের জন্য একটি চমৎকার গাইড হিসেবে কাজ করবে। লিংক: https://www.youtube.com/watch?v=5Uc_m9CRWro

[

Data Science & Machine Learning Project - Part 5 Training a Model | Image Classification

codebasics · 58K views

](http://www.youtube.com/watch?v=5Uc_m9CRWro)

মন্তব্যসমূহ

এই ব্লগটি থেকে জনপ্রিয় পোস্টগুলি

সিজ্জিন (Sijjin) vs ইল্লিয়িন (Illiyin) পার্থক্য Difference

Sijjin (سِجِّين) এবং Illiyin (عِلِّيِّين) —এ দুটি শব্দ কুরআনে এসেছে এবং দুটোই মানুষের আমলনামা সংরক্ষণ সম্পর্কিত স্থানকে নির্দেশ করে। ১. সিজ্জিন (Sijjin) সিজ্জিন হলো পাপীদের (কাফের, মুনাফিক ও দুরাচারীদের) আমলনামা সংরক্ষণের স্থান। এটি সাত তলদেশের নীচে এক কারাগার বা অন্ধকার জগতে অবস্থিত বলে উল্লেখ রয়েছে। সূরা আল-মুতাফফিফীন (৮৩:৭-৯) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْفُجَّارِ لَفِي سِجِّينٍ ۝ وَمَا أَدْرَاكَ مَا سِجِّينٌ ۝ كِتَابٌ مَرْقُومٌ" অর্থ: "না, পাপীদের আমলনামা সিজ্জিনে সংরক্ষিত। তুমি কি জানো, সিজ্জিন কী? এটি এক লিখিত দলিল।" সিজ্জিনকে একটি কারাগার, সংকীর্ণ স্থান, বা নিচের স্তরে অবস্থিত এক অন্ধকার দুনিয়া হিসেবে ব্যাখ্যা করা হয়। ২. ইল্লিয়িন (Illiyin) ইল্লিয়িন হলো সৎকর্মশীলদের (মুমিন ও নেককারদের) আমলনামা সংরক্ষণের স্থান । এটি সপ্তম আসমানের ওপরে সংরক্ষিত এক সম্মানিত স্থান। সূরা আল-মুতাফফিফীন (৮৩:১৮-২১) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْأَبْرَارِ لَفِي عِلِّيِّينَ ۝ وَمَا أَدْرَاكَ مَا عِلِّيُّونَ ۝ كِتَابٌ مَرْقُومٌ ۝ يَش...

তারাবিহ সমগ্র - প্রথম আলো

রামাদান ২০২৪ উপলক্ষে প্রথম আলোর নিয়মিত আয়োজন - খতমে তারাবিহ'র সূরা গুলো নিয়ে সংক্ষিপ্ত আলোচনা'র লিংক  নিচে দেওয়া হলো।  লিংকে ক্লিক করলেই আপনাকে আলোচনা তে নিয়ে যাবে। তারাবিহ: ১ | একটি খুন ও গাভি নিয়ে বনি ইসরাইলের বাড়াবাড়ি তারাবিহ: ২ | নারীর মর্যাদা ও অধিকার এবং অলৌকিক তিন ঘটনা তারাবিহ: ৩ | যে ১৪ নারীকে বিয়ে করা হারাম তারাবিতে: ১২ | মহানবী (সা.)–এর আকাশভ্রমণ এবং আসহাবে কাহাফের কাহিনি

রেডমি নোট ৯ এর বিস্তারিত | Redmi Note 9 in Bangla

৩০ এপ্রিল, ২০২০ এ শাওমির ঘোষনা আসে এই ফোনটি নিয়ে। কিন্তু ফোনটি মার্কেটে আসে মে মাসের শেষের দিকে৷ করোনার কারনে ফোনটি বাংলাদেশে আসতে আরো সময় নেয়। বর্তমানে বাংলাদেশে আন অফিশিয়াল ভাবে ফোনটি পাওয়া যাচ্ছে৷ বাংলাদেশে অফিশিয়াল ভাবে এখনো ফোনটি আসার তথ্য নেয়৷ চলুন ফোনটি নিয়ে বিস্তারিত আলোচনা করা যাক। শাওমি নোট সিরিজের ফোন বের করে এদের রেডমি নামে সাব ব্যান্ড৷ এদের কাজ হল এই নোট সিরিজ নিয়ে কাজ করা৷ প্রতিবছর নোট সিরিজের ১/২ টা ফোন বাজারে আসে। সাথে সেই ফোন গুলার বিভিন্ন ভার্সন (যেমন - র‍্যাম ও রমের ভিত্তিতে) বাজারে আসে। এই বছরও তারা রেডমি সিরিজের নোট ৯ বাজারে আনে। এই বছর হয়তো এই সিরিজের আরো ফোন বাজারে আসবে। ডিস্পলেঃ ফোনটির ডিসপ্লে সাইজ ৬.৫৩ ইঞ্চি। এতে আইপিএস এলসিডি ডিসপ্লে ব্যবহার করা হয়েছে। এই ফোনের ডিসপ্লে প্রটেকশন হিসেবে আছে গরিলা গ্লাস ফাইভ। স্ক্রিন আর ফোনের বডির অনুপাত প্রায় ৮৩.৫%। এই ফোনের ডিসপ্লে ফুলএইচডি মানে ১০৮০পি। এই ডিস্পলের দৈর্ঘ্য ১৯.৫ একক এবং প্রস্থ হল ৯ একক। এত বড় ফোনের কারনে এই ফোনের পিপি আই ডেনসিটি ৩৯৫। যা একটু কম। প্লাটফর্মঃ এই ফোনের অপারেটিং সিস্টেম এন্ড্রয়েড ১০ এবং এর...