সরাসরি প্রধান সামগ্রীতে চলে যান

মেশিন লার্নিংয়ের জন্য ছবির ডেটা পরিষ্কার করার উপায়

ভূমিকা

মেশিন লার্নিং বা কৃত্রিম বুদ্ধিমত্তা দিয়ে কোনো কিছু শেখাতে হলে আমাদের প্রচুর ডেটা বা তথ্যের প্রয়োজন হয়। এই ভিডিওতে দেখানো হয়েছে কীভাবে ইন্টারনেট থেকে ডাউনলোড করা ছবিগুলোকে সাজাতে হয় যাতে সেগুলোকে মডেল প্রশিক্ষণের (training) জন্য ব্যবহার করা যায়। সহজ কথায়, খারাপ বা অস্পষ্ট ছবিগুলো বাদ দিয়ে শুধুমাত্র পরিষ্কার ছবিগুলো বেছে নেওয়াই হলো এই প্রক্রিয়ার মূল লক্ষ্য।


ছবির ডেটা কেন এবং কীভাবে পরিষ্কার করবেন?

ভিডিও রেফারেন্স: Data Science & Machine Learning Project - Part 3 Data Cleaning

মেশিন লার্নিং মডেল তখনই ভালো কাজ করে যখন তাকে সঠিক এবং পরিষ্কার তথ্য দেওয়া হয়। যদি মডেলকে ভুলভাল ছবি দেওয়া হয়, তাহলে সে ভুল শিখবে।

এখানে আমরা যা করছি: আমরা এখানে মূলত মানুষের মুখ শনাক্ত করার চেষ্টা করছি। এর জন্য আমরা OpenCV (ওপেনসিভি) লাইব্রেরি ব্যবহার করছি। এটি একটি জনপ্রিয় টুল যা দিয়ে কম্পিউটার ছবি বা ভিডিওর ভেতরে মানুষের মুখ বা চোখ খুঁজে বের করতে পারে।

কঠিন শব্দের সহজ ব্যাখ্যা:

  • Classifier (ক্লাসিফায়ার): সহজ ভাষায়, এটি একটি ডিজিটাল 'বাছাইকারী'। যেমন, একটি বক্সের ভেতর আপেল আর কমলা আছে, ক্লাসিফায়ার হলো সেই মেশিন যা আপেলগুলোকে একপাশে আর কমলাগুলোকে অন্যপাশে আলাদা করে দেয়।

  • Haar Cascades (হার ক্যাসকেড): এটি ওপেনসিভির একটি বিশেষ টেকনিক বা পদ্ধতি যা ছবি থেকে খুব দ্রুত মানুষের মুখ বা অবজেক্ট খুঁজে বের করতে পারে।

  • Data Cleaning (ডেটা ক্লিনিং): অপ্রয়োজনীয় বা ভুল তথ্য বাদ দিয়ে সঠিক তথ্যগুলো আলাদা করার প্রক্রিয়া।


কোডিং এবং বাস্তবায়ন

ছবিতে মানুষের চোখ ও মুখ আছে কি না তা যাচাই করার জন্য পাইথন কোড ব্যবহার করা হয়েছে।

Python

import cv2
import os

# হার ক্যাসকেড ফাইল লোড করা হচ্ছে যা মুখ শনাক্ত করবে
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
eye_cascade = cv2.CascadeClassifier('haarcascade_eye.xml')

# ছবি পড়ার কোড
img = cv2.imread('image_path.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # রঙিন ছবিকে সাদা-কালো করা হচ্ছে দ্রুত প্রসেসিংয়ের জন্য

# মুখ শনাক্ত করা
faces = face_cascade.detectMultiScale(gray, 1.3, 5)

# যদি মুখ এবং চোখ পাওয়া যায় তবেই ছবিটি রাখা হবে
for (x,y,w,h) in faces:
    roi_gray = gray[y:h, x:w]
    eyes = eye_cascade.detectMultiScale(roi_gray)
    if len(eyes) >= 2:
        print("ছবিটি সঠিক") 

কোড ব্যাখ্যা: ১. প্রথমে আমরা ছবিটিকে সাদা-কালো (Grayscale) করে নিচ্ছি, কারণ এতে কম্পিউটার দ্রুত মুখ চিনতে পারে। ২. এরপর detectMultiScale ব্যবহার করে ছবির ভেতর মুখ খুঁজি। ৩. শেষে চেক করি ছবিতে অন্তত দুটি চোখ আছে কি না। যদি থাকে, তবেই আমরা ছবিটি রাখছি, নাহলে সেটি মুছে ফেলছি।


আমার বিশ্লেষণ এবং পরামর্শ

এই ভিডিওটি একজন ডেটা সায়েন্টিস্টের জন্য খুবই জরুরি কারণ মডেল তৈরির ৮০% সময় নষ্ট হয় ডেটা ঠিকঠাক করতে। কনটেন্ট ক্রিয়েটর এখানে খুব সুন্দরভাবে বুঝিয়েছেন যে কীভাবে অটোমেশনের মাধ্যমে হাজার হাজার ছবি থেকে সেরাগুলো বেছে নেওয়া যায়।

বাস্তবতা ও পরামর্শ:

  • অটোমেশনের সীমাবদ্ধতা: সবসময় কোড দিয়ে সব কাজ হয় না। কিছু ছবি ম্যানুয়ালি বা হাতে চেক করা ভালো।

  • বিকল্প উপায়: আজকের দিনে Deep Learning এর মডেলগুলো (যেমন: CNN) ব্যবহার করলে আরও নিখুঁতভাবে ছবি যাচাই করা যায়। ওপেনসিভি একটু পুরনো পদ্ধতি হলেও এটি শেখার জন্য সেরা।

  • পরামর্শ: যদি আপনার ছবির পরিমাণ অনেক বেশি হয়, তবে শুধুমাত্র মুখ চেনার ওপর নির্ভর না করে ছবির কোয়ালিটি বা রেজোলিউশন চেক করার আলাদা কোনো কোড লিখে নিতে পারেন।

এই পদ্ধতিটি মেনে চললে আপনার মেশিন লার্নিং মডেলের নির্ভুলতা (accuracy) অনেক বেড়ে যাবে।

[

0 views

](http://www.youtube.com/watch?v=kwKfWBb6fr0)

[

Data Science & Machine Learning Project - Part 3 Data Cleaning | Image Classification

codebasics · 149K views

](https://www.youtube.com/watch?v=kwKfWBb6frs)

মন্তব্যসমূহ

এই ব্লগটি থেকে জনপ্রিয় পোস্টগুলি

সিজ্জিন (Sijjin) vs ইল্লিয়িন (Illiyin) পার্থক্য Difference

Sijjin (سِجِّين) এবং Illiyin (عِلِّيِّين) —এ দুটি শব্দ কুরআনে এসেছে এবং দুটোই মানুষের আমলনামা সংরক্ষণ সম্পর্কিত স্থানকে নির্দেশ করে। ১. সিজ্জিন (Sijjin) সিজ্জিন হলো পাপীদের (কাফের, মুনাফিক ও দুরাচারীদের) আমলনামা সংরক্ষণের স্থান। এটি সাত তলদেশের নীচে এক কারাগার বা অন্ধকার জগতে অবস্থিত বলে উল্লেখ রয়েছে। সূরা আল-মুতাফফিফীন (৮৩:৭-৯) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْفُجَّارِ لَفِي سِجِّينٍ ۝ وَمَا أَدْرَاكَ مَا سِجِّينٌ ۝ كِتَابٌ مَرْقُومٌ" অর্থ: "না, পাপীদের আমলনামা সিজ্জিনে সংরক্ষিত। তুমি কি জানো, সিজ্জিন কী? এটি এক লিখিত দলিল।" সিজ্জিনকে একটি কারাগার, সংকীর্ণ স্থান, বা নিচের স্তরে অবস্থিত এক অন্ধকার দুনিয়া হিসেবে ব্যাখ্যা করা হয়। ২. ইল্লিয়িন (Illiyin) ইল্লিয়িন হলো সৎকর্মশীলদের (মুমিন ও নেককারদের) আমলনামা সংরক্ষণের স্থান । এটি সপ্তম আসমানের ওপরে সংরক্ষিত এক সম্মানিত স্থান। সূরা আল-মুতাফফিফীন (৮৩:১৮-২১) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْأَبْرَارِ لَفِي عِلِّيِّينَ ۝ وَمَا أَدْرَاكَ مَا عِلِّيُّونَ ۝ كِتَابٌ مَرْقُومٌ ۝ يَش...

তারাবিহ সমগ্র - প্রথম আলো

রামাদান ২০২৪ উপলক্ষে প্রথম আলোর নিয়মিত আয়োজন - খতমে তারাবিহ'র সূরা গুলো নিয়ে সংক্ষিপ্ত আলোচনা'র লিংক  নিচে দেওয়া হলো।  লিংকে ক্লিক করলেই আপনাকে আলোচনা তে নিয়ে যাবে। তারাবিহ: ১ | একটি খুন ও গাভি নিয়ে বনি ইসরাইলের বাড়াবাড়ি তারাবিহ: ২ | নারীর মর্যাদা ও অধিকার এবং অলৌকিক তিন ঘটনা তারাবিহ: ৩ | যে ১৪ নারীকে বিয়ে করা হারাম তারাবিতে: ১২ | মহানবী (সা.)–এর আকাশভ্রমণ এবং আসহাবে কাহাফের কাহিনি

রেডমি নোট ৯ এর বিস্তারিত | Redmi Note 9 in Bangla

৩০ এপ্রিল, ২০২০ এ শাওমির ঘোষনা আসে এই ফোনটি নিয়ে। কিন্তু ফোনটি মার্কেটে আসে মে মাসের শেষের দিকে৷ করোনার কারনে ফোনটি বাংলাদেশে আসতে আরো সময় নেয়। বর্তমানে বাংলাদেশে আন অফিশিয়াল ভাবে ফোনটি পাওয়া যাচ্ছে৷ বাংলাদেশে অফিশিয়াল ভাবে এখনো ফোনটি আসার তথ্য নেয়৷ চলুন ফোনটি নিয়ে বিস্তারিত আলোচনা করা যাক। শাওমি নোট সিরিজের ফোন বের করে এদের রেডমি নামে সাব ব্যান্ড৷ এদের কাজ হল এই নোট সিরিজ নিয়ে কাজ করা৷ প্রতিবছর নোট সিরিজের ১/২ টা ফোন বাজারে আসে। সাথে সেই ফোন গুলার বিভিন্ন ভার্সন (যেমন - র‍্যাম ও রমের ভিত্তিতে) বাজারে আসে। এই বছরও তারা রেডমি সিরিজের নোট ৯ বাজারে আনে। এই বছর হয়তো এই সিরিজের আরো ফোন বাজারে আসবে। ডিস্পলেঃ ফোনটির ডিসপ্লে সাইজ ৬.৫৩ ইঞ্চি। এতে আইপিএস এলসিডি ডিসপ্লে ব্যবহার করা হয়েছে। এই ফোনের ডিসপ্লে প্রটেকশন হিসেবে আছে গরিলা গ্লাস ফাইভ। স্ক্রিন আর ফোনের বডির অনুপাত প্রায় ৮৩.৫%। এই ফোনের ডিসপ্লে ফুলএইচডি মানে ১০৮০পি। এই ডিস্পলের দৈর্ঘ্য ১৯.৫ একক এবং প্রস্থ হল ৯ একক। এত বড় ফোনের কারনে এই ফোনের পিপি আই ডেনসিটি ৩৯৫। যা একটু কম। প্লাটফর্মঃ এই ফোনের অপারেটিং সিস্টেম এন্ড্রয়েড ১০ এবং এর...