সরাসরি প্রধান সামগ্রীতে চলে যান

Pandas দিয়ে ডেটা অ্যানালাইসিসের সহজ পাঠ

Introduction: সবাইকে স্বাগতম! আজকের এই আলোচনায় আমরা শিখব পাইথনের সবথেকে জনপ্রিয় লাইব্রেরি Pandas সম্পর্কে। আপনি যদি ডেটা নিয়ে কাজ করতে চান, ডেটা থেকে দরকারি তথ্য বের করতে চান বা ডেটা সায়েন্স শিখতে চান, তবে Pandas আপনার জন্য সবথেকে শক্তিশালী হাতিয়ার। এই ভিডিওর নির্দিষ্ট অংশে দেখানো হয়েছে কীভাবে এই টুলটি ব্যবহার করে বিশাল ডেটাসেট সহজে হ্যান্ডেল করা যায়।

Pandas-এর মূল ধারণা (Understanding Pandas) Python Essentials for AI Agents

Pandas হলো পাইথনের এমন একটি লাইব্রেরি যা ডেটা ম্যানিপুলেশন এবং অ্যানালাইসিসের জন্য ব্যবহৃত হয়। সহজ কথায়, আমরা এক্সেলে (Excel) যেভাবে সারি (row) এবং কলাম (column) আকারে ডেটা সাজিয়ে কাজ করি, Pandas ঠিক সেই কাজটাই কোডিংয়ের মাধ্যমে আরও বড় পরিসরে করতে সাহায্য করে।

কিছু গুরুত্বপূর্ণ শব্দ:

  • Library (লাইব্রেরি): এটি আগে থেকে লিখে রাখা কোডের সংগ্রহ, যা আমাদের জটিল কাজগুলো সহজে করতে সাহায্য করে।

  • Data Manipulation (ডেটা ম্যানিপুলেশন): ডেটাকে নিজের প্রয়োজন অনুযায়ী পরিবর্তন বা সাজানো।

ডেটাসেট বোঝা (Understanding the Dataset) Python Essentials for AI Agents

ভিডিওর এই অংশে দেখানো হয়েছে কীভাবে একটি ডেটাসেট লোড করতে হয় এবং সেটি দেখতে কেমন। সাধারণত আমরা .csv ফাইল নিয়ে বেশি কাজ করি। Pandas-এ DataFrame নামক একটি অবজেক্ট থাকে যা অনেকটা টেবিলের মতো।

আমার ভাবনা: ডেটাসেট লোড করার পর প্রথম কাজ হলো সেটি একপলক দেখে নেওয়া। এতে বোঝা যায় ডেটাতে কী কী কলাম আছে এবং কোথাও কোনো তথ্য ভুল আছে কি না।

কোডিং উদাহরণ (Hands-on Coding)

Pandas ব্যবহার করতে হলে প্রথমে এটি ইনসটল এবং ইমপোর্ট করতে হয়। নিচে একটি সহজ উদাহরণ দেওয়া হলো:

Python

import pandas as pd

# একটি CSV ফাইল রিড করা বা লোড করা
df = pd.read_csv('your_data.csv')

# ডেটার প্রথম ৫টি সারি দেখা
print(df.head())

# ডেটার সংক্ষিপ্ত তথ্য জানা
print(df.info()) 

কোড ব্যাখ্যা:

  • import pandas as pd: এখানে আমরা Pandas-কে pd নামে ডাকছি যাতে বারবার বড় নাম লিখতে না হয়।

  • read_csv(): এই ফাংশনটি দিয়ে কম্পিউটার থেকে ডেটা ফাইলটি পড়া হয়।

  • head(): এটি দিয়ে আমরা টেবিলের শুরুর ৫টি সারি দেখতে পাই, যাতে ডেটার ধরন বোঝা যায়।

  • info(): এটি আমাদের বলে দেয় ডেটাতে কয়টি সারি আছে এবং কোনো কলামে কোনো তথ্য ফাঁকা (null) আছে কি না।

একটি কঠিন শব্দের সহজ ব্যাখ্যা:

  • CSV: এর পূর্ণরূপ হলো Comma Separated Values। এটি এমন এক ধরণের টেক্সট ফাইল যেখানে তথ্যগুলো কমা দিয়ে আলাদা করা থাকে।

ভিডিওর মূল বক্তব্য ও বিশ্লেষণ

ভিডিওর এই অংশ থেকে ক্রিয়েটর আমাদের বোঝাতে চেয়েছেন যে, একজন AI বা ডেটা প্রফেশনাল হতে হলে ডেটা ক্লিন করা এবং তা বিশ্লেষণ করা শেখা আবশ্যিক।

বাস্তবতা ও পরামর্শ: বর্তমানে ডেটা হলো নতুন 'তেল'। আপনি যদি Pandas শিখতে পারেন, তবে আপনি যেকোনো ব্যবসার ডেটা এনালাইসিস করে তাদের সিদ্ধান্ত নিতে সাহায্য করতে পারবেন। বাস্তব জীবনে Pandas-এর বিকল্প হিসেবে 'Polars' বা 'Dask' এর মতো কিছু লাইব্রেরি আছে যেগুলো আরও দ্রুত কাজ করে, কিন্তু বিগিনার বা শুরুতে শেখার জন্য Pandas-এর কোনো তুলনা নেই কারণ এর অনলাইন কমিউনিটি অনেক বড়।

পরামর্শ: শুধু ভিডিও দেখে থেমে না থেকে নিজে ছোট ছোট এক্সেলে ডেটা তৈরি করে তা Pandas দিয়ে এনালাইসিস করার চেষ্টা করুন। এতে আপনার জড়তা কাটবে।

এই ভিডিওটি আপনাকে পান্ডাস লাইব্রেরি ব্যবহার করে ডেটা লোড করা এবং এর প্রাথমিক গঠন বুঝতে দারুণভাবে সাহায্য করবে। Python Essentials for AI Agents – Tutorial

[

Python Essentials for AI Agents – Tutorial

freeCodeCamp.org · 71K views

](http://www.youtube.com/watch?v=UsfpzxZNsPo)

[

Python Essentials for AI Agents – Tutorial - YouTube

freeCodeCamp.org · 71K views

](https://www.youtube.com/watch?v=UsfpzxZNsPo)

মন্তব্যসমূহ

এই ব্লগটি থেকে জনপ্রিয় পোস্টগুলি

সিজ্জিন (Sijjin) vs ইল্লিয়িন (Illiyin) পার্থক্য Difference

Sijjin (سِجِّين) এবং Illiyin (عِلِّيِّين) —এ দুটি শব্দ কুরআনে এসেছে এবং দুটোই মানুষের আমলনামা সংরক্ষণ সম্পর্কিত স্থানকে নির্দেশ করে। ১. সিজ্জিন (Sijjin) সিজ্জিন হলো পাপীদের (কাফের, মুনাফিক ও দুরাচারীদের) আমলনামা সংরক্ষণের স্থান। এটি সাত তলদেশের নীচে এক কারাগার বা অন্ধকার জগতে অবস্থিত বলে উল্লেখ রয়েছে। সূরা আল-মুতাফফিফীন (৮৩:৭-৯) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْفُجَّارِ لَفِي سِجِّينٍ ۝ وَمَا أَدْرَاكَ مَا سِجِّينٌ ۝ كِتَابٌ مَرْقُومٌ" অর্থ: "না, পাপীদের আমলনামা সিজ্জিনে সংরক্ষিত। তুমি কি জানো, সিজ্জিন কী? এটি এক লিখিত দলিল।" সিজ্জিনকে একটি কারাগার, সংকীর্ণ স্থান, বা নিচের স্তরে অবস্থিত এক অন্ধকার দুনিয়া হিসেবে ব্যাখ্যা করা হয়। ২. ইল্লিয়িন (Illiyin) ইল্লিয়িন হলো সৎকর্মশীলদের (মুমিন ও নেককারদের) আমলনামা সংরক্ষণের স্থান । এটি সপ্তম আসমানের ওপরে সংরক্ষিত এক সম্মানিত স্থান। সূরা আল-মুতাফফিফীন (৮৩:১৮-২১) তে বলা হয়েছে: "كَلَّا إِنَّ كِتَابَ الْأَبْرَارِ لَفِي عِلِّيِّينَ ۝ وَمَا أَدْرَاكَ مَا عِلِّيُّونَ ۝ كِتَابٌ مَرْقُومٌ ۝ يَش...

তারাবিহ সমগ্র - প্রথম আলো

রামাদান ২০২৪ উপলক্ষে প্রথম আলোর নিয়মিত আয়োজন - খতমে তারাবিহ'র সূরা গুলো নিয়ে সংক্ষিপ্ত আলোচনা'র লিংক  নিচে দেওয়া হলো।  লিংকে ক্লিক করলেই আপনাকে আলোচনা তে নিয়ে যাবে। তারাবিহ: ১ | একটি খুন ও গাভি নিয়ে বনি ইসরাইলের বাড়াবাড়ি তারাবিহ: ২ | নারীর মর্যাদা ও অধিকার এবং অলৌকিক তিন ঘটনা তারাবিহ: ৩ | যে ১৪ নারীকে বিয়ে করা হারাম তারাবিতে: ১২ | মহানবী (সা.)–এর আকাশভ্রমণ এবং আসহাবে কাহাফের কাহিনি

রেডমি নোট ৯ এর বিস্তারিত | Redmi Note 9 in Bangla

৩০ এপ্রিল, ২০২০ এ শাওমির ঘোষনা আসে এই ফোনটি নিয়ে। কিন্তু ফোনটি মার্কেটে আসে মে মাসের শেষের দিকে৷ করোনার কারনে ফোনটি বাংলাদেশে আসতে আরো সময় নেয়। বর্তমানে বাংলাদেশে আন অফিশিয়াল ভাবে ফোনটি পাওয়া যাচ্ছে৷ বাংলাদেশে অফিশিয়াল ভাবে এখনো ফোনটি আসার তথ্য নেয়৷ চলুন ফোনটি নিয়ে বিস্তারিত আলোচনা করা যাক। শাওমি নোট সিরিজের ফোন বের করে এদের রেডমি নামে সাব ব্যান্ড৷ এদের কাজ হল এই নোট সিরিজ নিয়ে কাজ করা৷ প্রতিবছর নোট সিরিজের ১/২ টা ফোন বাজারে আসে। সাথে সেই ফোন গুলার বিভিন্ন ভার্সন (যেমন - র‍্যাম ও রমের ভিত্তিতে) বাজারে আসে। এই বছরও তারা রেডমি সিরিজের নোট ৯ বাজারে আনে। এই বছর হয়তো এই সিরিজের আরো ফোন বাজারে আসবে। ডিস্পলেঃ ফোনটির ডিসপ্লে সাইজ ৬.৫৩ ইঞ্চি। এতে আইপিএস এলসিডি ডিসপ্লে ব্যবহার করা হয়েছে। এই ফোনের ডিসপ্লে প্রটেকশন হিসেবে আছে গরিলা গ্লাস ফাইভ। স্ক্রিন আর ফোনের বডির অনুপাত প্রায় ৮৩.৫%। এই ফোনের ডিসপ্লে ফুলএইচডি মানে ১০৮০পি। এই ডিস্পলের দৈর্ঘ্য ১৯.৫ একক এবং প্রস্থ হল ৯ একক। এত বড় ফোনের কারনে এই ফোনের পিপি আই ডেনসিটি ৩৯৫। যা একটু কম। প্লাটফর্মঃ এই ফোনের অপারেটিং সিস্টেম এন্ড্রয়েড ১০ এবং এর...