Introduction সহজ কথায় বলতে গেলে, Databricks হলো এমন একটি ক্লাউড প্ল্যাটফর্ম যা বিশাল পরিমাণ ডেটা জমা রাখা (Store), প্রসেস করা এবং বিশ্লেষণ করার কাজে ব্যবহৃত হয়। এটি মূলত Apache Spark নামক একটি শক্তিশালী প্রযুক্তির ওপর ভিত্তি করে তৈরি। আপনি যদি ডেটা সায়েন্স বা ডেটা ইঞ্জিনিয়ারিং নিয়ে কাজ করতে চান, তবে Databricks আপনার কাজকে অনেক সহজ করে দেয়। আজকের আলোচনায় আমরা জানবো কেন এটি এত জনপ্রিয় এবং এটি কিভাবে কাজ করে। ১. Apache Spark এবং Databricks-এর সম্পর্ক যেকোনো বড় ডেটা নিয়ে কাজ করতে গেলে একটি ইঞ্জিনের প্রয়োজন হয়, আর সেই ইঞ্জিনটি হলো Apache Spark। কিন্তু এই ইঞ্জিনটি একা চালানো বেশ কঠিন। রেফারেন্স: [ 00:05 ] ভিডিওতে বলা হয়েছে, Databricks মূলত Apache Spark-এর চারপাশেই তৈরি করা হয়েছে। বিস্তারিত আলোচনা: স্পার্ক (Spark) হলো একটি ওপেন-সোর্স সফটওয়্যার। এটি খুব দ্রুত ডেটা প্রসেস করতে পারে। কিন্তু সমস্যা হলো, এটিকে নিজের কম্পিউটারে বা সার্ভারে সেটআপ করা এবং মেইনটেইন করা অনেক ঝামেলার কাজ। Databricks এই সমস্যার সমাধান দেয়। তারা স্পার্কের স্রষ্টাদের দ্বারাই তৈরি, তাই স্পার্ক চালানোর জন্য এর চেয়ে...
Blog of SH
This blog has concept of some common and uncommon things. Knowledge sharing is the main motive of this blog.