Naive Bayes Algorithm – সম্ভবনার গাণিতিক যাদু দিয়ে ক্লাসিফিকেশন

Naive Bayes Algorithm - সম্ভাবনার গাণিতিক যাদু দিয়ে ক্লাসিফিকেশন

ধরুন, আপনার ইনবক্সে অনেক ইমেইল আসে। কিছু স্প্যাম, কিছু গুরুত্বপূর্ণ। কীভাবে আপনি একটি নতুন ইমেইল দেখে বলবেন এটি স্প্যাম কিনা? এখানেই আসে Naive Bayes Algorithm – যা সম্ভবনার সাহায্যে বলে দেয় কোন ক্লাসে কোন ডেটা পড়বে!

💡 Naive Bayes হলো একটি supervised machine learning classification algorithm যা Bayes Theorem ব্যবহার করে এবং ধরে নেয় প্রতিটি ফিচার একে অপরের থেকে স্বাধীন (naive assumption)।

🎯 বাস্তব উদাহরণ: ইমেইল স্প্যাম ডিটেকশন

আমরা একটি সিম্পল ডেটাসেট দিয়ে বুঝব কিভাবে ইমেইল-এর শব্দ দেখে বলে দেওয়া যায় সেটা স্প্যাম নাকি না।

🧪 কোড উদাহরণ (Python):

# Import necessary libraries
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import make_pipeline

# Training data
emails = ["Free money now!!!", 
          "Hi, how are you?", 
          "Earn dollars easily", 
          "Let's schedule a meeting", 
          "Win cash prizes", 
          "Project deadline extended"]

labels = [1, 0, 1, 0, 1, 0]  # 1 = Spam, 0 = Not spam

# Create a model pipeline
model = make_pipeline(CountVectorizer(), MultinomialNB())
model.fit(emails, labels)

# Test the model
test_email = ["Congratulations, you've won a free ticket!"]
prediction = model.predict(test_email)

print("📧 Is it spam?:", "Yes" if prediction[0] == 1 else "No")

🔎 বুঝে নিন Naive Bayes এর পেছনের ম্যাজিক:

  • 📊 এটি প্রতিটি ফিচারের সম্ভাবনা হিসেব করে
  • 🧮 Bayes’ Theorem: P(A|B) = P(B|A) * P(A) / P(B)
  • 🧠 উদাহরণ: “Free”, “money” বা “win” – এই শব্দগুলো স্প্যাম ইমেইলে বেশি থাকে, তাই মডেল এদের গুরুত্ব দেয়
🎯 Naive Bayes কোথায় ব্যবহার হয়?
- ইমেইল স্প্যাম ফিল্টারিং
- টেক্সট ক্লাসিফিকেশন (পজিটিভ/নেগেটিভ রিভিউ)
- ম্যালওয়্যার ডিটেকশন
- মেডিকেল ডায়াগনোসিস

📘 শেখার সারাংশ:

Naive Bayes অত্যন্ত দ্রুত ও হালকা অ্যালগরিদম যা বড় টেক্সট ডেটা ক্লাসিফিকেশনে খুবই কার্যকরী। যদিও এটি কিছু সাধারণ অনুমান করে, তবুও ফলাফল বেশ ভালো দেয়।

📅 পরবর্তী পর্ব:

আমরা শিখবো Decision Tree অ্যালগরিদম যা “হ্যাঁ” ও “না” দিয়ে ডেটা বুঝতে শেখে!


✍️ লেখক পরিচিতি

Amanul Islam একজন গবেষক ও প্রযুক্তি শিক্ষাবিদ, যিনি বর্তমানে University of Colorado at Colorado Springs-এ Security বিষয়ক PhD করছেন। তার গবেষণার মূল ক্ষেত্র Cybersecurity, Anomaly Detection, Cryptocurrency Threat AnalysisMachine Learning। তিনি বাংলাদেশের একজন প্রযুক্তি প্গবেষক, যিনি বাংলা ভাষায় সহজে প্রযুক্তি শিক্ষার জন্য কাজ করছেন।

🌐 ICT Academy Bangladesh

📅 প্রকাশের তারিখ: ৫ জুন ২০২৫

একটি মন্তব্য পোস্ট করুন

0 মন্তব্যসমূহ