ধরুন, আপনার ইনবক্সে অনেক ইমেইল আসে। কিছু স্প্যাম, কিছু গুরুত্বপূর্ণ। কীভাবে আপনি একটি নতুন ইমেইল দেখে বলবেন এটি স্প্যাম কিনা? এখানেই আসে Naive Bayes Algorithm – যা সম্ভবনার সাহায্যে বলে দেয় কোন ক্লাসে কোন ডেটা পড়বে!
🎯 বাস্তব উদাহরণ: ইমেইল স্প্যাম ডিটেকশন
আমরা একটি সিম্পল ডেটাসেট দিয়ে বুঝব কিভাবে ইমেইল-এর শব্দ দেখে বলে দেওয়া যায় সেটা স্প্যাম নাকি না।
🧪 কোড উদাহরণ (Python):
# Import necessary libraries
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import make_pipeline
# Training data
emails = ["Free money now!!!",
"Hi, how are you?",
"Earn dollars easily",
"Let's schedule a meeting",
"Win cash prizes",
"Project deadline extended"]
labels = [1, 0, 1, 0, 1, 0] # 1 = Spam, 0 = Not spam
# Create a model pipeline
model = make_pipeline(CountVectorizer(), MultinomialNB())
model.fit(emails, labels)
# Test the model
test_email = ["Congratulations, you've won a free ticket!"]
prediction = model.predict(test_email)
print("📧 Is it spam?:", "Yes" if prediction[0] == 1 else "No")
🔎 বুঝে নিন Naive Bayes এর পেছনের ম্যাজিক:
- 📊 এটি প্রতিটি ফিচারের সম্ভাবনা হিসেব করে
- 🧮 Bayes’ Theorem:
P(A|B) = P(B|A) * P(A) / P(B) - 🧠 উদাহরণ: “Free”, “money” বা “win” – এই শব্দগুলো স্প্যাম ইমেইলে বেশি থাকে, তাই মডেল এদের গুরুত্ব দেয়
- ইমেইল স্প্যাম ফিল্টারিং
- টেক্সট ক্লাসিফিকেশন (পজিটিভ/নেগেটিভ রিভিউ)
- ম্যালওয়্যার ডিটেকশন
- মেডিকেল ডায়াগনোসিস
📘 শেখার সারাংশ:
Naive Bayes অত্যন্ত দ্রুত ও হালকা অ্যালগরিদম যা বড় টেক্সট ডেটা ক্লাসিফিকেশনে খুবই কার্যকরী। যদিও এটি কিছু সাধারণ অনুমান করে, তবুও ফলাফল বেশ ভালো দেয়।
📅 পরবর্তী পর্ব:
আমরা শিখবো Decision Tree অ্যালগরিদম যা “হ্যাঁ” ও “না” দিয়ে ডেটা বুঝতে শেখে!
✍️ লেখক পরিচিতি
Amanul Islam একজন গবেষক ও প্রযুক্তি শিক্ষাবিদ, যিনি বর্তমানে University of Colorado at Colorado Springs-এ Security বিষয়ক PhD করছেন। তার গবেষণার মূল ক্ষেত্র Cybersecurity, Anomaly Detection, Cryptocurrency Threat Analysis ও Machine Learning। তিনি বাংলাদেশের একজন প্রযুক্তি প্গবেষক, যিনি বাংলা ভাষায় সহজে প্রযুক্তি শিক্ষার জন্য কাজ করছেন।
📅 প্রকাশের তারিখ: ৫ জুন ২০২৫




0 মন্তব্যসমূহ