আপনি ইন্টারনেটে প্রত্যেক মুহূর্ত সময় কাটাচ্ছেন, আপনার প্রত্যেকটি অ্যাকশনে ইন্টারনেট ডাটাবেজ আরো বৃহৎ থেকে বৃহত্তর হয়ে উঠছে। আজকের বিশ্বে যদি এটা প্রশ্ন করা হয়, সবচাইতে গুরুত্বপূর্ণ এবং মূল্যবান জিনিষ কি? — তবে এর উত্তর হবে ডাটা, ইনফরমেশন। আসলে তথ্যই টাকা, যতোবেশি তথ্য আপনার কাছে রয়েছে আপনার কোম্পানিকে ততোবেশি সফল করতে পাড়বেন। আর এই কৌশল কাজে লাগিয়েই আজ অনেক কোম্পানি কোটি ডলার উপার্জন করছে। এমন কি বড় বড় কোম্পানিরা তো ডাটা সায়েন্টিস্ট হায়ার করে রেখে দিয়েছে। এখন প্রশ্ন হচ্ছে, আমরা জানি, ডাটা অনেক মূল্যবান জিনিষ, কিন্তু একে কাজে লাগিয়ে কিভাবে কোম্পানি অগুনতি প্রফিট ইনকাম করে? এই আর্টিকেল দিয়ে ডাটা মাইনিং এর সকল বেসিক বিষয় গুলো বর্ণিত করবো, যাতে আপনি সহজেই সম্পূর্ণ বিষয়টি উপলব্ধি করতে পারেন।
ডাটা মাইনিং কি?
যদি ডাটা মেইনিং এর আসল ব্যাপার গুলোকে হুবহু বোঝার চেষ্টা করেন, সেটা অনেক ক্রিটিক্যাল ব্যাপার। কেনোনা এটি ডাটা সায়েন্সের সাথে সম্পর্ক যুক্ত, আর সায়েন্সের টার্ম গুলো বোরিং হয়ে থাকে, সেটা সবাই জানেন। যদি সহজ ভাষায় উপস্থাপনা করি, ডাটা মাইনিং আসলে বিশাল পরিমানে ডাটা অ্যানালাইসিস এবং ডিস্কভার করার পদ্ধতি। যেখানে আপনার ডাটা উপর ভিত্তি করে এবং আপনার ইন্টারেস্ট হিসেবে সকল প্যাটার্ন মিলিয়ে আপনি কি পছন্দ করেন বা করতে পারেন সেটা আবিষ্কার করা হয়। ডাটা মাইনিং করার সময় ইউজার ইনফরমেশন, পরিসংখ্যান, মেশিন লার্নিং, আর্টিফিশিয়াল ইন্টেলিজেন্স, নিউরাল নেটওয়ার্ক, এবং বিশাল পরিমানে ডাটা প্রয়োজন হয়।
ডাটা মাইনিং টেক অনেকটা মানুষের মস্তিষ্কের মতো কাজ করে, আর এই জন্যই এমএল, এআই সমস্তকিছু এর মধ্যে জড়িত রয়েছে। ডাটা মাইনিং এর দুইটি প্রধান উদ্দেশ্য রয়েছে; প্রথমত এটি ডাটাকে বিশ্লেষণ করে সবকিছু নিরিক্ষা করে দ্যাখে, তারপরে সেই গবেষণার উপর ভিত্তি করে ভবিষ্যদ্বাণী করা হয়।
চলুন, বহুত পুস্তকের কথা প্রয়োগ হয়ে গেছে, আমি জানি আপনি এখানে সহজে বোঝার জন্য এসেছেন। তো ব্যস্তব আর সহজ উদাহরণ দিয়ে বিষয়টিকে পরিষ্কার করা যাক। মনে করুণ, আপনি কোন শপিং ওয়েবসাইটে গেছেন টেকনোলজি বই কেনার জন্য। এখন আপনি কিছু বই ব্রাউজ করলেন এবং হয়তো কিনে বা না কিনে সাইট থেকে ফেরত আসলেন। ঐ ওয়েবসাইটের ডাটা মাইনিং সার্ভিস আপনার ব্রাউজ তথ্য গুলো মাইন করে রাখবে। আপনার প্রোফাইলের সাথে সেটিকে যুক্ত করে দেবে। যখন পরবর্তী সময় আপনি আবার ঐ ওয়েব সাইটে যাবেন, ওয়েবসাইট থেকে আপনাকে অনেক টেক রিলেটেড বই স্বয়ংক্রিয়ভাবে সাজেস্ট করা হবে, আপনি হয়তো ভাবছেন, কিভাবে আপনার মনে করা জানলো ঐ ওয়েবসাইট! আসলে আপনার যেকোনো ব্রাউজিং ইন্টারেস্টকে তারা রেকর্ড করে রাখে এবং সেগুলো অ্যানালাইসিস করে আপনাকে রেকমেন্ড প্রোডাক্ট দেখানো হয়।
এভাবেই দুনিয়ার যতোবড় কোম্পানি রয়েছে, ইউজার ডাটা কালেক্ট করে বা আপনাকে কোনভাবে ট্র্যাক করে আপনার সম্পর্কে অনেক কিছু জ্ঞান লাভ করে। আপনি হয়তো খেয়াল করে দেখবেন, কোন শপিং সাইটে যাবেন কিছু কেনার জন্য তারপরে না কিনে ফেরত আসবেন, এর পরে দেখবেন ফেসবুকে ঐ প্রোডাক্টেরই অ্যাডস শো করছে, এমনকি গুগলও এভাবে অ্যাডস প্রদান করে থাকে। আপনার ইন্টারনেট সার্চ হিস্টোরি, আপনার কুকিজ, আপনার লোকেশন সবকিছু ট্র্যাক করা হয়, রেকর্ড করা হয়।
ডাটা মাইনিং কিভাবে কাজ করে?
বুঝতেই পাড়ছেন, এই টেকনিক পরিচালনা করতে সবচাইতে বড় জ্বালানী হচ্ছে আপনার পার্সোনাল সকল ইউজার ডাটা। আর গুগল বলেন কিংবা ফেসবুক, সবাই আপনার ডাটা গুলোকে প্রতিনিয়ত রেকর্ড করেই যাচ্ছে। আপনি হয়তো ফোনের লোকেশন অন করে কোথাও কোন কফি শপে কফি খেতে গেছেন, পরের দিন দেখবেন গুগল আপনাকে ঐ কফি শপের অ্যাডস দেখাচ্ছে, আপনি ওয়্যারবিডি ওপেন করে পড়তে বসবেন, কিন্তু দেখবেন ঐ অ্যাডসই শো করছে। আপনি হয়তো অনেক দামী ঘড়ি পড়তে ভালোবাসেন, ইউটিউব ভিডিও দেখেন ঘড়ি সম্পর্কে, তো গুগল আপনার সার্চ ইন্টারেস্ট সেভ করে রাখে যখন আপনি কোন শপিং সাইট যাবেন, আপনার পছন্দের ঘড়িই আপনার সামনে চলে আসবে। বুঝলেন তো, কিভাবে এই বড় কোম্পানি গুলো আপনার থেকেও আপনার সম্পর্কে বেশি কিছু জানে!
ডাটা মাইনিং বিশেষ করে কোন নির্দিষ্ট অ্যালগরিদমের উপর কাজ করে। এখানে ডাটার উপর ভিত্তি করে কম্পিউটারকে আদেশ দেওয়া হয় সে কিভাবে প্যাটার্ন গুলো কালেক্ট করে কি ধরণের রেকমেন্ড প্রদান করবে। আপনি হয়তো আজ কিছু একটি পারচেজ করলেন, কিন্তু ডাটা মাইনিং প্রোগ্রাম আগে থেকেই বুঝে ফেলতে পারবে আপনি ফিউচারে আরো কোন প্রোডাক্ট পারচেস করতে পারেন, বা আপনার চাহিদা কি রকম হতে পারে।
উদাহরণ স্বরূপ উপরে যেটা বর্ণিত করেছি, যে ফেসবুক বা গুগল আপনাকে সে অনুসারে অ্যাড প্রদর্শিত করে, যে সাইট গুলো আপনি ভিজিট করেন। ফেসবুক ডাটা মাইনিং প্রোগ্রাম আপনার ব্রাউজার কুকিজে বসে থেকে আপনার সকল অ্যাক্টিভিটি গুলোর উপর স্প্যাইং করে। আর পছন্দ অনুসারে তারপরে আপনাকে বিভিন্ন প্রোডাক্ট অ্যাডস প্রদর্শিত করে, এভাবে আপনার কাছে সঠিক অ্যাডস পৌঁছে যায় এবং আপনি সেটাকে পারচেস করবেন তার সম্ভবনা ও অনেক বেড়ে যায়। দুনিয়ার বড় বড় ই-কমার্স সাইট গুলো এই প্রিন্সিপ্যাল কাজে লাগিয়েই আজ অগুনতি টাকা আর আকাশ ছোঁয়া উন্নতি লাভ করছে।
কোন টাইপের ডাটা গুলোকে মাইনিং করা হয়?
অবশ্যই বুঝে গেছেন ইন্টারনেটে আপনি যা ই করুণ না কেন সমস্ত কিছু ডাটা রেকর্ড রাখা হয় এবং মাইনিং প্রসেসের মধ্যে জুড়ে দেওয়ার হয়। বেশিরভাগ ওয়েবসাইট ব্রাউজার কুকিজ ব্যবহার করে আপনাকে ট্র্যাক করে। বড় বড় ওয়েবসাইট আপনার ফিজিক্যাল লোকেশন, সার্চ হিস্টোরি, প্রোডাক্ট ইন্টারেস্ট, আপনার সাইন-আপ ডিটেইলস, ক্রেডিট কার্ড ইনফরমেশন ইত্যাদি ট্র্যাক করে ডাটা মাইনিং অপারেশন চালিয়ে থাকে।
শুধু যে অনলাইন, তা কিন্তু নয়, অফলাইন বা লোকাল বিজনেসের ক্ষেত্রেও ডাটা মাইনিং করা যেতে পারে। আপনার সমস্ত ব্যক্তিগত বিষয়ের উপর ঘোঁচর লাগিয়ে রাখা হয়। আপনি কোন ব্র্যান্ড কাপড় চোপড় পড়েন, কোন কোম্পানির কার বা ফোন বা বাইক ব্যবহার করেন। আপনার পরিবারের সদস্য কতোজন, আপনি কোন পত্রিকা বা ম্যাগাজিন পড়েন, আপনি কোন রাজনৈতিক দল সমর্থন করেন, আপনার পছন্দের ব্র্যান্ড গুলো কি কি, আপনি কোন কোন জায়গায় ট্র্যাভেল করেন, আপনি কোন হোটেলে চেকইন করছেন — সমস্ত কিছু ট্র্যাক করা হয়।
অনেক কোম্পানি রয়েছে, বিশেষ করে অনেক ফ্যাশন ব্র্যান্ড আপনার ফেসবুক বা ইন্সট্যাগ্রাম ফটো অনুসরণ করে আপনাকে ট্র্যাক করে, তারা বুঝে নেয় আপনি কোন টাইপের কাপড় পড়তে পছন্দ করেন, সহজেই তারা আপনাকে আপনার পছন্দের কাপড় দেখিয়ে দিতে পারে এতে প্রোডাক্ট সেল হওয়ার সুযোগ ৮০% বেড়ে যায়, কেনোনা তারা আপনার পছন্দ বোঝে, হয়তো আপনি নিজেই জানেন না আপনি কি পছন্দ করেন, ব্যাট তারা সেটা কম্পিউটারের মাধ্যমে আগে থেকেই নির্ণয় করে রাখে।
বর্তমানে প্রত্যেক জায়গায় ডাটা মাইনিং রয়েছে, কোন প্রতিষ্ঠান বা কোম্পানি যতো বড় ইউজার ইনফরমেশন ডাটাবেজ তৈরি করতে পারবে, ডাটা মাইনিং টেকনিক ব্যবহার করে কাস্টমারদের ততো উন্নত সেবা প্রদান করতে সক্ষম হবে।
যদিও এই সম্পূর্ণ টপিক এতো সহজ কোন ব্যাপার না, যতো সহজে আমি এই আর্টিকেলে বর্ণিত করেছি, কিন্তু এটিই চরম সত্য, আজকের বড় বড় কোম্পানিরা অধিক সেল আর আপনাকে উন্নত সেবা প্রদানের পেছনের মূলমন্ত্র হচ্ছে এই ডাটা মাইনিং! আর শুধু বিজনেস নয়, সরকারও ডাটা মাইনিং টেকনিক ব্যবহার করে।
Images: Shutterstock.com