AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণের বিষয়টা হলো, এটা স্লাইড ডেকে সবসময় নিখুঁত মনে হয়। পরিচ্ছন্ন ডায়াগ্রাম। তীর চিহ্ন। একটা তালা আইকন। তারপর আপনি যখন দেখবেন একই সিস্টেম একটা সস্তা ডিপফেক (deepfake) ধরতে পারছে না, তখন মনে হবে যেন কোনো লিটল লিগের (Little League) আউটফিল্ডার (outfielder) গোধূলিবেলায় সানগ্লাস (sunglasses) পরে খেলছে। এখানেই প্যারাডক্স (paradox): সত্যের জন্য প্রেক্ষাপট এবং উৎসের প্রমাণ লাগে; মিথ্যার শুধু ভাইরাল (viral) হওয়া দরকার।
চলুন, প্রথমে যেটা বলা দরকার সেটা সেরে ফেলি। আমরা এমন একটা জগতে বাস করছি, যেখানে যে কেউ একটা কণ্ঠস্বর তৈরি করতে পারে, একটা মুখচ্ছবি বানাতে পারে অথবা একটা নড়বড়ে দাবিকে একটা জেনারেটেড (generated) চার্ট (chart) এবং আত্মবিশ্বাসী ভঙ্গি দিয়ে ফুলিয়ে-ফাঁপিয়ে তুলতে পারে। আর AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণের সরঞ্জামগুলো? সেগুলোর উন্নতি হচ্ছে—ধীরে ধীরে, এলোমেলোভাবে, যেখানে অনেক বড় বড় শর্ত জুড়ে দেওয়া হচ্ছে—যেগুলোর মধ্যে দিয়ে নকল রোবোকলের (robocall) বোঝাই ট্রাক চালিয়ে দেওয়া যায়। যদি এটা শুনে হতাশাজনক মনে হয়, তবে তা নয়। এটাই আধুনিক ইন্টারনেটে (internet) বিশ্বাসের বাস্তব চিত্র।
এরপর যা বলা হবে তা হলো একটি সরল মাঠের নির্দেশিকা, যা সেইসব মানুষের জন্য লেখা হয়েছে, যারা প্রচারের জোয়ারের মধ্যে নিজেদের মাথা ঠান্ডা রাখতে চান: সাংবাদিক যারা ভিডিও যাচাই করতে চান, প্রোডাক্ট টিম (product team) যারা কন্টেন্টের (content) উৎস নিয়ে ভাবছেন, শিক্ষাবিদ যারা নকল প্রবন্ধ ঠেকাতে চান, অথবা সাধারণ মানুষ যারা কোনো ভুয়া খবরের মিলিয়নতম (millionth) রিটুইট (retweet) হতে চান না।
কেন AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণ একটি একক সমস্যা নয়
- এটা শুধু ডিপফেক (deepfake) নয়। এর মধ্যে আছে “শ্যালোফেক” (shallowfake) (কিছু অংশ সম্পাদনা করা), সিনথেটিক (synthetic) টেক্সট (text), AI (কৃত্রিম বুদ্ধিমত্তা) ইমেজ (image) মেশআপ (mashup) এবং ডেটা ভিজ্যুয়ালাইজেশন (data visualization), যা দেখতে প্রথমে বিশ্বাসযোগ্য মনে হলেও ভালোভাবে দেখলে বোঝা যায় y-অক্ষ শুরু হয়েছে ৯০ থেকে। “AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণ” শব্দটির আড়ালে অনেক রকমের সমস্যা লুকিয়ে আছে।
- এটা শুধু ক্লাসিফায়ার (classifier) নয়। মানুষ নির্ভুলতাকে এমনভাবে দেখে যেন এটা একটা সংখ্যা, যা বাস্তবতার সঙ্গে জুড়ে দেওয়া যায়। চিহ্নিতকরণ হলো একটা ইকোসিস্টেমের (ecosystem) সমস্যা: সংকেত, উৎস, প্ল্যাটফর্মের (platform) নিয়মকানুন এবং—নিজেকে প্রস্তুত করুন— মানুষের বিচারবুদ্ধি।
- এটা শুধু প্রযুক্তি নয়; এটা প্রণোদনা। প্ল্যাটফর্মগুলো (platform) তৈরি করাই হয়েছে এনগেজমেন্টকে (engagement) গুরুত্ব দেওয়ার জন্য। এনগেজমেন্ট (engagement) নতুনত্ব এবং ক্ষোভকে পুরস্কৃত করে। আপনি যদি এমন সিস্টেম ডিজাইন (design) করেন যা গতি এবং আবেগকে বাড়িয়ে তোলে, তাহলে আপনি এমন একটি বিতরণ নেটওয়ার্ক (network) তৈরি করবেন যা আত্মবিশ্বাসী বাজে কথা ছড়ানোর জন্য অপটিমাইজ (optimize) করা হয়েছে।
তিন-পায়ের টুল: উৎস, চিহ্নিতকরণ এবং বাধা
বিশ্বাসের টেবিলের নিচে তিনটি বাস্তবসম্মত পা রয়েছে:
- উৎস এবং কন্টেন্ট (content) প্রমাণপত্র
যদি আপনি বলতে না পারেন কোনো জিনিস কোথা থেকে এসেছে—ডিভাইস (device), অ্যাপ (app), এডিটর (editor) এবং এডিট (edit) করার ইতিহাস—তাহলে আপনি শুধু আন্দাজ করছেন। C2PA স্ট্যান্ডার্ডের (standard) এটাই উদ্দেশ্য: ক্রিপ্টোগ্রাফিক (cryptographic) স্বাক্ষরযুক্ত মেটাডেটা (metadata), যা ক্যাপচার (capture) এবং এডিট (edit) করার পদ্ধতি বর্ণনা করে এবং যা ক্যামেরা (camera), এডিটর (editor) এবং পাবলিশিং (publishing) সরঞ্জামগুলোতে ব্যবহার করা যেতে পারে। এটা এমন একটা সাধারণ ধারণা, যা সিনথেটিক (synthetic) মিডিয়া (media) তৈরি হওয়ার আগে সবাই এড়িয়ে গেছে। স্ট্যান্ডার্ডটি (standard) বিদ্যমান; এটি খোলা এবং ধীরে ধীরে এর ব্যবহার বাড়ছে। এটা প্রমাণ করে না যে কোনো জিনিস “সত্য”। এটা প্রমাণ করে যে কে এটা তৈরি করেছে এবং কী পরিবর্তন করা হয়েছে, যা দেখে এডিটর (editor) এবং আদালত এক শতাব্দী ধরে বিশ্বাসযোগ্যতা বিচার করে আসছে। এটাই প্রথম ধাপ: এমন একটা পথ তৈরি করা, যা মানুষ অনুসরণ করতে পারে, সহজ ভাষায়, স্টিগানোগ্রাফিতে (steganography) পিএইচডি (PhD) করার প্রয়োজন নেই।
কন্টেন্ট অথেনটিসিটি ইনিশিয়েটিভ (Content Authenticity Initiative)—অ্যাডোবি (Adobe) এবং তার সহযোগীরা—তাদের প্রোডাক্টে (product) এটাকে “কন্টেন্ট (content) প্রমাণপত্র” হিসেবে প্রচার করে। যখন আপনি একটি ছোট ব্যাজ (badge) দেখেন এবং ক্যাপচার (capture) ডিভাইস (device), এডিট (edit) এবং এক্সপোর্ট (export) চেইন (chain) দেখার জন্য ক্লিক (click) করতে পারেন, তখন এটাই হলো প্রতিশ্রুতি: অনুভূতির পরিবর্তে স্বচ্ছতা। এখন প্রশ্ন হলো, বাস্তবে এর ব্যবহার কেমন হবে। গুগল (Google) C2PA-এর স্টিয়ারিং কমিটিতে (steering committee) যোগদান করেছে—এটা একটা ভালো ইঙ্গিত যে এটা কোনো এক কোম্পানির প্রচেষ্টা নয়। এটা যত বেশি ক্যামেরা (camera), ফোন (phone) এবং নিউজ (news) রুমের (room) কাজের প্রক্রিয়ায় দেখা যাবে, তত কম আমাদের পিক্সেল (pixel) এবং মনের অনুভূতির ওপর নির্ভর করতে হবে।
- চিহ্নিতকরণ এবং ক্লাসিফায়ার (classifier)
উৎস থাকা সত্ত্বেও, প্রচুর মিডিয়া (media) প্রমাণপত্র ছাড়া, ব্যাপকভাবে সম্পাদিত বা সম্পূর্ণরূপে সিনথেটিক (synthetic) হিসাবে প্রকাশিত হবে। সেখানেই ক্লাসিফায়ারগুলির (classifier) ভূমিকা আসে। হ্যাঁ, গবেষকরা ফেস সোয়াপিং (face swapping), লিপ-সিঙ্কিং (lip-syncing) এবং অডিও (audio) ক্লোনিংয়ের (cloning) জন্য ডিটেক্টরগুলির (detector) উন্নতি করে চলেছেন। হ্যাঁ, তারা আরও ভালো বেঞ্চমার্ক (benchmark) প্রকাশ করছেন। এবং হ্যাঁ, এটা একটা অস্ত্রের প্রতিযোগিতা, কারণ জেনারেটিভ (generative) মডেলগুলি (model) পরিচিত বিষয়গুলো এড়িয়ে যাওয়ার জন্য অপটিমাইজ (optimize) করা হয়, এবং ডিটেক্টরগুলি (detector) নতুন বিষয়গুলো ধরার জন্য পুনরায় অপটিমাইজ (optimize) করা হয়। এটা অনেকটা বিড়াল-ইঁদুরের খেলা, তবে এখানে জিপিউ (GPU) ব্যবহার করা হয়।
দুটি বিষয়ে সাহিত্য পরিষ্কার ধারণা দেয়: চিহ্নিতকরণের নির্ভুলতা মাধ্যম (ভিডিও, অডিও, টেক্সট) এবং ডোমেইন (পরিচিত মুখ বনাম আপনার চাচা) অনুসারে ব্যাপকভাবে পরিবর্তিত হয়। এবং বেশিরভাগ ডিটেক্টর (detector) কিউরেটেড (curated) বেঞ্চমার্কের (benchmark) তুলনায় বাস্তবে খারাপ পারফর্ম (perform) করে। আপনি যদি একটি একক “সত্য স্কোর” (truth score) এর কথা ভাবছেন, তবে তা ভুলে যান। আপনার প্রয়োজন স্তরীভূত সংকেত এবং পরিমাপিত ঝুঁকি, মিথ্যা নিশ্চয়তা নয়।
আইন ও নীতি নির্ধারকরা এটা লক্ষ্য করেছেন। নির্বাচন বা জনসাধারণের মধ্যে আতঙ্ক ছড়ানোর উদ্দেশ্যে তৈরি ডিপফেকগুলি (deepfake) স্পষ্টতই ক্ষতিকর; যেমন: রাষ্ট্রপতির গলার স্বর নকল করে ভোট দিতে নিষেধ করা। চিহ্নিতকরণ শুধু একটি প্রযুক্তিগত চ্যালেঞ্জ (challenge) নয়—এটি একটি প্রশাসনিক চ্যালেঞ্জ (challenge), এই কারণে আইনি কাঠামো ধীরে ধীরে প্রকাশ, সম্মতি এবং জবাবদিহিতার আশেপাশে তৈরি হচ্ছে। ধীরে, ত্রুটিপূর্ণ, তবে প্রয়োজনীয়।
আপনি বিশ্বের সেরা ডিটেক্টর (detector) তৈরি করতে পারেন, তবুও যদি প্ল্যাটফর্মটি (platform) তিনটি ক্লিকের (click) পেছনে লুকিয়ে রাখে, তাহলে আপনি হেরে যাবেন। ভুল তথ্য ছড়ায় কারণ বিতরণ ব্যবস্থাগুলো বাধাহীন এবং আবেগপূর্ণ। এর প্রতিকার হলো এমন ডিজাইন (design) তৈরি করা, যেখানে ঝুঁকির সঙ্গে সামঞ্জস্য রেখে বাধা তৈরি করা হবে—সন্দেহজনক কন্টেন্টের (content) ওপর একটি দৃশ্যমান অন্তর্বর্তী স্থান, ফিডে (feed) অগ্রাধিকার হ্রাস, সহজে পড়া যায় এমন উৎসের ব্যাজ (badge) এবং প্রেক্ষাপট জানার জন্য একটি ক্লিকের (click) পথ। বিশ্বাস হলো অবকাঠামো। যখন এটি কাজ করে তখন আপনি এটি লক্ষ্য করেন না; আপনি গর্তগুলো দেখতে পান।
কীভাবে AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণ ব্যবহার করবেন (জম্বি না হয়ে)
- উৎস দিয়ে শুরু করুন। যদি কন্টেন্ট (content) প্রমাণপত্র থাকে, তবে তা পড়ুন। যদি না থাকে, তবে কিছু অনুমান করবেন না। জিজ্ঞাসা করুন সম্পদটি কোথায় ক্যাপচার (capture) করা হয়েছে, কোন ডিভাইসে (device) এবং কী পরিবর্তন করা হয়েছে। পেশাদাররা এই প্রশ্নে দ্বিধা বোধ করবেন না; তবে স্ক্যামাররা (scammer) করবে।
- সংকেতগুলোকে স্তরে স্তরে সাজান। একটিমাত্র ভবিষ্যদ্বক্তার ওপর নির্ভর না করে একাধিক ডিটেক্টর (detector) ব্যবহার করুন—ছবি, অডিও (audio) এবং টেক্সট (text)। অসঙ্গতিগুলোর দিকে নজর দিন: আলোর অমিল, ভাঙা প্রতিচ্ছবি, মুখের আকার যা ধ্বনির সঙ্গে মেলে না, ঘরের স্বর যা আবদ্ধ কক্ষের মতো শোনায়।
- বিতরণ প্যাটার্ন (pattern) পরীক্ষা করুন। ক্লিপটি (clip) কি কোনো বার্নার (burner) অ্যাকাউন্ট (account) থেকে রাতারাতি হাজার হাজার রি-পোস্ট (re-post) হয়েছে? এটি নকল হওয়ার প্রমাণ নয়, তবে এটি একটি বিপদ সংকেত।
- অনিশ্চয়তাকে সম্মান করুন। ভালো সিস্টেম (system) আপনাকে একটি রায় না দিয়ে আত্মবিশ্বাসের পরিসীমা দেয়। আপনার পূর্ব ধারণার সঙ্গে মেলে বলে ৬২% সম্ভাবনাকে একেবারে সত্য ধরে নেবেন না।
ডিপফেক (deepfake) কোনো জাদু নয়; এটা আসলে আত্মবিশ্বাসের খেলা
আপনি যদি ভিএফএক্স (VFX) শিল্পীদের AI (কৃত্রিম বুদ্ধিমত্তা) “অলৌকিক” বিষয়গুলোকে ভেঙে ফেলতে দেখেন, তাহলে আপনি এই জঁর (genre) সম্পর্কে জানবেন: অদ্ভুত চোখের পলক, প্লাস্টিকের গাছের মতো আচরণ করা চুল, ডিজে (DJ) ভিনাইল (vinyl) স্ক্র্যাচ (scratch) করার মতো লাফানো স্পেকুলার (specular) হাইলাইট (highlight) এবং পদার্থবিদ্যা যা মাধ্যাকর্ষণকে বিশ্বাস করে না। স্ক্যামগুলো (scam) আরও আধুনিক হচ্ছে, তবে পদার্থবিদ্যা এবং ধ্বনিতত্ত্ব এখনও কিছু সূত্র দেয়। এখনকার পার্থক্য হলো পরিমাণ এবং গতি—স্ক্যামগুলোর (scam) সবাইকে বোকা বানানোর দরকার নেই, শুধু যথেষ্ট সংখ্যক মানুষকে বোকা বানালেই যথেষ্ট, কারণ সংশোধন আসতে দুই দিন দেরি হয় এবং অর্ধেক ভাইরাল (viral) হয়।
আর শুধু ভিডিওই (video) একমাত্র সমস্যা নয়। AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি টেক্সট (text) হলো আলোচনার পরিবেশ দূষিত করার সবচেয়ে অলস উপায়। এটা গঠনগতভাবে উপযুক্ত এবং অর্থগতভাবে পিচ্ছিল—একজন রাজনীতিবিদ যেমন অস্পষ্ট প্রতিশ্রুতি দিতে ভালোবাসেন। একটি ডিটেক্টর (detector) পরিসংখ্যানগত অদ্ভুততা চিহ্নিত করতে পারে, তবে টেক্সচুয়াল (textual) ভুল তথ্যের জন্য সেরা ফিল্টার (filter) এখনও আপনার মাথার ভেতরেই রয়েছে। যদি এটি খুব পরিপাটি, খুব সময়োপযোগী, খুব সর্বজ্ঞ হয়, তবে সম্ভবত এটি ভুল।
উৎসের ওপর বাজি: কেন C2PA গুরুত্বপূর্ণ, এমনকি যদি কেউ ব্যাজে (badge) ক্লিক (click) না করে
সংশয়বাদীরা বলবেন যে কেউ ব্যাজে (badge) ক্লিক (click) করে না। সমষ্টিগতভাবে তারা ভুল নয়। তবে এডিটর (editor), সাংবাদিক, প্ল্যাটফর্ম (platform), আদালত এবং নজরদারি সংস্থাগুলো করে। তাদের তীক্ষ্ণ দৃষ্টি ধীরে ধীরে নিচের দিকে যায়। স্বাক্ষরিত চেইন (chain) অব কাস্টডি (chain of custody) টেকডাউনকে (takedown) দ্রুত করে, বিরোধ নিষ্পত্তি সহজ করে এবং আইনি হুমকি কমিয়ে আনে। এখানে উদ্দেশ্য হলো এই নয় যে সবাই মেটাডেটা (metadata) ডিটেকটিভ (detective) হবে; বরং উদ্দেশ্য হলো এমন একটি অবকাঠামো তৈরি করা, যাতে পেশাদাররা—এবং স্বয়ংক্রিয় সিস্টেমগুলো—তাদের কাজ করতে পারে। C2PA এবং কন্টেন্ট অথেনটিসিটি ইনিশিয়েটিভের (Content Authenticity Initiative) পেছনে এটাই বাজি: থিয়েট্রিক্স (theatrics) নয়, ডিজাইন (design) দ্বারা সত্যতাকে যাচাইযোগ্য করে তোলা।
কোথায় চিহ্নিতকরণ আজ কাজ করে—এবং কোথায় ব্যর্থ হয়
যুক্তিযুক্তভাবে ভালো কাজ করে:
- নিয়ন্ত্রিত পরিস্থিতিতে এবং পরিচিত ডোমেইনে (সেলিব্রিটি (celebrity) ডেটাসেট (dataset), প্রমিত কোণ) ফেস সোয়াপ (face swap) মোটামুটি নির্ভুলভাবে চিহ্নিত করা যেতে পারে।
- নির্দিষ্ট কণ্ঠের অডিও (audio) ক্লোন (clone), যখন তুলনা করার জন্য যথেষ্ট গ্রাউন্ড ট্রুথ (ground truth) থাকে, তখন বর্ণালীর কিছু বৈশিষ্ট্য দেখায় যা সহজেই চোখে পড়ে।
- ছবির কারসাজি যা ফরেনসিক (forensic) পদচিহ্ন ফেলে যায়: রিস্যাম্পলিং (resampling), অসামঞ্জস্যপূর্ণ নয়েজ (noise) প্যাটার্ন (pattern), ক্লোন (clone) করা অঞ্চল।
গোলমালপূর্ণভাবে ব্যর্থ হয়:
- আউট-অব-ডিস্ট্রিবিউশন (out-of-distribution) কন্টেন্ট (content)—নতুন কোণ, কম আলো, ভারী কম্প্রেশন (compression)—সাধারণ ডিটেক্টরগুলোকে (detector) নাকানিচোবানি খাওয়ায়।
- আংশিক আসল ফুটেজের (footage) সমন্বিত পুনঃব্যবহার (টাইট (tight) এডিট (edit) সহ একটি শ্যালোফেক (shallowfake)) অনেক AI (কৃত্রিম বুদ্ধিমত্তা)-ভিত্তিক পরীক্ষাতেও পার পেয়ে যায়।
- সিনথেটিক (synthetic) টেক্সট (text) যা বাস্তব তথ্যের সঙ্গে মনগড়া কারণ যুক্ত করে তৈরি করা হয়, তা বাইরের জ্ঞানগ্রাফ (knowledge graph) ছাড়া চিহ্নিত করা অবিশ্বাস্যভাবে কঠিন।
এর সঙ্গে অ্যাক্সেসিবিলিটি (accessibility) যোগ করুন: বেশিরভাগ মানুষ ল্যাব (lab) চালাতে পারে না। তাদের এমন সরঞ্জাম দরকার যা পরিষ্কার ভাষা ব্যবহার করে এবং যেখানে সৎভাবে অনিশ্চয়তার কথা বলা থাকে। যা আমাকে একটি ব্যবহারিক দিকের দিকে নিয়ে যায়।
একটি নীরবে উপযোগী টুলিং (tooling) প্যাটার্ন (pattern)
আপনি যদি যাচাইয়ের কাজ করেন, তবে আপনার স্ট্যাকে (stack) থাকা উচিত: কন্টেন্ট (content) প্রমাণপত্রের জন্য একটি প্রোভেনেন্স (provenance) ভিউয়ার (viewer), কয়েকটি সাধারণ ডিটেক্টর (detector), একটি রিভার্স (reverse) ইমেজ (image)/ভিডিও (video) লুকআপ (lookup) এবং আপনার পদক্ষেপগুলো রেকর্ড (record) করার জন্য একটি নোটবুক (notebook)। একটি ব্রাউজার (browser) কম্প্যানিয়নের (companion) জন্য বোনাস (bonus) পয়েন্ট (point) যা আপনাকে একটি ক্লিপ (clip) লোড (load) করতে এবং ফাইল (file) হেডারগুলোর (header) মধ্যে অনুসন্ধান না করেই মেটাডেটা (metadata) দেখতে দেয়।
Sider.AISider মূলত এই প্যাটার্নটির (pattern) ওপর ভিত্তি করে তৈরি হয়েছে এবং ধাপে ধাপে ব্যাখ্যা করে যে একটি ভিডিও AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি কিনা—এই ধরনের ব্যবহারিক, চেকলিস্টের (checklist) মতো চিন্তা আসল ব্যবহারকারীদের সাহায্য করে, শুধু লোক দেখানো নিরাপত্তার জন্য নয়। এটি এমন ভান করে না যে প্রোভেনেন্স (provenance) সবকিছু সমাধান করে; এটি দেখায় কীভাবে সূত্রগুলো খুঁজে বের করতে হয় এবং এটি C2PA-এর মতো স্ট্যান্ডার্ডগুলোর (standard) দিকে নির্দেশ করে, কোনো মার্কেটিংয়ের (marketing) চমক ছাড়াই। এমনকি Sider.AISider-এর কিউরেটেড (curated) ক্লিপ (clip) এবং ক্রিয়েটর (creator) কমিউনিটির (community) অংশগুলোও বড় সমস্যাটির দিকে ইঙ্গিত করে: প্রযুক্তিটি চিত্তাকর্ষক, এবং ঠিক এই কারণেই এটি manip টিউনিপুলের (manipulation) জন্য ব্যবহার করা হলে বিপজ্জনক। হ্যাঁ, এটা একটা প্রসঙ্গ। তবে এটি সেই ধরনের নীরব উপযোগিতা যা বেশিরভাগ মানুষের প্রয়োজন: সামান্য বাধা, সামান্য শিক্ষা এবং এমন একটি কর্মপ্রবাহ যা আপনাকে ট্যাক্স (tax) ফাইল (file) করার মতো অনুভূতি দেয় না। আপনার একটি জাদুকরী সমাধান দরকার নেই; আপনার একটি নির্ভরযোগ্য পকেট ছুরি দরকার।
নীতি, সীটবেল্ট (seatbelt) সহ
রাস্তার নিয়মকানুনের জন্য আগ্রহ বাড়ছে: সিনথেটিক (synthetic) কন্টেন্ট (content) লেবেল (label) করুন, বিদ্বেষপূর্ণ ছদ্মবেশের জন্য শাস্তি দিন এবং নির্বাচনের সময় প্ল্যাটফর্মগুলোর (platform) জন্য প্রত্যাশা নির্ধারণ করুন। আইন বিশেষজ্ঞরা এমন কাঠামো তৈরি করছেন যা জালিয়াতিকে আড়াল না করে বক্তৃতা সুরক্ষার চেষ্টা করে। আমরা পুরোপুরিভাবে মামলা করে এর থেকে মুক্তি পাব না—কোনো আইন মডেল (model) প্রকাশের সঙ্গে তাল মিলিয়ে চলতে পারবে না—তবে নিয়মগুলি গুরুত্বপূর্ণ। যদি ক্রিয়েটর (creator), প্ল্যাটফর্ম (platform) এবং সরঞ্জামগুলো ডিফল্টরূপে প্রোভেনেন্স (provenance) গ্রহণ করে, তবে এটি মিথ্যাবাদীদের উন্নতি লাভের ক্ষেত্র কমিয়ে দেবে।
কর্পোরেট (corporate) বাস্তবতার পরীক্ষা: যে সংস্থাগুলো জেনারেটিভ (generative) বৈশিষ্ট্যগুলো দ্রুত বাজারে নিয়ে আসার জন্য প্রতিযোগিতা করছে, তারা প্রোভেনেন্সের (provenance) স্ট্যান্ডার্ড (standard) লেখার কমিটিতেও (committee) বসে আছে। এটি স্বাস্থ্যকর, ভণ্ডামি নয়, ধরে নিচ্ছি যে ফলাফলটি আন্তঃকার্যক্ষম এবং ডিফল্টরূপে চালু আছে। C2PA-তে গুগলের (Google) আসন ইঙ্গিত দেয় যে মাধ্যাকর্ষণ কেন্দ্র প্ল্যাটফর্ম (platform) স্তরের সমর্থনের দিকে সরে যাচ্ছে। পরবর্তী পরীক্ষাটি হলো ফোন (phone) ক্যামেরা (camera), এডিটিং (editing) অ্যাপ (app) এবং সোশ্যাল (social) ফিড (feed) কন্টেন্ট (content) প্রমাণপত্রকে প্রথম শ্রেণির নাগরিক হিসাবে প্রকাশ করে কিনা এবং এগুলো সরিয়ে ফেলা কঠিন করে কিনা।
মানুষের হাতের ছোঁয়া, যা আমাদের দরকার নেই বলে আমরা ভান করি
আপনি ড্যাশবোর্ড (dashboard) বিক্রি করতে পারেন, তবে বিশেষজ্ঞের পর্যালোচনা এখনও গুরুত্বপূর্ণ। নিউজ (news) রুমগুলো (room) যখনই বুনিয়াদি বিষয়গুলো বাদ দেয়, তখনই কঠিন শিক্ষা পায়। যে কর্মপ্রবাহটি কাজ করে তা হলো, যেখানে ধরে নেওয়া হয় যে মানুষই চূড়ান্ত সিদ্ধান্ত নেয়: সাংবাদিক, ট্রাস্ট-অ্যান্ড-সেফটি (trust-and-safety) টিম (team), নির্বাচন কর্মকর্তারা। মেশিন (machine) বাছাই করে; মানুষ সিদ্ধান্ত নেয়।
একটি সমাপনী বক্তব্য: “AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণ” একটি পণ্যের চেয়ে বেশি একটি অনুশীলন। এটি অভ্যাস, সরঞ্জাম এবং প্রত্যাশার একটি সেট যা মিথ্যাবাদীদের ওপর বোঝা চাপিয়ে দেয়। আমরা তখন উন্নতি করব না যখন ডিটেক্টর (detector) ৯৯.৯%-এ পৌঁছাবে, বরং তখন উন্নতি করব যখন প্রোভেনেন্স (provenance) স্বাভাবিক হবে, বাধার কারণে মিথ্যা বলা ধীর হয়ে যাবে এবং ভালো ডিফল্টগুলো (default) সাধারণ ব্যবহারকারীদের তাদের খারাপ প্রবণতা থেকে বাঁচাবে।
টিমের (team) জন্য ব্যবহারিক প্লেবুক (playbook) (তত্ত্ব নয়—এটি করুন):
- আপনার ক্যাপচার (capture) এবং এডিটিং (editing) পাইপলাইনে (pipeline) কন্টেন্ট (content) প্রমাণপত্র চালু করুন। যদি আপনার সরঞ্জাম এটি সমর্থন না করে, তবে আরও জোরে জিজ্ঞাসা করুন। অথবা পরিবর্তন করুন।
- আপনার সিএমএসে (CMS) একটি প্রোভেনেন্স (provenance) পরীক্ষক এবং কমপক্ষে দুটি ডিটেক্টর (detector) যুক্ত করুন। একজন অ-বিশেষজ্ঞ বুঝতে পারে এমন ভাষায় ফলাফল দেখান।
- বিতরণের জন্য একটি লাল/হলুদ/সবুজ অন্তর্বর্তী স্থান তৈরি করুন। লাল মানে সম্ভবত সিনথেটিক (synthetic); হলুদ মানে অজানা/কোনো প্রোভেনেন্স (provenance) নেই; সবুজ মানে স্বাক্ষরিত, অক্ষত প্রমাণপত্র। কোনো দ্বিমুখী সত্যের স্ট্যাম্প (stamp) নয়।
- ব্যবহারকারীদের রসিদ দিন। একটি ক্লিকের (click) মাধ্যমে মেটাডেটা (metadata) দেখার সুযোগ দিন। মানুষ দেখে শেখে।
- অভ্যন্তরীণভাবে যাচাইকরণের পদক্ষেপগুলো লগ (log) করুন। যখন কিছু ভুল হয়, তখন কাগজের প্রমাণ “সম্ভবত” কে একটি বিপর্যয়ের পরিবর্তে একটি সমাধানে পরিণত করে।
অস্বস্তিকর সত্য
কিছু লোক একটি সুইস (Swiss) আর্মির (Army) মতো অ্যাপ (app) চায় যা তাদের বলবে কোনটি আসল। এমন কিছু আসছে না, এবং এলেও আপনি বিশ্বাস করবেন না। অস্বস্তিকর সত্য হলো বিশ্বাস তৈরি করতে হয়, অনুমান করে নয়। চিহ্নিতকরণ প্রয়োজনীয়, প্রোভেনেন্স (provenance) ভিত্তি এবং প্ল্যাটফর্মের (platform) বাধা হলো লিভার (lever)। বাকিটা সংস্কৃতি—আমরা প্রথম প্রচেষ্টাকে পুরস্কৃত করি নাকি সঠিকটিকে।
শেষ কথা: সবচেয়ে বড় ঝুঁকি এটা নয় যে আমরা মিথ্যা চিহ্নিত করতে পারছি না। বরং সবচেয়ে বড় ঝুঁকি হলো যখন সত্য প্রকাশিত হয়, তখন আমরা তা বিশ্বাস করা বন্ধ করে দিই। অত্যাধুনিক ভুল তথ্যের লক্ষ্য এটাই—আপনাকে কোনো নির্দিষ্ট মিথ্যা সম্পর্কে রাজি করানো নয়, বরং সবকিছুকে একটি হতাশাজনক কুয়াশার মধ্যে ফেলে দেওয়া, যেখানে কিছুই বিশ্বাসযোগ্য নয়। তাই এটি শুধু একটি প্রযুক্তিগত সমস্যা নয়। এটি নাগরিক স্বাস্থ্যবিধি।
যদি এটি খুব বড় কিছু মনে হয়, তবে বিকল্পটি বিবেচনা করুন: এমন একটি ফিড (feed) যেখানে সবকিছু বাস্তব মনে হয়, আসলে কিছুই বাস্তব নয় এবং একমাত্র গুরুত্বপূর্ণ বিষয় হলো ক্লিক (click)। আমরা এখনও সেখানে পৌঁছাইনি। তবে আমরা এখান থেকে তা দেখতে পাচ্ছি।
আরও পড়ুন এবং স্ট্যান্ডার্ড (standard)
- C2PA: কন্টেন্ট (content) প্রোভেনেন্স (provenance) এবং সত্যতার জন্য প্রযুক্তিগত স্ট্যান্ডার্ড (standard), যা শিল্পজুড়ে ক্রমশ ব্যবহৃত হচ্ছে।
- কন্টেন্ট অথেনটিসিটি ইনিশিয়েটিভ (Content Authenticity Initiative): কন্টেন্ট (content) প্রমাণপত্রের জন্য রিসোর্স (resource) এবং প্রোডাক্ট (product) সহায়তা।
- ডিপফেক (deepfake) চিহ্নিতকরণ এবং প্রশাসনের ওপর সমীক্ষা এবং আইনি দৃষ্টিভঙ্গি।
- কেন বিশ্বাসযোগ্য অবকাঠামো (প্রচার নয়) আসল যুদ্ধক্ষেত্র।
আর আপনি যদি AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভিডিও চিহ্নিতকরণের ওপর দ্রুত এবং ব্যবহারিক নির্দেশিকা চান, তাহলে -এর সরল গাইড (guide) একটি ভালো শুরু—এখানে বেশি উপদেশ নেই, বরং অনেক প্রমাণ আছে।
সাধারণ জিজ্ঞাসা
প্রশ্ন ১: AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য চিহ্নিতকরণ আসলে কী?
এটি কোনো জাদুকরী মিথ্যা আবিষ্কারক নয়; এটি উৎস মূল্যায়ন, স্তরীভূত ক্লাসিফায়ার (classifier) চালানো এবং বিতরণে বাধা দেওয়ার জন্য একটি টুলকিট (toolkit) এবং কর্মপ্রবাহ। এখানে গরম খবর কম এবং প্রমাণের ওপর বেশি জোর দেওয়া হয়—উৎস, সম্পাদনা, চেইন (chain) অব কাস্টডি (chain of custody), তারপর মডেল (model) সংকেত।
প্রশ্ন ২: ডিটেক্টরগুলো (detector) কি আজ নির্ভরযোগ্যভাবে ডিপফেক (deepfake) চিহ্নিত করতে পারে?
কখনও কখনও, ল্যাবে (lab); বাস্তবে কম। নির্ভুলতা নির্ভর করে মাধ্যম, কম্প্রেশন (compression) এবং ডোমেইনের (domain) ওপর, তাই চিহ্নিতকরণের সঙ্গে প্রোভেনেন্স (provenance) এবং প্ল্যাটফর্মের (platform) ডিজাইন (design) যুক্ত করুন, কোনো দ্বিমুখী রায় নয়।
প্রশ্ন ৩: C2PA এবং কন্টেন্ট (content) প্রমাণপত্র নিয়ে আমার কেন চিন্তা করা উচিত?
কারণ পিক্সেল (pixel) থেকে অনুমান করা একটি ব্যর্থ খেলা, এবং স্বাক্ষরিত প্রোভেনেন্স (provenance) মিথ্যা বলার খরচ বাড়িয়ে দেয়। কন্টেন্ট (content) প্রমাণপত্র ডিজাইন (design) দ্বারা সত্যতাকে নিরীক্ষণযোগ্য করে, যা মানুষ এবং স্বয়ংক্রিয় সিস্টেম (system) উভয়কেই সাহায্য করে।
প্রশ্ন ৪: প্ল্যাটফর্মগুলো (platform) কীভাবে বক্তৃতা বন্ধ না করে AI (কৃত্রিম বুদ্ধিমত্তা) দ্বারা তৈরি ভুল তথ্য কমায়?
ঝুঁকি-মাপের বাধা ব্যবহার করুন: সন্দেহজনক মিডিয়ার (media) জন্য স্পষ্ট লেবেল (label), অন্তর্বর্তী স্থান এবং ডাউনর্যাঙ্কিং (downranking) করুন, সেইসাথে যাচাইযোগ্য প্রোভেনেন্সকে (provenance) উন্নত করুন। এটি সেন্সরশিপ (censorship) নয়; এটি সন্দেহজনক কন্টেন্টকে (content) অ্যালগরিদমিক্যালি (algorithmically) আরও শক্তিশালী করতে অস্বীকার করা।
প্রশ্ন ৫: টিমের (team) জন্য সেরা ব্যবহারিক প্রথম পদক্ষেপ কী?
আপনার ক্যাপচার (capture)/এডিট (edit) পাইপলাইনে (pipeline) প্রোভেনেন্স (provenance) চালু করুন এবং আপনার প্রোডাক্ট (product) ইউআইতে (UI) এটি প্রদর্শন করুন। তারপর দুটি ডিটেক্টর (detector) এবং একটি সহজ লাল/হলুদ/সবুজ আত্মবিশ্বাসের ডিসপ্লে (display) যোগ করুন, যাতে অ-বিশেষজ্ঞরা সঠিক সিদ্ধান্ত নিতে পারে।