কবিতা ব্যবহার করে বিভিন্ন এআই মডেলকে পারমাণবিক অস্ত্র সম্পর্কিত গোপন তথ্য প্রকাশে প্ররোচিত করা যেতে পারে বলে দাবি করা হয়েছে সাম্প্রতিক এক গবেষণায়।
নতুন গবেষণায় বলছে, কবিতার আকারে লেখা বা প্রম্পট ব্যবহার করে চ্যাটজিপিটির মতো এআই মডেলের নিরাপত্তা ব্যবস্থা এড়িয়ে যাওয়া যায়, যার ফলে কিছু ক্ষেত্রে ম্যালওয়্যার বা রাসায়নিক ও পারমাণবিক অস্ত্র তৈরির মতো বিপজ্জনক নির্দেশনাও এআইয়ের কাছ থেকে আদায় করা সম্ভব হতে পারে।
এআই চ্যাটবট সাধারণত ব্যবহারকারীর কিছু অনুচ্ছেদ বা নির্দেশ অনুসারে কাজ করে, যাকে ‘সুরক্ষা ব্যবস্থা’ বা গার্ডরেলস বলে। এ সুরক্ষা ব্যবস্থা মূলত ক্ষতিকর বা অনুপযোগী কনটেন্ট থেকে ব্যবহারকারীকে রক্ষার জন্য তৈরি।
তবে গবেষকরা বলছেন, একটু সৃজনশীলতা ব্যবহার করলে এ সুরক্ষা ব্যবস্থা বাইপাস বা টপকে যাওয়া করা সম্ভব। গবেষণায় প্রমাণ মিলেছে, ব্যবহারকারী যদি চ্যাটবটকে কবিতার আকারে প্রশ্ন বা নির্দেশনা দেয় তবে অনেক লার্জ ল্যাঙ্গুয়েজ মডেল বা এলএলএম নিজের নিরাপত্তা নিয়ম এড়িয়ে যায়। সহজভাবে বললে, কবিতার জাদু ব্যবহার করে চ্যাটবটকে দিয়ে ‘সাধারণ নিয়মের বাইরে’ কাজ করানো সম্ভব।
চ্যাটজিপিটির নির্মাতা ওপেনএআই, মার্কিন সার্চ জায়ান্ট গুগল, সামাজিক মাধ্যম জায়ান্ট মেটা ও মার্কিন সফটওয়্যার জায়ান্ট মাইক্রোসফটের মতো জেনারেটিভ এআই নির্মাতারা বরাবরই বলেছে, তাদের বিভিন্ন এআই মডেলে এমন নিরাপত্তা ব্যবস্থা থাকে, যা ব্যবহারকারীদের পক্ষে ক্ষতিকর কনটেন্ট তৈরি করা ঠেকাতে পারে।
ওপেনএআইয়ের দাবি, অ্যালগরিদম ও মানব পর্যবেক্ষকদের ব্যবহার করে ঘৃণামূলক বক্তব্য, অশ্লীল কনটেন্ট ও তাদের ব্যবহারের নীতিমালা লঙ্ঘনকারী অন্যান্য আউটপুট ফিল্টার করে কোম্পানিটি।
তবে নতুন গবেষণায় উঠে এসেছে, সবচেয়ে উন্নত বিভিন্ন এআই মডেলের নিরাপত্তা নিয়ন্ত্রণ ব্যবস্থাকেও পাশ কাটিয়ে যেতে পারে কবিতার মতো করে লেখা ইনপুট বা প্রম্পট।
রোমের ‘ইউনিভার্সিটি অফ সাপিয়েঞ্জা’সহ বিভিন্ন প্রতিষ্ঠানের গবেষকরা গবেষণাপত্রে বলেছেন, ‘অ্যাডভারসারিয়াল পোয়েট্রি’ নামে পরিচিত পদ্ধতি ওপেনএআই, গুগল, মেটা ও ডিপসিকের মতো প্রধান এআই মডেল পরিবারের জন্য এক ধরনের জেলব্রেকিং কৌশল হিসেবে কাজ করে।
আরক্সিভ-এ প্রকাশিত ও পিয়ার-রিভিউ না হওয়া এ গবেষণায় গবেষকরা দাবি করেছেন, “কেবল লেখার ভঙ্গি বা স্টাইল পরিবর্তন করলেই এআই মডেলের আধুনিক বিভিন্ন সুরক্ষা ব্যবস্থা এড়িয়ে যাওয়া সম্ভব, যা বর্তমান অ্যালাইনমেন্ট পদ্ধতি ও মূল্যায়ন প্রোটোকলের মৌলিক সীমাবদ্ধতার ইঙ্গিত দেয়।”
গবেষণায় ক্ষতিকর কনটেন্ট তৈরির জন্য ছোট কবিতা বা রূপকধর্মী চরণকে ইনপুট হিসেবে ব্যবহার করেছেন গবেষকরা।
তারা বলছেন, একই উদ্দেশ্যপূর্ণ অন্যান্য ধরনের ইনপুটের তুলনায় কবিতার আকারে দেওয়া ইনপুট অনেক বেশি হারে অসুরক্ষিত বা নীতিবহির্ভূত উত্তর তৈরি করেছে। নির্দিষ্ট কিছু কবিতাধর্মী প্রম্পট প্রায় ৯০ শতাংশ ক্ষেত্রে অরক্ষিত আচরণ তৈরি করেছে।
গবেষকদের মতে, এ পদ্ধতিটি সবচেয়ে বেশি কার্যকর ছিল সাইবার আক্রমণ চালানো, ডেটা চুরি, পাসওয়ার্ড ভাঙা ও ম্যালওয়্যার তৈরির মতো তথ্য বের করে আনার ক্ষেত্রে।
বিভিন্ন এআই মডেল দিয়ে পারমাণবিক অস্ত্র তৈরির মতো তথ্য বের করতে তাদের সাফল্যের হার ছিল প্রায় ৪০ থেকে ৫৫ শতাংশ।
গবেষকরা বলেছেন, “গবেষণাটি থেকে ইঙ্গিত মিলেছে, কবিতার আকারে বা রূপকধর্মী ভাবে প্রম্পট দিলে বিভিন্ন এআই মডেল আগের মতো সহজে না বলতে পারে না। ফলে কিছুটা নিরাপত্তা নিয়ম উপেক্ষা করে বিপজ্জনক বা অনৈতিক উত্তর দেয় এরা।”
“ক্ষতিকর এসব প্রম্পট গদ্যভাষার পরিবর্তে কবিতার আকারে প্রকাশ হলে তা এআই মডেলের নিরাপত্তা ব্যবস্থাকে এড়িয়ে সফল হবার সম্ভাবনা অনেক বাড়িয়ে দেয়, যা বর্তমান পরীক্ষার পদ্ধতিতে ধরা পড়ে না।”
গবেষক পিয়েরকোসমা বিসকন্তি বলেছেন, এ পদ্ধতিটি অনুকরণ করা খুব সহজ হওয়ায় গবেষণায় ঠিক কোন কবিতা ব্যবহার করে নিরাপত্তা ব্যবস্থা পাশ কাটানো হয়েছে তা প্রকাশ করেননি তারা।
গবেষকরা বলছেন, কবিতার আকারে লেখা বিভিন্ন প্রম্পট ক্ষতিকর কনটেন্ট তৈরির ক্ষেত্রে প্রধান কারণ হচ্ছে সব এআই মডেল মূলত কোনো বাক্যের পরবর্তী সবচেয়ে সম্ভাব্য শব্দটি অনুমান করার মাধ্যমে কাজ করে। তবে কবিতার গঠন সহজে বোঝা যায় না। ফলে এআইয়ের জন্য এমন ক্ষতিকর প্রম্পট শনাক্ত ও তা অনুমান করা কঠিন হয়ে যায়।
এ বিষয়ে মন্তব্যের জন্য ইন্ডিপেনডেন্টের অনুরোধে সাড়া দেয়নি ওপেনএআই, গুগল, ডিপসিক ও মেটা।







০ টি মন্তব্য