গাণিতিক যুক্তিতে দুর্বল চ্যাটজিপিটি!
লেখা:মেগান বার্টলস; রূপান্তর: কাজী আকাশ | বিজ্ঞানচিন্তা
গাণিতিক ধাঁধা সমাধানে কতটা পারদর্শী চ্যাটজিপিটি? এই প্রশ্নের উত্তর খুঁজেছে যুক্তরাষ্ট্রের সায়েন্টিফিক আমেরিকান ম্যাগাজিন। চ্যাটজিপিটিকে তারা কিছু ধাঁধা সমাধান করতে বলে। ধাঁধার উত্তর দেখলে বোঝা যাবে, গাণিতিক দক্ষতায় কতটা পারদর্শী চ্যাটজিপিটি। ধাঁধাগুলো বিখ্যাত ধাঁধানির্মাতা মার্টিন গার্ডনারের তৈরি। সায়েন্টিফিক আমেরিকান-এর সেই এক্সপেরিমেন্টবিষয়ক নিবন্ধটি রূপান্তর করেছেন বিজ্ঞানচিন্তার সম্পাদনা দলের সদস্য কাজী আকাশ।
এতদিনেও চ্যাটজিপিটির নাম শোনেননি, এমন মানুষ খুঁজে পাওয়া কঠিন। কিছু কিছু কাজের জন্য চ্যাটজিপিটিসহ অন্যান্য কৃত্রিম বুদ্ধিমত্তাগুলো বেশ প্রশংসিতও হয়েছে। যেমন চিকিৎসা পরিস্থিতি নির্ণয়, বৈজ্ঞানিক গবেষণাপত্রের সারসংক্ষেপ করাসহ নানা অজানা প্রশ্নের উত্তর খুঁজে দেওয়ার ক্ষেত্রে বেশ সফল এসব কৃত্রিম বুদ্ধিমত্তা।
কিন্তু এসব কৃত্রিম বুদ্ধিমত্তার নিজস্ব বিচারবুদ্ধি নেই। আগে থেকে যেসব তথ্য ইনপুট দেওয়া আছে, সেগুলো থেকে যাচাই বাছাই করে উত্তর দেয়। এসব বুদ্ধিমত্তা আসলে কতটা কাজের? গাণিতিক ধাঁধা সমাধানে কতটা পারদর্শী এগুলো? এই প্রশ্নের উত্তর খুঁজেছে যুক্তরাষ্ট্রের সায়েন্টিফিক আমেরিকান ম্যাগাজিন। চ্যাটজিপিটিকে তারা কিছু ধাঁধা সমাধান করতে বলে। ধাঁধার উত্তর দেখলে বোঝা যাবে, গাণিতিক দক্ষতায় কতটা পারদর্শী চ্যাটজিপিটি। ধাঁধাগুলো বিখ্যাত ধাঁধানির্মাতা মার্টিন গার্ডনারের তৈরি। ২০১০ সালে এই কিংবদন্তি লেখক মারা গেছেন।
ধাঁধা ১
একটি বিল্ডিংয়ের নিচ তলায় তিনটি সুইচ আছে। সুইচগুলো অন বা অফ করে বাতি জ্বালানো ও নেভানো যায়। এর মধ্যে মাত্র একটি সুইচের সাহায্যে তৃতীয় তলায় একটি বাতি জ্বলে। বাকি দুটি সুইচের কোনো কাজ নেই। অর্থাৎ অকেজো। তিনটি সুইচের যেকোনো একটি চেপে বিল্ডিংয়ের তৃতীয় তলায় গিয়ে আপনি দেখবেন, বাতিটি জ্বলছে কি না। জ্বলুক বা না জ্বলুক, তৃতীয় তলায় থেকেই আপনার বলতে হবে, কোন সুইচটা আসলে কাজ করে। মনে রাখবেন, আপনি শুধু একবারই সুযোগ পাবেন।
এবার একটু থেমে নিজেই কল্পনা করুন, এ ধাঁধার সমাধান কী হতে পারে। তারপর চ্যাটজিপিটির উত্তরটা যাচাই করে দেখুন, সমাধান মনঃপূত হয় কি না।
চ্যাটজিপিটিকে প্রশ্নটা করার সঙ্গে সঙ্গে উত্তর দিয়েছে এরকম—
প্রথমে প্রথম সুইচটা অন করতে হবে। কিছুক্ষণ পর, মানে চার-পাঁচ মিনিট পর প্রথম সুইচটা বন্ধ করে দ্বিতীয় সুইচটি চালু করেই চলে যেতে হবে তৃতীয় তলায়। গিয়ে যদি দেখেন বাতি জ্বলছে, তাহলে বুঝতে হবে দ্বিতীয় সুইচটি কার্যকর। আর যদি দেখেন, বাতি জ্বলছে না কিন্তু বাল্বটি গরম, তাহলে বুঝতে হবে প্রথম সুইচটি কার্যকর। কারণ আপনি যখন প্রথমে ওই সুইচটা চালু করেছিলেন, তাতে বাতি জ্বলেছিল এবং গরম হয়েছিল। কিন্তু যদি দেখেন, বাতি বন্ধ এবং ঠান্ডা, তাহলে বুঝতে হবে তৃতীয় সুইচটি কার্যকর।
এই উত্তরটি সঠিক। কিন্তু চ্যাটজিপিটি কীভাবে এই বুদ্ধিভিত্তিক ধাঁধার উত্তর দিল? এটি তো নিজে চিন্তা করতে পারে না। মিশিগান বিশ্ববিদ্যালয়ের কম্পিউটারবিজ্ঞানী কেন্টারো তোয়ামা। তাঁর মতে, চ্যাটজিপিটি আগে থেকেই এ প্রশ্নের উত্তর জানত। তাকে যে পরিমাণ ডাটা ইনপুট দেওয়া হয়েছে, তার মধ্যে এটাও ছিল। স্বাভাবিক। ২০১৪ সালে এই সমাধানটি প্রকাশিত হয়েছিল সায়েন্টিফিক আমেরিকান-এই।
ধাঁধা ২
এবারে চলুন দেখা যাক, চ্যাটজিপিটি আরেকটু জটিল গাণিতিক ধাঁধার সমাধান দিতে পারে কি না।
দুটি ক্ষেপণাস্ত্র সরাসরি একটি অন্যটির দিকে ছুটে যাচ্ছে। একটির বেগ ঘন্টায় ৯ হাজার মাইল, অন্যটির বেগ ঘন্টায় ২১ হাজার মাইল। ১ হাজার ৩১৭ মাইল দূর থেকে দুটি ক্ষেপণাস্ত্র ছোড়া হয়েছে। এখন খাতা-কলম ছাড়া বলতে পারবেন, ক্ষেপণাস্ত্র দুটি সংঘর্ষ ঘটার ঠিক ১ মিনিট আগে কত দূরে ছিল?
চ্যাটজিপিটি এ প্রশ্নের উত্তর দিয়েছে দুটি উপায়ে। প্রথমে হিসেব করে বের করেছে, এক মিনিটে ক্ষেপণাস্ত্র দুটি ৫০০ মাইল অতিক্রম করে। এটিই আসলে এ ধাঁধার সঠিক উত্তর। কিন্তু কৃত্রিম বুদ্ধিমত্তা এখানে থামেনি। ভুলটা করেছে এখানেই। ওটা এরপর মোট দূরত্ব ১ হাজার ৩১৭ থেকে বিয়োগ করেছে ওই ৫০০ মাইল। ফলে চ্যাটজিপিটির উত্তর এসেছে ৮১৭ মাইল। বলা বাহুল্য, এটা ভুল। (চ্যাটজিপিটি কেন এই ভুলটা করেছে, তা হয়তো আপনারা বুঝেছেন। তবু যদি কেউ বুঝে না থাকেন, তবে বলি। কৃত্রিম বুদ্ধিমত্তাটি যে বিন্দু থেকে ক্ষেপণাস্ত্র দুটো যাত্রা করেছে, সেই বিন্দু থেকে সংঘর্ষের এক মিনিট আগে ক্ষেপণাস্ত্র দুটো কত দূরে আছে, তা হিসেব করেছে।)
এরপর চ্যাটজিপিটিকে বলা হয়, উত্তরটা ভুল। শুধরে দেওয়া হয়। বুঝিয়ে বলা হয়, শুরুর ওই বিন্দুটা বলা হয়েছে তাকে ফাঁদে ফেলার জন্য। সব কিছু বুঝিয়ে বলার পর আবারও একই ধাঁধা দিয়ে বলা হয় সমাধান করতে। কৃত্রিম বুদ্ধিমত্তাটি সফলভাবে সমাধান দেয়। এ পর্যন্ত ঠিকই আছে। কিন্তু সায়েন্টিফিক আমেরিকান দেখতে চাইল, চ্যাটজিপিটি আসলেই বিষয়টা শিখতে পারছে কি না। পরীক্ষা করার জন্য ক্ষেপণাস্ত্রের পরিবর্তে এবারে তারা ব্যবহার করে দুটি নৌকা। সঙ্গে সংখ্যাগুলোও পরিবর্তন করে দেয়। এতে আবারও ভুল উত্তর দেয় চ্যাটজিপিটি।
বোঝাই যায়, প্রথম ধাঁধাটির মতো এটি সরাসরি ইনপুট দেওয়া নেই। তাই প্রশ্ন আসে, চ্যাটজিপিটি কি নিজে থেকে আসলেই যুক্তি বুঝতে পারছে না? তোয়ামার বক্তব্য হলো, একটি গবেষণা বলে, কৃত্রিম বুদ্ধিমত্তাকে যথেষ্ট পরিমাণ উদাহরণ ইনপুট হিসেবে দিলে ওটা হিসেব করে যুক্তিটা ধরতে পারে। পরে সেটা কাজে লাগাতে পারে প্রয়োজনে। তবে অন্য কিছু গবেষণা বলছে, নিউরাল নেটওয়ার্ক বর্তমানে যেভাবে শিখছে যুক্তি ও কার্যকারণ মৌলিকভাবে সেরকম নয়। তাই কৃত্রিম বুদ্ধিমত্তাকে সুনির্দিষ্ট করে বুঝিয়ে না বললে এটি নিজে থেকে যুক্তি শিখতে পারে না।
এবারে তাহলে বিষয়টা আরেকটু যাচাই করে দেখা যাক!
ধাঁধা ৩
তৃতীয় ধাঁধাটি হলো, ১ থেকে ৯ পর্যন্ত প্রতিটি অঙ্ক একবার ব্যবহার করে তিনটি মৌলিক সংখ্যার সেট বানাতে হবে। সেই মৌলিক সংখ্যার সেট তিনটির সর্বনিম্ন যোগফল কত হতে পারে? যেমন ধরুন, তিনটি সেট যথাক্রমে ৯৪১, ৮২৭ ও ৬৫৩। এদের যোগফল ২ হাজার ৪২১। কিন্তু এই যোগফলটি অনেক বড়। আমরা এমন তিনটি মৌলিক সংখ্যা খুঁজছি, যেগুলো বানাতে ১ থেকে ৯ পর্যন্ত প্রতিটি অঙ্ক একবার ব্যবহৃত হবে, তবে যোগফলটি হবে সর্বনিম্ন। এবার চাইলে নিজেই চেষ্টা করে দেখতে পারেন।
মৌলিক সংখ্যা বলতে বোঝায়, যে সংখ্যাকে ১ এবং ওই সংখ্যা ছাড়া অন্য কোনো সংখ্যা দিয়ে ভাগ করা যায় না। ৩, ৫, ৭ বা ১১-এর মতো ছোট মৌলিক সংখ্যার সেটগুলো মূল্যায়ন করা তুলনামূলক সহজ। মৌলিক সংখ্যা যত বড় হয়, তা মূল্যায়ন করা তত বেশি কঠিন।
মার্টিন গার্ডনার এ প্রশ্নের একটি উত্তর দিয়েছেন। তিন অঙ্কের মৌলিক সংখ্যার জন্য শেষের অঙ্কটি অবশ্যই ১, ৩, ৭ বা ৯ হতে হবে। পাঁচ অঙ্কের যেকোনো মৌলিক সংখ্যার জন্যও এ শর্ত খাটে। আমরা শেষের তিনটি অঙ্ক ব্যবহার করে তিনটি মৌলিক সংখ্যার সেট বানাব। অর্থাৎ, আমাদের মৌলিক সংখ্যার সেটের শেষের অঙ্কটি হবে ৩, ৭ বা ৯। মৌলিক সংখ্যার তিনটি সেট বানাতে আমরা প্রথম অঙ্ক হিসেবে ১, ২ ও ৪ ব্যবহার করব। আর ৫, ৬ ও ৮ ব্যবহার করব মাঝে। তাহলে মৌলিক সংখ্যার সেট তিনটি হবে ১৪৯, ২৬৩ ও ৫৮৭। এদের যোগফল ১৪৯+২৬৩+৫৮৭ = ৯৯৯।
এ প্রশ্নের উত্তরে চ্যাটজিপিটির প্রথম সমাধানটা মুগ্ধ করার মতোই। উত্তরটি ছিল ২৫৭, ৬৮৩ এবং ৯৪১। এখানকার তিনটি সংখ্যাই মৌলিক। আমাদের শর্তও ঠিকভাবে মানা হয়েছে। অর্থাৎ, ১ থেকে ৯ পর্যন্ত অঙ্কগুলোর প্রতিটি ব্যবহার করা হয়েছে এবং একবারই ব্যবহার করেছে। যদিও গার্ডনারের যোগফলের চেয়ে এই যোগফলটা অনেক বেশি, ১ হাজার ৮৮১। কিন্তু চ্যাটজিপিটিকে যখন এই সমাধানটি ব্যাখ্যা করতে বলা হলো, তখন সেটা একটি ভিন্ন সমাধান দিয়েছিল। মৌলিক সংখ্যার সেট তিনটি ছিল ১০৯, ১০৩১ ও ৬৮৩। কিন্তু এ সমাধানে আমাদের শর্ত ভঙ্গ হয়েছে। সবগুলো তিন সংখ্যার হয়নি। একই অঙ্ক একাধিকবার ব্যবহার করা হয়েছে। যদিও সবগুলো সংখ্যাই মৌলিক।
চ্যাটজিপিটিকে যখন এ শর্তের কথা বলা হলো, তখন চ্যাটজিপিটি একটা ব্যাখ্যা দিয়েছে। কৃত্রিম বুদ্ধিমত্তার দাবি, তিন অঙ্কের প্রাইম সংখ্যার সেটে শুরুর অঙ্কটা ১, ৪ ও ৬ ব্যবহার করা যাবে না। কারণ এ সংখ্যাগুলো নাকি ৩ দিয়ে বিভাজ্য। যদিও এটা সম্পূর্ণ ভুল কথা। আপনি নিজেও যাচাই করে দেখতে পারেন। তিন অঙ্কের সংখ্যাটির অঙ্ক তিনটির যোগফল যদি ৩ দিয়ে ভাগ করা যায়, তাহলে সেই সংখ্যাটিও ৩ দিয়ে বিভাজ্য হয়। যেমন একটি সংখ্যা ১৪৯। এই সংখ্যার অঙ্কগুলোর যোগফল ১+৪+৯=১৪। এই ১৪ কোনোভাবেই ৩ দিয়ে বিভাজ্য নয়। সুতরাং, ১৪৯ সংখ্যাটিও ৩ দ্বারা বিভাজ্য হতে পারে না।
এরপর চ্যাটজিপিটিকে জানানো হয়, উত্তরগুলো আসলে সঠিক হচ্ছে না। এরপর কৃত্রিম বুদ্ধিমত্তাটি উত্তর হিসেবে ২, ৩ ও ৭৪৯ দেখায়। এটা কোনো উত্তরই হয়নি। এরপর আরও একটা উত্তর দেয়। ৩৫৯, ৪৬৭ ও ৮২১। এগুলো সবই মৌলিক সংখ্যা এবং যোগফল ১ হাজার ৬৪৭। প্রথমে যে উত্তর দিয়েছিল, তারচেয়ে এটা ভালো।
তাহলে চ্যাটজিপিটি তৃতীয় ধাঁধাটির মোট ছয়টি উত্তর দিয়েছে। কোনোটিকেই সঠিক বলা যায় না। কয়েকটি শর্ত ভঙ্গ করেছে এটি। তবে শেষের উত্তরটি সবচেয়ে ভালো ছিল। এরপর অবশ্য চ্যাটজিপিটি আরও একটি উত্তর দিয়েছে। ২৫৭, ৬৮৩ ও ৯৪১। তৃতীয় ধাঁধাটির দুটি উত্তর মোটামুটি সঠিক দিলেও তা যথেষ্ট নয়। মার্টিন গার্ডনারের দেওয়া যোগফলের চেয়েও কৃত্রিম বুদ্ধিমত্তার যোগফলটা অনেক বেশি। হয়তো যথাযথ উত্তর দেওয়ার জন্য এখনও সেরকম প্রোগ্রামিং করা হয়নি। আসলে চ্যাটজিপিটি হয়তো সমস্যাগুলোর সমাধান দেওয়ার পরিবর্তে সমাধানগুলো কেমন হতে পারে, তা দেখানোর চেষ্টা করে। কিংবা হয়তো বুঝতেই পারেনি ঠিকভাবে। কে জানে!
লেখক: বিজ্ঞানবিষয়ক সাংবাদিক ও লেখক, সায়েন্টিফিক আমেরিকান
অনুবাদক: সম্পাদনা দলের সদস্য, বিজ্ঞানচিন্তা
কোন মন্তব্য নেই