যন্ত্রকে কি নিজের থেকে নতুন কিছু শিখতে শেখানো সম্ভব? যন্ত্র কি ভুল থেকে শিখতে পারে আর নতুন পরিবেশে কাজে লাগাতে পারে তার অতীতের শিক্ষাগুলো? যন্ত্রের পক্ষে কি বুদ্ধিবৃত্তিক চিন্তাভাবনা সম্ভব? এমন কিছু করা সম্ভব যা যন্ত্র নিয়ে আমাদের ভাবনার সীমাকে অতিক্রম করে? যন্ত্র কি বুদ্ধিমান হতে পারে?

একটা সময়ে আমরা পড়েছিলাম কম্পিউটার একটা খুব শক্তিশালী, অথচ বড় বোকাসোকা যন্ত্র। যা বলা হয়, ঠিক তাই করে, নিজ থেকে কিছু করার মত বুদ্ধিসুদ্ধি তার নেই। তবে এখন এই কথাটাকে পুরোপুরি সত্যও বলা যায় না। মানুষের বুদ্ধির মত না হলেও, আধুনিক কম্পিউটার বা কম্পিউটার-নিয়ন্ত্রিত ডিভাইসগুলো কিন্তু মানুষের-ই প্রচেষ্টায় এক ধরণের বুদ্ধিমত্তা ঠিক-ই ধারণ করতে শুরু করেছে, যাকে আমরা বলছি কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স বা AI

আমাদের প্রতিদিনের স্মার্ট ডিভাইসগুলোর ব্যবহারে কৃত্রিম বুদ্ধিমত্তা ইতোমধ্যেই অবিচ্ছেদ্য হয়ে উঠছে। গুগল অ্যাসিস্ট্যান্ট, অ্যাপলের সিরি কিংবা আমাজনের এলেক্সা-র মত ভার্চুয়াল অ্যাসিস্টেন্টগুলোর কথা বলা যেতে পারে, যেখানে ভয়েসের মাধ্যমে যথাযথ কমান্ড দিলে তার ফলাফল চলে আসছে নিমেষেই। এর বাস্তবায়নের জন্য প্রয়োজন হয় মেশিন লার্নিং, ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, স্পিচ রিকগনিশনের মত প্রযুক্তিগুলো। সাথে এখানে ব্যবহার হয় উচ্চমানের অ্যালগরিদম, যা স্মার্ট ডিভাইসকে ব্যবহারকারীর ব্যবহারের ওপর ভিত্তি করে ক্রমাগত আরো প্রাসঙ্গিক ফলাফল দেয়ার জন্য প্রশিক্ষিত করে।

স্মার্টফোন ক্যামেরার ক্ষেত্রে প্রতিদিনের জীবনে সংশ্লিষ্ট আরেকটি উদাহরণ, যেখানে কৃত্রিম বুদ্ধিমত্তার ব্যবহার বিশেষভাবে গুরুত্বপূর্ণ হয়ে উঠছে। যে ধরণের এডিটিং বা প্রসেসিং ম্যানুয়ালি করতে বিভিন্ন সফটওয়্যারে দীর্ঘ সময়ের সাধনা প্রয়োজন ছিলো, AI-এর মাধ্যমে তা সম্ভব হচ্ছে রিয়েল টাইমেই। ছবির লাইটিং, অবজেক্ট ডিটেক্ট করে সে অনুযায়ী প্রপার প্রসেসিংয়ে কাজ করছে AI।

কৃত্রিম বুদ্ধিমত্তার ব্যবহার জীবনের আরো সুন্দর মুহুর্ত এনে দিতে পারে। চিন্তা করুন তো, কোন দূর্ঘটনায় অঙ্গ হারানো মানুষটির হারানো অঙ্গের কাজগুলো আবারো করতে পারছেন কৃত্রিম বুদ্ধিমত্তাসম্পন্ন সংযোজিত অঙ্গের মাধ্যমে? অন্ধ মা আর সন্তান একসাথে গল্পের বই উপভোগ করছেন যেখানে বই পড়ে শোনানোর কাজ করছে এ.আই? একাকী বৃদ্ধ মানুষটিকে সঙ্গ দিচ্ছে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন কিছু?

অথবা এর ঠিক বিপরীত কোন চিত্র? যেখানে মানুষের মধ্যে দুষ্কৃতিকারীরা কৃত্রিম বুদ্ধিমত্তার প্রয়োগ করছে অন্যায় কিছুর জন্য? কিংবা এ.আই-এর ওপর দখল হারিয়েছে মানুষ? কিংবা যান্ত্রিক প্রভাবে মানুষ হারিয়ে ফেলছে তার স্বাভাবিক মানবীয় অনুভূতিগুলো?

অনেক আশা, আর একই সাথে অনেক প্রশ্ন কিংবা আশঙ্কা। যন্ত্রের বুদ্ধিমত্তা কি আসলেই থাকা উচিৎ? অথবা ঠিক কতটুকুতে গিয়ে হওয়া উচিৎ তার শেষ?

বুদ্ধিমান ম্যাচের বাক্স

আধুনিক কম্পিউটার তো বুঝলাম, তাই বলে ম্যাচের বাক্সও বুদ্ধিমান হতে পারে নাকি? হ্যা, পারে বৈকি, ম্যাচের কাঠি দিয়ে দিব্যি বুদ্ধিমান কম্পিউটার বানানো যায়, যেটা দিয়ে গেম খেলা যায়। সে কথা বলবো, কিন্তু তার আগে কথা হলো ম্যাচের বাক্স কীভাবে কম্পিউটার হতে পারে? আর কম্পিউটার জিনিসটাই বা আসলে কী? ব্রিটানিকাতে কম্পিউটার নিয়ে বলা হয়েছে এভাবে: device for processing, storing, and displaying information

আর মার্টিন গার্ডনার সাহেবের বানানো ২৪টা ম্যাচ বাক্সের যন্ত্রে এই কাজটা বেশ করা যায়। এটা এক ধরণের মেকানিকাল কম্পিউটার। অবশ্যই এটা খুবই সিম্পল, কম্পিউটার বলতে আমরা যেমনটা বুঝি তেমন নয়। তবে এটা তথ্যের ভিত্তিতে আউটপুট প্রদর্শন করে এবং এমনকি এটা ভুল থেকে শিখে আপডেটও হয়।

এই কম্পিউটারটা একটা গেম খেলার জন্য তৈরি করা হয়েছে, হেক্সাপন (Hexapawn)। এটার অনুপ্রেরণা এসেছে ৩০৪টা ম্যাচবক্সের একটা কম্পিউটার থেকে, যার নাম MENACE। MENACE টিক-ট্যাক-টো, সোজা বাংলায় কাটাকুটি খেলার জন্য বানানো। আর Hexapawn খেলার এই কম্পিউটারটা MENACE-এর একটা সিম্পল সংস্করণ বলা চলে।

নিচের ছবিতে আমরা হেক্সাপনের পুরো সেটআপ দেখতে পাচ্ছি। বামদিকে ম্যাচের বাক্সগুলো আছে, প্রতিটি বাক্সে একটা করে ছবি, আর বাক্সের ভেতর ভিন্ন ভিন্ন রঙের কিছু পুঁথি রাখা হয়েছে। ডানদিকে আছে একটা হেক্সাপন বোর্ড, দাবার বোর্ডের মতই, কিন্তু ঘরের সংখ্যা 3*3। এটা টু-প্লেয়ার গেম, দু’জনের জন্য সাদা-কালো ৩টা করে গুটি আছে। খেলোয়াড়দের একজন হবে মানুষ, অন্যজন আমাদের ম্যাচের বাক্সের কম্পিউটার।

গুটির চাল দাবার সৈন্য বা pawn এর মত, অর্থাৎ খালি থাকলে সামনে এক ঘর যেতে পারবে, আর যদি প্রতিপক্ষের গুটি কাটার বা আরো সোজা বাংলায় খাওয়ার সুযোগ থাকে কেবল তাহলে কোণাকুণি চালাতে পারবে। তিনভাবে কোন খেলোয়াড় বিজয়ী হতে পারে। কোন গুটিকে বোর্ডের অপর প্রান্তে পৌঁছাতে পারলে, অথবা প্রতিপক্ষের সব গুটি কেটে দিতে পারলে অথবা প্রতিপক্ষের সম্ভাব্য কোন চাল না থাকলে। তো এখন খেলা শুরু করা যাক।

Round 1

নিয়ম অনুযায়ী, প্রথম চালটা অবশ্যই হিউম্যান প্লেয়ারকে দিতে হবে। আমি মনে করা যাক চাল দিলাম সবচেয়ে ডানের গুটি (ছবিতে দেখুন)। এখন ম্যাচের বাক্সের পালা। দেখুন প্রতিটা ম্যাচের বাক্সের ওপর একটা করে ভিন্ন ভিন্ন ছবি লাগানো আছে, আর ভেতরে কিছু রঙিন পুঁথি। আপনি অনুমান করতে পারছেন এটা কীভাবে কাজ করে? প্রথমে আমাদের দেখতে হবে বোর্ডের অবস্থা কোন ম্যাচ বাক্সের ছবির সাথে মিলে। আমার চালের পর বোর্ডের চেহারা প্রথম ম্যাচবাক্সের মত, যদিও মিররড অবস্থায় আছে, এতে অসুবিধে নেই। তো এখন এই বাক্সটা থেকে না দেখে র‌্যান্ডমলি একটা পুঁথি বের করা হবে। ধরা যাক লাল রঙের পুঁথি পাওয়া গেলো। তাহলে কম্পিউটারের চাল হবে বাক্সের ওপরে লাল চিহ্নিত চালের মত। পরের চালে আমি দ্বিতীয় ছবিতে দেখানো চাল দিলাম। তাহলে আমার একটা গুটি বোর্ডের বিপরীত প্রান্তে পৌঁছে গেলো, অর্থাৎ এই ম্যাচটা আমি জিতলাম।

কেন ম্যাচের বাক্সকে কম্পিউটার বলা হচ্ছে তা বুঝতে পারছেন কি? কম্পিউটারে আমি একটা ইনপুট দিচ্ছি, অর্থাৎ বোর্ডের যে সেটআপ আছে, তা ইনপুট হিসেবে যাচ্ছে। সম্ভাব্য চালগুলো এখানে স্টোর করা আছে এবং তা অনুযায়ী প্রসেস করে সম্ভাব্য চালগুলো থেকে একটি সে প্রদান করছে। (অবশ্য ‘প্রসেস’ শব্দটাতে এখানে প্রশ্ন থাকতে পারে, যেহেতু আউটপুট ইনপুটের ওপর নির্ভর করে সম্ভাব্য কয়েকটি থেকে একটি হচ্ছে, সে হিসেবে একে প্রসেস মনে করা যায়)

কিন্তু আমরা বলছিলাম এটা শুধু সাধারণ একটা কম্পিউটার না, এর নিজেকে উন্নত করার ক্ষমতা আছে। এখন বলি সেটা কীরকম। প্রথম রাউন্ডে কম্পিউটার হেরেছে। কেন হেরেছে? প্রথম বাক্সের ছবির মত পরিস্থিতির জন্য লাল পুঁথির চাল আউটপুট দিয়ে। এই পরিস্থিতিতে এই চাল দিলে যেহেতু কম্পিউটার হেরে যাচ্ছে, তাই লাল পুঁথি এর থেকে সরিয়ে নেয়া হবে। অর্থাৎ পরের রাউন্ডে ঠিক এই ঘটনার পুনরাবৃত্তি আর হবে না।

Round 2

দ্বিতীয় রাউন্ডেও প্রথম চাল হিসেবে আমি একই চাল দিলাম। আবারো প্রথম ম্যাচের বাক্সের মত পরিস্থিতি হবে। কিন্তু এবার আর লাল পুঁথি প্রথম বাক্সে নেই, সবুজ আর নীল পুঁথি আছে। মনে করা যাক, কম্পিউটারের আসলো নীল পুঁথি। বাকি চালগুলো ছবির মত হলো। সবশেষে এই রাউন্ডে বিজয়ী হলো কম্পিউটার। তাই এই রাউন্ডে কোন পুঁথি সরানো হবে না।

Round 3

পরের রাউন্ডে আবারো আমি একই চাল দিলাম, এবং বাকি ঘটনা ছবিতে। এবার কম্পিউটার দ্বিতীয় চালে কমলা পুঁথির চালের জন্য হেরেছে। তাই প্রথম বাক্সের সবুজ পুঁথি থাকবে, কিন্তু দ্বিতীয় বক্স থেকে কমলা পুঁথি সরিয়ে নেয়া হবে।

এরপর…

আরো রাউন্ড খেললে ঘটনাটা কীরকম হতে যাচ্ছে বুঝতে পারছেন নিশ্চয়ই? কম্পিউটার ক্রমাগত নিজেকে আপডেট করতে থাকবে এবং যে চালগুলোর জন্য সে হেরে যেতে পারে, তা সে পরিহার করবে। এখানে হেক্সাপনের একটা ইন্টেরেস্টিং ব্যাপার হলো প্রথম খেলোয়াড় যত দক্ষই হোক, দ্বিতীয় খেলোয়াড় প্রতিটি চাল পারফেক্টলি খেললে সবসময় জিততে পারবে এবং প্রথম খেলোয়াড় সবসময় হারবে। আর কম্পিউটার বারবার নিজেকে উন্নত করতে করতে ঠিক এই পর্যায়টাতেই চলে যাবে, অর্থাৎ সে পারফেকশনে পৌঁছে যাবে এবং একটা সময়ে গিয়ে কম্পিউটার প্রতিটা গেমই জিততে থাকবে।

আপনি নিজে এটা তৈরি করে দেখতে পারেন, ম্যাচ বাক্সের ওপর লাগানো ছবিগুলোর পিডিএফ এখানে আছে। অথবা সহজভাবে অনলাইনে আপনি এটা পরখ করে দেখতে পারেন, হেক্সাপন গেমটি খেলতে পারেন এখানে। শুরুর দিকে অনেকগুলো ম্যাচ-ই আপনি জিততে পারবেন, কিন্তু কিছু পরেই দেখবেন প্রতিটা ম্যাচ-ই আপনি হারতে শুরু করেছেন। যেমন আমি পরপর ৪১টি ম্যাচ খেলে ১১টি জিতেছি, যার মধ্যে ৫টি-ই প্রথম ৭ ম্যাচে, অন্যদিকে শেষের ১০ ম্যাচ একটিও জিততে পারিনি।

এখন একটা প্রশ্ন থেকে যায়, এটাকে কি অদৌ বুদ্ধিমত্তা বলা যায়? বাক্স থেকে ম্যাচ সরিয়ে নেয়াতে বুদ্ধিমত্তার প্রয়োগ কী হচ্ছে? তো বুদ্ধিমত্তার সবচেয়ে জটিল রূপ এখানে হয়ত প্রকাশিত হয়নি, তবে বুদ্ধিমত্তার মধ্যে শিখন প্রক্রিয়া একটা গুরুত্বপূর্ণ অংশ বা ধাপ। মানুষের ক্ষেত্রেও এটা খুব বেশি ভিন্ন না, যেমন বাংলা ভাষায় একটা প্রবাদ আছে, ন্যাড়া একবারই বেলতলায় যায়। ভুল থেকে আমরা শিখি। যেমন একদিন রাস্তা ভুলে ভুল রাস্তায় চলে গেলে পরদিন কিন্তু আপনি সে রাস্তায় আর যাবেন না, আপনার মস্তিষ্ক থেকে সে রাস্তায় যাওয়ার ব্যাপারটি আপনি মুছে ফেলবেন, ম্যাচের বাক্স থেকে পুঁথি সরিয়ে ফেলার মত।

হেক্সাপনের শিখনপদ্ধতিকে রিইনফর্সমেন্ট লার্নিংয়ের মধ্যে অন্তর্ভুক্ত করা যায়। রিইনফর্সমেন্ট লার্নিংয়ের ক্ষেত্রে রিওয়ার্ডপানিশমেন্টের ধারণা ব্যবহার করা হয়। এখানে শুধু পানিশমেন্ট পদ্ধতি ব্যবহার হয়েছে। অর্থাৎ, হারার ক্ষেত্রে পুঁথি বাদ দেয়া হচ্ছে, এটাকে পানিশমেন্টের সাথে তুলনা করা যায়। যদি জেতার সময় সে রংয়ের পুঁথি বাক্সে যোগ করা হত, তাহলে সেটাকে বলা হত রিওয়ার্ড।

হেক্সাপনের ক্ষেত্রে শুধু জয়ের জন্য রিওয়ার্ড দেয়া হলে শুরুর দিকে জয়ের হার আগের থেকে বেশি হবে, কিন্তু এরপর এটা যদিও উন্নত হতে থাকবে, কিন্তু কখনোই পারফেকশন পর্যন্ত পৌঁছাবে না। অন্যদিকে রিওয়ার্ড ও পানিশমেন্ট একসাথে প্রয়োগ করলে একসময় এটা পারফেকশনে পৌঁছাবে, তবে পারফেকশনে পৌঁছাতে বেশি সময় প্রয়োজন হবে। শুধু পানিশমেন্ট প্রয়োগের ক্ষেত্রে এটা শুরুর দিকে বেশি হারবে ঠিক-ই, তবে সবচেয়ে দ্রুত পারফেকশনে পৌঁছাতে পারবে।

নিয়ম ভাঙা লুকোচুরি

ম্যাচের বাক্স দিয়ে যদি এমনটা করা যায়, তবে চিন্তা করুন তো, আধুনিক কম্পিউটার ও সাম্প্রতিক গবেষণা এটাকে আরো কতদূর নিয়ে যেতে পারে? আমি কোন কল্পনার অদূর কিংবা সুদূর ভবিষ্যতের কথা বলছি না, বরং এরই মধ্যে অবিশ্বাস্য সব ঘটনা ঘটিয়েছে A.I। এমনকি কখনো তারা সাধারণ নিয়মের বাইরে গিয়ে এমন অসাধারণ কিছু করেছে, যা নির্মাতারাও চিন্তা করতে পারেনি।

OpenAI Agent-দের Hide and Seek (লুকোচুরি) খেলার এই ভিডিওতে আপনি হতবাক করা কিছু দেখতে চলেছেন। সিম্পল কিছু নিয়ম বেঁধে যখন তাদের লুকোচুরি খেলতে দেয়া হয়েছিলো, শুরুতে তারা বিক্ষিপ্ত ঘুরছিলো। কিন্তু অগণিত রাউন্ড চলতে থাকার পরে শিখতে শিখতে একটা সময়ে জেতার জন্য তারা এমন কিছু করতে শুরু করেছিলো, যা এমনকি ডেভেলোপারদের পর্যন্ত বিস্মিত করে ছেড়েছে।

এখানে জেনেটিক অ্যালগরিদমের মডেল প্রয়োগ করা হয়েছে। এই মডেলটি ডারউইনের বিবর্তন তত্ত্ব থেকে অনুপ্রাণিত প্রাকৃতিক নির্বাচনের অনুরূপ একটি প্রক্রিয়া ব্যবহার করে। এটা একটা পুনরাবৃত্তিমূলক মডেল, প্রাথমিক পপুলেশন র‌্যান্ডম বিহেভিয়র থেকে শুরু করে প্রতিটি প্রজন্মে প্রকরণ সৃষ্টি হয় এবং যোগ্যতম বৈশিষ্ট্যগুলো পরবর্তী প্রজন্মে স্থানান্তরিত হয়।

বুদ্ধিমত্তা

সে সময়ে, যখন সংখ্যা লেখা কেবল শিখছিলাম, তখন শুনতাম ১ থেকে ১০ পর্যন্ত লিখতে শিখলেই সব সংখ্যা লেখা যায়। যদিও আমার মনে হয় কথাটা সবার বেলায় খাটে না, আমার আরো কিছু বেশি শিখতে হয়েছিলো অল্প কিছু অঙ্ক দিয়ে অসংখ্য সংখ্যা লেখার রহস্য বুঝতে, তবে এটা ঠিক যে আপনি যদিও কখনোই এক কোটি তিরিশ লক্ষ একাশি হাজার তিনশো চৌত্রিশকে সংখ্যায় লিখতে আলাদাভাবে শিখেননি, কিন্তু আপনার সংখ্যা লেখার যেই জ্ঞান সাধারণভাবে আছে, তা দিয়ে আপনি অবশ্যই এই সংখ্যাকে লিখতে পারবেন।

বুদ্ধিমত্তা বলতে আমরা কী বুঝি? Google’s English Dictionary-তে ইন্টেলিজেন্সের সংক্ষিপ্ত অথচ চমৎকার একটা সংজ্ঞা দেয়া হয়েছে, “the ability to acquire and apply knowledge and skills.” চিন্তা করুন, আপনি এমন কোন একটা পরিবেশ বা পরিস্থিতিতে এসে পড়লেন যেরকম কোনকিছুর সম্মুখীন আপনি কখনো হননি। আপনি তাহলে কী করবেন? একজন মানুষ হিসেবে আপনি অতীতের অর্জিত ভিন্নতর বিভিন্ন পরিস্থিতির অভিজ্ঞতাকে বিশ্লেষণ করে এই নতুন পরিস্থিতির করণীয় আপনি ঠিক করতে পারেন, ঠিক একটু আগে দেয়া সংখ্যার উদাহরণের মত।

সহজাত প্রবৃত্তির জন্য যখন কোন প্রাণী কিছু করে, সেটা যতই জটিল বা চমকপ্রদ হোক না কেন, সেটাকে বুদ্ধিমত্তার প্রকাশ বলা হয় না। প্রাণীর আচরণের সবকিছুকে বুদ্ধিমত্তার মধ্যে ধরা হয় না, বুদ্ধিমত্তার লক্ষণ হলো পূর্বের শিক্ষাকে নতুন পরিবেশে খাপ খাওয়াতে পারা। বুদ্ধিমত্তা দিয়ে একটা প্রাণী জ্ঞান আহরণ, চিন্তা ও বিশ্লেষণের মাধ্যমে প্রয়োজনমত প্রয়োগ করতে পারে। এই সক্ষমতা প্রাণহীন যন্ত্রের মাঝে নিয়ে আসাটাকেই বলা চলে কৃত্রিম বুদ্ধিমত্তা।

অন্য প্রাণীদেরও কমবেশি বুদ্ধি রয়েছে, কিছু প্রাণী আমরা যতটা ভাবি তার থেকে বেশি বুদ্ধিমান, কিন্তু গভীর দার্শনিক পর্যায়ে না গেলে সন্দেহ নেই যে প্রাণীদের মধ্যে মানুষের বুদ্ধিমত্তা আর সবার থেকে আলাদা পর্যায়ের। তাই প্রায় সময় কৃত্রিম বুদ্ধিমত্তা দিয়ে মানুষের মত বুদ্ধিবৃত্তিক চরিত্রকে যন্ত্রের মধ্যে নিয়ে আসা বোঝানো হয়।

শুরুটা যেভাবে…

যন্ত্রের ধারণাটা এরকম যে, এখানে মেমোরি অসীম এবং একটা স্ক্যানার আছে যেটা এখানে দেয়া ইন্সট্রাকশন প্রোগ্রাম অনুযায়ী সিম্বল বাই সিম্বল সামনে-পেছনে যেতে পারবে ও সিম্বল পরিবর্তন করতে পারবে। সাদামাটা এই যন্ত্রের বিশেষত্ব হলো এর মেমোরির সীমা না থাকায় যথেষ্ট সময় দিলে তাত্ত্বিকভাবে এখানে যেকোন কম্পিউটেবল অ্যালগরিদম সমাধান করা সম্ভব। এখানেই সুপ্ত একটা প্রশ্ন চলে আসে, এমন কি হতে পারে, এ ধরণের কোন যন্ত্র নিজের ইন্সট্রাকশনকে পরিবর্তন করে নিজেকে আরো উন্নত করে তুলতে পারে?

ও আচ্ছা, যন্ত্রের নামটা এখনো বলা হয়নি, এই যন্ত্রটার নাম হলো টুরিং মেশিন। ১৯৩৫ সালে এই যন্ত্রের বিবরণ দিয়েছিলেন অ্যালান টুরিং। এটা অবশ্য বাস্তবের কোন যন্ত্র না, তবে কম্পিউটার ও আর্টিফিশিয়াল ইন্টেলিজেন্সের অগ্রগতিতে টুরিং মেশিনের ধারণা একটা গুরুত্বপূর্ণ ধাপ। ১৯৪৭ সালে অ্যালান টুরিং সম্ভবত প্রথম উন্মুক্ত বক্তব্যে যন্ত্রের বুদ্ধিমত্তার কথা তুলে ধরেছিলেন, “আমরা চাই এমন একটা যন্ত্র যেটা অভিজ্ঞতা থেকে শিখতে পারে“, এবং “এর উপায় হলো যন্ত্রকে নিজের ইন্সট্রাকশন পরিবর্তন করতে দেয়া।

প্রথম সফল A.I প্রোগ্রাম লেখা হয় ১৯৫১ সালে। এটা ছিলো একটা চেকার গেম, যেটা Ferranti Mark 1 কম্পিউটারে চলতো। প্রোগ্রামটি লিখেছিলেন ক্রিস্ট্রোফার স্ট্রেচি, যিনি পরবর্তীতে অক্সফোর্ড ইউনিভার্সিভার্সিটির প্রোগ্রামিং রিসার্চ গ্রুপের পরিচালক হয়েছিলেন। ১৯৫২ সালের মধ্যে এই প্রোগ্রামটি ডিসেন্ট গতিতে পুরো একটা চেকার গেম খেলার সক্ষমতা অর্জন করে।

মেশিন লার্নিংয়ের ডেমোন্সট্রেশন প্রথম দেখা যায় ক্যামব্রিজ বিশ্ববিদ্যালয়ের এনথনি ওয়েটিনজারের লেখা “Shopper” প্রোগ্রামে, যেটা EDSAC কম্পিউটারে রান করত। এই প্রোগ্রামের সিমুলেটেড জগত ছিলো একটা শপিং মল, যেখানে ৮টা দোকান আছে। যখন এটাকে কিছু কিনতে বলা হত, তখন র‌্যান্ডমলি সে কোন দোকানে যেত, পণ্যটা না পেলে অন্য দোকানে যেত। কিন্তু এখানে একটা ইন্টেরেস্টিং ব্যাপার ছিলো, তা হলো বিভিন্ন দোকানে ঘোরার মধ্যে সে দোকানে থাকা কিছু কিছু আইটেম মুখস্থ করে ফেলতো, ঠিক মানুষেরা স্বভাবতই যেমনটা করে! পরবর্তীতে একই আইটেম বা শিখে রাখা কোন আইটেম কিনতে বলা হলে সে অন্য দোকানে না ঘুরে সোজা ঠিক দোকানে চলে যেত। এটা এক ধরণের শিক্ষা, যাকে বলা হয় rote learning, কোন কিছুর সম্মুখীন হয়ে তা আয়ত্ত্ব করা।

বুদ্ধিমত্তার বৈশিষ্ট্য

মানুষের বুদ্ধিমত্তা কোন একক ধারণা নয়, বরং ভিন্ন ভিন্ন অনেকগুলো সক্ষমতার সমন্বয়ে গড়ে ওঠে। এর মধ্যে প্রধানতমভাবে শিখন (লার্নিং), যুক্তিপ্রয়োগ (রিজনিং), প্রবলেম সলভিং, উপলদ্ধি (পার্সেপশন)ভাষা ব্যবহারের সক্ষমতাকে গবেষকরা এ.আই এর জন্য প্রাধান্য দিয়ে থাকে।

লার্নিং

লার্নিংয়ের মধ্যে দুটো প্রকার আছে, rote learning-এর কথা আগেই বলা হয়েছে, কোন কিছুর সম্মুখীন হয়ে তা আয়ত্ব করা। দ্বিতীয় প্রকারটি হলো conceptual learning। Conceptual learning এর ক্ষেত্রে জেনারেলাইজেশন এর আইডিয়া ব্যবহার করা হয়। যেমন কিছু সংখ্যা লিখতে শিখে আমরা একটা জেনারেল আইডিয়া পেয়েছিলাম কীভাবে সকল সংখ্যা লেখা যায়। ধরা যাক আপনি বিদেশি কোন বন্ধুকে বাংলা শেখাচ্ছেন। করা-করব, বলা-বলব এভাবে কিছু যদি শেখান, সে কিন্তু ধারণা করে নিতে পারবে খেলা, চলা, পড়া এরকম অন্য ক্রিয়াগুলো ভবিষ্যত কালে কীভাবে রূপান্তর করা যায়।

Rote learning এর ক্ষেত্রে এই ব্যাপারটি নেই। ম্যাচ বাক্স এ.আই-তে যেমন প্রতিটা ভুল শুধুমাত্র ভুল করার পর-ই সংশোধন সম্ভব হয়, আগের ভুল থেকে জেনারেল কোন আইডিয়া নেয়ার সুযোগ থাকে না। এধরণের লার্নিং ইমপ্লিমেন্ট করা তুলনামূলক সহজ। তবে মেশিনের বেলায় জেনারেলাইজেশন নিয়ে আসাটা এর তুলনায় জটিল একটি কাজ।

রিজনিং

রিজনিং হলো সিচুয়েশনকে যুক্তি-পাল্টা যুক্তি দিয়ে বিশ্লেষণ করে একটা যথোপোযোগী সিদ্ধান্তে উপনীত হওয়া। পরীক্ষার রেজাল্টের পর কারো যদি চেহারা কালো দেখেন, তাহলে আপনি রিজনিংয়ের মাধ্যমে বুঝে নিতে পারেন, তার রেজাল্ট আশানুরূপ হয়নি। রিজনিং দু’প্রকার, InductiveDeductive

Inductive reasoning হলো পূর্বে আহরিত তথ্যের ভিত্তিতে সম্ভাব্য আরও তথ্য উদঘাটন করার প্রক্রিয়া। বৈজ্ঞানিক ক্ষেত্রে এধরণের রিজনিং প্রচলিত। অবশ্য এখানে কালো রাজহাঁস তত্ত্বের (Black swan theorem) ব্যাপারটা চলে আসে, অর্থাৎ, সারাজীবন সাদা রাজহাঁস দেখে কেউ সিদ্ধান্ত নিলো সব রাজহাঁসের রং সাদা, তারপর একদিন সে কালো রঙের রাজহাঁস দেখলো, তখন তার পরিবর্তিত সিদ্ধান্ত হলো অধিকাংশ রাজহাঁস সাদা, তবে কালো-ও হতে পারে। মানে পরবর্তীতে পূর্ববর্তী সিদ্ধান্তের সাথে যথেষ্ট পরিমাণে অসামঞ্জস্যপূর্ণ তথ্য পাওয়া গেলে Inductive reasoning-এ সংস্কার প্রয়োজন হয়।

Deductive reasoning হলো এক্সিস্টিং কোন তত্ত্বকে বেসিক স্বীকার্য ও নিয়মের সাহায্যে অকাট্যভাবে প্রমাণের প্রক্রিয়া। গণিত ও যুক্তিবিদ্যায় এই ধরণের রিজনিং কমনলি ব্যবহার হয়।

কৃত্রিম বুদ্ধিমত্তায় রিজনিং ইতোমধ্যে বেশ অগ্রগতি দেখেছে, বিশেষ করে ডিডাকটিভ রিজনিংয়ের ক্ষেত্রে। তবে গবেষকদের আল্টিমেট লক্ষ্য থেকে এখনো তা বহুদূর, এবং কৃত্রিম বুদ্ধিমত্তায় এটা কঠিনতম সমস্যাগুলোর একটি।

প্রবলেম সলভিং

প্রবলেম সলভিং হলো সম্ভাব্য একশনগুলো থেকে লক্ষ্যে পৌঁছানোর জন্য সঠিক একশনগুলো পর্যায়ক্রমে অনুসন্ধানের প্রক্রিয়া। যেমন ধরা যাক একটা সিম্পল রোবটের জন্য একশনগুলো হতে পারে: ওঠানো, নামানো, সামনে যাওয়া, পেছনে যাওয়া, ডানে যাওয়া, বামে যাওয়া। একটা বাক্সকে এক জায়গা থেকে অন্য জায়গাতে রাখতে তাকে কোনটির পর কোনটি করতে হবে এটার অনুসন্ধান হলো প্রবলেম সলভিং।

প্রবলেম সলভিং স্পেশাল-পারপোজজেনারেল-পারপোজ হতে পারে। স্পেশাল-পারপোজ প্রবলেম সলভিং প্রক্রিয়া শুধু নির্দিষ্ট কোন প্রবলেম সলভ করার জন্য উপযোগী হয়, এবং প্রবলেমের জন্য স্পেসিফিক সিচুয়েশন নিয়ে কাজ করে। অন্যদিকে জেনারেল-পারপোজ প্রবলেম সলভিংয়ের প্রাসঙ্গিকতার ক্ষেত্র বিস্তৃত। আর্টিফিশিয়াল ইন্টেলিজেন্সে জেনারেল পারপোজ প্রবলেম সলভিংয়ের একটা উদাহরণ হলো means-end analysis, যা নির্দেশ করে পর্যায়ক্রমিকভাবে ধাপে ধাপে বর্তমান অবস্থা ও চূড়ান্ত লক্ষ্যের পার্থক্য কমিয়ে আনা।

পার্সেপশন

মানুষের ক্ষেত্রে আমাদের ইন্দ্রীয়গুলোর মাধ্যমে আমাদের আশেপাশের পরিবেশকে উপলদ্ধি করি। আর্টিফিশিয়াল ইন্টেলিজেন্স-এর ক্ষেত্রে বিভিন্ন কৃত্রিম সেন্সর ব্যবহার করে আশেপাশের পরিবেশকে স্ক্যান করে বিভিন্ন অবজেক্টকে তাদের স্থানিক অবস্থা অনুযায়ী পৃথক করা হয়। এই বিশ্লেষণের ব্যাপারটাতে বেশ কমপ্লিকেসি আছে, কেননা একই জিনিস বিভিন্ন দিক থেকে, ভিন্ন রকম আলোতে বা ভিন্ন পরিবেশে আলাদা দেখাতে পারে।

তবে এরকম জটিলতা স্বত্ত্বেও গবেষণায় পার্সেপশন এ পরিমাণ এগিয়েছে যে অপটিকাল সেন্সরের সাহায্যে এ.আই বিভিন্নজনকে আলাদাভাবে চিহ্নিত করতে পারছে, স্বয়ংক্রিয় গাড়ি চালক ছাড়া রাস্তায় সাধারণ গতিতে চলাচল করতে পারছে এবং বিল্ডিংজুড়ে ঘুরে রোবট সোডার খালি ক্যান সংগ্রহ করতে পারছে।

মেশিন লার্নিং

এতক্ষণে নিশ্চয়ই বুঝতে পারছেন কৃত্রিম বুদ্ধিমত্তা নিছক কিছু if… else এর সমষ্টি কিংবা এটা হলে এটা কর, ওটা হলে ওটা কর এরকমটা থেকে বেশি কিছু। বরং এক অর্থে এর উল্টোটাই বলা যায়, যেন মেশিনকে এমনভাবে শেখানো যায় যে সবকিছু আলাদাভাবে বলে বলে দিতে না হয়। মেশিন লার্নিং হলো সুনির্দিষ্টভাবে সে বিষয়ের জন্য প্রোগ্রাম করা ছাড়া তথ্য ও উপাত্ত থেকে কোন বিষয়ে মেশিনের পারফর্মেন্সে ইম্প্রুভ করানোর মেথড।

লার্নিং ও জেনারেলাইজেশন নিয়ে আগেই বলা হয়েছে। মেশিন লার্নিংয়ে যন্ত্রকে কিছু তথ্য নমুনা হিসেবে দেয়া হয়, একে বলা হয় ট্রেনিং ডাটা। এরপর যন্ত্র ট্রেনিং ডাটার ওপর ভিত্তি করে যন্ত্রের অ্যালগরিদম একটি মডেল তৈরি করে, যে মডেলের সাহায্যে অন্যান্য ডাটাকে বিশ্লেষণ করে যন্ত্র সিদ্ধান্ত বা প্রেডিকশন প্রদান করতে পারে।

মেশিন লার্নিংকে বিস্তৃতভাবে সুপারভাইজড, আনসুপারভাইজড অথবা রি-ইনফর্সমেন্ট এই তিনটি ক্যাটাগরীতে ভাগ করা যায়। তাছাড়া কোন সিস্টেমে একাধিক পদ্ধতি একসাথে ব্যবহার হতে পারে, কিংবা এমন কোন পদ্ধতিও নেয়া হতে পারে যা এই তিনটির কোনটিতেই সম্পূর্ণভাবে পড়ে না।

সুপারভাইজড লার্নিং: এক্ষেত্রে মেশিনকে প্রশিক্ষিত করার জন্য সরবারহ করা ট্রেনিং ডাটাগুলো লেবেল করা থাকে, যেখানে সংশ্লিষ্ট ইনপুট ও আউটপুট জোড় আকারে দেয়া থাকে এবং সফটওয়্যার অ্যালগরিদম তা অ্যানালাইজ করে প্রদত্ত উদাহরণের সাপেক্ষে নতুন কোন উদাহরণের ক্ষেত্রে প্রয়োগ করতে শেখে।
আনসুপারভাইজড লার্নিং: এখানে শুধু ইনপুট ডাটা সরবরাহ করা হয় এবং তা লেবেলযুক্ত থাকে না। অ্যালগরিদম এগুলোকে বিশ্লেষণ করে অর্থপূর্ণভাবে পারস্পরিক সম্পর্ক অনুসন্ধানের মাধ্যমে গুচ্ছবদ্ধ করে এবং নতুন ডাটার ক্ষেত্রে সাদৃশ্য-বৈসাদৃশ্যের ভিত্তিতে প্রতিক্রিয়া করে।
সেমি-সুপারভাইজড লার্নিং: সুপারভাইজড ও আনসুপারভাইজড লার্নিং প্রক্রিয়ার মিশ্রণে সেমি-সুপারভাইজড লার্নিং কাজ করে। এখানে লেবেলকৃত ট্রেনিং ডাটা সরবারহ করা হয়, আবার পাশাপাশি অ্যালগরিদমকে ডাটাগুলো এক্সপ্লোর করে নিজের মত সম্পর্ক তৈরির সুযোগ দেয়া হয়।
রিইনফর্সমেন্ট লার্নিং: হেক্সাপনের কথাতে আমরা রিইনফর্সমেন্ট লার্নিং-এর একটা প্রয়োগ দেখেছিলাম। এখানে একটা আল্টিমেট লক্ষ্য থাকে এবং অ্যালগরিদমকে এমনভাবে প্রোগ্রাম করা হয় যেন যখন সে লক্ষ্য অর্জনের জন্য উপকারী কোন পদক্ষেপ নেয় তখন সে রিওয়ার্ড অর্জন করে, আর যদি লক্ষ্য থেকে দূরে সরিয়ে দেয়া কিছু করে, তখন পানিশমেন্ট পায়।

মেশিন লার্নিংকে বাস্তবায়নের জন্য বিভিন্ন ধরণের মডেল ব্যবহার হয়। এর মধ্যে আছে আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক, ডিশিসন ট্রি, সাপোর্ট ভেক্টর মেশিন, রিগ্রেশন এনালাইসিস, বায়েসিয়ান নেটওয়ার্ক, জেনেটিক অ্যালগরিদম প্রভৃতি।

আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক (ANN)

প্রাণীর মস্তিষ্কে বায়োলজিকাল নিউরাল নেটওয়ার্ক যেভাবে কাজ করে, কিছুটা তার অনুরূপ প্রক্রিয়াকে কৃত্রিমভাবে বাস্তবায়নের প্রচেষ্টা হলো আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক। নিউরনের পরিবর্তে এখানে থাকে আর্টিফিশিয়াল নিউরন বা নোডস। নোডগুলো পরস্পর সংযুক্ত হয়ে আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক গড়ে তোলে।

শুরুতে আর্টিফিশিয়াল নিউরাল নেটওয়ার্ককে প্রয়োজনীয় বিষয়ে প্রচুর পরিমাণ তথ্য প্রদানের মাধ্যমে প্রশিক্ষিত করা প্রয়োজন হয়। নিউরাল নেটওয়ার্কের প্রথম লেয়ারটি ইনপুট লেয়ার, যা বাইরে থেকে তথ্য গ্রহণ করে। প্রতিটি নোডে থাকা জ্ঞান অনুযায়ী কিছু গাণিতিক অপারেশনের মধ্য দিয়ে তথ্যগুলো মডিফাইড হয় এবং এরপর পর্যায়ক্রমে পরবর্তী লেয়ারে তথ্যগুলো প্রেরণ হতে থাকে। সবশেষে তা আউটপুট লেয়ারে পৌঁছায়। মাঝের লেয়ারগুলোকে হিডেন লেয়ার বলা হয়।

ছবি: উইকিমিডিয়া থেকে

ডিপ লার্নিং

ডিপ লার্নিং মেশিন লার্নিংয়ের একটি প্রকার, যা আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক ও ফিচার লার্নিংয়ের ওপর ভিত্তি করে গড়ে উঠেছে। ডিপ শব্দটি নির্দেশ করে একাধিক লেয়ারের সমন্বয়ে নেটওয়ার্কটি গড়ে ওঠেছে। ছবি, হাতের লেখা কিংবা কথা শনাক্তকরণের বিষয়টি এখন বেশ সাধারণ, স্মার্টফোনে আমরা প্রতিনিয়তই এরকম কাজগুলো করি। এই ব্যাপারগুলো সফল করতে ডিপ লার্নিংয়ের প্রয়োজন হয়।

আমার মত আরো একজন…

“একবার আমার বন্ধু বলেছিলো, তুমি তোমার ক্লোন বানাতে পারো না, তুমি একসাথে দু’জায়গায় থাকতে পারো না”- নিউজিল্যান্ডের অকল্যান্ডের সোল মেশিনস কোম্পানির সাথে নিজের এভাটার বানানোর বিষয়ে কথাগুলো উইলিয়াম জেমস এডামস জুনিয়রের, একজন মিউজিশিয়ান হিসেবে যিনি উইল.আই.এম নামে পরিচিত, “এভাটারের অঙ্গীকার এটাই!”

ডিজিটাল এভাটার সত্যিকারের কোন ক্লোন নয়। উইলের লক্ষ্যও তার ক্লোন তৈরি করা নয়। বরং তার ইচ্ছা এমন কিছু, যা সোশ্যাল মিডিয়ার জগতে তার কাজগুলো তার মত নিয়ন্ত্রণ করবে, এমন কিছু যা তাকে আরো ক্রিয়েটিভিটি, কিংবা জনহিতকর কাজের জন্য সময় করে দিবে। উইল সচেতনভাবে তার আর এভাটারের মধ্যে পার্থক্য রাখতে চেয়েছেন, তাই লিড অডিও ডিজাইনার যখন বলেছেন এভাটারের কথা ঠিক তার মতই শোনাবে, তখন উইল বলেছিলেন যে তিনি চাননা এটা পুরোপুরি একুরেট হোক, যেন এমন কিছু থাকে যে বোঝা যায় এটা AI।

The Age of AI from Stuart Parker on Vimeo.

তবে সোল মেশিনসের সিইও মার্ক স্যাগারের ভিশন আরো বিস্তৃত। তার স্বপ্ন এমন ভবিষ্যতের যেখানে মানুষ আর যন্ত্র পরস্পরের সহযোগী হবে আর তার মতে এর সেরা উপায় হলো A.I-কে যতটা সম্ভব জীবন্তরূপী করে তোলা। কান্নার ভাষা থেকে আধো আধো কথা থেকে একসময় জটিল বিষয়গুলো নিয়ে চিন্তা করতে পারা- মানুষের শেখার শুরুটা তার জন্মের সময় থেকেই। Artificial Intelligence-কে যদি ঠিক মানুষের মত করে শেখাতে হয়, একটা শিশুর থেকে উপযুক্ত মডেল কী হতে পারে?

মার্ক স্যাগার তাই শুরু করেছেন এখান থেকেই- Baby X, একটা শিশুর প্রাণবন্ত সিমুলেশন, যার মডেল মার্কের নিজের শিশু কন্যা। Baby X ক্যামেরা ও মাইক্রোফোনের মাধ্যমে দেখতে ও শুনতে পারে। এখানে অবজেক্ট রিকগনিশন পদ্ধতি ব্যবহার হয়েছে, যা বস্তুর মধ্যে প্যাটার্ন অনুসন্ধানের মাধ্যমে আলাদা আলাদা বস্তু চিহ্নিত করতে পারে।

Baby X-কে গঠন করা হয়েছে ঠিক মানুষের গঠনের একটা ভার্চুয়াল সিমপ্লিফায়েড সংস্করণ করে। যা নিয়ন্ত্রিত হয় ভার্চুয়াল মাসল দ্বারা এবং ভার্চুয়াল মাসলকে নিয়ন্ত্রণ করে ভার্চুয়াল ব্রেন তথা আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক। এমনকি ভার্চুয়াল হরমোন, নিউরোট্রান্সমিটার পর্যায়ে এর ডিটেইলিং করা হয়েছে, তার ফলে এখানে রয়েছে স্ট্রেস সিস্টেম, ফলে Baby X ভয় কিংবা আনন্দের বিষয়গুলোতে প্রতিক্রিয়া করতে পারে।

How Far is Too Far? | The Age of A.I. থেকে অংশবিশেষ | ফেয়ার ইউজ

একটুখানি আশার আলো

একজন পেশাদার ফুটবলার টিম শ, তিন বর্ণের NFL ছিলো যার স্বপ্ন, ২০১২ সাল থেকে অনুভব করতে থাকেন তার শারীরিক সামর্থ্য আর আগের মত নেই। ২০১৪ সালে, ৩০ তম জন্মদিনের পা রাখার এক মাস পর ডাক্তার তাকে জানালেন ভয়ঙ্কর সত্যটি- অন্য তিনটি বর্ণ, ALS (Amyotrophic lateral sclerosis), স্নায়ুতন্ত্রের রোগ, যাতে মাংসপেশীর ওপর নিয়ন্ত্রণ হারাতে থাকে।

ডাক্তার জানিয়েছিলেন তার আয়ুষ্কাল দুই থেকে পাঁচ বছর রয়েছে। সে সময়টি পার হয়েছে, অনুমান সত্য হয়নি। তবে ALS কেড়ে নিয়েছে হাঁটাচলা কিংবা অঙ্গগুলো স্বাভাবিক ব্যবহারের ক্ষমতা, সাধারণভাবে কোন কিছু চিবিয়ে বা গিলে খাওয়ার ক্ষমতাসহ তার জীবনের অনেক কিছু। টিম শ-র ভাষায়, “মনে হয় আমার জন্য সবচেয়ে কঠিন বিষয়টা হলো আমি একটা মাঝামাঝি পরিস্থিতিতে আছি, যেখানে আমি এখনও কথা বলতে পারি, কিন্তু আমার কথার অনেক কিছুই বোঝা যায় না।”

টিম শ-র বাবা এই ঘটনা বলতে গিয়ে আবেগী হয়ে পড়ছিলেন যে, একবার যখন টিম শ মোবাইলে ভয়েস অ্যাসিস্টেন্টকে Call Dad কমান্ড দিতে চাইছিলেন, ‘Dad’ শব্দটা ভয়েস অ্যাসিস্টেন্ট ডিটেক্ট করতে পারছিলো না। তাই টিম শ বাবার নাম্বারকে ‘Dad’-এর পরিবর্তে ‘Yo yo’ হিসেবে পরিবর্তন করেন।

আকিকো ইশি, একজন জাপানী, যিনি একটি ইনকর্পোরেট সমিতি পরিচালনা করছেন, আর স্বামী ও ৫-৬ বছরের শিশুকন্যাকে নিয়ে যার সংসার, একটি অপারেশনের ফলে তার দৃষ্টিশক্তি হারিয়েছিলেন ২০০৩ সালে। শান্তি, ভারতের একজন গৃহিণী, যার পরিশ্রমের জীবন আরো কঠিন হয়ে উঠেছে ডায়েবেটিসের ফলে দৃষ্টি ক্রমশ দুর্বল হচ্ছে এবং দ্রুত চিকিৎসা না হলে যা রূপ নিতে পারতো অন্ধত্বে।

জেসন স্নেইডার, একজন ফিল্মমেকার, যিনি তার এক হাত হারিয়েছিলেন ১২ বছর বয়সে। একইভাবে জেসন বার্নেস, একজন মিউজিশিয়ান, তার এক হাত হারিয়েছেন ২২ বছর বয়সে।

চিকিৎসাবিজ্ঞান কিংবা AI এমন জাদুকরী পর্যায়ে পৌঁছেনি যে শারীরিক ক্ষমতা হারানো মানুষকে ক্ষমতা, দৃষ্টি বা শ্রবণশক্তি হারানো মানুষকে সে শক্তি কিংবা অঙ্গহারা মানুষকে তাদের হারানো অঙ্গ ফিরিয়ে দিবে। তবু তাদের জীবনে একটুখানি আশার আলো এনে দিতে, কিংবা কিছু টুকরো টুকরো সুখের মুহুর্ত এনে দিতে সাধনা চালাচ্ছে A.I গবেষকরা।

টিম শ, যখন জীবনের সবচেয়ে কঠিন সময়ের মুখোমুখি হয়েছেন, একটুখানি অর্থবহ কিছু করার জন্য তিনি অংশ নিয়েছেন ALS রোগের প্রতি সচেতনতা তৈরির জন্য আইস বাকেট চ্যালেঞ্জে। আইস বাকেট চ্যালেঞ্জে ২২০ মিলিয়ন ডলারেরও বেশি ফান্ড উঠেছে, যা ALS TDI (ALS Therapy Development Foundation) এর হাতে এনে দিয়েছে পর্যাপ্ত অর্থ আরো অনুসন্ধানের জন্য ALS রোগীদের বিষয়ে তথ্য সংগ্রহ করতে।

ALS রোগীদের ভয়েস রিকগনিশন উন্নত করার জন্য ALS TDI কাজ করেছে গুগলের Project Euphonia-র সাথে। এটা ছিলো টিম শ-এর জন্য অর্থবহুল কিছু করার সুযোগ। ২০১৯ সাল নাগাদ ২ হাজারের অধিক বাক্য তিনি রেকর্ড করেছেন, যদিও তার জন্য কথা বলা সাধারণ মানুষের থেকে কঠিন, তবে তিনি তার সামর্থ্যের সবটুকু করতে চান শেষ নিঃশ্বাস ব্যয় করে হলেও।

এই ইনিশিয়েটিভ ভয়েস রিকগনিশনকে অনেক উন্নত করতে পেরেছে স্বাভাবিক কন্ঠহারা মানুষদের জন্য। টিম শ ও তার পরিবারকে গুগল ইউফোনিয়া উপহার দিতে পেরেছে এমন প্রযুক্তি, যা আগের থেকে অনেক একুরেটভাবে টিম শ-র কথা শনাক্ত করতে পারে। তবে তাদের পক্ষ থেকে ছিলো আরেকটি উপহার, স্পিচ সিনথেসিস ইঞ্জিন, যেটা টিম শ-র কথাকে রূপ দিতে পারে টিম শ-র আগের ভয়েসে। যে কন্ঠ শোনার জন্য তার বাবা-মার অপেক্ষা ছিলো বহুদিনের…

আকিকো ইশি-র জীবনের অনেক কিছু সহজ করে দিয়েছে AI। মাইক্রোসফটের দৃষ্টিসম্পন্ন এ.আই ব্যবহার করে তিনি আশেপাশের বিভিন্ন বস্তু, তাদের রং, লাইটিং প্রভৃতি সম্পর্কে জানতে পারেন। বিভিন্ন লেখা AI তাকে পড়ে শোনাতে পারে। সন্তানের সাথে সুন্দর কিছু সময় কাটাতে পারেন AI-এর সাহায্যে।

ভারতের মত রোগীর তুলনায় পর্যাপ্ত ডাক্তারের সংকটসম্পন্ন একটি দেশে অনেক দেরি হয়ে যাওয়ার আগেই শান্তির চোখের রোগের শনাক্তকরণকে সহজ করেছে AI, যেখানে ব্যবহার হয়েছে ইমেজ রিকগনিশন প্রযুক্তি। লেজার ট্রিটমেন্টের মাধ্যমে তার চোখের চিকিৎসা হয়েছে এবং ডাক্তার জানিয়েছেন ডায়াবেটিস নিয়ন্ত্রণে রাখতে পারলে তার চোখ ভালো থাকবে।

জর্জিয়া টেক সেন্টার ফর মিউজিক টেকনোলজির শুরু হয়েছিলো মিউজিক নিয়ে ক্রিয়েটিভ ও এক্সপ্রেসিভ কিছু করার জন্য। তারা তৈরি করেছিলেন এমন রোবট যা মেশিন লার্নিংয়ের মাধ্যমে ছন্দ ও প্যাটার্ন খুঁজে নিতে পারে। এরপর হাত হারানো মিউজিশিয়ান জেমস বার্নেসের জন্য তৈরি করেছিলেন দুটো স্টিকসম্পন্ন এমন কৃত্রিম বাহু যার একটি স্টিক বাজারে থাকা স্টিকগুলো থেকে বেশি নিয়ন্ত্রণযোগ্য, অন্যটি মিউজিক ডিটেক্ট করে এ.আই ব্যবহার করে ইম্প্রুভাইজ করতে পারে।

তবে এখান থেকে জর্জিয়া টেক সেন্টারের যাত্রা শুরু হয় আরো বড় কিছুর দিকে, স্কাইওয়াকার হ্যান্ড। একটা কৃত্রিম হাত, যার পাঁচটি আঙ্গুল আলাদাভাবে নিয়ন্ত্রণযোগ্য, যেভাবে অবচেতন মনে আমরা আমাদের অঙ্গগুলো নিয়ন্ত্রণ করি। স্কাইওয়াকার হ্যান্ড ব্যবহার করে আল্ট্রাসাউন্ড টেকনোলজি, যার মাধ্যমে এটা দেহের অভ্যন্তরীণ ইমেজ শনাক্ত করতে পারে।

অঙ্গ হারালেও মস্তিষ্কে স্মৃতি থেকে যায় অঙ্গ পরিচালনার সময় আমরা ঠিক কীভাবে মাংসপেশী পরিচালনা করতাম। প্রতিটি মুভমেন্টের জন্য আল্ট্রাসাউন্ডে শনাক্তকৃত ছবির ভিত্তিতে মেশিন লার্নিংয়ের মাধ্যমে প্যাটার্ন অনুসন্ধান করে হারানো অঙ্গের মুভমেন্টগুলো সিমুলেট করা সম্ভব। এখনো এই প্রযুক্তি পারফেক্ট নয়, আর স্বাভাবিক হাত থাকা আর রোবটিক হাতের ৫টা আঙ্গুল আলাদাভাবে নিয়ন্ত্রণ করতে পারা দুটো এক নয়। কিন্তু কৃত্রিম অঙ্গের উন্নয়নে স্কাইওয়াকার হ্যান্ড এক নতুন দিগন্তের সূচনা করেছে নিঃসন্দেহেই।

যে লেখা কোন মানুষ লিখেনি…

We are living in a world where AI is becoming more and more important. And it is not just the big companies that are benefiting from this. Bloggers, for example, are also starting to use artificial intelligence to generate content for their blogs.

And there is no denying that this will have an impact on the way we blog in the future. We can already see some of these changes happening today. For example, bloggers now have AI writing assistants to help them with their content and to generate ideas at scale when they need them.

ওপরের লেখাটা আমি লিখিনি। অনলাইনে কোন আর্টিকেল থেকেও এটা কপি করা নয়। এটা লিখে দিয়েছে একটা AI Writer। চমৎকার ব্যাপার হলো এই লেখাটা ইউনিক। কোন লেখা ইউনিক কিনা জানার একটা চমৎকার উপায় আছে। গুগলে কোন কিছু উদ্ধৃতি চিহ্নের মধ্যে (” “) সার্চ করলে তা হুবহু সার্চ হয়। লেখার sentence-গুলো এভাবে পরখ করে দেখতে পারেন।

আমাকে শুধু এটুকু জানাতে হয়েছে, আমি কী চাচ্ছি, যেটা ছবিতে দেখিয়েছি। তারপর ১০ সেকেন্ডের অপেক্ষা এবং বুম!

দেখতে পাচ্ছেন আমার কী-ওয়ার্ডগুলো সব ইউজ হয়নি এখানে, তবে অন্তত আমার কাঙ্ক্ষিত টপিকে লেখাটা টু দি পয়েন্ট ছিলো। তো AI Writer আসলে কী? আর কীভাবে কাজ করে? চলুন একে জিজ্ঞাসা করি-

AI writers are a new technology that has been around for about two years. They are software programs that can generate text based on the input of an AI writer. The AI writers are used to generate content for a specific topic or niche, or to generate all kinds of content for digital agencies’ clients.

The AI writers work by using Natural Language Processing (NLP) to understand what the human wants it to write and then using General Intelligence (G-intelligence) to come up with various sentences and words that fit the request. It is important to note that this technology is not meant as a replacement for human copywriters, but rather as an assistant who can provide creative ideas and emotional support during writing sessions.

এখানে সেকশন টপিক দেয়া হয়েছে: What is AI writer? How it works? এবং কীওয়ার্ডগুলো ছিলো: General Intelligence, Natural language processing। এবং এটা এতটা চমৎকারভাবে রিলিভেন্ট রেজাল্ট দেয়, যা সত্যিই একটা বিস্ময়!

একাধিক AI Writer রয়েছে, এবং কনটেন্ট জেনারেশনের ক্ষেত্রে ইতোমধ্যে এটা জনপ্রিয়তা পেয়েছে। আমি যে সার্ভিসটি ব্যবহার করেছি তা হলো, Rytr। দারুণ ব্যাপারটা হলো এটা ব্যবহারে কোন জটিলতা নেই এবং প্রতি মাসে তারা ৫০০০ ক্যারেক্টার পর্যন্ত জেনারেট করার সুযোগ দেয় ফ্রি অ্যাকাউন্টে।

অদ্ভুত ভাবনার প্রতিচ্ছবি…

শুরুটা করেছিলো This Person Does Not Exist, যার সাথে আমরা অনেকেই পরিচিত। প্রতিবার রিলোডে এটা একটা নতুন মানুষের ছবি এনে দেয়। StyleGAN2 ব্যবহার করে এটা কাজ করে, যা একটি মেশিন লার্নিং ফ্রেমওয়ার্ক, Generative adversarial network এর অন্তর্ভুক্ত। পরবর্তীতে এধরণের আরো ওয়েবসাইট গড়ে ওঠেছে, যেমন This Cat Does Not Exist জনপ্রিয় একটি।

ছবিগুলো যতটা রিয়েলিস্টিক, তা সত্যিই আশ্চর্যকর। কিন্তু এ পর্যন্ত এটা একটা বিষয়, কেননা অনলাইনে অজস্র মানুষ কিংবা বিড়ালের অজস্র ছবি আছে, যা থেকে AI-কে ট্রেইনড করা যায়। কিন্তু যদি বলি এমন কিছুর কথা, যাকে যা বর্ণনা দেয়া হবে, তারই ছবি তৈরি করে দিবে অল্প সময়ের মধ্যেই, এমনকি সবচেয়ে উর্বর কল্পনাগুলোরও?

অসম্ভব? হয়ত সুদূর ভবিষ্যতে কোনদিন হবে? নাহ, আমি দ্বাবিংশ শতকের প্রযুক্তির উৎকর্ষে উদ্ভাসিত কাল্পনিক কোন পৃথিবীর আশ্চর্য আবিষ্কারের কথা বলছি না, আমি বলছি ঠিক এখনকার কথা। কারণ AI গবেষকদের সাধনা ইতোমধ্যেই এই আপাত অসম্ভবকে সম্ভব করেছে।

“A robot in a car on a busy road at the midnight on the moon”-এটার ভিজ্যুয়ালাইজেশন কেমন হতে পারে? ইমাজিন করাও আমার জন্য সহজ নয়, তবে AI আমাকে এর ছবি দিতে কিছু সেকেন্ডের বেশি নেয়নি-

আমি যা বলেছি, ছবিগুলো পুরোপুরি তা নয়। কিন্তু যখন আপনি চিন্তা করছেন কোন মানুষ এই ছবিগুলো আঁকেনি, এই ছবিগুলো জেনারেট হয়েছে কৃত্রিম বুদ্ধিমত্তার মাধ্যমে, তখন আপনাকে বিস্মিত হতেই হবে। মানে আমি সুদূর কোন ভবিষ্যতের কথা বলছি না, ঠিক এখন-ই AI এতটা অসাধারণ কিছু করে ফেলছে কয়েক সেকেন্ডেই, যা মানুষের করতে উচ্চমাত্রার ক্রিয়েটিভিটি, দক্ষতা ও সময়ের প্রয়োজন!

তবে ছবিগুলোতে রেজ্যুলেশন কম মনে হতে পারে, কারণ আসলেই ছবিগুলো হাই রেজ্যুলেশনের না। কারণ আমি Hotpot AI Art Maker ব্যবহার করেছি, যেখানে ক্রেডিট কিনে আরো বেটার রেজ্যুলেশন পাওয়া গেলেও বিনামূল্যে তারা 256 x 256 রেজ্যুলেশনের ছবি প্রদান করে থাকে। তবে এটার সমাধানে আবারো এগিয়ে আসতে পারে AI, এখন আমি যে সার্ভিসটি ব্যবহার করছি, তা হলো Bigjpg

একই ছবিকে সাধারণভাবে ৪ গুণ জুম করার পর আর Bigjpg-র AI ব্যবহার করে ৪ গুণ আপস্কেল করার তফাৎটা খুব পরিষ্কার-

যদি এ সবকিছু আপনাকে যথেষ্ট বিস্মিত করতে না পারে, তবে চলুন এর আরো অত্যাধুনিক রূপ দেখে আসি। OpenAI-এর ডেভেলোপকৃত DALL.E 2, স্বাভাবিক ভাষা থেকে বাস্তবিক ছবি তৈরি ‘বিস্ময়কর’ একটা AI। তবে DALL.E 2 সবার জন্য উন্মুক্ত নয়। OpenAI এটা বাছাইকৃত অল্প কিছু মানুষের মধ্যে রেখেছে এখন পর্যন্ত। Marques Brownlee, যিনি MKBHD নিকনেমে সমধিক পরিচিত, তাকে সম্প্রতি একদিনের জন্য এটা ব্যবহারের সুযোগ দেয়া হয়েছিলো এবং এটা অবিশ্বাস্য সব রেজাল্ট দেখিয়েছে-

আরো কিছু আই-ক্যান্ডি যুক্ত করি। নিচে যে ৮টি ওয়ালপেপার দেখা যাচ্ছে, তা Simon Butcher তৈরি করেছেন আর্টিফিশিয়াল নিউরাল নেটওয়ার্কের মাধ্যমে। এমাজিং নয় কি?

যেখানে আশা আছে, আছে আশঙ্কা…

ইঞ্জিনিয়ারিং ইথিকসে আমাদের শেখানো হয়েছে প্রযুক্তি নিয়ে অধিকতর আশাবাদী কিংবা হতাশাবাদী দুটো প্রান্তিক অবস্থানের পরিবর্তে সচেতনতার সাথে আশাবাদী (cautious optimist) হতে। প্রযুক্তির অতিদ্রুত অগ্রগতি আর কৃত্রিম বুদ্ধিমত্তা নিয়ে আশঙ্কার জায়গাটা অমূলক নয়। অনেক অমীমাংসিত প্রশ্ন যেখানে এসে ভিড় করে।

‘উন্নতি’ আর ‘ভালো থাকা’ প্রায়সই দুটো খুব ভিন্ন অর্থ প্রকাশ করে। নির্মাণ, পরিবহন, চিকিৎসা, ব্যবসা, কৃষিকাজ সবকিছু হচ্ছে স্বয়ংক্রিয়ভাবে- এই ভাবনাটা কল্পনাতে সুখের হলেও বাস্তবে নয়, কারণ এমন একটা কৃত্রিম সভ্যতায় মানুষের গুরুত্ব থাকবে না। ঠিক এতটা উন্নতি হয়ত সচেতন কারো কাম্য হবে না।

কৃত্রিম বুদ্ধিমত্তা যে আশঙ্কা অনেকের মনে এনে দিচ্ছে, তা হলো ভবিষ্যতে কর্মক্ষেত্রে এর প্রভাব কতটা হবে? AI কি মানুষের কাজের জায়গাগুলো দখল করে নিবে? এখন পর্যন্ত বিভিন্ন কাজে AI মানুষের সহযোগী, বিকল্প নয়। কিন্তু ঠিক কতদিন এটা সত্য থাকবে? কোন মাত্রা পর্যন্ত AI মানুষের সহযোগী, আর কোন মাত্রায় গেলে তা হবে মানুষের জন্য হুমকি?

AI কাদের জন্য আশীর্বাদ আর কাদের জন্য অভিশাপ হবে? পৃথিবী এগিয়ে যাচ্ছে ঠিকই, কিন্তু ধনী-গরিবের বৈষম্য বাড়ছে ক্রমাগত। উন্নয়নের দৌড়ে পিছিয়ে পড়া জনগোষ্ঠীকে AI কোন সুবিধা কি অদৌ এনে দিবে, নাকি শুধু নির্দিষ্ট কোন শ্রেণির জন্য তা হবে পৃথিবীকে আয়ত্বে রাখার নতুন অস্ত্র?

অথবা আরেকটু অন্যরকম কিছু ভাবনা, যান্ত্রিক সভ্যতায় মানবীয় সম্পর্কগুলো যখন ক্ষীয়মান হচ্ছে, তখন যন্ত্র যদি আরো মানবীয় হয়ে ওঠে, তা কি সত্যিই ভালো কিছু হবে?

যন্ত্রের সাথে মানুষের সম্পর্ক কেমন হওয়া উচিৎ? কৃত্রিম বুদ্ধিমত্তার কি সত্যিকারের মানুষের মত স্বাধীন অস্তিত্ব অথবা মুক্ত চিন্তার ক্ষমতা থাকা উচিৎ? বর্তমান বিজ্ঞান ও কৃত্রিম বুদ্ধিমত্তা এই পর্যায় থেকে দূরে। তবে কারো কারো জন্য কৃত্রিম বুদ্ধিমত্তার আল্টিমেট লক্ষ্য এটাই, আর প্রযুক্তির অগ্রগতি যে দ্রুততায় হচ্ছে, তাতে এই প্রশ্নগুলো অপ্রাসঙ্গিক নয়।

একটা যন্ত্র যতই জীবন্ত হোক না কেন, প্রাণ আর নিষ্প্রাণ, দুটোর পার্থক্য নিশ্চয়ই আছে। যন্ত্রের আচরণ মানুষের মত হওয়া উচিৎ, কিংবা যন্ত্র আর মানুষের সম্পর্ক মানুষ-মানুষে সম্পর্কের মত হওয়া উচিৎ- অন্তত আমি এমনটা মনে করি না।

কিছু ভুলের কোন সংশোধন হয় না, তাই সম্ভাব্য পরিণতিগুলো নিয়ে সচেতন হওয়ার প্রয়োজন নিশ্চয়ই আছে। বিশেষ করে যখন আমরা বলছি এমন কিছু বা এমন কোন ধারণার কথা যা মানব ইতিহাসের শুরু থেকে এখন পর্যন্ত কখনোই এতটা প্রাসঙ্গিক হয়নি। কৃত্রিম বুদ্ধিমত্তা কি ভুল পথে যেতে পারে কিংবা ধ্বংসাত্মক কিছুর দিকে? হ্যা, অসম্ভব নয়।

তবু এটা তো সত্য যে কৃত্রিম বুদ্ধিমত্তা অতিমানবীয় বুদ্ধি কিংবা ক্ষমতাসম্পন্ন কিছু নয়, বরং এ নিছক মানুষের-ই আবিষ্কার। কখনো যদি কৃত্রিম বুদ্ধিমত্তা মানুষের জন্য বিপর্যয় আনে, ব্যবহার হয় মানুষের বিরুদ্ধে, তবে তা মানুষের কারণে হবে, যেমন পারমাণবিক বোমার বিস্ফোরণ হয়েছিলো হিরোশিমা আর নাগাসাকিতে।

তাই সচেতনতার সাথে আশাবাদী হওয়াই যায়। আমাদের প্রতিদিনের জীবনে কৃত্রিম বুদ্ধিমত্তা যেভাবে জড়িয়ে পড়েছে তার অনেকটাই হয়ত আমরা উপলদ্ধিও করিনা। হ্যা, কৃত্রিম বুদ্ধিমত্তা আমাদের জীবনকে অনেকভাবে সহজ করেছে, এটা নির্দ্বিধায় বলা যায়।

জীবন মানে গতি। মানুষ আসলে থেমে থাকে না। তাই কর্মক্ষেত্র হারানোর আশঙ্কা যেমন রয়েছে, মানুষের নতুন চাহিদা আর নতুন কর্মক্ষেত্রও তার সাথে গড়ে উঠবে, এটাই কি স্বাভাবিক নয়? কৃত্রিম বুদ্ধিমত্তা থেকে সুন্দর কিছু সম্ভব যদি মানুষ সচেতন থাকে, আর মানুষের আবিষ্কারকে কাজে না লাগায় মানুষের বিরুদ্ধে।

দিনশেষে, অঙ্গ হারা একজন ব্যক্তির জীবনকে আরেকটু সুন্দর করতে, চলাচলের রাস্তাগুলো আরো নিরাপদ করতে কিংবা অপরাধকর্মগুলো ন্যায়ভাবে শনাক্ত করে নিরাপদ সমাজ গড়তে কৃত্রিম বুদ্ধিমত্তা যে সম্ভাবনার নতুন দুয়ার খুলে দিয়েছে, তার বাস্তবায়ন কে না চাইবে!

এই আর্টিকেলটি প্রথম প্রকাশের পরবর্তী সময়ে ChatGPT ও Midjourney-র মত AI গুলো উন্মুক্ত হয়েছে এবং সামগ্রিকভাবে কৃত্রিম বুদ্ধিমত্তা নিয়ে আমাদের আরেকবার চিন্তা করার মত বিপ্লব ঘটেছে। সাম্রতিক এই অগ্রগতির প্রেক্ষিতে আমার ভাবনাগুলো এখানে তুলে ধরেছি, যা এই আর্টিকেলটির সাথে একটি সংযোজন বলা যায়: কৃত্রিম বুদ্ধিমত্তার সাম্প্রতিক অগ্রগতি ও আমার ভাবনা

সহায়ক আর্টিকেল ও ভিডিওসমূহ

Britannica – Artificial Intelligence

Wikipedia – Artificial Intelligence

YouTube Originals: How Far is Too Far? | The Age of A.I.

YouTube Originals: Healed through A.I. | The Age of A.I.

Microsoft: Seeing AI empowers people who are blind or with low vision for everyday life

Youtube – Vsauce 2 – The Game That Learns

Wikipedia – Machine Learning

TechTarget – What is Machine Learning and Why Is it Important?

TechTarget – What is virtual assistant (AI assistant)?

এবং আরো…

2 Comments

Leave a Reply

Your email address will not be published. Required fields are marked *