গুগলের এক হাজার ভাষার এআই মডেল আসছে

গুগল ও মাইক্রোসফটের মধ্যে বিরোধ চলছে কার চ্যাটবট ভালো। যা শুধুই মেশিন লার্নিং ও ল্যাঙ্গুয়েজ মডেল হিসেবে ব্যবহৃত হবে না। এই নিয়ে আলোচনা চলছে।

ধরণা করা হচ্ছে, এবারের বার্ষিক আই এবং ইভেন্টে ২০টিরও বেশি এআই (আর্টিফিসিয়াল ইন্টেলিজেন্স) ক্ষমতাসমৃদ্ধ পণ্য প্রদর্শন করা হবে। এর মধ্যে গুগল তার যে এআই ল্যাঙ্গুয়েজ মডেল তৈরি করছে, তা এক হাজার ভিন্ন ভিন্ন ভাষা সমর্থন করে।

সম্প্রতি একটি পোস্টে গুগল তার ইউনিভার্সাল স্পিচ মডেল বা ইউএসএম সম্পর্কে বেশ কিছু তথ্য শেয়ার করে, যাকে গুগল তার লক্ষ্যে পৌঁছাতে সবচেয়ে জটিল প্রথম পদক্ষেপ হিসেবে চিহ্নিত করে।

সংবাদমাধ্যম ভার্জ জানায়, গত নভেম্বরে গুগল প্রথম ঘোষণা দেয় তারা একটি ল্যাঙ্গুয়েজ মডেলের পরিকল্পনা করছে, যা বিশ্বের সবচেয়ে বেশি ব্যবহৃত এক হাজার ভাষাকে সমর্থন করে। সেই সঙ্গে তার ইউএসএম মডেল উন্মোচিত করে।

ইউএসএমের বর্ণনায় গুগল জানায়, এটি স্টেট অব দ্য আর্ট স্পিচ মডেলের একটি পরিবার। এখানে দুই বিলিয়ন প্যারামিটারকে প্রশিক্ষিত করা হয়েছে ১২ মিলিয়ন ঘণ্টা কথা এবং ৩০০টি ভাষার ২৮ বিলিয়ন বাক্য থেকে।

ইউটিউব ইতোমধ্যেই ইউএসএম ব্যবহার করছে ক্লোজড ক্যাপশন জেনারেট করার জন্য। এটি অটোমেটিক স্পিচ রিকগনিশন (এএসআর) সমর্থন করে। এটি স্বয়ংক্রিয়ভাবেই ভাষাকে নির্ণয় এবং অনুবাদ করতে পারে। ভাষাগুলো হলো, ইংলিশ, ম্যান্ডারিন, সিবুয়ানো, অহমীয়া ইত্যাদি।

গুগল জানায়, বর্তমানে ইউএসএম ১০০-এর বেশি ভাষাকে সমর্থন করছে, যা অনেক দামি একটি সিস্টেম তৈরিতে ফাউন্ডেশন হিসেবে কাজ করছে। একই রকম এআই অনুবাদ টুল নিয়ে মেটাও কাজ করছে, যা প্রাথমিক পর্যায়ে রয়েছে।