২ কোটি ৫০ লাখ ডেটাসেট উন্মুক্ত করলো গুগল

নুরুন্নবী চৌধুরী
২৭ জানুয়ারি ২০২০, ০৯:০০আপডেট : ২৭ জানুয়ারি ২০২০, ০৯:০০

২ কোটি ৫০ লাখ ডেটাসেট উন্মুক্ত করলো গুগল ইন্টারনেটে প্রায় দুই কোটি ৫০ লাখ ডেটাসেট ব্যবহারের জন্য উন্মুক্ত করে দিলো গুগল। ‘ডেটাসেট সার্চ’ নামের এই উদ্যোগে ধীরে ধীরে আরও নানান ডেটাসেট যুক্ত করা হবে বলে জানিয়েছে বিশ্বখ্যাত এই সার্চ ইঞ্জিন।
সম্প্রতি গুগলের রিসার্চ বিভাগের রিসার্চ সায়েন্টিস্ট নাতাশা নও এক ব্লগ পোস্টে জানান, পুরো ওয়েব দুনিয়ায় রয়েছে লক্ষাধিক ডেটাসেট। এর মধ্যে ব্যবহারকারীদের নানান বিষয়ে আগ্রহ দেখা যায়। তাদের বহুমাত্রিক পছন্দের কথা ভেবেই গুগল এসব ডেটাসেট বিনামূল্যে ব্যবহারের জন্য উন্মুক্ত করে দিয়েছে। 
নাতাশা নও বলেন, “আমাদের দীর্ঘদিনের গবেষণায় দেখেছি, ব্যবহারকারীরা এখন বিভিন্ন ধরনের ডেটা চায়। শিক্ষা প্রতিষ্ঠানে গবেষণা, শিক্ষার্থীদের পড়াশোনার কাজে ব্যবহার, বিজনেস অ্যানালাইসিস এবং ডেটা সায়েন্টিস্টদের জন্য ডেটা প্রয়োজন। বেশিরভাগ ক্ষেত্রেই দেখেছি ‘শিক্ষা’, ‘আবহাওয়া’, ‘ক্যান্সার’, ‘অপরাধ’, ‘সকার’ ও ‘কুকুর’ বিষয়ে ডেটা খুঁজে থাকেন অনেকেই।”
উন্মুক্ত করা ডেটাসেটগুলো ব্যবহার উপযোগী ফরম্যাটে পাওয়া যাচ্ছে। এটি উন্মুক্ত করার ব্যাপারে আমাজনের ওপেন ডেটা রেজিস্ট্রির মতো কাজটি করেনি গুগল। বরং এক্ষেত্রে ডেটাসেট পাবলিশারদের ব্যবহৃত মেটাডেটা ব্যবহারের মাধ্যমে ডেটাসেট উন্মুক্ত করেছে প্রযুক্তি প্রতিষ্ঠানটি। পরবর্তী সময়ে ডেটাগুলো মেটাডেটা অনুসরণ করে সার্চেবল আকারে ইনডেক্স করা হয়েছে।
সামাজিক যোগাযোগমাধ্যম ফেসবুকের ডেটা সায়েন্টিস্ট টম ওয়াটারম্যান গুগলের উন্মুক্ত ডেটাসেট প্রসঙ্গে বলেন, ‘উদ্যোগটি বেশ ভালো। আমি ব্যক্তিগতভাবে ডেটাসেট সার্চ করে দেখেছি, এর মধ্যে অর্ধেকই ফর-প্রফিট কাজে ব্যবহৃত করার জন্য রয়েছে। বাজার সম্পর্কিত ডেটাসেটও রয়েছে এই তালিকায়।’
ডেটাসেটের মধ্যে বিভিন্ন সরকারি ও গবেষণা প্রতিষ্ঠানের ডেটা যেমন রয়েছে, তেমনই ব্যবহারকারীদের কাজে লাগে এমন ডেটাও রাখা হয়েছে।
গুগলের তথ্যানুযায়ী, ডেটাসেটে তিন ধরনের ডেটার প্রাধান্য রয়েছে। এর মধ্যে উল্লেখযোগ্য ‘জিয়োসায়েন্স’, ‘বায়োলজি’ ও ‘এগ্রিকালচার’। বর্তমানে ডেটাসেট ব্যবহারের জন্য গুগল আলাদা কোনও এপিআই দিচ্ছে না।
গুগলের ডেটাসেট থেকে ফিল্টারের মাধ্যমে আলাদাভাবে টেবিল, ইমেজ ও টেক্সট বের করার সুযোগ রয়েছে। পুরো ডেটাসেটেই ওপেন স্ট্যান্ডার্ড নীতিমালা অনুসরণ করা হয়েছে।


স্কিমা ডট অর্গ ব্যবহারের মাধ্যমে চাইলে কেউ ওপেন স্ট্যান্ডার্ডে ডেটাসেট সার্চে এটি উন্মুক্ত করতে পারবেন। শুরুতে বেটা সংস্করণ চালু হলেও শিগগিরই পূর্ণাঙ্গভাবে ডেটাসেট উন্মুক্ত হবে বলে জানা গেছে।
আগ্রহীরা সরাসরি https://datasetsearch.research.google.com ঠিকানায় গিয়েই পাবেন ডেটাসেটগুলো।
তথ্যসূত্র: গুগল ব্লগ

/এইচএএইচ/জেএইচ/
সম্পর্কিত
সর্বশেষ খবর
ধর্ষণ ও ভ্রূণ নষ্টের মামলায় শিবির নেতা জিসান রিমান্ডে
ধর্ষণ ও ভ্রূণ নষ্টের মামলায় শিবির নেতা জিসান রিমান্ডে
১৪ দিনের ব্যবধানে মেসিকে ছাড়িয়ে গেলেন ইয়ামাল
১৪ দিনের ব্যবধানে মেসিকে ছাড়িয়ে গেলেন ইয়ামাল
১০ জনের বেলজিয়ামকে রুখে দিয়েছে ইরান
১০ জনের বেলজিয়ামকে রুখে দিয়েছে ইরান
অনেকটাই সুস্থ মির্জা আব্বাস, দেশে ফিরছেন কবে?
অনেকটাই সুস্থ মির্জা আব্বাস, দেশে ফিরছেন কবে?
সর্বাধিক পঠিত
‘লক্করঝক্কর’ বাসের শহরে চলবে ২৫০০ কোটির ইলেকট্রিক বাস 
‘লক্করঝক্কর’ বাসের শহরে চলবে ২৫০০ কোটির ইলেকট্রিক বাস 
মাজারের ডেগে হাত দিয়ে কপাল পুড়লো ডিসি সারওয়ারের
মাজারের ডেগে হাত দিয়ে কপাল পুড়লো ডিসি সারওয়ারের
গ্রাহকদের নতুন করে যে বার্তা দিলো ইসলামী ব্যাংক
গ্রাহকদের নতুন করে যে বার্তা দিলো ইসলামী ব্যাংক
লন্ডনে ‘হামলার’ মামলায় কী হ‌তে পা‌রে হাসনা‌ত আব্দুল্লাহর 
লন্ডনে ‘হামলার’ মামলায় কী হ‌তে পা‌রে হাসনা‌ত আব্দুল্লাহর 
বিসিএস ভাইভার নম্বর নিয়ে যা জানালেন প্রতিমন্ত্রী
বিসিএস ভাইভার নম্বর নিয়ে যা জানালেন প্রতিমন্ত্রী