ডাটা সায়েন্স উত্থানের শেষ দুই দশক

তথ্যকে সংরক্ষণের প্রাথমিক পদ্ধতি প্রাচীনকালে কত শত হাজার বছর আগে প্রথমে শুরু হয়েছিল সে বিষয়ে আমার পক্ষে সুনির্দিষ্ট করে বলা সম্ভব না হলেও ইরাকের মেসোপটেমিয়া যুগে মাটির প্লেটে পিকটোগ্রাফিক চিহ্ন দিয়ে লেখার মধ্য দিয়ে যেকোনও তথ্য বা ধারণাকে সংরক্ষণ করার ইতিহাস জানা যায়। তখন থেকে প্রায় চার হাজার বছর ধরে মানুষ তথ্যকে সংরক্ষণের একমাত্র উপায় হিসেবে লেখাকে ব্যবহার করে। কিন্তু উনিশ শতকের শিল্প বিপ্লব যুগে এই ইনফরমেশন বা তথ্যকে সংরক্ষণের নানাবিধ শক্তিশালী উপায় বের হয়।

১৮ শতকে ফ্রান্সের লিওন শহর ছিল সিল্ক ইন্ডাস্ট্রির আঁতুড় ঘর। শহরের প্রায় এক তৃতীয় লোক এই সিল্ক ইন্ডাস্ট্রির প্রায় ৪০ হাজার লুমে কাজ করতো। এবং কাঠামোগত কারণেই যেকোনও লুমের তাঁত বোনা অত্যন্ত সময় সাপেক্ষ এবং পরিশ্রমের ব্যাপার ছিল। জোসেফ মেরি জ্যাকার্ড নামে এক তাঁতি, একটি লুম মেশিন আবিষ্কার করেন, যার মাধ্যমে যেকোনও প্যাটার্ন বা ডিজাইনের সিল্ক কাপড় খুব কম সময়ে তৈরি করা সম্ভব হয়। এই লুম মেশিনটি উদ্ভাবনের পেছনে মূল বিষয়টি ছিল পাঞ্চড (বিভিন্ন হোল বা গর্ত) কার্ড ব্যবহার, যার মাধ্যমে সিরিজ পাঞ্চড প্রোগ্রাম ব্যবহার করে যেকোনও প্যাটার্ন তৈরি করা সম্ভব ছিল।

ফলে ইনফরমেশনকে পিকটোগ্রাফিক কিংবা লেখার বাইরে ট্রান্সলেট করে এনকোডিংয়ের মাধ্যমে পাঞ্চড কার্ড প্রোগ্রামে রূপান্তরিত করা হয়।

জ্যাকার্ডের এই আবিষ্কার ইনফরমেশনকে অন্য কোনও মাধ্যমে ট্রান্সফর্ম করার উপায় বিজ্ঞানের চোখ খুলে দেয়।

পরবর্তীতে ইলেকট্রিসিটি আবিষ্কারের ফলে বিজ্ঞানী মোর্সের ইলেকট্রিক টেলিগ্রামের মাধ্যমে অনেকটা জ্যাকার্ডের মতো এনকোডিং করে ইনফরমেশনকে ট্রান্সলেট করে ট্রান্সমিট করেন। ইনফরমেশনকে ধারণ, সংরক্ষণ করার সবচেয়ে আধুনিক এবং শক্তিশালী পদ্ধতি নিয়ে আসেন বিজ্ঞানী অ্যালেন টিউরিং, কম্পিউটার আবিষ্কারের মধ্য দিয়ে ১৯৩৬ সালে। গাণিতিক যুক্তি কিংবা কিছু নির্দেশিকাগুচ্ছ বা অ্যালগরিদমের মাধ্যমে ইনফরমেশন কিংবা ডাটাকে সংরক্ষণ, ম্যানুপুলেশন করা যায়।

আধুনিক ইলেকট্রিক কম্পিউটারের মাধ্যমে সব ধরনের ইনফরমেশনকে বাইনারি সিস্টেমের মাধ্যমে (০ এবং ১) যেকোনও ইনফরমেশন বা ডাটাকে ট্রান্সলেট, ধারণ, সংরক্ষণ এবং ট্রান্সমিট করা সম্ভব হয়। পরবর্তীতে ইন্টারনেট আবিষ্কারের মধ্য দিয়ে ডাটা কিংবা ইনফরমেশনের ট্রান্সলেট, ধারণ, সংরক্ষণ এবং ট্রান্সমিট অভূতপূর্ব শক্তিশালী হয়।

ইন্টারনেট আবিষ্কারের পেছনে একক কোনও বিজ্ঞানীর কৃতিত্ব নেই। কিন্তু ডজন ডজন বিজ্ঞানীদের পারস্পরিক কৃতিত্বের ফলস্বরূপ ইন্টারনেট ডাটা সায়েন্সে এবং কৃত্রিম বুদ্ধিমত্তার অবারিত দুয়ার খুলতে সাহায্য করে  মূলত ২০০০ সালের পর থেকে।  

২০০০-এর শুরুর দশকের শুরুর দিকে ‘ডাটা সায়েন্স’ শব্দটি জনপ্রিয় হতে শুরু করে এবং প্রাধান্য লাভ করে। বৃহৎ ডাটাসেটের ক্রমবর্ধমান প্রাপ্যতা এবং উন্নত বিশ্লেষণমূলক পদ্ধতির প্রয়োজনীয়তার সঙ্গে সঙ্গে ডাটা সায়েন্সও বিকশিত হতে শুরু করে। ২০০০-এর শুরুর দশকের শেষ থেকে ২০১০-এর দশকের শুরুর দিকে: প্রাথমিক প্রোগ্রামগুলো– ডাটা বিজ্ঞানকে একটি স্বতন্ত্র বিভাগ হিসেবে স্বীকৃতি দিতে শুরু করে, বিশ্ববিদ্যালয়গুলো বিদ্যমান প্রোগ্রামগুলোতে প্রাসঙ্গিক কোর্সগুলো অন্তর্ভুক্ত করা শুরু করে। এর মধ্যে পরিসংখ্যান, কম্পিউটার বিজ্ঞান এবং ব্যবসায়িক বিশ্লেষণ কোর্স অন্তর্ভুক্ত হতে থাকে। ২০১০-এর শুরুর দশকের মাঝামাঝি ডেডিকেটেড ডাটা সায়েন্স প্রোগ্রাম– নির্দিষ্ট ডাটা সায়েন্স দক্ষতার সঙ্গে পেশাদারদের চাহিদা বাড়ার সঙ্গে সঙ্গে, বিশ্ববিদ্যালয়গুলো ডেডিকেটেড স্নাতক এবং স্নাতক প্রোগ্রাম অফার করা শুরু করে।

এই প্রোগ্রামগুলো সাধারণত পরিসংখ্যান, মেশিন লার্নিং, ডাটা ভিজ্যুয়ালাইজেশন এবং ডোমেন-নির্দিষ্ট অ্যাপ্লিকেশনসহ বিভিন্ন বিষয়কে কেন্দ্র করে চলতে থাকে। ২০১৫-এর পরের দিকে ডেটা সায়েন্স প্রোগ্রামগুলোর ব্যাপক বিস্তার এবং জনপ্রিয়তা বাড়তে থাকে। বিশ্বব্যাপী অসংখ্য বিশ্ববিদ্যালয় বিশেষ ডিগ্রি প্রদান করতে শুরু করে। এই প্রোগ্রামগুলো প্রায়ই বিভিন্ন বিভাগের মধ্যে সমন্বয় করে চালিত হতে থাকে, যেমন- কম্পিউটার বিজ্ঞান, পরিসংখ্যান এবং ব্যবসা।

২০০১ সালে লিও ব্রেইম্যান ‘স্ট্যাটিস্টিক্যাল মডেলিং: দ্য টু কালচার’ নামে একটি বই প্রকাশ করেছেন। ডাটা থেকে সিদ্ধান্তে পৌঁছাতে পরিসংখ্যানগত মডেলিং ব্যবহারে দুটি সংস্কৃতি রয়েছে। কেউ ধরে নেয় যে ডাটা একটি প্রদত্ত স্টোকাস্টিক ডাটা মডেল দ্বারা তৈরি হয়। অন্যটি অ্যালগরিদমিক মডেল ব্যবহার করে এবং যেখানে ডাটা প্রক্রিয়াটিকে অজানা হিসাবে বিবেচনা করা হয়। পরিসংখ্যান ডিসিপ্লিনের ডাটা মডেলগুলোর প্রায় একচেটিয়া ব্যবহারের জন্য খুবই কার্যকরী। এই প্রতিশ্রুতি অপ্রাসঙ্গিক তত্ত্ব, সন্দেহজনক উপসংহারের দিকে পরিচালিত করেছে এবং পরিসংখ্যানবিদদের বর্তমান সমস্যাগুলোর একটি বৃহৎ পরিসরে কাজ করা থেকে বিরত রেখেছে।

তত্ত্বীয় এবং অনুশীলন উভয় ক্ষেত্রেই অ্যালগরিদমিক মডেলিং পরিসংখ্যানের বাইরের ক্ষেত্রে দ্রুত বিকাশ লাভ করেছে। যা বড় জটিল ডাটা সেটে এবং ছোট ডাটা সেটগুলোতে ডাটা মডেলিংয়ের জন্য আরও সঠিক এবং তথ্যপূর্ণ বিকল্প হিসাবে উভয়ই ব্যবহার করা যেতে পারে। যদি শুধু একটি ক্ষেত্র হিসাবে আমাদের লক্ষ্য সমস্যা সমাধানের জন্য ডাটা ব্যবহার করা হয়, তবে আমাদের ডাটা মডেলের ওপর একচেটিয়া নির্ভরতা থেকে দূরে সরে যেতে হবে এবং আরও বৈচিত্র্যময় সরঞ্জামগুলো গ্রহণ করতে হবে।

এপ্রিল ২০০২ ডাটা সায়েন্স প্রথম জার্নালের সূচনা হয়, যার নাম ছিল ‘বিজ্ঞান ও প্রযুক্তিতে ডাটা এবং ডাটাবেসগুলোর ব্যবস্থাপনা’। যেখানে কেবল ডাটা সায়েন্স সম্পর্কিত গবেষণাপত্র প্রকাশ করা হয়। জার্নালের পরিধিতে ডাটা সিস্টেমের বর্ণনা, ইন্টারনেটে তাদের প্রকাশনা, অ্যাপ্লিকেশনের ওপর গুরুত্ব দেওয়া হয়ে। জার্নালটি ইন্টারন্যাশনাল কাউন্সিল ফর সায়েন্স (ICSU)-এর কমিটি অন ডাটা ফর সায়েন্স অ্যান্ড টেকনোলজি (CODATA) দ্বারা প্রকাশিত হয়েছে।

২০০৫ সালের সেপ্টেম্বর-এ যুক্তরাষ্ট্রের জাতীয় বিজ্ঞান বোর্ড ‘Long-lived Digital Data Collections: Enabling Research and Education in the 21st Century’ প্রকাশ করে। প্রতিবেদনের একটি সুপারিশে বলা হয়েছে: “এনএসএফ, সংগ্রহ পরিচালক এবং বৃহত্তর গোষ্ঠীর সঙ্গে অংশীদারিত্বে কাজ করে, ডাটা বিজ্ঞানীদের জন্য ক্যারিয়ারের পথ বিকাশ ও পরিপক্ব করার জন্য কাজ করা উচিত এবং গবেষণা উদ্যোগে পর্যাপ্ত সংখ্যক উচ্চ মানের ডাটা বিজ্ঞানী অন্তর্ভুক্ত রয়েছে তা নিশ্চিত করা।’ প্রতিবেদনে ডাটা বিজ্ঞানীদের সংজ্ঞায়িত করা হয়েছে ‘তথ্য এবং কম্পিউটার বিজ্ঞানী, ডাটাবেস এবং সফ্টওয়্যার প্রকৌশলী এবং প্রোগ্রামার, শৃঙ্খলা বিশেষজ্ঞ, কিউরেটর এবং বিশেষজ্ঞ টীকাকার, গ্রন্থাগারিক, আর্কাইভিস্ট’। যারা একটি ডিজিটাল ডাটা সংগ্রহের সফল ব্যবস্থাপনার জন্য গুরুত্বপূর্ণ।

২০০৭ সালে ফুডান বিশ্ববিদ্যালয়, সাংহাই, চীনে ডাটালজি এবং ডাটা সায়েন্সের জন্য গবেষণাকেন্দ্র প্রতিষ্ঠিত হয়েছে। ২০০৯ সালে, কেন্দ্রের দুই গবেষক, ইয়াংইয়ং ঝু এবং ইউন জিয়ং, ‘ইন্ট্রাডাকশন টু ডাটালজি অ্যান্ড ডেটা সায়েন্স’ নামক প্রবন্ধ প্রকাশ করেন, যেখানে তারা বলেন ‘প্রাকৃতিক বিজ্ঞান এবং সামাজিক বিজ্ঞান থেকে ভিন্ন, ডাটালজি এবং ডাটা সায়েন্স সাইবারস্পেসে ডাটাকে তার গবেষণার বস্তু হিসেবে গ্রহণ করে। এটি একটি নতুন বিজ্ঞান।’ কেন্দ্রটি ডাটালজি এবং ডাটা সায়েন্সের ওপর বার্ষিক সিম্পোজিয়ামের আয়োজন করে।

২০০৯ সালের জানুয়ারিতে ম্যাককিনজি কোয়ার্টারলি হ্যাল ভ্যারিয়ান, গুগলের মুখ্য অর্থনীতিবিদ বলেন, ‘ডাটা নিয়ে কাজ করার দক্ষতা - সেটা মাত্রই আগামী দশকে খুবই গুরুত্বপূর্ণ দক্ষতা হবে... কারণ এখন আমাদের আসলে এমনিতেই অনেক ডাটা রয়েছে। সুতরাং তা বিশ্লেষণ করে প্রয়োজনীয় গুরুত্বপূর্ণ সিদ্ধান্ত বের করার দক্ষতা থাকা খুবই দরকার... আমি মনে করি এই দক্ষতা– ডাটা বিশ্লেষণ থেকে প্রাপ্ত বিচারগুলো অ্যাক্সেস, বোঝা এবং সারাংশ প্রসারণ করার দক্ষতা খুবই গুরুত্বপূর্ণ হবে। পরিচালকদেরই ডাটা অ্যাক্সেস করতে ও  বুঝতে পারা দরকার।’

ডেটা বিশেষজ্ঞরা... [বেন] ফ্রাই... একটি সম্পূর্ণ নতুন ক্ষেত্রের জন্য যুক্তি দেয় যা, প্রায়শই দক্ষতার বিচ্ছিন্ন ক্ষেত্রগুলোর দক্ষতা এবং প্রতিভাকে একত্রিত করে... [কম্পিউটার বিজ্ঞান; গণিত, পরিসংখ্যান, এবং ডাটা মাইনিং; গ্রাফিক ডিজাইন; ইনফোভিস এবং মানব-কম্পিউটার মিথস্ক্রিয়া]। এবং ফ্লোইংডাটাতে ভিজ্যুয়ালাইজেশন হাইলাইট করার দুই বছর পরে, মনে হচ্ছে ক্ষেত্রগুলোর মধ্যে সহযোগিতা আরও সাধারণভাবে বাড়ছে, তবে আরও গুরুত্বপূর্ণ হলো যে গণনামূলক তথ্য নকশা বাস্তবতার কাছাকাছি। আমরা ডাটা সায়েন্টিস্টদের দেখছি– যারা এটি সব করতে পারে।

জুন ২০০৯ ট্রয় স্যাডকোস্কি তার ওয়েবসাইট datasceintists.com (যা পরে datascientists.net হয়)-এর সহযোগী হিসাবে LinkedIn-এ ডাটা সায়েন্টিস্ট গ্রুপ তৈরি করেন।

ফেব্রুয়ারি ২০১০ কেনেথ কুকিয়ার দ্য ইকোনমিস্ট স্পেশাল রিপোর্ট ‘ডাটা, ডাটা এভরিহওয়ের’-এ লিখেছেন– ‘...এক নতুন ধরনের পেশাদারের আবির্ভাব হয়েছে, ডাটা সায়েন্টিস্ট, যিনি সফ্টওয়্যার প্রোগ্রামার, পরিসংখ্যানবিদ এবং গল্পকার/শিল্পীর দক্ষতাকে একত্রিত করে সোনার ঘুঁটি বের করার জন্য তথ্যের পাহাড়ের নিচে লুকিয়ে থাকে।’

জুন ২০১০ মাইক লুকিডস লিখেছেন, ‘ডাটা সায়েন্স কী?’ ডাটা বিজ্ঞানীরা ধৈর্যের সঙ্গে উদ্যোক্তাকে একত্রিত করেন, ডাটা পণ্যগুলো ক্রমবর্ধমানভাবে তৈরি করার ইচ্ছা, অন্বেষণ করার ক্ষমতা এবং একটি সলিউশনের ওপর পুনরাবৃত্তি করার ক্ষমতা। তারা সহজাতভাবে আন্তবিভাগীয়। প্রাথমিক ডাটা সংগ্রহ এবং ডাটা কন্ডিশনিং থেকে শুরু করে সিদ্ধান্তে পৌঁছানো পর্যন্ত তারা সমস্যার সমস্ত দিক মোকাবিলা করতে পারে। তারা সমস্যাটি দেখার জন্য বা খুব বিস্তৃতভাবে সংজ্ঞায়িত সমস্যাগুলোর সঙ্গে কাজ করার জন্য বাক্সের বাইরে চিন্তা করতে পারে– ‘এখানে প্রচুর ডাটা রয়েছে, আপনি এটি থেকে কী তৈরি করতে পারেন?

সেপ্টেম্বর ২০১০ হিলারি মেসন এবং ক্রিস উইগিন্স ‘এ ট্যাক্সোনমি অব ডাটা সায়েন্স’-এ লিখেছেন, ‘...আমরা ভেবেছিলাম এটি একটি সম্ভাব্য শ্রেণিবিন্যাস প্রস্তাব করা উপযোগী হবে... একজন ডাটা বিজ্ঞানী যা করেন, মোটামুটি কালানুক্রমিকক্রমে- পাওয়া, স্ক্রাব, এক্সপ্লোর, মডেল এবং ব্যাখ্যা... ডাটা সায়েন্স স্পষ্টতই হ্যাকারদের শিল্প… পরিসংখ্যান এবং মেশিন লার্নিং… এবং গণিতের দক্ষতা এবং বিশ্লেষণের জন্য ডাটার ডোমেন ব্যাখ্যাযোগ্য হওয়ার জন্য একটি মিশ্রণ… এটির জন্য একটি বৈজ্ঞানিক প্রেক্ষাপটে সৃজনশীল সিদ্ধান্ত এবং খোলা মনের প্রয়োজন।’

সেপ্টেম্বর ২০১১ সালে হারলান হ্যারিস ‘ডেটা সায়েন্স, মুরস ল, এবং মানিবল’-এ লিখেছেন, ‘ডাটা সায়েন্টিস্টরা যা করেন তা খুব ভালোভাবে কভার করা হয়েছে, এবং এটি ডাটা সংগ্রহ এবং মুংগিং থেকে শুরু করে পরিসংখ্যান এবং মেশিন লার্নিং এবং সম্পর্কিত কৌশল প্রয়োগের মাধ্যমে, ব্যাখ্যা, যোগাযোগ এবং ফলাফলের দৃশ্যায়ন পর্যন্ত চালায়। ডাটা সায়েন্টিস্ট কে? তা আরও মৌলিক প্রশ্ন হতে পারে... আমি এই ধারণাটি পছন্দ করি যে ডাটা সায়েন্সের অনুশীলনকারীদের দ্বারা সংজ্ঞায়িত করা হয়, এটি কার্যকলাপের একটি বিভাগের পরিবর্তে একটি কর্মজীবনের পথ। লোকদের সঙ্গে আমার কথোপকথনে, মনে হচ্ছে যে লোকেরা নিজেদের ডাটা সায়েন্টিস্ট বলে মনে করে তাদের সাধারণত সারগ্রাহী কর্মজীবনের পথ থাকে, যা কিছু উপায়ে খুব বেশি অর্থবহ বলে মনে হয় না।’

সেপ্টেম্বর ২০১১ সালে D.J. পাটিল “Building Data Science Teams”-এ লিখেছেন: “২০০৮ সালে শুরু করে, Jeff Hammerbacher (@hackingdata) এবং আমি Facebook এবং LinkedIn-এ ডাটা এবং অ্যানালিটিক্স গ্রুপ তৈরির অভিজ্ঞতা শেয়ার করতে বসেছিলাম। অনেক উপায়ে, সেই মিটিংটি ছিল একটি স্বতন্ত্র পেশাদার বিশেষীকরণ হিসাবে ডাটা সায়েন্সের শুরু.... আমরা বুঝতে পেরেছিলাম যে আমাদের সংস্থাগুলো বৃদ্ধি পাওয়ার সঙ্গে সঙ্গে আমাদের উভয়কেই আমাদের দলে থাকা লোকদের কী নামে ডাকতে হবে তা নির্ধারণ করতে হয়েছিল।

‘ব্যবসায়িক বিশ্লেষক’ খুব সীমাবদ্ধ বলে মনে হয়েছিল। ‘ডাটা বিশ্লেষক’ একটি প্রতিযোগী ছিল, কিন্তু আমরা অনুভব করেছি যে নামটি লোকেরা যা করতে পারে তা সীমিত করতে পারে। সর্বোপরি, আমাদের দলের অনেকেরই প্রকৌশল বিষয় দক্ষতা ছিল। ‘গবেষণা বিজ্ঞানী’ ছিল একটি যুক্তিসঙ্গত চাকরির শিরোনাম, যা সান, এইচপি, জেরক্স, ইয়াহু এবং আইবিএম-এর মতো কোম্পানিগুলো ব্যবহার করতো।’

২০১৪ সালে ডাটার ক্রমবর্ধমান গুরুত্বের কারণে, এবং সংস্থাগুলোর প্যাটার্নগুলো খুঁজে পেতে এবং আরও ভালো ব্যবসায়িক সিদ্ধান্ত নেওয়ার আগ্রহের কারণে, বিশ্বের বিভিন্ন অংশে ডাটা বিজ্ঞানীদের চাহিদা নাটকীয়ভাবে বৃদ্ধি পেতে শুরু করে।

২০১৫ সালে মেশিন লার্নিং, ডিপ লার্নিং এবং আর্টিফিসিয়াল ইন্টেলিজেন্স (AI) আনুষ্ঠানিকভাবে ডাটা সায়েন্সের জগতে প্রবেশ করে। এই প্রযুক্তিগুলো গত এক দশকে উদ্ভাবনগুলোকে চালিত করেছে — ব্যক্তিগতকৃত কেনাকাটা এবং বিনোদন থেকে শুরু করে স্ব-চালিত যানবাহন এবং সমস্ত অন্তর্দৃষ্টিসহ AI-এর এই বাস্তব-জীবনের অ্যাপ্লিকেশনগুলোকে আমাদের দৈনন্দিন জীবনে কার্যকরভাবে তুলে ধরার জন্য।

২০১৮ সালে ডাটা বিজ্ঞানের বিবর্তনের সবচেয়ে বড় দিকগুলোর মধ্যে একটি হলো ক্ষেত্রের নতুন নিয়ম। ডাটা বিজ্ঞান প্রযুক্তিগুলো একাধিক ক্ষেত্রে নতুন নিয়ম স্থাপন করেছে, যা ব্যবসায়িক সিদ্ধান্ত গ্রহণে গুরুত্বপূর্ণ হয়েছে। ডাটা বিজ্ঞানের মাধ্যমে ডাটা থেকে প্রাসঙ্গিক তথ্য আছেদ্য করা হয়, যা সংস্থাগুলোর প্যাটার্ন খুঁজে পেতে এবং আরও ভাল ব্যবসায়িক সিদ্ধান্ত নেওয়ার জন্য উপযুক্ত হয়ে ওঠে।

২০২০ সালে AI, মেশিন লার্নিং এবং বিগ ডাটাতে যোগ্য পেশাদারদের জন্য ক্রমবর্ধমান চাহিদার ক্ষেত্রে অতিরিক্ত সাফল্য দেখা মেলে, বিশেষ করে চতুর্থ শিল্পবিপ্লবের যুগে যাকে একটি পরিবর্তনশীল প্রযুক্তিগত যুগও বলা হয়। এবং যেটি প্রযুক্তি, ডিজিটাল সংস্কৃতি এবং ফিজিক্যাল জগতের সমন্বয়ে নতুন সমস্যার সমাধানের জন্য উন্নত প্রযুক্তি ব্যবহার করে।

কৃত্রিম বুদ্ধিমত্তা, অগমেন্টেড রিয়েলিটি, এবং ব্লকচেইন অদূর ভবিষ্যৎ বা ভবিষ্যতে, স্থায়ীভাবে ডাটার ধরন পরিবর্তন করতে পারে। নতুন নতুন মেশিন লার্নিং, ডিপ লার্নিং কিংবা উন্নত এলগরিদমও হয়তো আসবে কিন্তু ডাটাকে ব্যবহার করে ফল লাভের জন্য ডাটা সাইন্টিস্টদের প্রয়োজনীয়তা অফুরন্ত থেকে যাবে যুগের পর যুগ।
 
লেখক: অধ্যাপক, ফলিত পরিসংখ্যান এবং ডাটা সায়েন্স, পরিসংখ্যান গবেষণা ও শিক্ষণ ইনস্টিটিউট, ঢাকা বিশ্ববিদ্যালয়।

hasinur@du.ac.bd