পরিচিতি

প্রকল্প পরিচিতি

গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ (EBLICT) প্রকল্প সম্পর্কে জানুন।


লক্ষ্য: আর্টিফিশিয়াল ইন্টেলিজেন্স এবং ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং-এর মাধ্যমে বাংলা ভাষাকে বৈশ্বিক ডিজিটাল ইকোসিস্টেমে একীভূত করা।

বাংলাদেশ কম্পিউটার কাউন্সিল দ্বারা পরিচালিত ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ (EBLICT) প্রকল্প একটি কৃত্রিম বুদ্ধিমত্তা, ডেটা সায়েন্স ও বাংলা ভাষার সফটওয়্যার তৈরির জাতীয় উদ্যোগ। বর্তমানে এই প্রকল্পটি বাংলাদেশের হোম গ্রোন AI-এর হাব হিসেবে কাজ করছে। এই প্রকল্পের প্রধান কার্যপরিধি ও অর্জনসমূহ নিচে দেওয়া হলো:

১. এআই-নির্ভর প্রধান অ্যাপ্লিকেশনসমূহ
Kagoj.ai (কাগজ এআই):

এটি একটি ইন্টিগ্রেটেড AI প্ল্যাটফর্ম যা সরকারি ও বেসরকারি ডকুমেন্ট তৈরি, প্রক্রিয়াকরণ, গবেষণা এবং কন্টেন্ট ক্রিয়েশনে সহায়তা করে। এতে বাংলা OCR, STT, TTS এবং স্পেল চেকার যুক্ত আছে।

সঠিক:

একটি AI-ড্রিভেন বানান ও ব্যাকরণ পরীক্ষক টুল যা বাংলা একাডেমি স্ট্যান্ডার্ড অনুসরণ করে।

বর্ণ ওসিআর:

এটি ছবি, পিডিএফ এবং হাতে লেখা ডকুমেন্টকে এডিটযোগ্য টেক্সটে রূপান্তর করে। এটি কম্পিউটার-কম্পোজড, টাইপরাইটার এবং লেটারপ্রেস ডকুমেন্ট সাপোর্ট করে।

কথা:

একটি স্পিচ-টু-টেক্সট (STT) সিস্টেম যা মুখে বলা বাংলাকে টেক্সটে রূপান্তর করে।

উচ্চারণ:

একটি টেক্সট-টু-স্পিচ (TTS) ইঞ্জিন যা মানুষের মতো স্বাভাবিক স্বরে লিখিত টেক্সট পড়ে শোনায়।

Jiggasha.ai (জিজ্ঞাসা এআই):

একটি বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্ট্যান্ট, যা ৫০টিরও বেশি সরকারি অফিস সার্ভিসের সাথে যুক্ত।

উল্লেখ্য, এটুআই এর D-nothi (ডি-নথি) অ্যাপ্লিকেশনে স্পেল, ওসিআর এবং এসটিটি সার্ভিসগুলো এই প্ল্যাটফর্ম থেকে প্রদান করা হয়।

২. ডিজেবিলিটি, অ্যাক্সেসিবিলিটি এবং ইনক্লুশন

প্রতিবন্ধী এবং পিছিয়ে পড়া জনগোষ্ঠীর জন্য বিশেষ সফটওয়্যার তৈরি করা হয়েছে।

বাংলা স্ক্রিন রিডার “আলো”:

দৃষ্টিপ্রতিবন্ধীদের কম্পিউটার পরিচালনায় সাহায্য করে।

সাইন ল্যাংগুয়েজ রিকগনিশন সিস্টেম:

ইশারা ভাষাকে লিখিত টেক্সটে রূপান্তর করে।

টেক্সট-টু-সাইন পাপেট:

লিখিত টেক্সটকে অ্যানিমেটেড ইশারা ভাষায় রূপান্তর করে।

ব্রেইল কনভার্টার:

বাংলা টেক্সট এবং গাণিতিক চিহ্নকে ব্রেইল ফরম্যাটে রূপান্তর করে।

৩. নৃ-গোষ্ঠী ভাষা সংরক্ষণ

বিলুপ্তপ্রায় নৃ-গোষ্ঠী ভাষা সংরক্ষণের জন্য একটি প্ল্যাটফর্ম তৈরি করা হয়েছে।

multiling.cloud (মাল্টিলিংগুয়াল ক্লাউড):

বাংলাদেশের ৪০টিরও বেশি আদিবাসী ভাষার ডিজিটাল ভাণ্ডার। এতে ১৪টি বিপন্ন ভাষার (যেমন: রেংমিটচা এবং কোডা) ডাটা এবং ১২,০০০ মিনিটেরও বেশি অডিও সংরক্ষণ করা হয়েছে।

৪. ভাষাগত / লিংগুইস্টিক রিসোর্স অ্যান্ড রিসার্চ

বাংলা এআই-এর জন্য প্রয়োজনীয় বিগ ডাটা তৈরি করা হয়েছে।

বাংলাদেশ ন্যাশনাল করপাস (BDNC):

৩০০ কোটিরও বেশি শব্দ এবং ২০ হাজার ডিজিটাইজড বইয়ের সংগ্রহ, যা LLM ট্রেনিংয়ে ব্যবহৃত হবে।

ব্যানব্রেইন:

একটি ল্যাংগুয়েজ মডেল যা পরবর্তী শব্দ সাজেস্ট করা এবং প্যারাফ্রেজ শনাক্ত করতে সক্ষম।

ডিজিটাল লেক্সিকন:

প্রথম প্রযুক্তি-নির্ভর বাংলা অভিধান।

ইউনিভার্সাল কিবোর্ড – ইউবোর্ড:

কাস্টম লেআউট তৈরির প্ল্যাটফর্ম যা চাকমা, মারমা এবং ম্রো-এর মতো ক্ষুদ্র নৃ-গোষ্ঠীর ভাষা সমর্থন করে।

পূর্ণ এবং জুলাই ফন্ট:

অফিসিয়াল ব্যবহারের জন্য প্রফেশনাল ইউনিকোড ফন্ট।

আইপিএ কনভার্টার – ধ্বনি:

বাংলা টেক্সটকে ইন্টারন্যাশনাল ফোনেটিক অ্যালফাবেট (IPA)-এ রূপান্তর করে।

ইউনিকোড ও সিএলডিআর সমন্বয়:

বাংলা ভাষা ও স্থানীয় সংস্কৃতি যেমন বাংলা তারিখ, সময়, পরিমাপ এবং বর্ণমালা সঠিকভাবে প্রদর্শনের জন্য আন্তর্জাতিক স্ট্যান্ডার্ডের সাথে নিয়মিত সমন্বয় করা হয়।


এই সকল রিসোর্স বর্তমানে bangla.gov.bd এবং বিভিন্ন অ্যাপ স্টোর (যেমন: গুগল প্লেস্টোর, ক্রোম স্টোর) এবং Huggingface অ্যাকাউন্টে পাওয়া যাচ্ছে।

প্রযোজ্য সেবাগুলোর মাধ্যমে সাধারণ ব্যবহারকারীদের জন্য B2C মডেলে নিজেদের তৈরি অ্যাপ বিনামূল্যে ব্যবহার করা যায় এবং প্রতিষ্ঠানগুলোর জন্য B2B চ্যানেলের API এর মাধ্যমে মনিটাইজেশনের সুযোগ রয়েছে।

গবেষক, বিশ্ববিদ্যালয় এবং স্টার্টআপ প্রতিষ্ঠানগুলো কোলাবোরেশনের মাধ্যমে জিপিইউ ব্যবহার করে গবেষণা কার্যক্রম পরিচালনা করতে পারে।

উল্লেখ্য, প্রকল্পটির মেয়াদ জুলাই ২০১৬ – জুন ২০২৬ এবং মোট বরাদ্দ ১৫৮৯৬.৬৯ লক্ষ টাকা (জিওবি বরাদ্দ)।