‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ প্রকল্পটির উদ্দেশ্য বাংলা ভাষার জন্য বিভিন্ন প্রযুক্তিমাধ্যমে ব্যবহারযোগ্য বিভিন্ন সফটওয়্যার/টুলস/রিসোর্স তৈরি করা, যাতে বাংলা ভাষা কম্পিউটারে সর্বোতভাবে ব্যবহার করা যায়।
প্রকল্পের কার্যাদি সুষ্ঠুভাবে সমাপ্ত হলে, মুখে উচ্চারিত বাংলা ভাষা স্বয়ংক্রিয়ভাবে কম্পোজ হয়ে যাবে, লিখত টেক্সট কম্পিউটার শুদ্ধ উচ্চারণে পড়ে শোনাবে, মুদ্রিত বই-দলিল মুদ্রিত সফটকপিতে রূপান্তরিত হবে, কম্পিউটার নানান বিদেশি ভাষার বাক্যকে সঠিকভাবে অনুবাদ করে দিবে এবং আরো নানা ভাবে বাংলা ভাষা প্রযুক্তি বিকশিত হবে। এতে বিশ্বের দরবারে ও তথ্যপ্রযুক্তি জগতে বাংলা ভাষার মর্যাদা ও ব্যবহারযোগ্যতার মান বৃদ্ধি পাবে।
প্রকল্পের কম্পোনেন্টগুলোর পূর্ণ মালিকানা গণপ্রজাতন্ত্রী বাংলাদেশ সরকার এর তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের আওতাধীন সংস্থা বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি) এর। প্রকল্পের যেসকল সার্ভিস ও প্রোডাক্ট বিনামূল্যে ব্যবহারের জন্য বলে প্রতীয়মান হবে, সেগুলো প্রকল্পের সাথে সংশ্লিষ্ট ওয়েবসাইটে প্রোডাক্ট শোকেসের মাধ্যমে জনগণের জন্য উন্মুক্ত করা হবে।
এই প্রকল্পের মাধ্যমে বাংলা ভাষার জন্য ১৬ টি সফটওয়্যার/টুলস বানানো হচ্ছে। এর মধ্যে রয়েছে বাংলা করপাস সম্পর্কিত টেকনোলজি, বাংলা থেকে পৃথিবীর প্রধান দশটি ভাষার যান্ত্রিক অনুবাদ, বাংলা ওসিআর ( টাইপ করা ও হাতের লেখা অটোমেটিক শনাক্তকরণ ও কম্পোজ), কথা থেকে লেখা এবং লেখা থেকে কথায় রূপান্তর সফটওয়্যার, জাতীয় কিবোর্ড (বাংলা) এর উন্নয়ন, বাংলা ফন্ট রূপান্তর ইঞ্জিন, বাংলা বানান ও ব্যকরণ সংশোধক, বিশেষভাবে সক্ষম কম্পিউটার ব্যবহারকারীদের জন্য স্ক্রিন রিডার সফটওয়্যার, বাংলা অনুভূতি বিশ্লেষণের সফটওয়্যার সহ নানা নতুন প্রযুক্তি।
এই প্রকল্পের অধীনস্ত কিছু সফটওয়্যারের পরীক্ষামূলক সংস্করণ ইতোমধ্যেই উন্মুক্ত করা হয়েছে। ধীরে ধীরে বানান ও ব্যকরণ সংশোধক, অনুভূতি বিশ্লেষক, বাংলা ওসিআর ইত্যাদি নানান প্রযুক্তি জনসাধারণের কাছে পৌছে যাবে। এ ছাড়াও, প্রতিটি প্রযুক্তির সাথে সংশ্লিষ্ট এপিআই সাপোর্ট থাকার ফলে ডেভেলপাররা সহজেই এসব প্রযুক্তি ব্যবহার করে কথার মাধ্যমে লেখার কিবোর্ড/ অ্যাপ্স, বাংলা পার্সোনাল ভার্চুয়াল এসিস্টেন্ট ইত্যাদি অনেক প্রযুক্তি উদ্ভাবনের দিকে আগাতে পারবেন। এর ফলে জনসাধারণ যাপিত জীবনের সকল স্তরে বাংলার ব্যবহার করতে পারবে স্বাচ্ছন্দে।
বিভিন্ন কম্পোনেন্টের মাধ্যমে এই প্রকল্পের অধীনে টেক্সট করপাস, ট্রিব্যাংক করপাস, ইরর করপাস, সেন্টিমেন্ট ডেটাসেট, কম্পিউটার কম্পোজ, হ্যান্ডরাইটিং, ডায়নামিক হ্যান্ডরাইটিং,টাইপরাইটার ও লেটারপ্রেস টেক্সটের ইমেজ ডেটাসেট, স্পিচ করপাস, ম্যাশিন ট্রান্সলেশনের জন্য ১০ টি ভাষার অ্যালাইন করপাস, এথনোলিংগুয়িসটিক্যাল স্পিচ ডেটাসেট, এবং একটি মোশন সাইন ও জেসচার সাইন ল্যাংগুয়েজ ডেটাসেট তৈরির কাজ চলমান। বাংলাদেশের ছাড়াও বিশ্বের সকল গবেষকগণ এইসব আন্তর্জাতিক মানের ডেটাসেট ব্যবহার করে গবেষণা চালাতে পারবেন প্রযুক্তিগুলোকে আরো বিকশিত করতে।