অফিস
আইসিটি টাওয়ার (৯ম তলা-উত্তর ব্লক) ই-১৪/এক্স,বিসিসি ভবন, আগারগাঁও,
শেরে-বাংলানগর, ঢাকা-১২০৭
দূরালপনী
ইমেইল pdeblict@bcc.net.bd
টেলিফোন: 88-02-55006869

টেক্সট করপাস: যা মূলত বাংলা বিশাল র-টেক্সটের ভাণ্ডার। যা হবে ব্যালেন্সড ও রিপ্রেজেনটেটিভ করপাস।

ট্রিব্যাংক করপাস: এই করপাসটি মূলত অ্যানোটেডেট গোল্ড স্ট্যান্ডার্ড করপাস।

ইরর করপাস: বাংলা লিখনে যেসব ভুল হয় সেসব বাক্যের সংগ্রহ এই করপাস।

সেন্টিমেন্ট ডেটাসেট: সেন্টিমেন্ট অ্যানালাইসিস তৈরির জন্য এই করপাস তৈরি হচ্ছে।

ইমেজ ডেটাসেট: একটি মূলত কম্পিউটার কম্পোজ বর্ণের ও শব্দের সংগ্রহ।

হ্যান্ডরাইটিং ডেটাসেট: হাতের লেখার ইমেজের সংগ্রহ এই ডেটাসেট।

ডায়নামিক হ্যান্ডরাইটিং ডেটাসেট: রিয়েলটাইম ডায়নামিক হ্যান্ডরাইটিংয়ের সংগ্রহ এই করপাস।

টাইপরাইটার ও লেটারপ্রেস ডেটাসেট: লেটারপ্রেস ও টাইপরাইটের ইমেজ ও শব্দের অ্যালাইন সংগ্রহ এই করপাস।

স্পিচ করপাস: বাংলা স্পনটেনিওয়াস ও স্ক্রিপটেড স্পিচ করপাস।

অ্যালাইন করপাস ফর ম্যাশিন ট্রান্সলেশন: বাংলার সঙ্গে ইংরেজিসহ মোট ১০টি ভাষার অ্যালাইনড করপাস।

এথনোলিংগুয়িসটিক্যাল স্পিচ ডেটাসেট: ক্ষুদ্র-নৃগোষ্ঠীর প্রায় ৪০টি ভাষার অডিও ও ট্রান্সস্ক্রিপটেড করপাস।

সাইন ল্যাংগুয়েজ ডেটাসেট: মোশন সাইন ও জেসচার ডেটাসেট