কমপিউটার লিখবে রেকর্ড করা কথা
এ প্রজেক্টটিতে রেকর্ড করা কথাকে লিখতে পারবে কমপিউটার৷ সাধারণত মূল্যবান কথা, ভাষণ আমরা রেকর্ড করে থাকি৷ কিন্তু এই রেকর্ড করা শব্দকে যদি লেখায় রূপান্তর করা যায়, তাহলে লেখার কষ্ট হতে অনেকেই মুক্তি পাবেন৷ রেকর্ড করা শব্দকে লিখিত আকারে রূপান্তর করা খুবই জটিল কাজ৷ এখানে সাধারণ কথা বা শব্দকে কিভাবে লেখায় রূপান্তর করা যায় তার ওপরে এই প্রজেক্টটিতে কাজ করা হয়েছে৷ এটি কোনো প্রফেশনাল সফটওয়্যার নয়, তাই এটি কিভাবে আরো কার্যকরভাবে উপস্থাপন করা যায় তা নিয়ে চলছে প্রোগ্রামারদের গবেষণা৷ এই প্রজেক্টটি সাধারণ শব্দকে লেখায় রূপান্তর করবে, তবে সে ক্ষেত্রে যে শব্দ রেকর্ড করা হবে তা অবশ্যই .wav ফরমেটে রাখতে হবে৷ আর যে জায়গায় এই শব্দকে রেকর্ড করা হচ্ছে, তা যেন সাউন্ড প্রুফ বা শব্দ নিরোধক হয়, সে ব্যাপারে খেয়াল রাখতে হবে৷
এ প্রজেক্টটি সচল করতে প্রয়োজন হবে SAPI 5.1 বা উচ্চতর ভার্সন৷ সাধারণত উইন্ডোজ ভিসতায় এ প্রজেক্টটি চলবে৷ তবে যারা উইন্ডোজ এক্সপি বা অন্য কোনো উইন্ডোজ ভার্সন চালাতে চান, সেখানে অবশ্যই SAPI 5.1 ইনস্টল থাকতে হবে৷ SAPI হচ্ছে Sound Application Programming Interface, যা মাইক্রোসফটের ডেভেলপ করা ভয়েজ ইঞ্জিন৷ এই ইঞ্জিন শব্দকে কথায় আর কথাকে শব্দে রূপান্তর করে৷ মাইক্রোসফটের ওয়েব পেজ www.microsoft.com/downloads থেকে ডাউনলোড করে নিতে পারবেন SAPI 5.1৷ প্রোগ্রামটি চালিয়ে রেকর্ড করা ফাইলটি লোড করতে হবে৷ প্রোগ্রামের উইন্ডোতে Add বাটনটির সাহায্যে আপনার রেকর্ড করা .wav ফাইল লোড করতে হবে৷ প্রোগ্রামের ভেতরে একটি ফাইল Selected.wav আগে থেকেই রেকর্ড করে রাখা হয়েছে৷ এই ফাইলটি Add করে First Listen বাটনটি চেপে শুনতে পারেন এর মধ্যে কি কথা রেকর্ড করা হয়েছে৷ এই .wav ফাইলটি আপনার রেকর্ড করা যেকোনো ফাইল হতে পারে৷ আপনি যেকোনো শব্দ ইংরেজিতে বলে .wav ফরমেটে রেকর্ড করে নিতে পারেন এবং Add বাটন দিয়ে যুক্ত করে First Listen বাটন দিয়ে শুনে নিন আপনার বলা শব্দ বা লাইনটি কী৷ এবার Open file for transcription বাটনটি চাপার সাথে সাথে আপনার রেকর্ড করা শব্দ বা কথাকে রূপান্তর করবে লেখায়, যা আউটপুট হিসেবে দেখতে পারবেন৷ এখানে আলোচনা করা হয়েছে শুধু এই প্রজেক্টটি কিভাবে চালানো হয়, তা নিয়ে৷ আর এর প্রোগ্রামিং সম্বন্ধে বুঝতে হলে আপনাকে নিচে উল্লেখিত ওয়েব এড্রেস থেকে কোড ডাউনলোড করতে হবে৷ প্রোগ্রামের Load() ফাংশনটি SAPI-এর Recognizer ও Grammar-কে Set বা Initialized করে নিচ্ছে৷ প্রোগ্রামের মূল অংশ হচ্ছে Private Sub RC-Recogtion() ফাংশনটি যেটি রেকর্ড ফাইল থেকে শব্দ নিয়ে SAPI-এর গ্রামার হতে প্রকৃত শব্দ খুঁজে সঠিক ফলটি দেখায়৷ এ প্রজেক্টটি এখনো গবেষণায় আছে, এটিকে কিভাবে আরো উন্নত করা সম্ভব তার চেষ্টা চলছে৷ জটিল সব শব্দ বা শব্দ অনেক বেশি এমন জায়গায় শব্দ রেকর্ড করলে ফলাফল সঠিক আসবে না৷ তাই যতটা সম্ভব শব্দ রেকর্ড করার সময় শব্দদূষণ থেকে দূরে থাকতে হবে৷ প্রোজেক্টটি www.geocities.com/redu0007 থেকে ডাউনলোড করে নিতে পারেন৷
১ টি মন্তব্য
Shamim Miah
২০২২-১০-১৮ ১৪:০৪:০৮Tahole toh valoi hobe