https://powerinai.com/

ইন্টারফেস

কমপিউটার লিখবে রেকর্ড করা কথা

কমপিউটার লিখবে রেকর্ড করা কথা কমপিউটার লিখবে রেকর্ড করা কথা
 

কমপিউটার লিখবে রেকর্ড করা কথা


এ প্রজেক্টটিতে রেকর্ড করা কথাকে লিখতে পারবে কমপিউটার৷ সাধারণত মূল্যবান কথা, ভাষণ আমরা রেকর্ড করে থাকি৷ কিন্তু এই রেকর্ড করা শব্দকে যদি লেখায় রূপান্তর করা যায়, তাহলে লেখার কষ্ট হতে অনেকেই মুক্তি পাবেন৷ রেকর্ড করা শব্দকে লিখিত আকারে রূপান্তর করা খুবই জটিল কাজ৷ এখানে সাধারণ কথা বা শব্দকে কিভাবে লেখায় রূপান্তর করা যায় তার ওপরে এই প্রজেক্টটিতে কাজ করা হয়েছে৷ এটি কোনো প্রফেশনাল সফটওয়্যার নয়, তাই এটি কিভাবে আরো কার্যকরভাবে উপস্থাপন করা যায় তা নিয়ে চলছে প্রোগ্রামারদের গবেষণা৷ এই প্রজেক্টটি সাধারণ শব্দকে লেখায় রূপান্তর করবে, তবে সে ক্ষেত্রে যে শব্দ রেকর্ড করা হবে তা অবশ্যই .wav ফরমেটে রাখতে হবে৷ আর যে জায়গায় এই শব্দকে রেকর্ড করা হচ্ছে, তা যেন সাউন্ড প্রুফ বা শব্দ নিরোধক হয়, সে ব্যাপারে খেয়াল রাখতে হবে৷


এ প্রজেক্টটি সচল করতে প্রয়োজন হবে SAPI 5.1 বা উচ্চতর ভার্সন৷ সাধারণত উইন্ডোজ ভিসতায় এ প্রজেক্টটি চলবে৷ তবে যারা উইন্ডোজ এক্সপি বা অন্য কোনো উইন্ডোজ ভার্সন চালাতে চান, সেখানে অবশ্যই SAPI 5.1 ইনস্টল থাকতে হবে৷ SAPI হচ্ছে Sound Application Programming Interface, যা মাইক্রোসফটের ডেভেলপ করা ভয়েজ ইঞ্জিন৷ এই ইঞ্জিন শব্দকে কথায় আর কথাকে শব্দে রূপান্তর করে৷ মাইক্রোসফটের ওয়েব পেজ www.microsoft.com/downloads থেকে ডাউনলোড করে নিতে পারবেন SAPI 5.1৷ প্রোগ্রামটি চালিয়ে রেকর্ড করা ফাইলটি লোড করতে হবে৷ প্রোগ্রামের উইন্ডোতে Add বাটনটির সাহায্যে আপনার রেকর্ড করা .wav ফাইল লোড করতে হবে৷ প্রোগ্রামের ভেতরে একটি ফাইল Selected.wav আগে থেকেই রেকর্ড করে রাখা হয়েছে৷ এই ফাইলটি Add করে First Listen বাটনটি চেপে শুনতে পারেন এর মধ্যে কি কথা রেকর্ড করা হয়েছে৷ এই .wav ফাইলটি আপনার রেকর্ড করা যেকোনো ফাইল হতে পারে৷ আপনি যেকোনো শব্দ ইংরেজিতে বলে .wav ফরমেটে রেকর্ড করে নিতে পারেন এবং Add বাটন দিয়ে যুক্ত করে First Listen বাটন দিয়ে শুনে নিন আপনার বলা শব্দ বা লাইনটি কী৷ এবার Open file for transcription বাটনটি চাপার সাথে সাথে আপনার রেকর্ড করা শব্দ বা কথাকে রূপান্তর করবে লেখায়, যা আউটপুট হিসেবে দেখতে পারবেন৷ এখানে আলোচনা করা হয়েছে শুধু এই প্রজেক্টটি কিভাবে চালানো হয়, তা নিয়ে৷ আর এর প্রোগ্রামিং সম্বন্ধে বুঝতে হলে আপনাকে নিচে উল্লেখিত ওয়েব এড্রেস থেকে কোড ডাউনলোড করতে হবে৷ প্রোগ্রামের Load() ফাংশনটি SAPI-এর Recognizer ও Grammar-কে Set বা Initialized করে নিচ্ছে৷ প্রোগ্রামের মূল অংশ হচ্ছে Private Sub RC-Recogtion() ফাংশনটি যেটি রেকর্ড ফাইল থেকে শব্দ নিয়ে SAPI-এর গ্রামার হতে প্রকৃত শব্দ খুঁজে সঠিক ফলটি দেখায়৷ এ প্রজেক্টটি এখনো গবেষণায় আছে, এটিকে কিভাবে আরো উন্নত করা সম্ভব তার চেষ্টা চলছে৷ জটিল সব শব্দ বা শব্দ অনেক বেশি এমন জায়গায় শব্দ রেকর্ড করলে ফলাফল সঠিক আসবে না৷ তাই যতটা সম্ভব শব্দ রেকর্ড করার সময় শব্দদূষণ থেকে দূরে থাকতে হবে৷ প্রোজেক্টটি www.geocities.com/redu0007 থেকে ডাউনলোড করে নিতে পারেন৷








১ টি মন্তব্য

  • Shamim Miah

    Shamim Miah

    ২০২২-১০-১৮ ১৪:০৪:০৮

    Tahole toh valoi hobe



মতামত দিন

আপনি লগ ইন অবস্থায় নেই।
আপনার মতামতটি দেওয়ার জন্য লগ ইন করুন। যদি রেজিষ্ট্রেশন করা না থাকে প্রথমে রেজিষ্ট্রেশন করুন।







পাসওয়ার্ড ভুলে গেছেন? পুনরায় রিসেট করুন






রিভিউ

আপনি লগ ইন অবস্থায় নেই।
আপনার রিভিউ দেওয়ার জন্য লগ ইন করুন। যদি রেজিষ্ট্রেশন করা না থাকে প্রথমে রেজিষ্ট্রেশন করুন।