https://powerinai.com/

প্রযুক্তি

রোবট কুকুর কঠিন ভূখণ্ডে হাঁটতে শিখেছে মাত্র 20 মিনিটের মধ্যে

রোবট কুকুর কঠিন  ভূখণ্ডে হাঁটতে শিখেছে মাত্র 20 মিনিটের মধ্যে রোবট কুকুর কঠিন ভূখণ্ডে হাঁটতে শিখেছে মাত্র 20 মিনিটের মধ্যে
 

রোবট কুকুর মাত্র 20 মিনিটের মধ্যে কঠিন ভূখণ্ডে হাঁটতে শিখেছে


ঘাসের লন এবং হাইকিং ট্রেইলগুলি এই রোবটের জন্য কোনও সমস্যা নয়, যা একটি মেশিন লার্নিং অ্যালগরিদমকে ধন্যবাদ দিয়ে উড়তে হাঁটতে শিখেছে


একটি মেশিন লার্নিং অ্যালগরিদমকে ধন্যবাদ একটি রোবট কুকুর মাত্র 20 মিনিটের মধ্যে ঘাস, বাকল এবং হাইকিং ট্রেইলের মতো অপরিচিত এবং কঠিন থেকে মাস্টার ভূখণ্ডে হাঁটতে শিখতে পারে।


বেশিরভাগ স্বায়ত্তশাসিত রোবটকে মানুষের দ্বারা সাবধানে প্রোগ্রাম করতে হয় বা বাস্তব-বিশ্বের কাজগুলি সম্পাদন করার আগে সিমুলেটেড পরিস্থিতিতে ব্যাপকভাবে পরীক্ষা করতে হয়, যেমন একটি পাথুরে পাহাড় বা পিচ্ছিল ঢালে হাঁটা – এবং যখন তারা অপরিচিত পরিবেশের মুখোমুখি হয়, তখন তারা সংগ্রাম করতে থাকে।


এখন, ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলে-এর সের্গেই লেভিন এবং তার সহকর্মীরা দেখিয়েছেন যে ডিপ রিইনফোর্সমেন্ট লার্নিং নামক এক ধরনের মেশিন লার্নিং ব্যবহার করে একটি রোবট কীভাবে ঘাসের লনের মতো বিভিন্ন পরিবেশে প্রায় 20 মিনিটের মধ্যে হাঁটতে পারে তা কাজ করতে পারে। , ছালের একটি স্তর, একটি মেমরি ফোম গদি এবং একটি হাইকিং ট্রেইল।


রোবটটি কিউ-লার্নিং নামে একটি অ্যালগরিদম ব্যবহার করে, যার জন্য লক্ষ্য ভূখণ্ডের একটি কার্যকরী মডেলের প্রয়োজন হয় না। এই ধরনের মেশিন লার্নিং অ্যালগরিদম সাধারণত সিমুলেশনে ব্যবহৃত হয়। “আমাদের বোঝার দরকার নেই যে পরিবেশের পদার্থবিদ্যা আসলে কীভাবে কাজ করে, আমরা শুধু রোবটটিকে একটি পরিবেশে রাখি এবং এটি চালু করি,” লেভিন বলেছেন।


পরিবর্তে, রোবটটি পূর্বনির্ধারিত লক্ষ্য অনুযায়ী কতটা সফল ছিল তার উপর নির্ভর করে প্রতিটি কর্মের জন্য একটি নির্দিষ্ট পুরস্কার পায়। এটি হাঁটতে না শেখা পর্যন্ত তার আগের সাফল্যের তুলনা করার সময় এই প্রক্রিয়াটি ক্রমাগত পুনরাবৃত্তি করে।


“কিছু অর্থে, লোকেরা কীভাবে শেখে তার সাথে এটি খুব মিল,” দলের সদস্য ইলিয়া কোস্ট্রিকভ বলেছেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলেতেও৷ “কিছু পরিবেশের সাথে মিথস্ক্রিয়া করুন, কিছু উপযোগিতা গ্রহণ করুন এবং মূলত আপনার অতীত অভিজ্ঞতা সম্পর্কে চিন্তা করুন এবং কী উন্নত করা যেতে পারে তা বোঝার চেষ্টা করুন।”


যদিও রোবটটি মুখোমুখি হওয়া প্রতিটি নতুন পৃষ্ঠে হাঁটতে শিখতে পারে, লেভিন বলেছেন যে রোবটটি অন্যান্য দক্ষতা শিখতে হলে দলটিকে মডেলের পুরষ্কার সিস্টেমটি সূক্ষ্ম-সুর করতে হবে।


রয়্যাল হলওয়ে, লন্ডন ইউনিভার্সিটির ক্রিস ওয়াটকিনস বলেছেন, বাস্তব জগতে গভীর শক্তিবৃদ্ধি শেখার কাজ করা কঠিন, কারণ একই সময়ে বিভিন্ন ভেরিয়েবল এবং ডেটার পরিমাণের সাথে যোগাযোগ করতে হয়।


“আমি মনে করি এটি খুব চিত্তাকর্ষক,” ওয়াটকিন্স বলেছেন। “আমি সত্যই কিছুটা অবাক হয়েছি যে আপনি এত কম অভিজ্ঞতার সাথে এবং এত দ্রুত বাস্তব সময়ে বিভিন্ন পৃষ্ঠে হাঁটার মতো দক্ষতা শিখতে Q-লার্নিংয়ের মতো সহজ কিছু ব্যবহার করতে পারেন।”








০ টি মন্তব্য



মতামত দিন

আপনি লগ ইন অবস্থায় নেই।
আপনার মতামতটি দেওয়ার জন্য লগ ইন করুন। যদি রেজিষ্ট্রেশন করা না থাকে প্রথমে রেজিষ্ট্রেশন করুন।







পাসওয়ার্ড ভুলে গেছেন? পুনরায় রিসেট করুন






রিভিউ

আপনি লগ ইন অবস্থায় নেই।
আপনার রিভিউ দেওয়ার জন্য লগ ইন করুন। যদি রেজিষ্ট্রেশন করা না থাকে প্রথমে রেজিষ্ট্রেশন করুন।