جزئیات اثر

یادگیری تقویتی عمیق برای بازی ۲۰۴۸ مقاله ارسال شده توسط اسماعیل مبینی دهکردی ارسال شده در :۱۳۹۸/۳/۶ اثری از :اسماعیل مبینی دهکردی، مانا فلاح نژاد درباره اثر :در این مقاله ما به بررسی بازدهی یک الگوریتم یادگیری تقویتی با استفاده از شبکه عصبی خط مشی برای اجرای بازی مشهور 2048 می‌پردازیم. بعد از پیشنهاد نوعی مدلسازی از فضاهای حالت و اقدام، به بازبینی فرآیند یادگیری می‌پردازیم و مدل اولیه ای را آموزش می‌دهیم، بدون اینکه هیچگونه دانش قبلی درباره بازی در آن لحاظ کنیم. ثابت می‌کنیم که یک شبکه ساده خط مشی احتمالی به حداکثر امتیازی چهار برابر خط مشی تصادفی اولیه دست می‌یابد. سپس تلاش می‌کنیم تا فرآیند یادگیری را با برنامه نویسی تخمینی پویا بهبود دهیم. درنهایت بازدهی شبکه مان را با ترکیب آن با جستجوی درختی مونته کارلو آزمایش می‌کنیم تا با استفاده از روشی اکتشافی باعث تقویت تصمیمات بهینه شویم.
تصاویر :

0 نقد داور

0 نظر (نمایش فقط برای صاحب اثر)