1400/11/24 09:34

یادگیری تقویتی،پیشرفتی جدید در هوش مصنوعی

بخش هوش مصنوعی شرکت ژاپنی "سونی"، اکنون یک هوش مصنوعی جدید ایجاد کرده است که می‌تواند بهترین رانندگان انسانی را در بازی "Gran Turismo" یا "GT" که یک بازی واقع‌گرایانه مسابقه اتومبیل‌رانی است، شکست دهد.در حالی که تاکتیک‌های استفاده شده توسط این هوش مصنوعی، آنها را حیرت‌زده کرد.

این شرکت در یک بیانیه مطبوعاتی، تلاش‌های خود را برای ایجاد این هوش مصنوعی به نام "GT Sophy" و اینکه چگونه موفق می‌شود در یک بازی که شامل انتخاب‌های تاکتیکی بی‌پایان است از انسان‌ها پیشی بگیرد، توضیح داد.

این بازی که توسط شرکت "پلی‌فونی دیجیتال"(Polyphony Digital) توسعه داده شده است، در بازسازی محیط مسابقات دنیای واقعی در قلمروی دیجیتال ماهر است. این بازی نه تنها دارای خودروها و مسیرهای مسابقه‌ای مختلف است که شباهت زیادی به نمونه‌های واقعی دارد، بلکه پدیده‌های فیزیکی دنیای واقعی مانند مقاومت هوا و اصطکاک لاستیک‌های خودرو را نیز به خوبی در بازی جای داده است.

"سونی" برای توسعه این هوش مصنوعی جدید، تکنیک یادگیری عمیق را که معمولاً برای آموزش هوش مصنوعی استفاده می‌شود، کنار گذاشت و در عوض از یک روش جدید به نام "یادگیری تقویتی"(RL) برای آموزش "GT Sophy" استفاده کرد. در این روش، عامل هوش مصنوعی بدون آموزش وارد دوره مسابقه می‌شود و هر یک از اقداماتش بسته به نتایجی که به دست می‌آید، پاداش یا جریمه می‌گیرد.

به گفته محققان، یادگیری تقویتی، یک پیشرفت جدید در هوش مصنوعی است که به عوامل هوش مصنوعی اجازه می‌دهد تا پیامدهای طولانی‌مدت اقدامات خود را درک کنند و نیاز به کدگذاری هر رفتار را از بین می‌برد.

این هوش مصنوعی جدید با استفاده از یادگیری تقویتی توانست به شیوه‌هایی که رانندگان انسانی تاکنون نتوانسته‌اند بر آنها تسلط یابند، مسلط شود. در واقع این هوش مصنوعی توانست بر رانندگی در کنار دیواره‌ها بدون برخورد با آنها و حتی سبقت گرفتن در پیچ‌های تیز تسلط یابد.

شکست بهترین رانندگان برابر هوش مصنوعی در یک بازی ویدئوییمهم‌تر از همه اینکه این تیم همچنین توانست "GT Sophy" را به گونه‌ای آموزش دهد که بتواند بدون برخورد ناعادلانه و ناجوانمردانه، رقابتی باشد. به عنوان مثال این شرکت ادعا می‌کند که این هوش مصنوعی هنگام سبقت گرفتن از دیگر خودروها، تضمین می‌کند که خط رانندگی را برای رقبای خود مسدود نمی‌کند و فضای کافی برای مانور آنها وجود دارد.

بازیکنان برتر این بازی می‌گویند "GT Sophy" محدودیت‌های رانندگی در این بازی را یک یا دو درجه به عقب رانده است و از این بازیکنان الهام گرفته است تا با جدیت و مهارت بالاتر مسابقه دهد.

البته کار این شرکت هنوز تمام نشده است و می‌خواهد این هوش مصنوعی را در بازی‌های آینده ادغام کند.

منبع:ایسنابه نقل از سی‌نت