
تحقيق درس يادگيري ماشين .موضوع :يادگيري ماشين در بازي مقابل انسان
فرمت : word
تعداد صفحه : 37 قیمت : مبلغ ۵ هزار تومان
مقدمه:
تحقيق در بازي ها يکي از روياهاي هوش مصنوعي را تحقق بخشيد يعني شکست قهرمان شطرنج جهان در يک تورنمنت ، در حدود يک سال بعد در يک مسابقه برنامه Checkers اولين برنامه اي بود که توانست قهرمان جهان را در هر مسابقهاي شکست دهد . تعدادي از بازيهاي معروف سادهتر مانندConnect-4 ، Gomoku يا mill نيز حل شده اند. برنامه ها اکنون مسابقات قوياي با بهترين هاي انسان در جهان در بازيهايي مثل تخته نرد ، اتللو و Scrabble انجام مي دهند.
تحقيق در رشد ساير بازي هايي مانند پوکر ،Bridge ، shogi يا Go در حال انجام است در حالي که انسانها هنوز در لبه داغ چنين بازيهايي قرار دارند. يک ديد سطحي از آخرين پيشرفت ها در بازيهاي کامپيوتر در مقاله ( Ginsberg) ديده ميشود. تحليلي با جزئيات در مقاله (Schaeffer) در بزرگداشت چهلمين سال انتشار مقاله Samuel نوشته شده است . يافت مي شود.
در اين مقاله ، سعي برآن است که يک بررسي بر روي حجم زيادي از ادبياتي که با رهيافت يادگيري ماشين بر بازيها در ارتباط است انجام شود . هدف اصلي از اين مقاله ارائه توانايي به خوانندگان مشتاق است تا خيلي سريع به نتايج گذشته که در ارتباط با تحقيق يا پروژه آن هاست دست يابند تا تحقيق خود را از آن جا شروع کنند.
تعداد راه هاي زيادي براي دسته بندي مطالب در اين مقاله وجود دارد . ما مي توانستيم به طور مثال دسته بندي براساس بازي هاي مختلف انجام دهيم مانند: شطرنج ، تخته نرد، Go، chekers ، shogi ، poker و ... و يا اينکه دسته بندي را براساس روش ها و تکنيک هاي يادگيري انجام دهيم . به جاي آنها تصميم گرفته شد که رهيافتي بر پايه مسئله در نظر گرفته شود و دسته بندي را براساس رقابت هايي که در جنبه هاي مختلف بازي ها انجام شده اند انجام دهيم . با توجه به اين معتقديم که هم محقق در بازي هاي کامپيوتري مي تواند تکنيک هاي يادگيري ماشين را براي حل مسئله خود پيدا کند و هم محقق در يادگيري ماشين مي تواند موضوعات مفيد در دامنه تحقيق در بازي هاي کامپيوتري را داشته باشد.
مقاله پس از نگاهي گذرا بر تاريخچه تحقيق بر روي تکنيکهاي يادگيري ماشين در بازيها با طرح book Learning به عنوان مثال تکنيک هايي که در ذخيره پيش محاسبات حرکات انجام مي شود که به نام دستيابي سريع در بازي هاي تورنمنت هم خوانده مي شود آغاز مي گردد. سپس مسئله استفاده از تکنيک هاي يادگيري براي کنترل کردن فرآيند جستجو که در همه برنامه هاي بازي وجود دارد مورد بررسي قرار مي گيرد.
در قسمت چهارم به بررسي بيشترين و معروف ترين وظيفه يادگيري که به نام تنظيم خودکار يک تابع ارزيابي است مي پردازيم . مسئله يادگيري با ناظر ، يادگيري مقايسهاي ، يادگيري تقويتي ، يادگيري Temporal Difference نيز بررسي مي گردند. در يک زير بخش مجزا در مورد موضاعات مهم و متفاوت بر اين رهيافت ها بحث مي شود . سپس در بخش پنجم به بررسي راه حل هاي مختلفي که در شناسائي طرح ها و الگو ها پرداخته مي شود از simple – advice taking رهيافت مدل سازي هوشمند گرفته تا استقراء الگوها و استراتژي ها از يک پايگاه داده بازي . در پايان در قسمت ششم مدل سازي حريف به طور مختصر بحث شده و وظيفه بهبود برنامه بازي توسط يادگيري براي استفاده از ضعف حريف مورد بررسي قرار مي گيرد.
فهرست مطالب
1- بازي ماشين در مقابل انسان
2- ميراث ساموئل
3- يادگيري کتابي
3-1- يادگيري براي انتخاب تغييرات باز
3-2- يادگيري از روي اشتباهات
3-3- يادگيري به وسيله شبيه سازي
4- يادگيري کنترل جستجو:
5- تنظيم تابع ارزيابي
5-1- يادگيري با ناظر
5-2- آموزش مقايسه اي
6- يادگيري تقويتي
6-1- Temporal-difference learning :
6-2- يادگيري تابع ارزيابي
6-2-1- توابع ارزيابي خطي در مقابل توابع ارزيابي غيرخطي
6-2-2- استراتژيهاي آموزش
6-2-3- يادگيري توابع ارزيابي و جستجو
6-2-4- استخراج خصايص
7- الگوهاي يادگيري و تصميم
7-1- Advice-taking :
8- مدلسازي حريف :
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
تکنیکها ، ابزارها و روشهای Web Data Mining , بررسي زبان هاي برنامه نويسي , هوش مصنوعي , ماشين مجازي جاوا Java Virtual Machine ( JVM) ,
|