• <em id="6vhwh"><rt id="6vhwh"></rt></em>

    <style id="6vhwh"></style>

    <style id="6vhwh"></style>
    1. <style id="6vhwh"></style>
        <sub id="6vhwh"><p id="6vhwh"></p></sub>
        <p id="6vhwh"></p>
          1. 国产亚洲欧洲av综合一区二区三区 ,色爱综合另类图片av,亚洲av免费成人在线,久久热在线视频精品视频,成在人线av无码免费,国产精品一区二区久久毛片,亚洲精品成人片在线观看精品字幕 ,久久亚洲精品成人av秋霞

            qwop怎么玩(qwop技巧)

            更新時間:2023-03-01 16:38:30 閱讀: 評論:0

            夢晨 曉查 發(fā)自 凹非寺 量子位 報道 | 公眾號 QbitAI

            13年以前,有這樣一款“變態(tài)”級難度的游戲曾風靡一時。

            它的名字簡單粗暴——QWOP。意思是讓玩家用這四個鍵位控制游戲人物的左右大腿和小腿,以最快的速度跑完100米。

            實際上,大部分玩家剛上手的時候,可能連起點線都邁不過去就Game Over了。

            如果你能跑出幾米遠,絕對算是一個高手,甚至能在朋友面前炫耀一番。

            QWOP的難點在于,一旦角色失去平衡就很難再挽回,需要在100米的距離內(nèi)一直保持重心不過于向前后傾斜。

            當你經(jīng)過苦練第一次跑起來時,又會被50米處作者故意設置的欄桿擺一道:說好的100米短跑怎么變跨欄了?

            △某小編當年的游戲截圖

            在那個4399小游戲盛行的年代,這款也被戲稱為“是男人就跑100米”。因為難度過于“變態(tài)”,QWOP開發(fā)者曾收到過很多辱罵郵件。

            雖然絕大部分人難以跑到終點,但仍有一批骨灰級玩家樂此不疲,他們不僅能輕松跑完,至今還為競爭世界排名而不斷挑戰(zhàn)。

            2個月前,一位日本玩家創(chuàng)造了新的世界紀錄:48.34秒。

            看到這款“沙雕游戲”,你是不是會想到強化學習來訓練雙足機器人的畫面?

            一位來自波士頓咨詢的數(shù)據(jù)分析師Wesley Liao也是這么想的。

            不過別以為“變態(tài)”難度的游戲到了AI面前就變成了毛毛雨。

            Liao綜合了之前多種強化學習算法,最后甚至請來了“世界名師”教學,費了好大一番功夫,才終于讓AI在上周打破人類玩家的記錄。

            可見這款游戲的難度一點都不比圍棋低啊。(手動狗頭)

            小試牛刀

            一開始,Liao使用OpenAI Gym強化學習環(huán)境來訓練AI,先設定好游戲的狀態(tài)、操作和獎懲機制。

            狀態(tài)包括每個身體部位和關節(jié)的位置、速度和角度。操作方式限定為11種:4個QWOP按鍵、6種兩兩按鍵組合以及不按任何鍵。

            用來訓練AI的算法是ACER(具有經(jīng)驗回放能力的Actor-Critic)。這種算法的優(yōu)點是,不僅可以從其最近獲得的經(jīng)驗中學習,也可以學習存儲數(shù)據(jù)中更早的經(jīng)驗。

            由于ACER非常復雜,Liao使用了別人的實現(xiàn)代碼“Stable Balines”。

            Liao首先嘗試了讓AI自己學習。經(jīng)過多次實驗后,他發(fā)現(xiàn)AI只學會了“蹭膝蓋”這種方式跑過終點,速度很慢。

            這和許多人類普通玩家以及其他強化學習算法是一樣的,離高手的水平還差很遠,更不用談打破紀錄了。

            仔細分析可以發(fā)現(xiàn),AI根本沒有學習到跨步機制,只是學習到了最安全、最慢的方法來到達終點。

            看來靠AI完全自學是不行了。

            學會奔跑

            類似于DeepMind用頂級棋手教AlphaGo下棋,Liao想到是不是也可以讓人類玩家來教一下AI。

            但是Liao本人的技術和頂級玩家差距太大,自己最多也只能跑到28米。

            這都不重要,重要的是起碼Liao跨出更大步伐的技巧,只能寄希望于AI能從“渣技術”里學到一點奔跑的技巧吧。

            但是結果很不幸,AI很好地詮釋了“邯鄲學步”:不僅沒掌握跑步技巧,反而在起點就跌倒了。

            然后Liao讓AI自己繼續(xù)訓練。所謂師父領進門,修行在個人,AI能否將人類技術和自學能力結合起來?

            結果令人興奮,經(jīng)過90個小時的訓練,AI終于學會了像人一樣奔跑!

            最終成績是1分25秒,已經(jīng)能跑進全球排行榜的前15名,離超過人類不遠了。

            接下來要做的就是再向AI教授更多技巧,奈何本人技術太渣。

            所以要想進一步提高AI的水平,必須找頂級高手來幫忙。

            頂級高手助陣

            Liao觀察速通排行榜上的錄像,發(fā)現(xiàn)頂級玩家的技巧是把左腿抬高可以跑得更快。

            △排名第一玩家gunmaneko的踢腿技巧

            他開始全球排名前二的玩家gunmaneko和Kurodo請教踢腿技巧的操作。

            兩位玩家熱情地回答了他的問題。其中Kurodo指出這個技巧的關鍵在于減少游戲角色在縱向的移動,并提出把保持身體高度加入AI的獎勵函數(shù)。

            Liao向Kurodo分享了他的代碼,Kurodo慷慨地使用代碼記錄了50次自己游戲時的按鍵記錄發(fā)給Liao。

            Liao嘗試使用這些數(shù)據(jù)對AI進行預訓練,但效果并不好。AI還沒來得及學會踢腿技巧,倒先把基本的跑步方法忘記了。

            Liao不得不改變方法,他把Kurodo的數(shù)據(jù)注入到AI的回放緩存*(Replay Buffer)*中。這相當于修改AI的記憶,使AI有一半的記憶是自己的,另一半來自Kurodo。

            并且是AI每自己玩一次,就注入一次Kurodo的數(shù)據(jù),保證AI隨機從記憶中選取一段來學習時選到兩種記憶的概率相同,避免在學習新技巧的過程中把基本操作忘掉。

            AI使用Kurodo的數(shù)據(jù)訓練了15個小時,終于學會了踢腿,但因為兩種記憶無法協(xié)調(diào)在一起,跑時間長了動作會不穩(wěn)定。

            Liao此時把Kurodo的記憶移除,又讓AI自己訓練了25小時,總訓練時間達到了65小時。

            最終AI的成績達到1分08秒,終于進入前十。

            打破世界紀錄

            Liao把教AI玩這個游戲的過程做成視頻發(fā)在網(wǎng)上。一個月前,外媒Gismodo問他:為什么AI還沒有打破世界紀錄?

            于是Liao重新訓練了一個只為優(yōu)化速度而存在的新AI。

            新AI改用Prioritized DDQN算法,因為這種算法會給學習效率更高的狀態(tài)增加權重而不是均勻采樣,能使新AI迅速學會舊AI已經(jīng)掌握了的技巧。

            并且,新AI的獎勵函數(shù)去掉了身體高度,膝蓋彎曲角度等參數(shù),改成只和前進速度相關。

            新AI先用已有數(shù)據(jù)進行只有幾分鐘的預訓練,隨后是40小時的自訓練。最終,新AI每秒所做的動作數(shù)在訓練環(huán)境中由9提高到18,并在測試環(huán)境中達到25。

            新AI對踢腿技巧的掌握非常穩(wěn)定,即使被障礙物影響也能迅速恢復。

            快速高效的動作使AI的成績提高到47.34秒,比人類最高紀錄48.34秒剛好快1秒。

            這才終于算是,在人工智能超越人類的游戲列表中又增加了一項。

            One More Thing

            你以為這就完了?

            跑完100米不算完,這款游戲還有一種世界級難度——“是男人就跑完馬拉松”。

            為Liao提供幫助的玩家Kurodo最近剛剛提交了世界紀錄,全球也只有兩人完成了這項壯舉。

            很難想象他們在電腦前連續(xù)按幾個小時QWOP的畫面。

            另外,QWOP的開發(fā)者Bennett Foddy一直在堅持開發(fā)這類“變態(tài)”難度的獨立小游戲。

            有一款Getting Over It with Bennett Foddy名氣頗高,中文名“掘地求升”。玩法就是一個裝在壇子里的人不停用錘子讓自己升高。

            Foddy曾經(jīng)在普林斯頓大學和牛津大學擔任博士后研究員,現(xiàn)在是一名獨立游戲設計師。QWOP就是他在普林斯頓大學時期開發(fā)的。

            我只能說,學霸開發(fā)的游戲,學渣真的玩不起。

            QWOP在線游戲地址:http://www.foddy.net/Athletics.html

            參考鏈接:[1] https://github.com/Wesleyliao/QWOP-RL[2] https://www.speedrun.com/qwop[3] https://gizmodo.com/an-ai-was-taught-to-play-the-worlds-hardest-video-game-1846388137[4] https://towardsdatascience.com/achieving-human-level-performance-in-qwop-using-reinforcement-learning-and-imitation-learning-81b0a9bbac96[5] https://www.youtube.com/watch?v=82sTpO_EpEc[6] https://wesleyliao.com/

            — 完 —

            量子位 QbitAI · 頭條號簽約

            關注我們,第一時間獲知前沿科技動態(tài)

            本文發(fā)布于:2023-02-28 20:10:00,感謝您對本站的認可!

            本文鏈接:http://m.newhan.cn/zhishi/a/167765991077778.html

            版權聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權益請與我們聯(lián)系,我們將在24小時內(nèi)刪除。

            本文word下載地址:qwop怎么玩(qwop技巧).doc

            本文 PDF 下載地址:qwop怎么玩(qwop技巧).pdf

            標簽:技巧   qwop
            相關文章
            留言與評論(共有 0 條評論)
               
            驗證碼:
            Copyright ?2019-2022 Comsenz Inc.Powered by ? 實用文體寫作網(wǎng)旗下知識大全大全欄目是一個全百科類寶庫! 優(yōu)秀范文|法律文書|專利查詢|
            主站蜘蛛池模板: 亚洲午夜伦费影视在线观看| 欧美人妻aⅴ中文字幕| 92国产精品午夜福利免费| 国产亚洲无日韩乱码| 女同久久精品国产99国产精品| 国产精品一区二区性色av| 国产精品白浆在线观看免费| 人妻在线无码一区二区三区| 中文国产成人久久精品小说| 精品国产911在线观看| 国产午夜福利大片免费看| 久久亚洲国产成人精品性色| 久久狠狠一本精品综合网| 爱情岛亚洲论坛成人网站| 天堂√在线中文官网在线| 久久av高潮av喷水av无码| 黑人欧美一级在线视频| 成人午夜在线播放| 国产AV无码专区亚洲AV漫画| 西欧free性满足hd| 亚洲二区中文字幕在线| 国产视频最新| 四虎影视在线永久免费观看| 亚洲一区二区三成人精品| 亚洲一区二区偷拍精品| 久久国内精品自在自线91| 蜜桃臀无码AV在线观看| 精品尤物国产尤物在线看| 久久精品国产久精国产| 亚洲国产99精品国自产拍| 成人午夜在线观看日韩| 国产a在亚洲线播放| 亚洲伊人久久综合成人| 国产精品电影久久久久电影网| 欲色影视天天一区二区三区色香欲 | 久久精品天天中文字幕人妻| 九九热免费精品视频在线| 国产一区在线观看不卡| 国产蜜臀av在线一区在线 | 九九re线精品视频在线观看视频| 成人免费A级毛片无码片2022|