第一av在线_日韩成人久久久_亚洲人成电影网站色_精品精品导航_亚洲综合中文_精品国产91久久久久久_可以在线观看的黄色_99热这里有精品

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>新視野 > 正文
厲害了!谷歌通過乒乓球運(yùn)動(dòng)強(qiáng)化機(jī)器人學(xué)習(xí)
2022-11-01 09:32:21 來源:DeepTech深科技 編輯:

乒乓球運(yùn)動(dòng)可大大助推機(jī)器人學(xué)習(xí)研究?

在最近的一篇博文中表示,機(jī)器人學(xué)習(xí)現(xiàn)已應(yīng)用到許多真實(shí)世界任務(wù),但將其應(yīng)用于需要緊密循環(huán)的動(dòng)態(tài)、高速人機(jī)交互任務(wù)還并不常見。這方面的任務(wù)可體現(xiàn)在乒乓球訓(xùn)練上。

乒乓球任務(wù)有兩個(gè)互補(bǔ)的屬性,其不僅需要速度和精度(對(duì)算法要求高),還是高度結(jié)構(gòu)化的(環(huán)境固定、可預(yù)測(cè))。

另外,執(zhí)行乒乓球任務(wù)的機(jī)器人可與人和其他機(jī)器人分別對(duì)戰(zhàn),非常利于有關(guān)人機(jī)交互和強(qiáng)化學(xué)習(xí)方面的研究。因此,一些團(tuán)隊(duì)已經(jīng)開發(fā)了乒乓球研究平臺(tái)。

機(jī)器人團(tuán)隊(duì)同樣搭建了一個(gè)類似平臺(tái),使其能夠在多玩家、動(dòng)態(tài)的環(huán)境中,研究機(jī)器人學(xué)習(xí)中出現(xiàn)的問題。

視頻 | (來源:)

對(duì)于該方面的研究,通過兩篇論文做了相關(guān)闡述,分別題為《i-Sim2Real:緊密人機(jī)交互循環(huán)中機(jī)器人策略的強(qiáng)化學(xué)習(xí)》()、《GoalsEye: 在一個(gè)物理機(jī)器人上學(xué)習(xí)高速精密乒乓球》(),且都已提交到 arXiv 上。

下面對(duì)的 i-Sim2Real 和 GoalsEye 兩個(gè)項(xiàng)目分別做一簡單介紹。

在 i-Sim2Real(i-S2R)項(xiàng)目中,機(jī)器人的目標(biāo)本質(zhì)上是有關(guān)合作的。即最大程度與人類玩家連續(xù)游戲。

由于在現(xiàn)實(shí)中通過人類訓(xùn)練機(jī)器人既費(fèi)時(shí)又費(fèi)力,采用了一種基于仿真(模擬現(xiàn)實(shí))的方法。但該方法較難準(zhǔn)確模擬人類行為,尤其是在需要與人類進(jìn)行緊密、閉環(huán)交互的任務(wù)上。

因此,開發(fā)出一種學(xué)習(xí)人類行為模型,專門用于人-機(jī)器人交互。最終,在與人對(duì)戰(zhàn)中,機(jī)器人能夠連續(xù)擊中乒乓球三百多次。

關(guān)于學(xué)習(xí)人類行為模型,其在官網(wǎng) 表示,該問題似乎是一個(gè)悖論。若起 初缺乏優(yōu)良的機(jī)器人策略,便很難獲得人機(jī)交互方面的優(yōu)質(zhì)數(shù)據(jù)。但人類行為模型的缺失,又會(huì)得不到機(jī)器人策略。

為解決這個(gè)問題,i-S2R 以一般的人類行為模型為起點(diǎn),并在模擬和真實(shí)訓(xùn)練中不斷迭代,人類行為模型和策略都逐漸得到了優(yōu)化。

還通過不同的人類對(duì)手重復(fù)訓(xùn)練,來評(píng)估 i-S2R。并將它與通常的模擬到現(xiàn)實(shí)(S2R,sim-to-real)+微調(diào)(FT,fine-tuning)進(jìn)行比較,發(fā)現(xiàn) i-S2R 反彈長度比 S2R + FT 高約 9%。

i-S2R 和 S2R + FT 的反彈長度直方圖顯示,S2R + FT 的反彈大部分較短(即小于 5),而 i-S2R 實(shí)現(xiàn)更長的反彈更頻繁。

圖 | i-S2R 結(jié)果摘要(來源:)

還在博文中表示,i-S2R 專注于模擬到真實(shí)學(xué)習(xí),但有時(shí)需要僅使用真實(shí)世界的數(shù)據(jù)進(jìn)行學(xué)習(xí)。在這種情況下,縮小模擬到真實(shí)的差距是不必要的。

研究人員還簡單分析了模仿學(xué)習(xí)(Imitation learning,IL)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)存在的問題。

其認(rèn)為,IL 提供了一種簡易、穩(wěn)定的學(xué)習(xí)方法,但它需要獲得演示,并且?guī)缀醪粫?huì)超過被模仿者的表現(xiàn)。而在高速環(huán)境下,收集專業(yè)人員訓(xùn)練時(shí)的精確目標(biāo)定位非常困難。

RL 雖然十分適合這種高速、高精度任務(wù),但它面臨著一個(gè)艱難的探索問題(特別是在一開始),并且采樣效率很低下。

所以,在另外一個(gè) GoalsEye 項(xiàng)目上,結(jié)合行為克隆技術(shù),來塑造精確定位策略。該方法起始于一個(gè)結(jié)構(gòu)薄弱的、非目標(biāo)的小型數(shù)據(jù)集。其主要考慮乒乓球任務(wù)的精度。

關(guān)鍵詞: 谷歌通過乒乓球運(yùn)動(dòng)強(qiáng)化機(jī)器人學(xué)習(xí) 乒乓球運(yùn)動(dòng)強(qiáng)化機(jī)器人學(xué)習(xí) 乒乓球運(yùn)動(dòng) 機(jī)器人學(xué)習(xí)

分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com
一区二区三区中文字幕精品精品 | 日韩一区二区影院| 日韩欧美一区二区三区久久| 中国在线观看免费国语版电影| 在线观看网站免费入口在线观看国内| 国产日产一区 | 污网站免费在线观看| 日韩在线卡一卡二| 欧美性爽视频| 亚洲国产欧美在线| 成人爽a毛片免费啪啪红桃视频| 日本黄色一区二区| 91精品一区二区三区综合在线爱| 亚洲精品av在线| 伊人春色精品| 亚洲日本欧美中文幕| 中文精品视频| 日韩av在线不卡| 在线观看一区视频| 亚洲人成自拍网站| 雨宫琴音一区二区在线| 三上悠亚在线免费观看| 亚洲自拍偷拍网| 亚洲国产成人在线视频| 久久中文字幕一区二区| 95精品视频在线| 99riav视频在线观看| 麻豆成人综合网| 亚洲欧美日韩天堂一区二区| 国产精品视频首页| 久久综合给合久久狠狠狠97色69| 欧美性猛交7777777| 亚洲三级视频| 91视频成人| 国产在线播放一区三区四| 国产伦精品一区二区三区视频金莲| 国产女同性恋一区二区| 欧美不卡高清一区二区三区| 欧美视频精品一区| 最新精品国产| 免费黄色在线视频网站| 68国产成人综合久久精品| 亚洲国产精品字幕| 91在线高清观看| 国产一区二区三区朝在线观看| 91色porny在线视频| 深夜福利在线视频| 粉嫩久久99精品久久久久久夜| 日本欧美三级| 欧美aa视频| 欧美日韩精品系列| 国产一区二区日韩精品| 欧美gay囗交囗交| 亚洲国产日韩综合久久精品| 亚洲精品亚洲人成在线观看| 欧美精品日日鲁夜夜添| 国产高清不卡一区二区| 99热在线精品观看| 影音先锋在线一区| а√天堂资源官网在线资源| 亚洲精品456在线播放狼人| 一区二区三区在线影院| 国产激情视频一区二区在线观看 | 国产污视频在线播放| 欧美美女网站色| 精品久久久免费| 日韩欧美高清在线视频| 678五月天丁香亚洲综合网| 91精品国产综合久久久久久漫画| 一区二区三区日韩在线观看| 亚洲第一主播视频| aa级大片欧美| 香蕉久久网站| 在线免费av资源| 在线观看av中文| 精品成人私密视频| 欧美色图免费看| 亚洲精品久久7777| 91影院成人| 黄瓜视频成人app免费| 免费av片在线观看一道本| 欧美一级欧美一级在线播放| 欧美中文一区二区三区| 99riav久久精品riav| 狠狠色丁香久久综合频道| 国产一区在线电影| 久久电影天堂| 亚洲黄页网在线观看| 成人爱爱电影网址| 奇米精品一区二区三区在线观看| 亚洲精品一级二级三级| 国产精品国产三级国产在线观看 | 日韩成人综合网站| 超碰这里只有精品| youjizz亚洲| 久久精品国产亚洲夜色av网站| 国产精品一区二区99| 国产精品麻豆成人av电影艾秋| 岛国精品在线| 成年人视频在线观看免费| 成人亚洲综合天堂| 丁香婷婷自拍| 最新中文字幕在线| 午夜影院在线| 91精品在线免费| 动漫精品一区二区| 国产午夜亚洲精品羞羞网站| 亚洲蜜臀av乱码久久精品| 亚洲美女精品一区| 91免费看`日韩一区二区| 国产电影一区在线| 国产一区二区视频在线| 91免费国产视频网站| 国产精品字幕| 欧美影院精品| 国产99久久| 久久密一区二区三区| 久久99日本精品| 第一福利永久视频精品| 在线观看av片| 91精品亚洲一区在线观看| 首页亚洲欧美制服丝腿| thepron国产精品| 性做久久久久久久免费看| 在线观看av一区二区| 精品国产乱码久久| 91麻豆福利| 亚洲美女精品久久| 男人天堂亚洲二区| 小早川怜子影音先锋在线观看| 成人在线app| 成年人黄色大片在线| 日本片在线看| 成人免费短视频| 日本黄色免费在线| 日韩成人在线一区| 伊人久久亚洲影院| 亚洲色图清纯唯美| 亚洲精品视频网上网址在线观看| 91传媒在线观看| 国产精品一级伦理| 日韩视频一区二区三区四区| 仙踪林久久久久久久999| 波多视频一区| 电影中文字幕一区二区| 国产亚洲激情| 亚洲国产欧美日韩另类综合 | 日韩欧美国产三级电影视频| 888av在线视频| 久久福利毛片| 日韩欧美中文字幕一区| 午夜免费福利在线观看| 免费看日本一区二区| 成人av网站在线观看免费| 国产91在线|亚洲| 一区二区久久久久久| 欧美日韩国产a| 日本大臀精品| 成人高清一区| 天天色天天射综合网| 日韩在线一区二区| av不卡在线播放| 亚洲欧洲av在线| 在线观看一区日韩| 亚洲精选av在线| 免费欧美电影| 久久久久99精品国产片| 亚洲人成在线免费观看| 爱啪啪综合导航| 日韩一级电影| 成人91在线观看| 亚洲欧美一区二区三区四区| 小水嫩精品福利视频导航| 免费成人毛片| 国产午夜精品理论片a级大结局| 国产黄色免费网| 超碰国产精品一区二页| 亚欧日韩另类中文欧美| 成人一级毛片| 亚洲小说欧美激情另类| 色视频免费在线观看| 亚洲一区导航| 97久久综合区小说区图片区| 91精品入口| 999国产精品视频| 亚洲制服丝袜一区| 成人福利视频导航| 校园春色欧美| 尤物tv在线精品| 国产美女精品在线| 亚洲成人av一区| 深夜影院在线观看| 小视频免费在线观看| 午夜精品久久久久99热蜜桃导演 | 国产精品国产成人国产三级| 国产亚洲福利社区一区| 亚洲少妇激情视频| 高清不卡一区| 亚洲男女自偷自拍| 丝袜国产日韩另类美女|