日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

【全球熱聞】人類被 AI “毀滅”,一定是從教它玩《我的世界》開始的

2023-06-03 12:06:37來源:ZAKER科技  

上周,幾乎是前后腳,英偉達(dá)和國內(nèi)幾家科研機(jī)構(gòu)分別發(fā)布了兩份內(nèi)容相似的論文。

首先是英偉達(dá)宣布開發(fā)出了一個全新的游戲 AI 智能體 "VOYAGER",將 AI 大模型 GPT-4 接入了《我的世界》(Minecraft)游戲。基于 GPT-4,VOYAGER 能夠在《我的世界》里擴(kuò)充著自己的物品和裝備,完成諸如建造房屋、挖礦、收集仙人掌和狩獵等基本生存技能;也能獨(dú)立進(jìn)行開放式探索,去到不同的城市和地點(diǎn),甚至是自己搭建傳送門。

英偉達(dá)稱 VOYAGER 在《我的世界》里獲得的物品增加了 3.3 倍,旅行距離增加了 2.3 倍,解鎖關(guān)鍵技能樹的速度也比之前的方法快了 15.3 倍。

接著就是商湯科技聯(lián)合清華大學(xué)、上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)發(fā)布了通才 AI 智能體 "Ghost in the Minecraft(GITM)"。


(資料圖)

同樣是將大語言模型(LLM)整合進(jìn)《我的世界》,GITM 在《我的世界》內(nèi)主世界的所有技術(shù)挑戰(zhàn)上實(shí)現(xiàn)了 100% 的任務(wù)覆蓋率(成功通關(guān)解鎖了完整的科技樹),而此前所有智能體的總和只能覆蓋 30%;另外在 " 獲取鉆石 " 任務(wù)上,GITM 成功率達(dá) 67.5%,同樣相比于此前的最佳成績—— OpenAI 的 VPT 方法大幅提高了 47.5%。

GITM 在《我的世界》的任務(wù)覆蓋率遠(yuǎn)高于現(xiàn)有 AI 智能體

直白點(diǎn)說,他們都選擇了《我的世界》這款游戲來訓(xùn)練 AI,并且 AI 都實(shí)現(xiàn)了真人玩家能夠完成的幾乎所有游戲任務(wù),堪比是能以假亂真的效果(這放在幾個月前還是不可能的事)。

我們先拋開看起來艱澀的技術(shù)細(xì)節(jié)不談,為啥他們不約而同都迷上了拿《我的世界》做實(shí)驗(yàn)?

《我的世界》就是個大型 AI 試驗(yàn)場

要說起在《我的世界》里訓(xùn)練過的 AI,那可就太多了。

著名的莫拉維克悖論是這么說的:一些任務(wù)對于人類而言很困難,例如下棋,但對 AI 來說很簡單;而像《我的世界》這樣開放世界中與環(huán)境交互、進(jìn)行規(guī)劃和決策等對人類來說較為簡單的事情,對 AI 來說卻是巨大挑戰(zhàn)。

正因?yàn)檫@種情況的存在,在 AI 還不像現(xiàn)在這么發(fā)達(dá)的早幾年,科學(xué)家們最初只是在《我的世界》里用 AI 完成一些簡單的指令。

比如在 2019 年,F(xiàn)acebook 研發(fā)過一款《我的世界》AI 助手 "craftassist bot",這是一個智能協(xié)作式的助理機(jī)器人,可以執(zhí)行人類玩家指定的各種任務(wù),如馴服馬匹、建造城市、與村民會面及交易等。

也是在 2019 年,卡內(nèi)基 · 梅隆大學(xué)、微軟、DeepMind 和 OpenAI,聯(lián)合機(jī)器學(xué)習(xí)頂級會議 NeurIPS 共同舉辦了一個叫做 "MineRL" 的專門針對《我的世界》游戲的 AI 比賽,到 2022 年一共舉辦了四屆。

這個比賽同樣見證了 AI 在《我的世界》中的應(yīng)用由簡單到復(fù)雜的過程。

比如第一屆 MineRL 比的東西還很簡單:看哪個研究團(tuán)員能夠創(chuàng)造出可以在《我的世界》中成功開采鉆石的 AI。不過很慘,最后參加的 900 多個全球頂尖團(tuán)隊(duì)沒有一個能完成挑戰(zhàn),一些 AI 擼掉木材卻不會合成,一些 AI 造出了熔爐卻不會冶煉,一些 AI 知道去地下挖礦,但卻選擇了垂直挖……

后來到了第三屆,比賽內(nèi)容就變成了看誰能訓(xùn)練出樣本高效的《我的世界》AI 智能體。這一屆的冠軍是以 76.970 分的絕對優(yōu)勢奪冠的騰訊 AI Lab" 絕悟 "。

各種公司、機(jī)構(gòu)密集開始在《我的世界》中訓(xùn)練 AI 其實(shí)也是最近五年的事。

美國國防高級研究計劃局(DARPA)在 2020 年 8 月啟動了自適應(yīng)分布式概率任務(wù)分配(ADAPT)項(xiàng)目,以期在戰(zhàn)場空間中利用 AI 協(xié)助指揮官進(jìn)行決策,該項(xiàng)目的承包商 Aptima 公司用到的就是《我的世界》來訓(xùn)練 AI 與人類的互動能力。

2021 年哥本哈根信息技術(shù)大學(xué)、紐約大學(xué)和上海大學(xué)的研究者也創(chuàng)建過一個使用 3D 神經(jīng)元胞自動機(jī)(Neural Cellular Automata,NCA)的系統(tǒng),并將該系統(tǒng)部署在了《我的世界》里,這個時候的 NCA 已經(jīng)可以建造毛毛蟲、城堡、公寓樓和樹等復(fù)雜的實(shí)體。

比較出圈的一次實(shí)驗(yàn)是在去年。

OpenAI 去年宣布由他們訓(xùn)練的 AI 已經(jīng)做到了熟練游玩《我的世界》。通過引入一種新穎且便捷的 AI 訓(xùn)練法 " 視頻預(yù)訓(xùn)練(Video PreTraining)",在向 AI" 投喂 " 了 7 萬小時從相關(guān)合作方處獲取的《我的世界》演示視頻以及與視頻配套的鍵盤鼠標(biāo)操作記錄后,OpenAI 旗下的 AI 的操作已經(jīng)相當(dāng)傳神,掌握了只有人類才能領(lǐng)悟的高階玩法。

OpenAI 在《我的世界》中的實(shí)操演示

此外,DeepMind 也在今年年初開發(fā)出了能夠媲美 OpenAI 成果的名叫 "DreamerV3" 的 AI 智能體。DreamerV3 在沒有任何人工數(shù)據(jù)輔助的情況下,被丟進(jìn)《我的世界》里摸爬滾打了 17 天,驚人地學(xué)會了如何從 0 開始挖鉆石,成了世界上第一個純靠自己摸索,就能在《我的世界》里速挖鉆石的 AI 智能體。

當(dāng)時 MineRL 比賽的發(fā)起人之一 William Guss 都忍不住第一時間發(fā)來賀電:4 年了," 鉆石挑戰(zhàn) " 終于被攻克了!

沒有誰比《我的世界》更合適了

《我的世界》面世 12 年,已經(jīng)成為世界上最受歡迎的一款游戲,被許多玩家形容為電子版的樂高。早在 2019 年,《我的世界》就超過《俄羅斯方塊》成為全球銷量最高的游戲。

《我的世界》" 開放世界 " 的游戲?qū)傩宰屗闪丝茖W(xué)家們訓(xùn)練 AI 的絕佳場所。

不同于 LOL 和王者榮耀等單一的戰(zhàn)略對戰(zhàn)游戲,《我的世界》并不預(yù)先設(shè)定目標(biāo),僅有的兩個模式是 " 生存 " 和 " 創(chuàng)造 "。" 生存 " 模式中,玩家要造好房子并收集東西,保證活下來,即使是用來擊退僵尸和蜘蛛的劍也需要玩家用木材和鐵礦來鍛造;" 創(chuàng)造 " 模式則更加自由,玩家使用各種功能的立方體,自由構(gòu)建建筑物和物體,而且游戲永遠(yuǎn)不會結(jié)束。

如果說 LOL、王者榮耀或是很多棋類游戲因?yàn)楹唵蔚囊?guī)則和游戲機(jī)制,可以讓 AI 以極快的速度學(xué)習(xí)并超越戰(zhàn)勝人類,《我的世界》游戲過程的復(fù)雜程度就幾乎是在挑戰(zhàn) AI 的極限。

極度多樣的環(huán)境、完全靠隨機(jī)種子生成的地圖、長決策序列與復(fù)雜的技能學(xué)習(xí)、高自由度玩法帶來的海量策略偏好,都增加了《我的世界》AI 研究的難度。

比如,為了讓 AI 在 15 分鐘內(nèi)找到鉆石,AI 需要經(jīng)歷徒手采集原木、合成木板、木棍與木鎬,采集到鐵礦,經(jīng)過一系列加工才能合成鉆石,看似只是一件小事,但對于 AI 來說,卻需要掌握其中復(fù)雜的邏輯關(guān)系——這還只是《我的世界》游戲的一部分,除了制造工具,AI 還需要給自己制定目標(biāo),學(xué)著在游戲世界里探索,直到解鎖所有的游戲任務(wù)。

《我的世界》中找鉆石的步驟

而如果只是學(xué)下棋或是打 LOL,AI 只用知道怎么贏就行了。

是不是覺得,《我的世界》訓(xùn)練出來的 AI,要比靠下棋、玩 LOL 訓(xùn)練出來的 AI 高級多了(雖然學(xué)習(xí)速度可能慢了點(diǎn))?

事實(shí)上在當(dāng)前的 AI 研究中,科學(xué)家們會越來越追求通用人工智能(AGI)的研究,追求打造更通用的 AI 智能體,也就是發(fā)展 AI 智能體能夠掌握廣泛的技能,適應(yīng)各種環(huán)境變化,更深入地模擬和應(yīng)對人類在復(fù)雜問題上的能力,像人一樣的進(jìn)行感知、理解和交互(而不是只會回答簡單問題、下棋能贏人類那種 " 小打小鬧 " 的 AI)。

這就意味著要訓(xùn)練通用 AI,《我的世界》模擬的環(huán)境是非常合適的。

不過,開放世界游戲那么多,為什么又偏偏是《我的世界》呢?

有網(wǎng)友在推特向參與開發(fā)了 VOYAGER 的英偉達(dá)首席科學(xué)家 Jim Fan 發(fā)問說,既然 VOYAGER 是為開放世界而生,那為什么沒有選擇在《塞爾達(dá)》或者是《艾爾登法環(huán)》這樣看上去更加宏大的開放世界游戲中作 AI 訓(xùn)練?

Jim Fan 的回答是,這中間的主要難點(diǎn)其實(shí)并不是算法,而是因?yàn)椤度麪栠_(dá)》和《艾爾登法環(huán)》這樣的游戲運(yùn)用了 " 緩慢且難以以編程方式控制高端控制臺 ",并且 " 需要一個好的編碼 API 來控制角色 "。相較之下,《我的世界》的技術(shù)門檻要更低,在目標(biāo)和玩法類似的情況下,《我的世界》實(shí)際也為 AI 訓(xùn)練降低了難度。

另外,《我的世界》對開發(fā)者也很友好。許多用于構(gòu)建《我的世界》的代碼庫都是開源的,所以人們可以很容易修改。并且該游戲也允許研究人員記錄和學(xué)習(xí)人們是如何一起完成任務(wù)的,然后觀察他們將如何與 AI 智能體一起工作。

從這些意義上說,沒有誰比《我的世界》來訓(xùn)練 AI 更合適的了。

這次《我的世界》里的 AI 有什么特別?

此次英偉達(dá)開發(fā)的 VOYAGER,和商湯科技聯(lián)合清華大學(xué)、上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)開發(fā)的 GITM,與過去基于《我的世界》訓(xùn)練的 AI 智能體最大的不同在于,引入了大語言模型(LLM)作為 AI 訓(xùn)練的核心方法。

以往在《我的世界》中訓(xùn)練 AI 用到的主流方法則是,模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

即便是此前 OpenAI 和 DeepMind 開發(fā)出的最先進(jìn)的《我的世界》AI 智能體,用到的訓(xùn)練方法也是模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

打個比方,如果想讓 AI 在《我的世界》里學(xué)會挖礦,模擬學(xué)習(xí)要做的就是先喂給 AI 上萬個游戲視頻,讓它分析學(xué)習(xí)為什么要擼樹,如何利用工作臺進(jìn)行分解合成,如何做出第一把鎬子,如何冶煉鐵錠,制作鐵鎬,獲取鉆石,如何避免落入巖漿,如何戰(zhàn)斗等等挖礦的必要步驟。

等到投喂學(xué)習(xí)結(jié)束,AI 接下來就要接受強(qiáng)化學(xué)習(xí),也就是把 AI 小人扔進(jìn)《我的世界》,讓它去 " 真正 " 執(zhí)行挖礦的任務(wù),通過反復(fù)實(shí)驗(yàn)來發(fā)現(xiàn)和解決問題,從而真正學(xué)會挖礦這一技能。

但在大語言模型的訓(xùn)練方法下,AI 的學(xué)習(xí)邏輯是被完全重構(gòu)的。

依然拿挖礦來說,AI 智能體自身會首先根據(jù) " 盡可能多發(fā)現(xiàn)不同的東西來幫助挖礦 " 的總體目標(biāo)去提問、自動生成許多小任務(wù),通過去存儲有助于成功解決某個任務(wù)的行動程序(比如擼掉樹木再去進(jìn)行合成被驗(yàn)證是正確的,造出了熔爐就要去冶煉也是正確的),AI 就會逐漸建立起一個如何正確挖礦的技能庫。而往后如果再遇到挖礦任務(wù),AI 就可以根據(jù)其描述的嵌入在技能庫中進(jìn)行檢索。

大語言模型訓(xùn)練方法下的 GITM

也就是說,大語言模型的訓(xùn)練方法下,AI 是可以自主驅(qū)動探索并掌握廣泛技能的,這就使得大語言模型方法更能幫助 AI 成為一個終身學(xué)習(xí)者,能在較長的時間跨度內(nèi)逐步獲得、更新、積累和遷移知識,同時緩解了其他持續(xù)學(xué)習(xí)方法中的 " 災(zāi)難性遺忘 "。

VOYAGER 探索物品量高于其他許多 AI 智能體

有點(diǎn)像是一直讓 AI 呆在學(xué)校里讀書實(shí)習(xí),還是讓 AI 一開始就在社會里摸爬滾打的區(qū)別。

總而言之,用大語言模型方法在《我的世界》訓(xùn)練出來的 AI 更像一個真實(shí)的人了。

我們知道,一個理想的 AI 應(yīng)該具有與人類類似的能力。《我的世界》里的 AI 不管是根據(jù)其當(dāng)前的技能水平和世界狀態(tài)提出合適的任務(wù)(如果發(fā)現(xiàn)自己處于沙漠而不是森林,就會在打鐵前學(xué)會獲取沙子和仙人掌),根據(jù)環(huán)境反饋完善技能并將掌握的技能存入記憶(比如打僵尸和打蜘蛛的技能類似),還是不斷探索世界,以自驅(qū)動的方式尋找新任務(wù),其實(shí)都已經(jīng)和現(xiàn)實(shí)世界中人類的決策過程和行為方式非常相近。

說《我的世界》已經(jīng)是一個縮小版的現(xiàn)實(shí)世界也許一點(diǎn)也不夸張。

而讓人細(xì)思極恐的是,隨著 VOYAGER 和 GITM 的研究成果發(fā)布,AI 現(xiàn)在已經(jīng)能通關(guān)《我的世界》了。

這不禁讓人猜想,AI 是不是很快就能在現(xiàn)實(shí)世界里如魚得水,它能像人一樣生活,會做飯、會用手機(jī)、知道怎么穿衣服、怎么養(yǎng)寵物、怎么坐公交地鐵……更不可思議的是,它還能像人一樣有自己的想法,知道穿哪件衣服好看,怎么做飯能更好吃,電話應(yīng)該打給誰……沒準(zhǔn)在不久的將來,我們在生活中遇到到的 " 人 ",都無法分辨它是不是 AI。

既然都能通關(guān)《我的世界》了,AI 過上人的生活從技術(shù)上來講也不是不能實(shí)現(xiàn)。

人類又會如何選擇呢?

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

推薦閱讀

国产一区二区三区成人欧美日韩在线观看 | 人在线成免费视频| 亚洲优女在线| 国产一区二区三区免费在线| 高清一区二区三区| 国产精品视频久久一区| av一区在线播放| 国产精品一区高清| 天天久久夜夜| 成人1区2区| 国产日韩欧美中文在线| 国产深夜精品| 日韩精品成人一区二区在线| 伊人久久影院| 国产美女高潮在线观看| 欧美精品成人| 久久影院100000精品| 日本蜜桃在线观看视频| 国产一区二区三区91| 亚洲精品1区2区| 影音先锋久久精品| 久久精品动漫| 四虎4545www国产精品 | 99国产**精品****| 欧美三级网址| 91成人在线精品视频| 色999国产精品| 精品久久亚洲| 日韩中文字幕av电影| 欧美激情综合色综合啪啪| 极品av少妇一区二区| 国产精品久久久一区二区| 久久要要av| 欧美永久精品| 亚洲美女15p| 国产欧美在线观看免费| 99香蕉久久| 在线天堂资源| av不卡一区二区| 蜜桃视频www网站在线观看| 视频欧美一区| 亚洲成人毛片| 欧美肉体xxxx裸体137大胆| 久久激情五月激情| 亚洲香蕉网站| 在线看片一区| 天堂va蜜桃一区二区三区 | 1024日韩| 白嫩亚洲一区二区三区| 午夜日韩在线| 国产一区日韩| 日韩免费高清| 在线观看欧美理论a影院| 欧美日韩一卡| 免费精品视频最新在线| 91精品日本| 久久精品99国产精品日本| 五月天久久网站| 亚洲欧洲av| 欧美日韩女优| 亚洲美女视频在线免费观看 | 裸体素人女欧美日韩| 日韩视频1区| 天天综合91| 久久性天堂网| 日日夜夜精品免费视频| 男人的j进女人的j一区| 亚洲五月综合| 四虎成人精品永久免费av九九| 欧美2区3区4区| 99久久婷婷国产综合精品首页 | 日本 国产 欧美色综合| 国产精品调教视频| 日韩国产高清在线| 欧美jizz| japanese国产精品| 日韩电影在线免费看| 国产成人精品一区二区三区视频 | 亚洲精品午夜av福利久久蜜桃| 色综合综合色| 国产欧美日韩亚洲一区二区三区| 欧美女激情福利| 91欧美极品| 国产精品免费大片| 日韩成人在线一区| 蜜臀a∨国产成人精品| 视频福利一区| 日韩成人精品在线| 麻豆成人免费电影| 午夜影院一区| 香蕉成人久久| 亚洲精品小说| 久久久精品五月天| 亚洲资源网站| 欧美激情综合色综合啪啪| 国产精品久久久久av电视剧| 国产精品呻吟| 91成人观看| 久久精品亚洲人成影院| 日韩不卡一区二区三区| 综合五月婷婷| 日本不卡一区二区| 四虎地址8848精品| 欧美gv在线观看| 久久青草伊人| 91视频综合| 欧美日韩免费观看一区=区三区 | 中文字幕系列一区| 黄视频免费在线看| 亚洲在线日韩| 夜久久久久久| 黑人一区二区| 亚洲国产精品91| 欧美日韩国产一区二区三区不卡 | 91中文字幕精品永久在线| 久久av资源| 中文在线日韩| 亚洲日本黄色| 日韩精品高清不卡| 久久精品99国产精品日本| www成人在线视频| 香蕉视频亚洲一级| 日韩一区二区在线| 亚洲欧美小说色综合小说一区| 嫩草成人www欧美| 亚洲综合激情| 国产精品传媒精东影业在线| 每日更新成人在线视频| 国产亚洲在线| 丝袜美腿亚洲一区| 性一交一乱一区二区洋洋av| 麻豆精品91| 国产精品久久久久无码av| 欧美国产偷国产精品三区| 成人在线电影在线观看视频| av中文在线资源库| 深夜成人在线| 78精品国产综合久久香蕉| av在线一区不卡| 美日韩一区二区| 麻豆国产91在线播放| 欧美日韩一区二区高清| 国产成人1区| 日本高清久久| 神马午夜久久| 伊人久久亚洲热| 视频在线观看一区二区三区| 色综合五月天| 精品美女一区| 欧美96一区二区免费视频| 伊人久久一区| 视频一区国产| 欧美+亚洲+精品+三区| 99国产精品久久久久久久成人热 | 日韩国产欧美在线观看| 亚洲精品黄色| 日本精品一区二区三区在线观看视频| 日韩精品成人在线观看| 国产精品主播在线观看| 国内精品99| 欧美1级片网站| 精品美女一区| 欧美男gay| 久久精品动漫| 丝袜国产日韩另类美女| 欧美综合影院| 疯狂欧洲av久久成人av电影| 中文字幕一区日韩精品| **女人18毛片一区二区| 日韩1区2区| 美日韩一区二区| 久久视频免费| 成人a'v在线播放| 极品av在线| 亚洲精品女人| 99久久婷婷国产综合精品青牛牛| 亚洲一级网站| 神马久久午夜| 成人日韩视频| 99久久婷婷国产综合精品电影√| 在线综合欧美| 国产91在线精品| 日韩av不卡一区二区| 午夜欧美视频| 成人综合网站| 精品91福利视频| 99国产精品久久久久久久 | 91看片一区| 国产精品视频一区二区三区| 精品久久91| 中文字幕人成乱码在线观看 | 91精品天堂福利在线观看| 国产视频一区免费看| 国产第一亚洲| 亚洲天堂中文字幕在线观看| 国产精品日本| 亚洲精品乱码| 国产99久久| 成人一区视频| 国产成人aa在线观看网站站|