日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

ResponsibleTA 提升 LLM 可靠性,任務完成更安全、更高效 即時看

2023-06-22 14:10:46來源:ZAKER科技  

機器之心專欄

機器之心編輯部


(相關資料圖)

AI 智能助手照進現實。

近幾個月,ChatGPT、GPT-4 等大語言模型(LLM)展現出突破性的理解、推理、生成、泛化和對齊能力,對各行各業的研究方式和生產效率均帶來廣泛而深遠的變革及影響。此外,LLM 還展現出在真實世界的開放場景中解決復雜問題的能力,使科幻電影中無所不能的 AI 智能助手照進了現實。

在實現自然場景中的任務自動化時,一個復雜的任務往往由多個子任務構成,這需要多個模型或 APIs 的協作。如何確保 LLM 和執行器之間高效、安全、穩定地協同工作,是構建 Responsible AI ,以及讓 LLM 可靠地為人類提供服務的關鍵問題。

為了解決這個問題,來自微軟亞洲研究院的研究團隊提出 Responsible Task Automation ( ResponsibleTA ) 框架,提升 LLM 和執行器之間協同工作的安全性和有效性。

論文鏈接:https://arxiv.org/pdf/2306.01242.pdf

項目主頁:https://task-automation-research.github.io/responsible_task_automation/

方法

本文通過提出一個新的任務自動化框架,通過可行性檢測,完成度檢驗,用戶隱私保護等三個模塊,提高了大語言模型作為任務助手的可靠性,為未來的人機交互提供了一種可行的方式。

該系統框架包含基于 LLM 的中央處理單元、指令執行器、指令可行性預測器、指令完成度檢驗器和安全性保護器。

Responsible Task Automation ( ResponsibleTA ) 框架示意圖

當 ResponsibleTA 接收到復雜任務對應的高層級指令時,安全性檢測自動將包含用戶隱私的命令實體替換成對應的占位符,然后將去隱私化的指令發送給部署在云端的 LLM,LLM 據此規劃實現該負責任務目標的單步指令,然后發送給的部署在本地的執行器實際執行相關操作。從 Responsible AI 的角度出發,該框架賦予 LLM 三個新的能力:

1)可行性預測:ResponsibleTA 框架針對 LLM 和執行器的協同,開發設計了可行性預測模塊。該模塊用于對 LLM 的輸出進行可行性判斷,及時攔截不可行的執行指令,從而規避在執行這些指令的過程中產生的不可控風險。當 LLM 輸出的指令判斷為「不可行」時,可行性預測期會將其分析結果返回給 LLM,并要求其重新進行任務規劃,力求將合理可行性的指令交付給執行器,提升任務自動化的成功率。

2)完成度檢驗:ResponsibleTA 框架設計了一個完成度檢驗器,用于在執行器每次執行結束后自動檢查其執行結果是否符合預期。該模塊根據執行器執行后的即時狀態,判斷 LLM 當前規劃是否完成,并提供及時補救的可能。當執行狀態判定為「未完成」時,完成度檢驗器會要求 LLM 啟動 replanning,使其能夠及時調整任務規劃。

完成度檢驗器和上述可行性預測器,分別在 LLM 輸出指令的執行前后,對指令的合理性和執行的完成性進行校驗,為任務自動化的可靠性提供了雙重保險。

3)用戶隱私保護:ResponsibleTA 框架還設置了用戶隱私保護機制,該機制通過一個本地記憶單元實現。當用戶將高層級命令發送給部署在云端的大語言模型時,ResponsibleTA 中的隱私保護模塊自動將命令中的隱私信息(如:用戶名、密碼、地址等)替換成對應的占位符,而當大語言模型將規劃的低層級指令發送給部署在本地的執行器是,占位符會被自動替換成對應的真實信息。于此方式,用戶的隱私信息僅在本地被存儲和被使用,無需發送至云端,從而避免在傳輸和使用中的不可控風險。

針對 ResponsibleTA 中的可行性預測和完成度檢查功能,其研究團隊在 UI 任務自動化場景下提出并對比了兩種不同的技術路線,并在實驗部分詳細分析了這兩種技術路線的特點。以可行性預測為例,第一種技術方案通過 Prompting 的方式利用大語言模型內部知識進行判斷。具體地,研究者訓練了一個屏幕解析模型將 UI 頁面解析成所含 UI 元素的語言描述,并將和指令一起輸入給 GPT-4 模型,讓 GPT-4 判斷當前指令的可行性。具體方案如下圖所示。

基于 prompt engineering 的(指令)可行性預測器實現方案

另一種技術方案在于訓練一個專用的多模態模型,該模型接收 UI 頁面的視覺信號和對應的語言指令為輸入,輸出該指令的可行性判定結果,具體結構如下圖。

基于專用模型的(指令)可行性預測器實現方案

完成度檢驗器的實現方案于可行性預測器類似,在此不詳細贅述。

實驗

該工作的作者首先對 ResponsibleTA 中的關鍵模塊進行定性實驗,驗證其有效性,并對比不同實現方式的特點。據下表所示實驗結果,作者認為專用模型能夠提供更優的實驗結果但需要收集特定任務對應的數據和標注用于模型訓練,而基于 LLM 的技術方案也能達到不錯的效果,并在實際部署的成本和靈活性方面具有優勢。

可行性預測器和完成度檢驗器的定性實驗結果

作者還在真實世界的實際使用場景中進行 online testing, 并匯報了基線模型,具有可行性預測器的 ResponsibleTA 框架和完整版的 ResponsibleTA 框架在 12 個實際 UI 任務執行過程中的具體表現。作者觀察到所提出的可行性預測器和完成度檢驗器能夠避免執行不可理 / 不可行的指令,并能通過讓 LLM 進行 replanning 的方式進行及時補救,從而提升任務自動化的成功率。

真實世界中實例研究定量結果。表格中的數字表示 「有效執行步數 / 總共執行步數 (人類專家執行步數)」。

此外,作者還通過具體的案例分析直觀地展現了 ResponsibleTA 框架中的關鍵模型如何對一個失敗案例進行補救,使其成為一個成功案例。

案例分析:進入亞馬遜網站并將最便宜的充電器添加至購物車。

THE END

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

亚洲欧美日本日韩| 欧美1区2区3区| 日本一区二区三区播放| 久久国产亚洲精品| 日韩1区2区| 影音先锋久久资源网| 日韩一区二区三区高清在线观看| 欧美日韩精品一区二区视频| 欧美韩国日本在线观看| 欧美日韩 国产精品| 精品国产美女| 国产伦久视频在线观看| 在线欧美激情| 天天射综合网视频| 亚洲a成人v| 亚洲精选av| 日本欧美在线观看| 2019中文亚洲字幕| 欧美日韩国产高清电影| 日韩精品第一| 国产成人夜色高潮福利影视| 蜜臀va亚洲va欧美va天堂| 国内揄拍国内精品久久| 久久青草久久| 欧美中文字幕精在线不卡| 欧美极品在线| 99精品在免费线中文字幕网站一区| 亚洲欧美日韩精品一区二区| 免费亚洲一区| 久久国产精品亚洲人一区二区三区 | 麻豆精品视频在线观看免费| 国产日韩三级| 蜜臀久久久久久久| 国产在线日韩精品| 免费人成精品欧美精品| 国产亚洲电影| 免费的成人av| 日韩精品一区二区三区中文字幕| 97国产成人高清在线观看| 日韩av午夜在线观看| 激情黄产视频在线免费观看| 日韩成人18| 亚洲精品aaa| 久久国产精品成人免费观看的软件| 日本国产亚洲| 美日韩中文字幕| 99er精品视频| 97国产精品| 中文一区二区三区四区| 亚洲国产aⅴ精品一区二区三区| 精品视频国产| 国产精品地址| 蜜臀av一区二区在线观看| 中文无码日韩欧| 欧美在线三级| 亚洲欧美日本视频在线观看| 国产一区二区三区四区| 欧美激情欧美| 久久理论电影| 欧美影院精品| 91精品影视| 亚洲啊v在线观看| 欧美精品97| 天堂av中文在线观看| 欧美精品一区二区三区精品| 国产在线一区不卡| 天天综合网天天| 在线成人激情| 日本最新不卡在线| 久久一区国产| 国产精品成人a在线观看| 欧美韩一区二区| 国产一区二区三区免费在线| 肉色欧美久久久久久久免费看 | 中文字幕人成乱码在线观看| 亚洲女同中文字幕| 国产一区一区| 成人在线不卡| 天堂成人免费av电影一区| 国产美女撒尿一区二区| 综合亚洲视频| 日韩欧美专区| 日韩aaaa| 狠狠干成人综合网| 成人综合一区| 精品国产亚洲一区二区三区在线| 免费在线成人| 欧美91看片特黄aaaa| 在线亚洲自拍| 欧美 日韩 国产一区二区在线视频| 亚洲自拍电影| 欧美黄污视频| 国产精品第一国产精品| 国产精品毛片久久| 99成人免费视频| 久久中文字幕av一区二区不卡| 欧美欧美黄在线二区| 日本成人中文字幕在线视频| 日韩电影免费在线观看| 手机精品视频在线观看| 九九久久电影| 99久久综合| 在线一区二区三区视频| 国产亚洲高清在线观看| 日韩国产在线观看| 成人国产精品| 欧美三级网址| 三级在线观看视频| 日韩成人a**站| 久久国产精品99国产| 伊人久久亚洲影院| 欧美精品一二| 亚洲国产老妈| 免费av一区二区三区四区| 国产亚洲精品美女久久| av不卡一区二区| 91精品国产自产在线丝袜啪| 国产麻豆精品久久| 亚洲综合伊人| 国精一区二区| 日韩福利视频导航| 精品久久国产一区| 日韩区一区二| 国产精品99久久免费观看| aaa国产精品视频| 国产精品极品| 麻豆成人入口| 激情久久久久久| 国产一在线精品一区在线观看| 欧美一区二区麻豆红桃视频 | 乱码第一页成人| 免费在线观看视频一区| 日本欧美在线看| av在线视屏| 韩国三级一区| 欧美一区二区| 欧美日本精品| 久久99国产精品视频| 少妇精品在线| 91精品啪在线观看国产18| 久久久影院免费| 91国语精品自产拍| 一本久久知道综合久久| 奇米狠狠一区二区三区| 亚洲精品字幕| 国产影视一区| 欧美三区视频| 亚洲国产专区| 玖玖视频精品| 亚洲va中文在线播放免费| 欧美在线1区| 国产精品**亚洲精品| 日韩av不卡一区二区| 欧美三区视频| 仙踪林久久久久久久999| 亚洲一区区二区| 密臀av在线播放| 日日摸夜夜添夜夜添亚洲女人| 日本午夜精品视频在线观看| 欧美高清hd| 久久激情av| 亚洲一区二区网站| 美女福利一区二区三区| 日本在线不卡视频一二三区| 国产亚洲精aa在线看| 国产另类在线| 在线亚洲一区| 福利一区二区免费视频| 高清一区二区三区av| 国产精品tv| 老鸭窝91久久精品色噜噜导演| 欧美不卡高清一区二区三区| 亚洲五月综合| 久久久噜噜噜久久狠狠50岁| 国产精品入口| 99精品热视频只有精品10| 国产欧美一区二区精品久久久| 精品一二三区| 蜜臀av国产精品久久久久| 久久精品99国产国产精| 日韩成人精品视频| 婷婷亚洲图片| 78精品国产综合久久香蕉| 国产精品一区高清| 婷婷综合在线| av成人在线观看| 日韩视频一区二区三区四区| 欧美1区2区| 国产精品第一| 国产91精品入| 中文字幕在线免费观看视频| 日韩电影免费网址| 色综合久久一区二区三区| 国产精品xvideos88| 成人在线亚洲| 久草在线中文最新视频| 影音先锋日韩精品| 自拍欧美一区| 亚洲视频二区| 精品国产中文字幕第一页 |