日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

面向現實世界場景,多語言大數據集 PRESTO 來了

2023-04-07 21:13:28來源:ZAKER科技  

機器之心報道

機器之心編輯部


(資料圖片僅供參考)

PRESTO –一個多語言數據集,用于解析現實的面向任務的對話。

虛擬助理正日益融入我們的日常生活。它們可以幫助我們完成很多事情:從設置鬧鐘到在地圖導航,甚至可以幫助殘疾人更容易地管理他們的家。隨著我們使用這些助手,我們也越來越習慣于使用自然語言來完成那些我們曾經用手完成的任務。

構建強大虛擬助理所面臨的最大挑戰之一是確定用戶想要什么,以及完成這些任務需要哪些信息。在自然語言處理(NLP)的相關文獻中,這件事被定義為一個面向特定任務的對話解析任務,其中給定的對話需要由系統解析,以理解用戶意圖并執行操作來實現該意圖。

基于定制化的數據集,如 MultiWOZ、TOP、SMCalFlow 等,學術界在處理面向特定任務的對話方面取得了一些進展。但這些數據集缺乏模型訓練所需的典型語音場景,無法優化語言模型性能,仍然有很大的進步空間。由此產生的模型往往表現不佳,用戶對互動功能的效果有一些失望。相關的語音場景涉及內容修改場景、不流暢的對話語序場景、不同語言混合使用場景,以及使用圍繞用戶環境的結構化上下文,其中可能涉及用戶的筆記、智能家居、聯系人列表等。

例如以下對話,該對話說明了用戶需要修改其話語時的一個常見實例:

體現了用戶修訂的對話實例。

虛擬助理誤解了用戶的請求,并試圖撥打不正確的聯系人。因此,用戶必須修改他們的話語以糾正助手的錯誤。為了正確地解析最后一句話,助理還需要解釋用戶特指的內容 — 在這種情況下,它需要知道用戶在他們的手機中保存了一個聯系人名單,它應該參考這個名單。

另一類對虛擬助理具有挑戰性的困難場景是混合語言采場景,當用戶在對助理講話時從一種語言切換到另一種語言時,就會發生語言混合使用。例如下面的話語:

英語和德語文本混合使用的對話示意圖。

在本例中,用戶從英語切換到德語,其中「vier Uhr」在德語中的意思是「四點鐘」。

為了推進解析這種現實存在的復雜語言文本的研究,近日,谷歌助手團隊和哥倫比亞大學俞舟教授合作推出一個名為 PRESTO 的新數據集,這是一個用于解析現實任務對話的多語言數據集,其中包括大約 50 萬人與虛擬助理之間的現實對話。

該數據集涵蓋六種不同的語言,包括用戶在使用助手時可能遇到的多種對話場景,包括用戶定制改變、不流暢的對話語序場景、不同語言混合使用場景。數據集還包括結構化的上下文,例如用戶的聯系人列表。PRESTO 對各種場景進行了標注,使人們能夠創建不同的測試集來分別分析這些語言場景的模型性能。

論文鏈接:https://arxiv.org/abs/2303.08954

研究者發現,這些場景中的一些更容易建模,只需很少的樣本,而另一些場景則需要更多的訓練數據。

數據集特征

涉及六種語言

我們數據集中的所有對話都是由語言對應的原生使用者提供,包括六種語言 —— 英語、法語、德語、印地語、日語和西班牙語。這與其他數據集,如 MTOP 和 MASSIVE 形成了鮮明對比。上述數據集僅將話語從英語翻譯成其他語言,并不一定反映以非英語為母語的人的語言模式。

結構化上下文

用戶在與虛擬助理交互時,通常會使用存儲在設備中的信息,如筆記、聯系人和列表。然而,助手通常無法訪問此上下文,這可能導致在處理用戶話語時出現解析錯誤。為了解決這個問題,PRESTO 包括三種類型的結構化上下文、注釋、列表和聯系人,以及用戶話語及其解析。列表、筆記和聯系人由每種語言的母語使用者在數據收集過程中編寫。有了這樣的上下文,研究者可以探索如何使用這些信息來提高解析面向任務的對話模型的性能。

PRESTO 中的每個例子都包括:輸入 —— 用戶的虛擬狀態(上下文)、一個或多個用戶的對話,以及虛擬助理的回應(對話)。輸出 —— 對話中最后一個用戶話語的語義解析(parse)。

內容修改場景

用戶在與虛擬助理交談時,修改或糾正自己的話語是很常見的。這些修改發生的原因有很多 —— 助手可能在理解話語方面犯了錯誤,或者用戶在發表話語時改變了他們的想法,例如圖二。其他例子包括取消自己的請求(「不要添加任何東西。」)或在同一個語詞中糾正自己(「添加面包 — 不,不,等等 — 在我的購物清單上添加小麥面包。」)。在 PRESTO 的所有例子中,大約有 27% 的例子有某種類型的用戶修改,并且在數據集中有明確的標記。

語言混合使用場景

截至 2022 年,世界上大約有 43% 的人口是雙語的。因此,許多用戶在與虛擬助手交談時都會轉換語言。在建立 PRESTO 的過程中,研究者要求雙語數據貢獻者對語言混合使用的語料進行注釋,這些語料約占數據集中所有語料的 14%。

來自 PRESTO 的印地語 - 英語、西班牙語 - 英語和德語 - 英語編碼混合語料的例子。

非流暢的對話語序場景

由于人們和虛擬助手的對話中存在很多口語表達,類似重復的短語或填充詞這樣的斷續語在用戶的話語中是無處不在的。像 DISFL-QA 這樣的數據集注意到現有的 NLP 文獻中存在這樣的場景,開始致力于跨域這種鴻溝。在本文的工作中,研究者考慮了六種語言下的對話。其中,英語、日語和法語中帶有填充詞或重復的語料的例子。

主要發現

研究者對上述每一種場景都進行了有針對性的實驗,他們使用 PRESTO 數據集訓練出一些基于 mT5 的模型,并使用介于預測解析和人工注釋解析之間的一種精確匹配方法來對模型進行評估。下面展示了對內容修改場景、非流程的對話語序場景和語言混合使用場景這三種場景中,在不同的訓練數據數量下的性能結果。

隨著訓練數據量的增加,對各種語言場景和完整測試集進行 K-shot 的結果。

可以發現,對目標場景進行零樣本學習得到的性能較差,這說明在數據集中使用目標場景中設計的文本來提高性能是有必要的。模型在非流程的對話語序場景和語言混合使用場景下的表現比用戶判讀要好得多(精確匹配準確度相差 40 多分)。

結論

在該工作中,作者介紹了 PRESTO,一個用于解析面向對話任務的多語言數據集。該數據集涵蓋了用戶與虛擬助理的日常對話中的各種真實痛點,這些痛點是當前 NLP 社區中現有數據集所缺乏的。

PRESTO 包括大約 50 萬個由英語、法語、德語、印地語、日語和西班牙語六種語言的母語使用者貢獻的話語。研究者創建了專門的測試集來評估每一種場景 —— 內容修改場景、非流程的對話語序場景和語言混合使用場景以及結構化的上下文。實驗的結果表明,當目標場景不包含在訓練集中時,零樣本的表現較差,這表明需要使用此類語句來提高性能。

同時研究者注意到,內容修改場景、非流程的對話語序場景更容易通過增加更多的數據來完成建模,而語言混合使用場景下即使有更多的樣本,也依然難以建模。

隨著這個數據集的發布,研究者預期能帶來新一輪的探索熱潮,他們希望研究界能在用戶每天日常聊天場景下進行研究,并且能取得進展。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

成人自拍在线| 日本不卡在线视频| 一本色道久久综合亚洲精品不| 美女精品在线观看| 日韩一级视频| 国产精品色婷婷在线观看| 国产丝袜一区| 亚洲精品国产偷自在线观看| 日韩免费一区| 亚洲成aⅴ人片久久青草影院| 99久久激情| 桃色一区二区| 激情综合五月| 欧美独立站高清久久| 天堂网在线观看国产精品| 亚洲亚洲一区二区三区| 亚洲精品.com| 欧美日韩在线精品一区二区三区激情综合| 国产精品久久久久毛片大屁完整版 | 日韩 欧美一区二区三区| 91国内精品| 神马午夜久久| 免费在线成人网| 国内精品久久久久久久影视蜜臀 | av中文资源在线资源免费观看| 欧美日韩国产v| 精品中文字幕一区二区三区| 午夜在线视频观看日韩17c| 青青草精品视频| 久久九九精品| 久久精品国产99国产精品| 免费观看成人www动漫视频| 欧美日韩精品免费观看视完整| av日韩精品| 精品三级久久| 日韩欧美视频在线播放| 高清欧美日韩| 亚洲国产视频二区| www.色在线| 日韩高清三区| 美女亚洲一区| 蜜桃视频欧美| 欧美一区二区三区久久精品茉莉花| 91成人福利| 草莓视频一区二区三区| 国产一区美女| 麻豆国产欧美一区二区三区| 婷婷中文字幕一区| 久久夜色电影| 伊人成人在线视频| 亚洲午夜精品一区 二区 三区| 黑人一区二区| 不卡在线一区| 欧洲成人一区| 91精品国偷自产在线电影| 一区二区国产精品| 91成人精品视频| 国内精品久久久久久久久电影网| 色天天综合网| 精品嫩草影院| 亚洲久久在线| 国产不卡人人| 国产精品网址| 亚洲天堂免费| 丝袜诱惑一区二区| 欧美日韩在线二区| 国产精品成人3p一区二区三区 | 日本不卡免费高清视频在线| 亚洲va中文在线播放免费| 国产精品一区二区三区av| 亚洲在线黄色| 日本中文字幕在线一区| 亚洲国产成人二区| 久久高清免费| 亚洲最新av| 美女av一区| 三级精品在线观看| 日韩精品成人一区二区三区| 国产精品亚洲一区二区在线观看 | 日韩三级在线| 色愁久久久久久| 国产精品视频一区二区三区| 日韩成人亚洲| 欧美天堂亚洲电影院在线观看| 成人福利视频| 日本最新不卡在线| 久久夜夜久久| 男女性色大片免费观看一区二区 | 亚洲精品护士| 福利欧美精品在线| 日韩深夜视频| 一本久久知道综合久久| 精品久久美女| 精品一区二区三区亚洲| 欧美一区=区三区| 国产麻豆综合| 精品久久久久久久久久久下田| 国产欧美一区二区三区精品观看 | 亚洲区小说区图片区qvod| 麻豆成人av在线| 天天综合网站| 国产精品论坛| 亚洲专区一区| 欧美二区视频| 精品久久97| 一区中文字幕| 麻豆一区二区在线| 成人在线高清| 电影亚洲精品噜噜在线观看| 国产精品久久观看| 久久性色av| av亚洲一区| 欧美天堂视频| 国产精品久久久久久久久久10秀| 伊人成人网在线看| 伊人情人综合网| 黑人操亚洲人| 亚洲性人人天天夜夜摸| 99久久亚洲精品蜜臀| 久久久精品区| 亚洲精品一二三**| 日韩视频一区二区三区四区| 久久人人精品| 最新亚洲国产| 亚洲最大av| 亚洲动漫精品| 久久精品97| 久久精品女人天堂| 亚洲一区黄色| 久久久久久久欧美精品| 美美哒免费高清在线观看视频一区二区| 天堂成人国产精品一区| 午夜在线a亚洲v天堂网2018| 午夜在线一区二区| 毛片一区二区| cao在线视频| 日韩精品影院| 美女视频网站黄色亚洲| 日本成人中文字幕| 99久久久成人国产精品| 日韩福利电影在线观看| 国产精品主播在线观看| 国产精品99免费看| 亚洲一区一卡| 伊人久久视频| 久久激情五月激情| 国产精品xvideos88| 91成人在线网站| 日本最新不卡在线| 成人久久一区| 亚洲激情成人| 中文亚洲免费| 国产综合久久| 天堂日韩电影| 美女网站色精品尤物极品姐弟| 美女视频亚洲色图| 一级欧洲+日本+国产| 丝袜美腿高跟呻吟高潮一区| av中文资源在线资源免费观看| 日韩黄色大片| 日本中文一区二区三区| 国产综合久久久| 国内毛片久久| 在线亚洲激情| 免费在线观看一区| 亚洲欧美网站在线观看| 久久av免费| 欧美1区二区| 亚洲尤物在线| 四虎地址8848精品| 久久一日本道色综合久久| 国产亚洲一区二区三区啪| 久久国产精品免费精品3p| 黄色日韩在线| 午夜欧美激情| 国内精品久久久久久久97牛牛| 免费成人av| 丝袜美腿亚洲色图| 欧美伊人久久| 久久久久亚洲精品中文字幕| 老司机精品在线| 手机精品视频在线观看| 欧美日韩国产网站| 日韩成人午夜精品| 亚洲美女网站| 日韩成人综合网| 2020国产精品极品色在线观看| 蜜桃精品噜噜噜成人av| 日韩在线二区| 亚瑟一区二区三区四区| 九九综合九九| 丁香婷婷久久| 日韩电影在线一区二区三区| 伊人影院久久| 国产精品亚洲综合久久| 久久伊人影院| 亚洲一区二区三区免费在线观看| 日韩精品欧美成人高清一区二区| 日韩成人在线看| 丝袜美腿亚洲一区|