日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

AI 大模型的語言不平等:英語訓練費用最便宜,漢語訓練費用是英語的 2 倍

2023-08-01 21:16:33來源:ZAKER科技  

近日,X(原 Twitter)用戶 @Dylan Patel 展示了一份來自牛津大學的研究:通過對 GPT-4 和大多數其他常見 LLM 的語言進行研究,研究發現 LLM(大語言模型)推理的成本差異很大。

其中英語輸入和輸出要比其他語言便宜得多,簡體中文的成本大約是英語的 2 倍,西班牙語的成本是英語的 1.5 倍,而緬甸撣語則是英語的 15 倍。


(資料圖片僅供參考)

究其原理,可以追溯到今年 5 月份牛津大學在 arXiv 上刊印的一篇的論文。

詞元是將自然語言文本轉換成詞元(token)序列的過程,是語言模型處理文本的第一步。在 LLM 計算力成本的核算中,詞元越多,耗費計算力的成本越高。

毫無疑問,在生成式 AI 商業化的趨勢下,計算力的耗費成本也會嫁接給用戶,當下許多 AI 服務也正是按照需要處理的詞元數量來計費。

論文顯示,研究者通過分析 17 種詞元化方法后,發現同一文本被轉換成不同語言詞元序列時長度差異巨大,即使是宣稱支持多語言的詞元化方法,也無法做到詞元序列長度完全公平。

例如,根據 OpenAI 的 GPT3 tokenizer,倘若給「你的愛意」詞元化,英語只需兩個詞元,而在簡體中文中則需要八個詞元。即使簡體中文文本只有 4 個字符,而英文文本有 14 個字符。

從 X 用戶 @Dylan Patel 曝光的圖片也可以直觀看到,讓 LLM 處理一句英語需要 17 個詞元(tokens),而讓 LLM 處理同樣意思的一句緬語,則需要 198 個詞元(tokens)。這意味著緬語的處理成本將達到英語的 11 倍。

類似的情況也有很多,Aleksandar Petrov 的網站中提供了許多相關的圖標和數據,感興趣的朋友不妨點擊「https://aleksandarpetrov.github.io/tokenization-fairness/」進去查看語言之間的差異。

在 OpenAI 的官網上也有著類似的頁面,解釋了 API 是如何對一段文本進行詞元化,以及顯示該文本的詞元總數。官網也提到,一個詞元通常對應英語文本的約 4 個字符,100 個詞元約等于 75 個單詞。

得益于英語詞元序列長度短的優勢,在生成式人工智能預訓練的成本效益方面,英語可謂是最大贏家,將其他語言使用者遠遠地甩在身后,間接產生了一種不公平的局面。

除此之外,這種詞元序列長度的差異也會導致處理延遲不公平(某些語言處理同樣內容需要更多時間)和長序列依賴性建模不公平(部分語言只能處理更短的文本)。

簡單點理解,就是某些語言的用戶需要支付更高的成本,承受更大的延遲,獲得更差的性能,從而降低了他們公平地訪問語言技術的機會,也就間接導致了英語使用者和世界其他語言使用之間形成了 AI 鴻溝。

僅從輸出的成本來看,簡體中文的成本是英語的兩倍。伴隨著 AI 領域的深層次發展,總是「差一步」的簡體中文顯然并不友好。在成本等各方面疊加因素的權衡下,非英語母語的國家也紛紛嘗試開發自己的母語語言大模型。

以中國為例,作為國內最早一批探索 AI 的巨頭,2023 年 3 月 20 日,百度正式上線生成式 AI 文心一言。

隨后阿里巴巴的通義千問大模型、華為的盤古大模型等一批批優秀大模型也陸續涌現出來。

在這當中,華為盤古大模型中的 NLP 大模型更是行業內首個千億參數中文大模型,擁有 1100 億密集參數,經過 40TB 的海量數據訓練而成。

正如聯合國常務副秘書長阿米娜 · 穆罕默德曾經在聯合國大會上警告說,如果國際社會不采取果斷行動,數字鴻溝將成為「不平等的新面孔」。

同理,伴隨著生成式 AI 的狂飆突進,AI 鴻溝也很有可能成為新一輪值得關注的「不平等的新面孔」。

所幸的是,平時「慘遭嫌棄」的國內的科技巨頭已然采取了行動。

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

日韩国产一区二| 亚洲小说欧美另类社区| 久久人人超碰| 日韩精品久久久久久| 日韩网站在线| 狠狠入ady亚洲精品| 日韩精品一卡| 日本美女视频一区二区| 老司机精品导航| 精品国产一区二区三区不卡蜜臂| 国产日韩一区二区三区在线播放 | 午夜不卡影院| 欧美/亚洲一区| 日本免费一区二区视频| 影音先锋亚洲电影| 日韩三区免费| 国产美女一区| 免费成人网www| 国产一区二区视频在线看| 亚洲成人不卡| 男女男精品网站| 午夜欧美精品| 激情综合网五月| 日韩精品免费一区二区三区| 日韩欧美国产大片| 日日摸夜夜添夜夜添国产精品 | 日韩激情啪啪| 午夜亚洲福利| 天堂8中文在线最新版在线| 欧美gayvideo| 爽好多水快深点欧美视频| 伊人久久亚洲影院| 国产一区99| 国产精品手机在线播放| 欧美v亚洲v综合v国产v仙踪林| 日韩在线影视| 日韩午夜av在线| 老司机午夜精品视频在线观看| 亚洲不卡在线| 天天操综合520| 亚洲先锋成人| 黄色精品免费| 激情国产在线| 成人精品国产| 麻豆视频一区二区| 国产精品亚洲一区二区在线观看| 国产精品一区二区美女视频免费看| 国产亚洲电影| 一呦二呦三呦国产精品| 九九久久精品| 国产精品99视频| 美腿丝袜在线亚洲一区| 欧美精品97| 欧美第一在线视频| 六月丁香久久丫| 亚洲一区二区免费看| 日韩中文在线播放| 91成人精品观看| 中文字幕一区二区三区日韩精品| 亚洲二区在线| 国产在线看片免费视频在线观看| 日本不良网站在线观看| 亚洲区综合中文字幕日日| 91久久亚洲| 丝袜美腿亚洲综合| 日本v片在线高清不卡在线观看| 精品中文视频| 免费日韩一区二区| 伊人久久大香线| 视频精品一区二区| 日韩欧美1区| 日韩福利视频导航| 中文久久精品| 一区二区日本视频| 一区二区三区四区视频免费观看| 午夜久久福利| 日韩高清一区在线| 欧美伦理影院| 91精品麻豆| 在线视频观看日韩| 日日欢夜夜爽一区| 一区二区网站| 日韩精选视频| 久久狠狠婷婷| 欧美日韩亚洲一区二区三区在线| 亚洲一区二区| 日本精品三区| 欧美顶级毛片在线播放| 欧美成人黄色| 在线一区免费观看| 亚洲桃色综合影院| 日韩欧美大片| 51精产品一区一区三区| 国产精品**亚洲精品| 久久都是精品| 亚洲一级大片| 日本不卡一区二区三区| 中日韩男男gay无套| 一区二区网站| www.久久爱.com| 偷拍精品精品一区二区三区| 日韩一级淫片| 国产精品va视频| 日日摸夜夜添夜夜添亚洲女人| 老司机午夜精品视频| 国产图片一区| 国产精品自拍区| 国产精品综合| 国产精品久久久久久麻豆一区软件| 久久久夜夜夜| 西野翔中文久久精品国产| 一区二区久久| 久久亚洲国产精品一区二区| 在线观看欧美理论a影院| 日韩成人伦理电影在线观看| 一区二区国产在线| 亚洲免费精品| 婷婷综合视频| 激情婷婷综合| 午夜免费一区| 99热精品在线观看| 狠狠干综合网| 亚洲香蕉网站| 女人色偷偷aa久久天堂| 激情婷婷亚洲| 91久久国产| 久久精品导航| 激情综合久久| 亚洲女同中文字幕| 久久综合中文| 成人福利一区二区| 国产欧美日韩精品一区二区三区| 1204国产成人精品视频| 久久国产亚洲精品| 日产午夜精品一线二线三线| a屁视频一区二区三区四区| 亚洲欧美网站在线观看| 大色综合视频网站在线播放| 在线午夜精品| 国产欧美日韩一区二区三区在线| 日韩不卡手机在线v区| 亚洲网址在线| 精品成人av| 一区三区自拍| 鲁大师影院一区二区三区| 欧美成a人片免费观看久久五月天| 亚洲区小说区图片区qvod| 日韩精品一区二区三区免费观影| 伊人精品在线| 捆绑调教一区二区三区| 精品国产美女| 日本不良网站在线观看| 欧美一级大片在线视频| 午夜精品免费| 一本综合久久| 亚洲成人精品| 免费一级欧美在线观看视频| 欧美日韩网站| 日韩欧美一区二区三区在线视频| 中文字幕一区二区av| 99综合视频| 亚洲青青久久| 另类国产ts人妖高潮视频| 欧美国产亚洲精品| 麻豆九一精品爱看视频在线观看免费| 美女视频黄 久久| 婷婷久久一区| 国产欧美日韩精品一区二区免费 | 国产一区二区三区四区大秀| 一本久久综合| 西野翔中文久久精品字幕| 蜜桃视频免费观看一区| 日韩精品a在线观看91| 欧美男人天堂| 久久免费大视频| 亚洲毛片视频| 日韩主播视频在线| 久久天堂久久| 久色婷婷小香蕉久久| 欧美日韩国内| 亚洲成人影音| 麻豆久久一区二区| 91日韩免费| 亚洲精品成人影院| 日韩中文字幕在线一区| 一区二区日本视频| 在线天堂资源| 亚洲少妇一区| 欧美wwwwww| 日韩精品福利一区二区三区| 四虎精品一区二区免费| 日韩午夜av| 免费久久久久久久久| av综合网站| 少妇精品久久久| 欧美日韩1区2区3区| 开心久久婷婷综合中文字幕| 天天久久综合| jizz性欧美2| 精品久久免费|