馬斯克硬剛 OpenAI,用戶慘遭池魚之殃
只聽說過社交媒體想方設法讓用戶多停留的,沒聽說過主動給人加個上限的。如今開眼了,埃隆 · 馬斯克正在給所有推特用戶加 " 未成年人保護 ",而這一切,居然是被 AI 逼的?
如今推特用戶每天最多能瀏覽多少推特,不取決于手速或者舍不舍得熬夜,而是有一個明確的數字:已驗證(也就是付費的 " 藍鳥 " 服務)賬戶 10000 條、未驗證賬戶 1000 條,而新注冊的未驗證賬戶只有 500 條。
(資料圖片)
就這,還是馬斯克面對憤怒的用戶,兩次提高后的標準。至于原因,是 " 為了解決極端水平的數據抓取和系統操縱問題 "。
他指的正是 AI 公司們,為了訓練模型,這些企業需要大量數據作為喂養的飼料。去年 12 月,馬斯克切斷了與 OpenAI 的數據聯系,今年 4 月又指責微軟非法使用推特的數據。
在馬斯克為阻止數據抓取采取激進措施的同時,OpenAI 正在面臨一項集體訴訟。訴訟的原告有 16 名,都是個人,換句話說,都是普通的互聯網沖浪人。他們指控 OpenAI 秘密地 " 從互聯網抓取了 3000 億字詞 ",未經允許從互聯網那個用戶那里竊取 " 大量私人信息 ",以培訓 ChatGPT。
一邊是互聯網用戶和多年來積累大量 UGC 內容的平臺,另一面是新興的 AIGC 企業,一場圍繞數據抓取、隱私安全的戰爭已經打響。
周五周五,敲鑼打鼓。好不容易要周末了,推特的用戶卻傻了,屏幕上顯示報錯信息,提醒其已經超過了 " 速率限制 ",違反了推特的規則,查看了過多推文。
人們壓根不知道這是什么意思,推特老板馬斯克站了出來,表示的確是有速率限制,而且宣布:為了解決極端水平的數據抓取和系統操縱問題,已驗證、未驗證、新注冊未驗證賬戶每天的瀏覽上限是 6000、600 和 300 條推文。
在此之前,馬斯克剛宣布推特開始禁止未登錄的用戶瀏覽內容,用戶尚且能接受。限制實錘,用戶麻了,繼而看著這驗證與否的區別對待,眉毛挑起來了:你個老六該不會是想用這招推行 " 藍鳥訂閱 " 吧?在評論區,不止一位用戶評論:" 現在得用錢制勝了?"不滿的聲音很大,推特的競品 Hive、Mastodon、Tumblr 等出現在熱門話題里,一張推特墓碑的梗圖被大量使用。爭議聲中,馬斯克兩次提高標準至驗證用戶 10000 條瀏覽、未驗證用戶 1000 條。
一個馬斯克的高仿號調侃道:" 我設置限制,是因為你們這些推特成癮者需要出去走走。我這是在為世界做好事啊 "。這種上價值的思路好,馬斯克反手就是一個轉發,自己還單獨發了條 " 去拜訪下你的朋友和家人吧 "。不過玩笑歸玩笑,馬斯克為自己的這次 " 測試 " 給出了明確的解釋:應對數據爬取。用戶的不滿,也在于限流的做法是否有效,而不在數據爬取的問題上。AI 初創公司跑來推特 " 扒數據 " 的情況有多嚴重呢?馬斯克在一條推文中說,流量激增,推特不得不啟用備用服務器:" 在緊急情況下啟用大量在線服務器,僅僅是為了給某些 AI 初創公司高得離譜的估值幫忙,這太令人惱火了。"
在限流風波的前一天,Epic Games 的 CEO 蒂姆(Tim Sweeney)還發推抱怨推特也在建墻,馬斯克回復:" 數百個(甚至更多)阻止正在極其激進地爬取推特數據,到了影響用戶體驗的地步。我們應該怎么做?我對所有想法都保持開放。"
剛才還在抱怨的蒂姆,很快就給出了認真的建議,如在推特的服務條款中加入禁止數據爬取、以信息安全工程保護平臺,以及針對大規模濫用推特的公司采取法律行動。
值得注意的是,馬斯克在回復中提到," 絕對 " 會對那些竊取數據的人采取法律行動:"(樂觀地說)從現在起 2 到 3 年,期待在法庭上看到他們。"
不管 " 為付費訂閱添柴 " 的猜想是不是以小人之心度了馬斯克之腹,馬斯克高舉用戶隱私大旗之外,多少有可能抱有私心。4 月,馬斯克被傳出成立 X.AI 新人工智能公司,要對抗 ChatGPT。如果真的要訓練大語言模型,推特的用戶數據,當然是只給自己用最好。
不論如何,主動給平臺限流都做得出來,馬斯克已經做好準備,要和 AI 初創公司們硬剛到底了。
就在馬斯克重拳出擊給全平臺限流的時候,這場 AICG 熱潮的 " 始作俑者 "、ChatGPT 的造物主 OpenAI,正卷入一場集體訴訟中。
這起訴訟在美國加州北區地方法院發起,原告 16 人,均為匿名,均為個人。訴狀很長,足足有 157 頁,以斯蒂芬 · 霍金的一句話作為開頭:" 強大人工智能的崛起,要么是人類有史以來最好的事,要么是最糟的。" 被告除了 OpenAI,還有為其注資上百億美元的微軟。
核心指控是,ChatGPT 使用從互聯網上收集的數據來 " 訓練其技術 " 時,侵犯了 " 無數人的版權和隱私。"
起訴書中稱,OpenAI 從互聯網上秘密抓取 3000 億字詞,竊聽了 " 書籍、文章、網站和帖子,包括未經同意獲得的個人信息 ",違反了隱私法。其中就提到了 OpenAI 爬取大量網絡數據,包括社交媒體中的數據。
他們還指出 OpenAI 有個專有 AI 語料庫,積累了大量個人數據,包括從 Reddit 帖子及其鏈接到網站中獲取的數據。
這是訓練模型方面的指控,此外,原告還稱用戶與 OpenAI 的產品的互動、在產品中的私人信息,也都被 OpenAI 非法訪問、大規模盜用。
這已經不是 OpenAI 第一次在美國面臨集體訴訟。去年 11 月,就有 Github 程序員對 Github、OpenAI 和微軟發起集體訴訟的事件,指控 OpenAI 涉嫌違反開源許可,使用他們貢獻的代碼訓練專有 AI 工具 GitHub Copilot。
彼時 ChatGPT 還沒有上線,如今回頭看,AI 訓練的問題那時就已經暴露。如今,最新的集體訴訟針對的是用戶更為廣泛、被侵犯人群也更加廣泛(基本上就是全員受害)的 ChatGPT,更重要的是,在 AIGC 的狂潮之下,任何法律先例都可能影響未來。代理該案的克拉克森公益律師事務所(Clarkson)在一封聲明中,將這次的集體訴訟稱作 " 里程碑式 " 的聯邦案件,是對整個人工智能的警告。
從這個角度看,OpenAI 肩上的擔子的確很重。
OpenAI 因數據抓取和隱私安全已經惹上諸多麻煩,平臺上鎖、用戶翻臉都只是冰山一角。
在歐洲,OpenAI 已經遭到了多個國家的調查,甚至在今年 4 月,意大利擔心 ChatGPT 會違反歐洲數據保護法,暫時封禁過 ChatGPT。
針對整個人工智能領域的監管正在推進。法國于 5 月推出人工智能行動計劃,其中在 AIGC 方面,法國隱私監管機構特別關注一些 AI 模型從互聯網上搜集數據、建立數據集,用來訓練大語言模型的做法。
最重磅的是歐盟人工智能監管法案(EU AI Act),目前已經走向收尾階段。該法案將有可能成為全球 AI 治理的范本。
平臺、用戶、監管,三股力量已經形成合圍之勢,誓要盡早給 AIGC 立立規矩,并且要從大模型訓練這個起點開始。
一方面,時間緊迫,AIGC 發展得太快。
馬斯克說 " 估值高得離譜的 AI 初創公司 " 指的是誰,咱也不知道。但這話一出,中箭的確實不少,畢竟現在 AIGC 領域融資一波接一波,全是熱錢。
在初創公司里,OpenAI 估值近 300 億美元,融資總規模 113 億美元,是 AIGC 里最有錢的;然后是 Anthropic,第二有錢,估值超過 40 億美元。而前幾天才以 13 億美元融資震驚硅谷的 Inflection,估值也已經有 40 億美元,而它成立不過一年多。
大的可能還在后頭。Inflection 用的是自家的大語言模型,這次 13 億美元到手,宣布要搞 2.2 萬張英偉達 H100 芯片,做全球最大的人工智能集群。如此大規模算力,目標參數量和數據集勢必也是驚人的。
另一方面,ChatGPT 橫空出世,等它暴露出問題時,想 " 修補 " 并不是那么容易。OpenAI 的幾代大語言模型,GPT-2 數據集有 40GB 文本,GPT-3(也就是 ChatGPT 發布時用的模型)訓練數據有 570GB,至于今年才發布的 GPT-4,數據集大小壓根沒透露。
海量的數據并沒有從一開始就做好記錄。谷歌前研究科學家尼西亞 · 桑巴斯萬曾在采訪中表示,科技公司不會記錄它們是如何收集或注釋 AI 訓練數據的,甚至不知道數據集中到底有什么。木已成舟的 ChatGPT 就像一個黑匣子,而且是一個打造在密室里的黑匣子,如今要做透明化、隱私保護,比如羅列到底爬取了哪些數據、闡釋使用過程中會如何使用這些數據、應用戶要求刪除某條數據,其實很難。
互聯網沖浪人和監管死咬 OpenAI 們,還有一個不容忽視的原因——在社媒發展壯大的那些年,對個人網絡數據保護的意識還在襁褓中,待要抗衡時,發現已錯過太遠。
當扎克伯格 2018 年首次坐上國會聽證席時,他的社交媒體平臺 Facebook 已經推出了 14 年。彼時 Facebook 身陷 " 劍橋丑聞 ",公司首席技術官稱有 8700 萬用戶受影響。那也是一次因數據抓取釀成的大錯。
等到今年 5 月阿爾特曼坐上美國國會聽證席,議員頻頻表達著在社媒時代行動不足的悔恨,意思很明了:這一次,就算不能超前,也至少要跟上 AIGC 的腳步。
一個接一個的大模型仍然在訓練當中,數據抓取是一根線頭,攥住它才有望理清 AIGC 的糊涂賬。
參考資料:
1、新浪科技:《馬斯克跟微軟杠上了?Twitter 稱微軟非法使用其數據》
2、黑馬程序員:《這些程序員把 GitHub 告了!要求索賠 649 億》
3、界 - 面新聞:《歐盟 AI 法案出爐,OpenAI 等公司可打幾分,核心爭議點有哪些?》
4、騰訊科技:《對數據的渴求正反傷 OpenAI?多國指控其違反數據保護法》
5、網易科技:《ChatGPT 在意大利恢復上線 但 OpenAI 的監管麻煩才剛剛開始》
責任編輯:hnmd003
相關閱讀
相關閱讀
-
馬斯克硬剛 OpenAI,用戶慘遭池魚之殃
只聽說過社交媒體想方設法讓用戶多停留的,沒聽說過主動給人加個上限的
-
MIUI15 來了!小米下半年最大重頭戲:多款新機已在測試!|全球快報
在去年底發布的小米13系列上,除了在核心硬件上的全新升級外,我們也見
-
菜鳥京東化,順豐怎么辦?
圖片來源@視覺中國文|解碼Decode每年,國家郵政局都會按季度公布一份快
-
傳阿里有意將優酷和土豆注入阿里影業?阿里大文娛公關回應稱,不屬實
36氪獲悉,有市場消息傳出,阿里巴巴據悉考慮視頻平臺優酷和土豆的戰略
-
中端手機暴打旗艦!上半年重磅新機扎堆,太卷了!
隨著6月份的結束,熱鬧了整整半年的手機市場總算是迎來了「冷靜期」。
-
集度汽車緘默,百度造車到哪一步了? 環球快訊
作者:孫志富來源:貓頭鷹車志(ID:owlauto)2021年,李彥宏首次明確了
-
即時:新型硅了解下?性能全面升級自帶新特性 適用于量子計算機等領域
財聯社7月4日訊(編輯黃君芝)近一個世紀以來,硅在電子領域一直占據著
-
合資變外資?smart 電動化轉型國內市場承壓
隨著A00級別小車市場規模下降,行業電動化轉型趨勢加快等因素影響,sma
-
鎵鍺出口管制!概念股應聲大漲,業內:半導體產業或受影響
利好消息助攻,今日鍺、鎵概念股開盤大漲。個股中,國內兩大鍺生產企業
-
“陳思誠模式”為何叫座? 焦點速遞
燃次元(ID:chaintruth)原創作者|陶淘編輯|曹楊電影《消失的她》爆
-
萬控智造: 公司在定期報告披露相應報告期末的股東人數 今熱點
萬控智造(603070)07月04日在投資者關系平臺上答復了投資者關心的問題。
-
重疾險和百萬醫療哪個好?區別是什么?
都好。重疾險和百萬醫療都有各自的優勢,取決于您的需求和偏好。重疾險
-
焦點!畢馬威中國發布金融科技企業首席洞察報告
6月30日,由青島市地方金融監督管理局、中國人民銀行青島市中心支行指
-
生孩子能用百萬醫療保險么?一年要交多少保費?|每日觀點
不能。百萬醫療保險一般并不包括生育相關的費用。百萬醫療保險主要針對
-
全球觀察:顧家家居被投訴,拒絕為保修期內產品保修,官網8大承諾成一紙空話?
近日,有消費者向《消費者報道》投訴稱對顧家家居的售后運營感到不滿,
-
環球時訊:大麥稱被罰系項目批文不完善 大麥網擅自出售演出門票被罰 大麥回應被罰
天眼查App顯示,近日,北京大麥文化傳媒發展有限公司因未經批準擅自出
-
工傷報完百萬醫療可以報嗎?多久生效?|天天熱點評
可以。工傷報完了基本的工傷保險后,如果仍然有醫療費用沒有得到充分覆
-
元宇宙|WAIC 2023 阿里元境元宇宙產業創新論壇,海內外大咖齊聚一堂共話元宇宙未來_頭條焦點
由國家發展和改革委員會、科學技術部、工業和信息化部、國家互聯網信息
-
眾安惠醫保百萬醫療險保什么?可靠嗎?
住院醫療費用:包括住院治療期間的床位費、手術費、藥品費等。手術醫療
-
每日短訊:元宇宙 | 上海市多媒體行業協會“引領未來,賦能煥新”WAIC 2023浦東論壇邀您共謀未來數字新紀元
論壇名稱:“引領未來,賦能煥新”2023浦東論壇主辦 指導 協辦單位指導
-
環球觀熱點:網上說的百萬醫療是真的嗎?可靠嗎?
是真的。網上所說的百萬醫療保險確實存在,并由專業的保險公司提供。以
-
全球簡訊:叉車龍頭安徽合力業績預增,半年內股價上漲59.24%,董秘:對國內市場抱有信心
叉車龍頭安徽合力(600761 SH)2023半年度業績預增。7月3日晚,安徽合
-
網傳阿里或將重新整合視頻資產,阿里公關負責人回應:假的,沒有的事_關注
網傳消息稱,阿里集團正重新評估視頻資產,或在優酷與土豆之間進行
-
中國駐日大使館:國際原子能機構評估報告不能成為福島核污染水排海“通行證”
中國駐日本大使館4日舉行記者會,就福島核污染水排海問題闡述中方立場
-
全球今熱點:突發!中國電子競技國家集訓隊宣布白家浩、喻文波退出亞運會名單
7月3日深夜,中國電子競技國家集訓隊微信公眾號發布消息:2023年6月30
-
微軟內部信流出,雄心規劃曝光,合理 PE 在 25 倍,短期增長在云計算 全球新資訊
紅周刊本刊編輯部|張一雪雖然是全球家喻戶曉的科技巨頭,但相較于蘋果
-
每日快播:集度汽車緘默,百度造車到哪一步了?
作者:孫志富來源:貓頭鷹車志(ID:owlauto)2021年,李彥宏首次明確了
-
美媒:Meta 想進入中國市場賣產品 或正在與騰訊洽談
【CNMO新聞】當地時間7月3日,據美國媒體報道,扎克伯格的Meta公司正與
-
700 億游戲巨頭終被立案,“莆田化”的三七互娛好日子到頭了
圖片來源@視覺中國文|金融八卦女,作者|鄧碧蘿小腰總眼見股價觸及跌停
-
天天日報丨堅持異質主機形態,任天堂下一代 Switch 性能直追 PS4
從5月《塞爾達傳說:王國之淚》解禁以來,這一個多月我一直在沉浸在海
精彩推薦
閱讀排行
精彩推送
- 世界快看:車企最看好的激光雷達...
- 曾被安徽前首富“掏空”,700 ...
- 燕京啤酒的蔡徐坤隱喻 滾動
- 世界快資訊丨上汽的痛,誰懂?
- 半年排名躍升近30位 中建智地...
- 途昂鎖車喇叭怎么開啟視頻(途昂...
- 【全球新視野】華夏喜盈門年金保...
- 世界新動態:惠添寶年金保險條款...
- 環球關注:平安年金保險富贏金生...
- 天天通訊!華東醫藥(000963.SZ)...
- 天天亮點!農銀人壽養老年金保險...
- 平安有增額終身壽險嗎?值得購買...
- 報道:菜鳥京東化,順豐怎么辦?
- 高德地圖宣布王鶴棣為新代言人
- 每日快報!騰勢N7,宣戰BBA
- 嵐圖追光開啟7月限時免費升級權益
- csgo開箱龍狙箱子多少錢一個?cs...
- csgo龍狙箱子怎么獲得?csgo開箱...
- csgo買鑰匙哪里便宜?csgo開箱鑰...
- 我國多種礦產勘查開發實現新突破...
- 全球球精選!理想汽車 CEO:7 ...
- 拓維信息辟謠“華為入股”!商譽...
- 緊急辟謠“華為入股”!二股東家...
- 【獨家焦點】小米總裁盧偉冰:“...
- 全托管半年:AliExpress、Temu ...
- 掛牌 + 拍賣:多家基金公司股...
- 乘客動車上買盒飯,撕開 35 元...
- 港股的買點-環球快資訊
- 全球今頭條!溫州廠二代,3000 ...
- 世界熱文:價格狂飆!“ 7000 ...






