第一av在线_日韩成人久久久_亚洲人成电影网站色_精品精品导航_亚洲综合中文_精品国产91久久久久久_可以在线观看的黄色_99热这里有精品

每日熱文:谷歌更新隱私政策,大模型“諸神之戰”背后的訓練數據隱憂
2023-07-05 20:56:54 來源:21世紀經濟報道 編輯:

21世紀經濟報道記者王俊 南方財經全媒體記者馮戀閣 實習生羅洛 北京、廣州報道“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓練Google的人工智能模型。”近日,谷歌更新隱私政策,表示將利用網絡公開數據訓練旗下的AI模型,相關條款已于7月1日生效。

谷歌的這一動作引發爭議,單方面通知用戶的行為是否合法合規?此舉又是否有“囤數據”之嫌?

此前,Twitter和社交網站Reddit已經采取措施,限制第三方對其API的訪問。國外科技公司的一系列舉措背后,可能是大模型發展路上一個不可忽視的真相:訓練數據的重要性愈發顯現。隨著大模型產業的快速發展,出于市場競爭的需要,模型規模將快速膨脹,但同時可用于訓練的數據供給相對不足,且未來日趨稀缺。


(相關資料圖)

未來,數據或將成為AI發展的“兵家必爭之地”。

“囤數據”訓練AI模型

近日,谷歌更新隱私政策,表示將利用網絡公開數據訓練旗下的AI模型。在隱私協議的“可公開獲取的資源”一欄,谷歌提到:“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓練Google的人工智能模型。”該大模型將會為谷歌翻譯、谷歌旗下聊天機器人產品“Bard”及Cloud AI等產品和功能提供助力。

對比去年年底發布的上一版隱私政策,谷歌將“收集信息以幫助訓練語言模型”的相關措辭更改為“訓練人工智能模型”,并新增明確了自家AI產品對于數據的使用權利。這似乎意味著,谷歌在訓練旗下聊天機器人及其他AI模型,或未來開發AI產品的過程中,有權使用人們在網上公開發布的任意內容。

南方財經全媒體記者在檢索后發現,7月5日,谷歌中文版隱私政策也已經進行同步更新。

在競天公誠律師事務所合伙人袁立志看來,此次谷歌隱私政策的更新從實踐角度看不算重大變化。“無論在我國還是域外,對公開數據的正常收集和使用,在一般情況下不算違法。”不過他補充道,如果個人通過發送郵件等方式向信息處理者就相關使用表露明確拒絕,對其個人信息的收集和使用就應當停止。

北京大成律師事務所高級合伙人鄧志松也表示,就目前可獲得的信息而言,谷歌對收集與處理用戶個人信息的范圍和目的作出了詳細說明,即使以歐盟GDPR項下更為嚴格的“告知-同意”規則為標準,谷歌的這一收集與處理行為至少在形式上具有合法性。至于其實施過程中可能涉及的實質合法性判斷,及由此可能對AI等行業產生的影響,則尚待進一步觀察。

雖然此次更新并未對個人信息保護帶來影響,但暗藏背后的數據隱憂卻逐漸被公眾注意到。

“得數據者得天下”

數據是數字經濟時代的“新石油”,處在時代中的人工智能技術亦受其影響。

以OpenAI的幾代GPT模型為例,訓練數據上,GPT-1預訓練數據量僅有5GB;到了GPT-2,這個數據則增加至40GB;而在GPT3模型下,OpenAI用以訓練模型的數據集數據量達到了驚人的45TB。

“大模型時代,得數據者得天下。”對外經濟貿易大學數字經濟與法律創新研究中心執行主任張欣指出,一方面,訓練數據是大模型訓練的基石和燃料,如果沒有數據,大模型的訓練就無法開展和持續;另一方面,當前技術領域的研究顯示,各家大模型在算法層區別并不大,并且具有同質化的趨勢。在此背景下,訓練數據就成了真正區分且影響大模型性能的重要因素之一。

需求漸長,供給端卻并未馬上配合。目前,有多家處在“數據提供端”的公司對數據抓取、開源等做出了反應。比如Twitter限制了用戶每天能查看的推文數量,幾乎使數據提供服務無法使用。馬斯克表示,這是對“數據抓取”和“系統操縱”的必要反應。

今年1月,圖庫網站Getty Images對AI圖像生成器研發公司Stability AI提起法律訴訟,指其非法復制和處理版權圖像作為模型訓練數據。4月,環球音樂集團發函要求Spotify等音樂流媒體平臺切斷AI公司的訪問權限,以阻止其版權歌曲被用于訓練模型和生成音樂。

同樣在4月,Reddit官方宣布將對調用其API的公司收費,原因正是OpenAI、谷歌等公司利用該平臺上的數據訓練模型。此外,IT技術問答網站Stack Overflow也計劃向AI大模型的開發者及公司收取數據訪問費用。

6月,中文在線、同方知網與中國工人出版社等國內25家文化出版機構發出共同倡議,強調“為人工智能學習模型提供可靠、穩定、安全的內容來源”等AIGC版權保護問題的重要性。

科技公司的系列動作,一定程度反映了數據的重要性。

在7月2日全球數字經濟大會人工智能高峰論壇上,昆侖萬維科技股份有限公司CEO方漢表示,高質量數據對大模型發展至關重要。

“坦白地講,最近三年的大模型訓練積累的是對豐富的預訓練數據深度加工的能力。OpenAI所有公開的論文和講演,對訓練過程和訓練算法都是公開的,但其從不公開模型結構及數據處理。”方漢指出,目前全世界大模型預訓練團隊都試圖重現OpenAI在模型架構的動作以及預訓練數據的動作,任何一家企業的預訓練數據加工能力都至關重要。

數據稀缺、分散難題何解?

數據的重要性不言而喻,高質量數據更是稀缺品。

早在去年,一項來自Epoch Al Research團隊的研究就揭示了一個殘酷的事實:模型還要繼續做大,但數據卻不夠用了。研究結果表明,高質量的語言數據存量將在2026年耗盡,低質量的語言數據和圖像數據的存量則分別在2030年至2050年、2030年至2060年枯竭。

這意味著如果數據效率沒有顯著提高或沒有新的數據源可用,那么到2040年,模型的規模增長將放緩。

百舸爭流是市場競爭的常態,但過分競爭也有可能為行業帶來災難。限制數據抓取,很可能導致新一輪的數據大戰,進而引發平臺之間屏蔽、數據壟斷等問題。

國際標準化組織TC/154技術專家王翔指出,大模型的蓬勃發展對訓練數據提出了很高的數量和質量要求。在供給側,人口增速、用網時間下降、制度性地理約束提高、高質量數據匱乏等都在制約大模型未來發展,SOP化和轉發習慣也降低了供給能力;在需求側,無論是主觀治理思路還是客觀基礎設施條件,以及大型語言模型所有者應對市場的考量,都會持續強化數據壟斷。

此外,大模型訓練中,面對的高質量數據的稀缺、行業數據分散等問題應如何解決?

受訪專家指出,未來健康的生態需要市場側和監管側等多方的共同建設維護。

“首先還是需要相信市場的力量”,袁立志指出,隨著優質數據的需求逐漸顯現,各個市場主體都會被“無形的手”推動向前。“數據資源的尋找、匯聚、清洗、標注等各個環節預計都會因競爭的活躍而不斷改善,以滿足市場需求。”他表示。

張欣則具體指出,目前行業內的開源數據集正在不斷增多,未來應呼吁更多人工智能企業、從業者加入,建立更加良好的行業生態。“人工智能訓練時的眾包思路也非常重要。”她認為,企業之外,還可以善用技術社群的力量提升并開拓更多的高質量數據集。

而監管側,在張欣看來,從法律法規層面明確訓練數據集的合法性獲取路徑是監管下一步應當關注的重點。“只有明確了合法獲取的路徑,大模型訓練者才有更穩定的合規預期以開展工作。”

袁立志認為,監管側數據要素市場的建設深入會為大模型領域的發展帶來良性影響。“數據要素市場建設走深意味著數據流通利用全流程提速提效,自然也惠及大模型的訓練數據收集。”

關鍵詞:

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網 - 環球資訊網 - 環球生活門戶"或電頭為"環球傳媒網 - 環球資訊網 - 環球生活門戶"的稿件,均為環球傳媒網 - 環球資訊網 - 環球生活門戶獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網 - 環球資訊網 - 環球生活門戶",并保留"環球傳媒網 - 環球資訊網 - 環球生活門戶"的電頭。

aⅴ色国产欧美| 欧美日韩va| 在线视频毛片| 亚洲三级黄色在线观看| 国产网站欧美日韩免费精品在线观看| 91在线你懂得| 久久美女精品| 你微笑时很美电视剧整集高清不卡| 欧美久久天堂| 青青操视频在线| 欧美日韩国产免费| 亚洲视频你懂的| 日日噜噜噜夜夜爽爽狠狠| 亚洲成色777777在线观看影院 | 亚洲一区一卡| av免费在线观| а√在线中文在线新版| gogogogo高清视频在线| 图片区小说区亚洲| 亚洲伦伦在线| 在线欧美一区二区| 理论片午夜视频在线观看| 一区二区在线视频观看| 女人色偷偷aa久久天堂| 成人三级视频| 久久亚洲国产精品尤物| 日韩精品视频一区二区三区| 校园春色另类视频| 国产一区成人| 国产精品手机在线播放 | 婷婷丁香六月天| 91短视频版在线观看www免费| 国产大片在线免费观看| 日韩av免费| 成人资源在线| 成人短视频在线观看| 888av在线视频| 欧美日韩国产观看视频| 国产精品2023| 国产精品欧美综合在线| 亚洲精品666| 久久久久国产精品| 国产精品成人一区二区艾草| 日韩乱码在线视频| 在线激情网站| 欧美变态网站| 日韩精品一区二区久久| 粉嫩一区二区三区性色av| 一级特黄大欧美久久久| 日韩av在线免费观看| 91精品国产品国语在线不卡| 日韩黄色高清视频| 毛片电影在线| 久草精品在线观看| 亚洲成人综合网站| 三级理论午夜在线观看| 亚洲精品毛片| 欧美aaaaa性bbbbb小妇| 久久9999免费视频| 99久久精品一区二区| 老司机午夜激情| 国产成人影院| 色偷偷成人一区二区三区91| 6080成人| 欧美亚洲综合久久| 婷婷丁香在线| 久久久久久免费视频| 青青草97国产精品免费观看无弹窗版 | 四虎在线精品| 天使萌一区二区三区免费观看| 国产精品久久久久久久久妇女| 日韩成人午夜电影| 国产欧美精品区一区二区三区| 国产精品二线| 91麻豆国产精品久久| 日韩精品免费看| 日韩欧美另类一区二区| 久久精品国产在热久久| 欧美激情在线观看视频免费| 国产三级精品视频| 中文字幕资源网在线观看| 蜜桃视频成人m3u8| 激情文学综合插| 黄网站app在线观看下载视频大全官网| 色爱综合网欧美| 最美情侣韩剧在线播放| 国产河南妇女毛片精品久久久| yjizz视频网站在线播放| 青娱乐精品视频在线| 日韩久久免费av| 国产欧美啪啪| 中文字幕第一页久久| 免费国产在线观看| 国产精品毛片在线| 色呦呦网站在线观看| 99久久er热在这里只有精品66| 超免费在线视频| 国产精品一区二区黑丝| 亚洲人成在线免费观看| 欧美色一级片| 一区二区三区在线免费观看| 四虎精品在永久在线观看| 成人区精品一区二区婷婷| 欧美影视一区在线| 中文字字幕在线中文乱码电影| 欧美理论片在线播放| 久久综合中文| 怡红院红怡院欧美aⅴ怡春院| 一区二区三区日韩欧美| 爱看av在线入口| eeuss国产一区二区三区| 青春草在线观看 | 欧美精品自拍偷拍| 国产伦乱精品| 欧美日韩激情网| 日韩欧美看国产| 依依成人精品视频| 欧美性videos| 久久精子c满五个校花| 高清国语自产在线观看| 青草在线视频| 亚洲天堂黄色| 一区二区三区在线观看网站| 2022成人影院| 国产精品69久久久久水密桃| 亚洲国语精品自产拍在线观看| segui88久久综合| 欧美天天在线| 91精品国产综合久久小美女| 国产丝袜在线| jlzzjlzz亚洲女人| 中文一区一区三区高中清不卡| 蜜桃麻豆av在线| 欧美日韩一区二区三区不卡| 9l视频自拍九色9l视频成人| 成人久久久精品乱码一区二区三区| 91在线九色porny| 亚洲天堂网站| 国产乱码精品1区2区3区| а√天堂官网中文在线| 韩国av一区二区三区在线观看| 欧美日韩中字一区| 户外露出一区二区三区| 久久久精品国产免大香伊| av免费观看一区二区| av亚洲精华国产精华| 岛国中文字幕在线| 99久久精品国产一区二区三区 | 精品一区二区三区蜜桃| 欧美在线色视频| 九七影院97影院理论片久久 | 精品三级av在线导航| 色伊人久久综合中文字幕| 欧美电影完整版在线观看| 欧美人与禽zozo性伦| 国产一区二区观看| 亚洲免费影视第一页| 尹人成人综合网| 日韩极品精品视频免费观看| 91精品国产乱码久久久久久 | 日韩免费高清av| 一区在线视频| 久草在线资源视频在线观看| 丝瓜av网站精品一区二区| av在线免费观看网址| 亚洲欧美一区二区不卡| 日韩黄色av| 精品国产sm最大网站免费看| 少妇久久久久| 欧美tk—视频vk| 久久99精品久久久久久动态图| 色戒汤唯在线观看| 91精品国产一区二区| 久久成人免费电影| 麻豆传媒在线免费| 亚洲中国最大av网站| 肉丝袜脚交视频一区二区| 亚洲成人直播| 日本一本不卡| 亚洲色图美女| 日韩精品水蜜桃| 色琪琪丁香婷婷综合久久| 亚洲成av人影院在线观看网| 日韩区一区二| eeuss影院在线观看| 欧美三级电影一区| 亚洲欧美一区二区三区久本道91| 国产成人精品影院| 青青草原综合久久大伊人精品| 蜜桃传媒在线观看免费进入 | 围产精品久久久久久久| 午夜av成人| 偷拍自拍在线| 亚洲第一黄色网| 国产精品毛片高清在线完整版| www.性欧美| 夜夜精品视频| 18成人免费观看视频| 国产精品一区二区三区美女| 国产美女久久|