日本成人激情_久久久免费精品视频_亚洲激情四射视频中文字幕久久_日本wwwwww_男女做爰裸体猛烈吃奶摸视频_日韩大片在线观看

AI發(fā)展:訓(xùn)練數(shù)據(jù)即將遭遇瓶頸

2024-12-31 01:01:00 來源: 點(diǎn)擊數(shù):

科技日報(bào)記者 張佳欣

得益于神經(jīng)網(wǎng)絡(luò)規(guī)模的擴(kuò)大以及海量數(shù)據(jù)的訓(xùn)練,人工智能(AI)在過去10年間突飛猛進(jìn)。“做大做強(qiáng)”的策略,在構(gòu)建大型語言模型(LLM)上取得了顯著成果,ChatGPT就是一個典型的例子。

然而,《自然》《麻省理工科技評論》等多家雜志網(wǎng)站指出,AI擴(kuò)展正逼近極限。一方面,AI“吞噬”著越來越多的能源;另一方面,滋養(yǎng)無數(shù)模型成長的傳統(tǒng)數(shù)據(jù)集,正被LLM開發(fā)人員過度開墾。

訓(xùn)練數(shù)據(jù)即將遭遇的瓶頸已悄然浮現(xiàn)。有研究機(jī)構(gòu)預(yù)測,到2028年左右,用于訓(xùn)練AI模型的數(shù)據(jù)集典型規(guī)模將達(dá)到公共在線文本總估計(jì)量的規(guī)模。換句話說,AI可能會在大約4年內(nèi)耗盡訓(xùn)練數(shù)據(jù)。與此同時,數(shù)據(jù)所有者(如報(bào)紙出版商)開始打擊對其內(nèi)容的濫用行為,進(jìn)一步收緊了訪問權(quán)限,這正在引發(fā)“數(shù)據(jù)共享”規(guī)模上的危機(jī)。為此,開發(fā)人員必須尋找變通之道。

數(shù)據(jù)集供需失衡

過去10年間,LLM的發(fā)展顯示出了對數(shù)據(jù)的巨大需求。自2020年以來,用于訓(xùn)練LLM的“標(biāo)記”(或單詞)數(shù)量已增長100倍,從數(shù)百億增加到數(shù)萬億。一個常見的數(shù)據(jù)集RedPajama,包含數(shù)萬億個單詞。這些數(shù)據(jù)會被一些公司或研究人員抓取和清洗,成為訓(xùn)練LLM的定制數(shù)據(jù)集。

然而,可用互聯(lián)網(wǎng)內(nèi)容的增長速度出乎意料的緩慢。據(jù)估計(jì),其年增長率不到10%,而AI訓(xùn)練數(shù)據(jù)集的大小每年增長超過一倍。預(yù)測顯示,這兩條曲線將在2028年左右交匯。

與此同時,內(nèi)容供應(yīng)商越來越多地加入軟件代碼或修改條款,阻止爬蟲及AI抓取其數(shù)據(jù)。在這些內(nèi)容中,被明確標(biāo)記為限制爬蟲訪問的數(shù)量,從2023年的不足3%猛增到了2024年的20%至33%之間。

當(dāng)前,圍繞AI訓(xùn)練中數(shù)據(jù)使用的合法性,試圖為數(shù)據(jù)提供商爭取應(yīng)有賠償?shù)亩嗥鹪V訟正在進(jìn)行。2023年12月,《紐約時報(bào)》向OpenAI及其合作伙伴微軟提起了訴訟,指控其侵犯了版權(quán);今年4月,紐約市Alden全球資本旗下的8家報(bào)紙聯(lián)合發(fā)起了一起類似的訴訟。對此,OpenAI表示,《紐約時報(bào)》的訴訟“毫無根據(jù)”。

若法院最終站在內(nèi)容提供商一方,支持其獲得經(jīng)濟(jì)賠償,那么對于AI開發(fā)人員,尤其是那些資金緊張的學(xué)者而言,獲取所需數(shù)據(jù)無疑將變得更加艱難。

新方法有待印證

數(shù)據(jù)匱乏對AI的傳統(tǒng)擴(kuò)展策略構(gòu)成了潛在挑戰(zhàn)。

尋找更多數(shù)據(jù)的一個途徑是收集非公開數(shù)據(jù),如社交媒體消息或視頻文字記錄。然而,這種做法的合法性尚存爭議。

一些公司選擇使用自己的數(shù)據(jù)來訓(xùn)練AI模型,如Meta利用虛擬現(xiàn)實(shí)頭顯收集的音頻和圖像進(jìn)行訓(xùn)練。但各公司政策不同,包括Zoom在內(nèi)的一些公司則明確表示不會使用客戶內(nèi)容訓(xùn)練AI。

另一種選擇可能是專注于快速增長的專業(yè)數(shù)據(jù)集,如天文學(xué)或基因組學(xué)數(shù)據(jù),但其對訓(xùn)練LLM的可用性和實(shí)用性尚不清楚。

如果AI接受除文本之外的多種類型的數(shù)據(jù)訓(xùn)練,可能會為豐富數(shù)據(jù)的涌入打開閘門。Meta首席AI科學(xué)家勒丘恩強(qiáng)調(diào),人類通過觀察物體而“吸收”的數(shù)據(jù)遠(yuǎn)超用于訓(xùn)練LLM的數(shù)據(jù)量,機(jī)器人形態(tài)的AI系統(tǒng)或許能從中獲取經(jīng)驗(yàn)。

此外,制造數(shù)據(jù)也是解決之道。一些AI公司付費(fèi)讓人們生成訓(xùn)練內(nèi)容,或使用AI生成的合成數(shù)據(jù)來訓(xùn)練AI。這已成為一個潛在的巨大數(shù)據(jù)源。然而,合成數(shù)據(jù)也存在問題,如遞歸循環(huán)可能鞏固錯誤、放大誤解,并降低學(xué)習(xí)質(zhì)量。

小模型更專更精

另一種策略是摒棄模型“越大越好”的開發(fā)觀念。一些開發(fā)者已在追求更高效、專注于單一任務(wù)的小型語言模型。這些模型需要更精細(xì)、更專業(yè)的數(shù)據(jù)以及更好的訓(xùn)練技術(shù)。

12月5日,OpenAI發(fā)布了新的OpenAI o1模型。盡管該公司未透露模型的規(guī)模或訓(xùn)練數(shù)據(jù)集大小,但o1采用了新方法:在強(qiáng)化學(xué)習(xí)上投入更多時間,讓模型對每個回答進(jìn)行更深入的思考。這標(biāo)志著一種轉(zhuǎn)變,即從依賴大規(guī)模數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,轉(zhuǎn)向更注重訓(xùn)練和推理。

當(dāng)前,LLM可能已飽覽互聯(lián)網(wǎng)大部分內(nèi)容,或許無需更多數(shù)據(jù)即可變得更智能。美國斯坦福大學(xué)一項(xiàng)研究表明,模型從多次讀取給定數(shù)據(jù)集中學(xué)到的內(nèi)容,與從相同數(shù)量的唯一數(shù)據(jù)中學(xué)習(xí)到的內(nèi)容一樣豐富。

合成數(shù)據(jù)、專門數(shù)據(jù)集、多次讀取和自我反思等因素的結(jié)合,或?qū)⒐餐苿覣I的進(jìn)一步飛躍。

責(zé)任編輯:左常睿

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽
主站蜘蛛池模板: 亚洲精品TV久久久久久久久久_天堂网资源WWW_日本新janpanese乱熟_午夜666_国产高清视频一区三区_日皮视频免费看_亚洲热在线视频_a人片中文字幕一区二区 | 中文字幕视频在线免费观看_欧美黑人巨大久久久精品一区小蓝_欧洲日韩一区二区_精品久久久久久中文字国产_18禁免费无码无遮网站国产_手机色网_啪免费视频_欧洲国产精品精华液 | 凹凸视频国产福利永久_91华人在线_亚洲免费av网站_av白浆_亚洲制服无码一区二区三区_91精产品一区一区三区_国产免费人视频在线观看免费_国产亚洲欧美日韩在线观看一区二区 | 日本精品区_国模私拍xvideos_亚洲gv白嫩小受在线观看_超碰人人在线_91日韩久久_国产欧美洲中文字幕_91久久_h纯肉无遮掩3d动漫在线观看 | 日韩精品一级毛片_91成人免费在线观看_最近的中文字幕视频完整_国产一区二区三区网站_黄色精品一区二区_99视频有精品视频高清_国产在线精品一区二区在线播放_av人摸人人人澡人人超碰 | 人人人妻人人澡人人爽欧美一区_91亚洲精品久久久中文字幕_亚洲第一网址_国产粗语刺激对白性视频_国产成人99_国产精品久久久一区二区三区网站_国产日韩在线视看第一页_欧美25p | 日本三级香港三级人妇少妇_国内精品999_国产成人久久av免费高清蜜臀_奥门一级毛片_国产欧美日韩精品专区_国产精品禁漫天堂视频_国产午夜精品av一区二区_乳首av | 日韩亚洲一区二区_99精品福利视频_美女又黄又免费的视频_无码专区永久免费AV网站_一区二区免费视频_7777色鬼XXXX欧美色妇_h动漫视频在线_国产ed2k | 亚洲综合第一页_成人在线视频在线观看_欧美成人精品一区二区三区在线观看_国产日韩欧美亚洲精品中字_国产二区在线播放_av黄在线观免费网站_国产精品自在在线午夜蜜芽TV在线_国产色悠悠 | 精品一区二区三区91_国产黄网在线_国产精品熟妇一区二区三区四区_亚洲αv在线精品糸列_无遮挡边摸边吃奶边做的视频刺激_在线免费观看h视频_狠狠爱网_免费无码AV片在线观看软件 | 国产福利自产拍_色一情一区_日韩一区精品视频_天色综合网_日本性色_a级录像_饥渴少妇AV无码影片_免费av黄色 | 日本三级黄色中文字幕_久久国产精品波多野结衣AV_动漫精品一区二区三区_亚洲AV无码一区二区二三区∝_男人午夜av_91网址在线观看_91精品国产一区二区无码_无码专区国产精品一区 | 亚洲jizzjizz妇女_性色AV无码中文AV有码VR_色夜av_久久久www免费人成黑人精品_亚洲线精品一区二区三区四区_四虎影视久久久免费观看_99久久精品免费看国产一区二区三区_日本国产一区二区三区 | 中文字幕在线精品中文字幕导入_╳╳╳无尽动漫性视频_无码专区人妻系列日韩精品少妇_全部露出来毛走秀福利视频_国产高清成人在线观看_黄色在线_日韩毛片久久久_欧美网站一区二区 | 丰满人妻久久中文字幕免费_亚洲男女羞羞无遮挡久久丫_韩国三级毛片_美女啪啪网站又黄又免费_丰满人妻一区二区三区av猛交_中文字幕在线网站_亚洲.欧美.在线视频_欧产日产国产精品 | 国产日韩在线一区_色婷婷激情一区二区三区_狠狠做五月深爱婷婷伊人_成人二区_国产又黄又大又粗视频_亚洲性免费视频_日韩三级精品_91经典在线 | www视频免费在线观看_女人精69xxx免费网站_国产99久久久国产精品成人免费_人人艹人人射_一级啪啪_好吊妞视频988在线播放_伊人干综合_日韩中文字幕无码一区二区三区 | 国产色片_欧美成人黄色片_午夜影院在线观看_国产精品视频1区_宅男影院在线播放999_久在线视频播放免费视频_国产69精品久久久久9999APGF_别c我啊嗯国产av一毛片 | 中文字幕欧美成人免费_日韩美女乱淫作爱欣赏_国产伦久视频免费观看视频_西西人体大胆午夜啪啪_八戒八戒神马影院在线4_欧美一级网_亚洲欧美一区二区三区在线_欧美一级免费黄色片 | 欧美性生活18~19_深夜免费看_操鸡视频在线观看_国产亚洲日本精品成人专区_国产一区二区免费在线观看视频_国产毛片一区二区三区_在线欧美_美女裸体视频免费网站无毒不卡 | 日产精品一线二线三线区_欧洲成人在线_欧洲美熟女乱AV亚洲一区_在线看片黄色_欧美兽交一区二区三区影院_伊人久久大香线蕉AV不变影院_男人日女人的网站_日韩av在线综合 | 国产97碰免费视频_毛片全网站_日本在线观看www_久久精品一区二区三区四区五区_av喷水高潮喷水在线观看com_久久久av亚洲男天堂_亚洲成人日韩在线_亚洲一区蜜桃 | 婷婷久久精品_九九热这里都是精品_色综合色狠狠天天综合网_国产精一区_久久中文一区二区_亚洲AV最新天堂地址_国产精品污www一区二区三区_free男子游泳部一季免费观看 | 欧美一区三区三区高中清蜜桃_少妇又紧又色又爽又刺激视频_亚洲黄色一级大片_久久久亚洲热_免费av网页_欧美一级片免费播放_久久亚洲av成人无码国产最大_无码伊人66久久大杳蕉网站谷歌 | 久久成人免费观看_4虎海外永久域站_黄色一类片_免费视频久久久_色欲人妻AAAAAAA无码_国产嫖妓一区二区三区麻豆_色综合久久中文_日本精品福利 国产精品久久久久久久福利竹菊_久久激情小视频_国产伦精品一区二区三区视频黑人_久久精品无码午夜福利理论片_久色成人在线_色婷婷久久综合中文久久_成人欧美一区二区三区黑人免费_国产高潮a片羞羞视频涩涩 | 欧美顶级毛片在线播放_日韩五区_国产一级午夜_avhd101素人diy入口_成人免费一级片_超碰香蕉在线_无码人妻一区二区免费视频_51国产午夜免费福利视频 | 国产92成人精品视频免费_铠甲勇士铠传免费观看_亚洲AV无码乱码麻豆精品国产_YY6080久久亚洲精品_日韩免费无遮挡毛片一区_俄罗斯粗大猛烈18P_西门庆一级淫片免费放_91免费在线视频观看 | 精品国产一区二区三区2021_啊轻点灬大ji巴太粗太长了网站_91免费黄色软件_99精品久久99久久久久胖女人_亚洲成a∧人片在线播放无码_岳肥肉紧嫩嫩伦69_久久久久青草线蕉亚洲_国产无夜激无码av毛片 | 国内老司机精品视频在线播出_国产下药迷倒白嫩丰满美女BD_国产精品久久久久久TV_国产办公室秘书无码精品_亚洲专区一_免费看黄a级毛片_少女视频哔哩哔哩免费观看_妇女站着交性打野战 | 色婷婷人妻av毛片一区_亚洲熟妇自拍无码区_日韩无码系列综合区_伊人久久大香线蕉AV不卡_天干天干夜啦天干天干国产_一级片视频免费看_久久久久激情视频_欧美a级情欲片 | 亚洲肥老太bbw_久久夜靖品_成年无码专区在线蜜芽TV_免费在线一区二区三区_热久久久_av天天av_国内精品九九久久精品_国产精品情侣呻吟对白视频 | 亚洲最大成人免费视频_日本极品少妇XXXX_九色精品91_AV无码精品一区二区三区四区_亚洲精品美女久久久久99_人人色在线视频播放_久久激情av_国产成人a亚洲精品 | 小娇孩性freesexhd_91精品夜夜_日韩AV高潮喷水在线观看_亚洲精品欧洲_男人猛躁进女人免费视频夜月_一区二区三_欧美日本性视频_亚洲av日韩av无码尤物 | 国产精品一区免费在线_欧美一级黄色毛片_一个人看的www高清免费视频_污污污污污污污网站污_正在播放亚洲一区_黄色一级生活片_日韩在线免费不卡_欧美福利在线 | 精品视频自拍_在线观看xxxx7777视频_天天艹视频_国产手机av在线_永久免费无码AV网站在线观看_国产精品45p_久久av青久久久av三区三区_国产精品美女久久久久图片 | 国产成人精品网站_亚洲国产精选_国产露脸精品产三级国产av_人妻精油按摩BD高清中文字幕_久草日韩_337p粉嫩大胆噜噜噜_亚洲国产制服丝袜先锋_国产专区亚洲精品无码 | 97视频入口_美女夫妻内射潮视频_欧美3p两根一起进高清视频_国产在线不卡_超碰在线最新地址_国产视频只有这里有精品最新_99国产精品99久久久久久粉嫩_成人在线视频国产 | 公天天吃我奶躁我的在线观看_午夜激情网_2021精品亚洲中文字幕_国产免费小视频_九九热在线观看_欧美亚洲日本国产其他_国产高潮呻吟久久_亚洲精品成人a在线观看 | 亚洲综合一区无码精品_91狼人社区_人人做人人爽国产视_日韩欧美卡一卡二卡新区_91视频成人入口_国内永久福利在线视频图片_在线观看欧美成人_色综合久久综合 | 亚洲一区视频在线_日韩av无码中文一区二区三区_欧洲一级中文字幕在线_伊人大杳焦在线_国产精品久久久久久久久久久久久久_freesexvideos高潮hd护士_久久久久成亚洲综合精品_成人片又黄又爽免费视频 | 久久精品在线免费观看_九九热影院_超乳爆乳上司在线观看_懂色aⅴ精品一区二区三区_日本高清免费xxx_亚洲综合在线免费_国产99久_久久中文字幕人妻熟女 |