這段時間,一款名叫ChatGPT的人工智能聊天系統(tǒng)就像平地起春雷,突然刷爆網(wǎng)絡(luò)。
“從目前普遍的對話感受來看,ChatGPT的最大亮點就在于其優(yōu)秀的意圖識別與語言理解能力,這令人意識到人工智能的交互能力已經(jīng)實現(xiàn)了跨越式進展?!币子^智慧院高級分析師陳晨評價。
(資料圖片僅供參考)
有問必答,侃侃應(yīng)對。這種神奇的人機互動體驗,勾起人們絞盡腦汁向ChatGPT提問的熱情,并為其帶來驚人的用戶量:該系統(tǒng)在兩個多月前由美國人工智能研究公司OpenAI推出,今年1月便已達到1億月活躍用戶,用戶增長速度堪稱史無前例。
這款產(chǎn)品大受歡迎,其重要幕后功臣是被業(yè)內(nèi)稱為預(yù)訓(xùn)練模型的技術(shù)。面對ChatGPT的爆火,國內(nèi)科技機構(gòu)和企業(yè)紛紛“亮劍”。據(jù)最新消息,中國版ChatGPT將于下個月與公眾見面。
參數(shù)規(guī)模從幾百萬狂飆至幾千億
“目前,預(yù)訓(xùn)練技術(shù)是人工智能研究的重要突破口?!卑⒗镅芯吭何磥砑夹g(shù)中心負責(zé)人蘇中解讀,傳統(tǒng)的研究方法中,標注成本一直是阻礙人工智能算法推向更大數(shù)據(jù)集合的障礙,而預(yù)訓(xùn)練技術(shù)不依賴數(shù)據(jù)標注,就可以訓(xùn)練出一個大規(guī)模深度學(xué)習(xí)模型。
科技日報記者了解到,由于不需要數(shù)據(jù)標注,預(yù)訓(xùn)練模型往往可以使用更大的數(shù)據(jù)集,因而可以選擇更大的模型規(guī)模——這就催生了預(yù)訓(xùn)練大模型。
“與以往的人工神經(jīng)網(wǎng)絡(luò)相比,預(yù)訓(xùn)練大模型最大的不同在于它規(guī)模足夠大,深度學(xué)習(xí)網(wǎng)絡(luò)的層數(shù)多、連接多、參數(shù)多?!盜DEA研究院(粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院)認知計算與自然語言研究中心講席科學(xué)家張家興接受記者采訪時介紹,2012年前后的深度學(xué)習(xí)網(wǎng)絡(luò)只有幾百萬參數(shù);2018年前后主流的預(yù)訓(xùn)練模型達到1億參數(shù);目前被證明非常有效的大規(guī)模預(yù)訓(xùn)練模型已有幾千億參數(shù),短短幾年時間提升了幾千倍。
量變引起質(zhì)變。蘇中分析,在對預(yù)訓(xùn)練模型各種不同的技術(shù)評測中,算法性能展示了一個規(guī)律:數(shù)據(jù)規(guī)模越大、預(yù)訓(xùn)練模型參數(shù)越多,算法輸出精度往往也越高。
除了規(guī)模大以外,張家興談到,目前的預(yù)訓(xùn)練大模型由于采用了新的結(jié)構(gòu)模型,非常適合并行訓(xùn)練。同時,在訓(xùn)練方式上,人工神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練任務(wù)類似“解題”,比如把一句話的某個詞或前半句去掉,讓預(yù)訓(xùn)練模型利用海量大數(shù)據(jù)對句子進行恢復(fù),這樣訓(xùn)練下去,預(yù)訓(xùn)練模型的“解題”能力就會越來越好。而且,在大語言模型的基礎(chǔ)上,引入指令學(xué)習(xí),可以遠超模型微調(diào)帶來的收益。在此基礎(chǔ)上,人類的反饋可以幫助模型更好地理解人類意圖和接收信息,人機對話也就越來越流暢。
“ChatGPT在底層數(shù)據(jù)、核心技術(shù)、用戶體驗等各方面都可以說是里程碑式的人工智能產(chǎn)品?!睍缫曆芯吭夯A(chǔ)科研負責(zé)人張祥雨表示,ChatGPT的核心技術(shù)是人工智能語言大模型,其關(guān)鍵是如何讓人工智能模型具備邏輯推理能力,以及如何讓人工智能學(xué)習(xí)全互聯(lián)網(wǎng)的知識。這些ChatGPT基本都做到了,因此在決策和知識環(huán)節(jié)有了很大的突破。
國內(nèi)多家科技機構(gòu)已布局相關(guān)領(lǐng)域
據(jù)外媒報道,多家國外科技巨頭正重金投入預(yù)訓(xùn)練模型和人工智能生成內(nèi)容(AIGC)賽道。記者了解到,國內(nèi)已有不少科技機構(gòu)和企業(yè)布局相關(guān)領(lǐng)域。
張家興告訴記者,IDEA研究院認知計算與自然語言研究中心在此方向上布局已久,該中心擁有國內(nèi)最大的開源模型體系——封神榜,已開源的98個模型正在全力支持中國AIGC的發(fā)展,探索研發(fā)適配各個領(lǐng)域的個性化可定制模型,支持全部自然語言處理(NLP)任務(wù)。
“很高興能在深度學(xué)習(xí)高速發(fā)展的第十年節(jié)點上,看到AIGC和ChatGPT的出現(xiàn),今天所有這些自然語言處理任務(wù)正在被統(tǒng)一到ChatGPT模式下,我們也正在整合之前的模型和技術(shù),推出我們的類ChatGPT模型?!睆埣遗d說。
記者從百度獲悉,百度已投入開發(fā)類似ChatGPT的相關(guān)技術(shù),該項目名字確定為文心一言,英文名ERNIE Bot,3月份完成內(nèi)測后面向公眾開放。目前,文心一言在做上線前的沖刺。
“ChatGPT主要涉及自然語言處理相關(guān)技術(shù),屬于認知智能領(lǐng)域的應(yīng)用之一,科大訊飛在該方向的技術(shù)和應(yīng)用方面具備長期深厚的積累?!?月8日晚,科大訊飛在投資者互動平臺回應(yīng)稱,公司已面向認知智能領(lǐng)域陸續(xù)開源了6大類、超過40個通用領(lǐng)域的系列中文預(yù)訓(xùn)練語言模型,并于去年12月啟動生成式預(yù)訓(xùn)練大模型任務(wù)攻關(guān),人工智能學(xué)習(xí)機將成為該項技術(shù)率先落地的產(chǎn)品,今年5月將進行產(chǎn)品級發(fā)布。
此外,360公司2月7日在投資者互動平臺表示,該公司也計劃盡快推出類ChatGPT技術(shù)的原型版產(chǎn)品?!癆IGC技術(shù)除了在搜索引擎的應(yīng)用之外,還可以輔助數(shù)字安全能力的提升?!?60公司稱。
來源:科技日報
作者:
責(zé)任編輯:馮崢
- ChatGPT爆火,國內(nèi)研發(fā)進展如何?|當前熱訊
- ChatGPT給職場人的8點建議 當前快報
- 這樣補鈣有風(fēng)險|環(huán)球播資訊
- 全球熱資訊!你會喝酸奶嗎
- 首份《行業(yè)技術(shù)指數(shù)》發(fā)布 探究企業(yè)創(chuàng)新文化_時快訊
- 數(shù)字中國創(chuàng)新大賽將首設(shè)數(shù)據(jù)開發(fā)賽道|世界熱消息
- 2022年度“浙江制造精品”名單公布:衢州9家企業(yè)產(chǎn)品上榜 熱文
- 衢州市經(jīng)信局深入開展“大走訪大調(diào)研大服務(wù)大解題”服務(wù)企業(yè)活動-環(huán)球動態(tài)
- 監(jiān)控下的戰(zhàn)友情,很暖! 速遞
- 全球快資訊:青海創(chuàng)新交旅融合服務(wù)生態(tài)旅游
- 韓國:2月11日起發(fā)放中國公民赴韓短期簽證
- 全球消息!益陽南縣:區(qū)域協(xié)助救援,秉承群眾安全至上
- 天天觀點:中航安盟:因到齡退休 余萌不再任董事長職務(wù)
- 今年,也有這么多恐怖片啊
- 濫用市場支配地位 南京中燃城市燃氣發(fā)展有限公司被重罰
- 恪盡職守 護航“春運” 每日觀察
- 全球熱點!突發(fā)極端天氣連夜出擊 打造風(fēng)雪無阻春運暢通
- 砂鍋紅燒肉的做法 最正宗的做法_砂鍋紅燒肉
- 二次元美圖分享第89期|每日看點
- 《終將成為你》長評
- 再看這部片是多少年之后了?
- 新假面騎士定檔3月18日,相關(guān)情報即將解禁
- 最高檢:對新型毒品犯罪一手抓打擊 一手抓治理
- 俄羅斯駐波蘭大使:俄方不會主動降低或斷絕雙邊外交關(guān)系_即時焦點
- 佛山男科醫(yī)院哪家會比較好?
- 每日視訊:天!孕期出軌,恩愛夫妻坦言:我們各玩各…
- 觀致汽車被強執(zhí)2383萬元 累計被執(zhí)行超4億|當前報道
- LoveLive!系列之歷史上的今天——2月10日-世界快消息
- 招聘會開到了家門口 當前關(guān)注
- 全球熱推薦:2022年蘇州數(shù)字人民幣交易額超3400億元