當前位置：首頁 > 城市大腦 > ai智能 > 新華社研究院發布《人工智能大模型體驗報告2.0》

新華社研究院發布《人工智能大模型體驗報告2.0》

來源：新華社研究院編輯：創澤時間：2023/8/18 主題：其他 [加盟]

新華社(she)研究院中(zhong)國企(qi)業發展研究中(zhong)心(xin)(xin)發布(bu)的(de)《人工(gong)智能大(da)模型體驗報告2.0》（以下簡稱報告）顯示，訊(xun)飛星火、百度文心(xin)(xin)一(yi)言、商湯商量(liang)和智譜(pu)AI-ChatGLM均表現搶眼，AI大(da)模型的(de)發展為(wei)人類工(gong)作(zuo)和生活的(de)提質增效(xiao)均帶來了正向積極的(de)影(ying)響。

報告顯(xian)示，與(yu)2023年6月(yue)相比，當前中國大(da)模(mo)型產(chan)品進步(bu)顯(xian)著。但(dan)與(yu)接受過(guo)高等教育的人類(lei)相比，大(da)模(mo)型在(zai)(zai)智商(shang)、情商(shang)等方(fang)面(mian)還存(cun)在(zai)(zai)一定(ding)程度差距(ju)。具體(ti)(ti)來看，訊飛星火在(zai)(zai)工作提效方(fang)面(mian)優勢(shi)明顯(xian)，百(bai)度文心(xin)一言基(ji)礎(chu)能力(li)仍處(chu)領(ling)軍(jun)水準，商(shang)湯商(shang)量(liang)則在(zai)(zai)情商(shang)方(fang)面(mian)表現(xian)(xian)優秀，智譜AI-ChatGLM整體(ti)(ti)表現(xian)(xian)優秀。

針對各維度能力測(ce)評，該報告(gao)還(huan)給出了相應(ying)的(de)案例展示和(he)分析。

在基礎(chu)能力方(fang)面，人類與AI之間的差距(ju)并(bing)不(bu)顯著(zhu)。課題組分(fen)別從(cong)語言能力（35%）、AI向(xiang)善（10%）、跨模(mo)態（20%）和多輪對話（35%）四(si)大指標進(jin)行測(ce)評(ping)。測(ce)評(ping)顯示，科(ke)技企業大模(mo)型中(zhong)，百度文(wen)心一言表現最為搶眼(yan)，商湯(tang)商量、智譜AI-ChatGLM、360智腦表現優良。

在智商(shang)評(ping)估方面(mian)，人類在智商(shang)方面(mian)仍(reng)然具(ju)有明顯(xian)優(you)勢。課題組分別(bie)從常識知(zhi)識（20%）、邏(luo)輯(ji)能力(li)（50%）和專業(ye)知(zhi)識（30%）方面(mian)對科(ke)技企業(ye)大模(mo)型進行考量。結(jie)果顯(xian)示，訊飛星(xing)火、智譜(pu)AI-ChatGLM表(biao)(biao)現突(tu)出，百度文心一言、昆侖萬維天(tian)工表(biao)(biao)現優(you)良(liang)。

在情商方(fang)面，AI與人類之(zhi)間的(de)差距最為明顯。人類在情緒理(li)解和處(chu)(chu)理(li)方(fang)面通常(chang)具有更強(qiang)的(de)優(you)勢，和更靈活的(de)處(chu)(chu)理(li)能力。通過對(dui)處(chu)(chu)理(li)日常(chang)事項（35%）、一語雙(shuang)關（30%）、人際(ji)關系（35%）問(wen)題進行分析(xi)發現(xian)(xian)，科(ke)(ke)技企業大模型中(zhong)，商湯商量表現(xian)(xian)亮(liang)眼，百度文心一言、瀾舟科(ke)(ke)技Mchat、智譜AI-ChatGLM及360智腦均(jun)表現(xian)(xian)優(you)良。

在(zai)(zai)工作效(xiao)率(lv)(lv)提升方面(mian)，課(ke)題組重點(dian)在(zai)(zai)工具(ju)(ju)提效(xiao)（50%）和生成創新(xin)（50%）方面(mian)進行(xing)考量(liang)(liang)。結(jie)果(guo)顯示，訊飛(fei)星火表現最為搶眼(yan)，百度文心(xin)一言、商湯商量(liang)(liang)、智譜(pu)AI-ChatGLM表現優良(liang)。不過，盡管(guan)AI具(ju)(ju)有(you)高速度和高效(xiao)率(lv)(lv)的優勢，但(dan)在(zai)(zai)某些復雜(za)和具(ju)(ju)有(you)創新(xin)性(xing)的任(ren)務中，人類的智慧和想象力(li)仍(reng)然具(ju)(ju)有(you)無法替代(dai)的作用(yong)。

報告認為(wei)，雖(sui)然(ran)在不同領(ling)域中，AI和人類表現出(chu)不同的(de)優劣勢，但在整體(ti)上，AI大(da)模型的(de)發展為(wei)人類工作和生活的(de)提質增效(xiao)帶來了重要的(de)積極影響，大(da)模型正在加速走(zou)(zou)進(jin)生活、走(zou)(zou)進(jin)產業。在本(ben)次體(ti)驗測評(ping)基礎(chu)上，研究(jiu)團隊將繼續深耕，加強在大(da)模型安全可解(jie)釋性、工作提效(xiao)能力、實際落地情況、產業優秀案例等維(wei)度上的(de)探索與研究(jiu)。

附件：新華社研究院發布《人工智能大模型體驗報告2.0》

国产成在线观看免费视频_久久九九久精品国产日韩经典_亚洲AV无码成H人动漫网站_YY亚洲人成电影网站色

新華社研究院發布《人工智能大模型體驗報告2.0》

大模型訓練參數規模量級最高或達5萬億以上

大語言模型研發的關鍵影響要素

大規模語言模型發展經過三階段在2023年進⼊爆發階段

中國郵政儲蓄銀行、科藍軟件：科藍智能高柜數幣機器人“小藍”

中國移動天津公司、亞信科技：“天工”AIGC智慧客服虛擬數字人解決方案

AI的應用場景有：消費端、產業端和多個行業

CHATGPTAI掀起AI浪潮助力制造業發展

人工智能研發運營體系（ML0ps）實踐指南2023

國內細分賽道企業在 AIGC 各應用場景有哪些布局

國內科技大廠布局生成式 AI，未來有望借助業務生態推出爆款應用產品

AIGC領域相關初創公司及業務場景梳理

ChatGPT 以 GPT+RLHF 模型為核心支撐，為 AIGC 發展指明方向

服務機器人(迎賓、講解、導診...)