新華社(she)研究院中(zhong)國企(qi)業發展研究中(zhong)心(xin)(xin)發布(bu)的(de)《人工(gong)智能大(da)模型體驗報告2.0》(以下簡稱報告)顯示,訊(xun)飛星火、百度文心(xin)(xin)一(yi)言、商湯商量(liang)和智譜(pu)AI-ChatGLM均表現搶眼,AI大(da)模型的(de)發展為(wei)人類工(gong)作(zuo)和生活的(de)提質增效(xiao)均帶來了正向積極的(de)影(ying)響。
報告顯(xian)示,與(yu)2023年6月(yue)相比,當前中國大(da)模(mo)型產(chan)品進步(bu)顯(xian)著。但(dan)與(yu)接受過(guo)高等教育的人類(lei)相比,大(da)模(mo)型在(zai)(zai)智商(shang)、情商(shang)等方(fang)面(mian)還存(cun)在(zai)(zai)一定(ding)程度差距(ju)。具體(ti)(ti)來看,訊飛星火在(zai)(zai)工作提效方(fang)面(mian)優勢(shi)明顯(xian),百(bai)度文心(xin)一言基(ji)礎(chu)能力(li)仍處(chu)領(ling)軍(jun)水準,商(shang)湯商(shang)量(liang)則在(zai)(zai)情商(shang)方(fang)面(mian)表現(xian)(xian)優秀,智譜AI-ChatGLM整體(ti)(ti)表現(xian)(xian)優秀。
針對各維度能力測(ce)評,該報告(gao)還(huan)給出了相應(ying)的(de)案例展示和(he)分析。
在基礎(chu)能力方(fang)面,人類與AI之間的差距(ju)并(bing)不(bu)顯著(zhu)。課題組分(fen)別從(cong)語言能力(35%)、AI向(xiang)善(10%)、跨模(mo)態(20%)和多輪對話(35%)四(si)大指標進(jin)行測(ce)評(ping)。測(ce)評(ping)顯示,科(ke)技企業大模(mo)型中(zhong),百度文(wen)心一言表現最為搶眼(yan),商湯(tang)商量、智譜AI-ChatGLM、360智腦表現優良。
在智商(shang)評(ping)估方面(mian),人類在智商(shang)方面(mian)仍(reng)然具(ju)有明顯(xian)優(you)勢。課題組分別(bie)從常識知(zhi)識(20%)、邏(luo)輯(ji)能力(li)(50%)和專業(ye)知(zhi)識(30%)方面(mian)對科(ke)技企業(ye)大模(mo)型進行考量。結(jie)果顯(xian)示,訊飛星(xing)火、智譜(pu)AI-ChatGLM表(biao)(biao)現突(tu)出,百度文心一言、昆侖萬維天(tian)工表(biao)(biao)現優(you)良(liang)。
在情商方(fang)面,AI與人類之(zhi)間的(de)差距最為明顯。人類在情緒理(li)解和處(chu)(chu)理(li)方(fang)面通常(chang)具有更強(qiang)的(de)優(you)勢,和更靈活的(de)處(chu)(chu)理(li)能力。通過對(dui)處(chu)(chu)理(li)日常(chang)事項(35%)、一語雙(shuang)關(30%)、人際(ji)關系(35%)問(wen)題進行分析(xi)發現(xian)(xian),科(ke)(ke)技企業大模型中(zhong),商湯商量表現(xian)(xian)亮(liang)眼,百度文心一言、瀾舟科(ke)(ke)技Mchat、智譜AI-ChatGLM及360智腦均(jun)表現(xian)(xian)優(you)良。
在(zai)(zai)工作效(xiao)率(lv)(lv)提升方面(mian),課(ke)題組重點(dian)在(zai)(zai)工具(ju)(ju)提效(xiao)(50%)和生成創新(xin)(50%)方面(mian)進行(xing)考量(liang)(liang)。結(jie)果(guo)顯示,訊飛(fei)星火表現最為搶眼(yan),百度文心(xin)一言、商湯商量(liang)(liang)、智譜(pu)AI-ChatGLM表現優良(liang)。不過,盡管(guan)AI具(ju)(ju)有(you)高速度和高效(xiao)率(lv)(lv)的優勢,但(dan)在(zai)(zai)某些復雜(za)和具(ju)(ju)有(you)創新(xin)性(xing)的任(ren)務中,人類的智慧和想象力(li)仍(reng)然具(ju)(ju)有(you)無法替代(dai)的作用(yong)。
報告認為(wei),雖(sui)然(ran)在不同領(ling)域中,AI和人類表現出(chu)不同的(de)優劣勢,但在整體(ti)上,AI大(da)模型的(de)發展為(wei)人類工作和生活的(de)提質增效(xiao)帶來了重要的(de)積極影響,大(da)模型正在加速走(zou)(zou)進(jin)生活、走(zou)(zou)進(jin)產業。在本(ben)次體(ti)驗測評(ping)基礎(chu)上,研究(jiu)團隊將繼續深耕,加強在大(da)模型安全可解(jie)釋性、工作提效(xiao)能力、實際落地情況、產業優秀案例等維(wei)度上的(de)探索與研究(jiu)。
智能服務機器人 導覽機器人 |