DeepSeek-V3 和 DeepSeek-R1 陸續發(fa)(fa)布,國產大(da)(da)模(mo)(mo)(mo)型(xing)(xing)能力已(yi)可比(bi)肩(jian)(jian)海 外領(ling)(ling)軍(jun)(jun)大(da)(da)模(mo)(mo)(mo)型(xing)(xing)。2024 年 12 月(yue) 26 日,杭州(zhou) AI 公司(si)深度求(qiu)索(DeepSeek) 正(zheng)式(shi)發(fa)(fa)布 DeepSeek-V3 大(da)(da)模(mo)(mo)(mo)型(xing)(xing)首個版本并(bing)同步開源。根(gen)據(ju) DeepSeek 網 站信(xin)息,DeepSeek-V3 為(wei)自研 MoE 模(mo)(mo)(mo)型(xing)(xing),671B 參數,激活 37B,在(zai) 14.8T tokens 上進行了預(yu)訓(xun)練(lian)(lian)。DeepSeek-V3 多項評(ping)測(ce)成(cheng)績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他(ta)開源模(mo)(mo)(mo)型(xing)(xing),并(bing)在(zai)性(xing)能上和世界 頂尖的(de)(de)閉源模(mo)(mo)(mo)型(xing)(xing) GPT-4o 以及 Claude-3.5-Sonnet 相(xiang)當(dang)。在(zai)訓(xun)練(lian)(lian)成(cheng)本方 面,根(gen)據(ju) DeepSeek 發(fa)(fa)布的(de)(de)技術文檔論文信(xin)息,DeepSeek-V3 的(de)(de)訓(xun)練(lian)(lian)時(shi)(shi) 長為(wei) 2788K 個 H800 GPU 小時(shi)(shi),訓(xun)練(lian)(lian)花費約為(wei) 557.6 萬美(mei)元。2025 年 1 月(yue) 20 日,DeepSeek 正(zheng)式(shi)發(fa)(fa)布復雜推理類大(da)(da)模(mo)(mo)(mo)型(xing)(xing) DeepSeek-R1,性(xing)能對 齊 OpenAI o1 正(zheng)式(shi)版。以 DeepSeek 系列大(da)(da)模(mo)(mo)(mo)型(xing)(xing)為(wei)代(dai)表的(de)(de)國產大(da)(da)模(mo)(mo)(mo)型(xing)(xing)性(xing) 能已(yi)可比(bi)肩(jian)(jian)海外領(ling)(ling)軍(jun)(jun)大(da)(da)模(mo)(mo)(mo)型(xing)(xing),且成(cheng)本更低。
DeepSeek 系列大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)引發全球(qiu)廣(guang)(guang)(guang)泛(fan)關(guan)注,海(hai)(hai)內(nei)外巨(ju)頭科(ke)技公司(si)及云(yun)服務 平臺廠商(shang)已相(xiang)(xiang)繼(ji)接入(ru)。2025 年 1 月(yue)(yue) 15 日(ri)(ri),DeepSeek 推出(chu) AI 助手(shou) DeepSeek App。2025 年春(chun)節期間,DeepSeek 系列大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)火爆出(chu)圈,引 發全球(qiu)廣(guang)(guang)(guang)泛(fan)關(guan)注。根據(ju)(ju)新浪財(cai)經(jing) 2 月(yue)(yue) 1 日(ri)(ri)引用(yong)彭博社信息,DeepSeek 的(de)(de) AI 助手(shou)在(zai) 140 個(ge)(ge)市(shi)場中成為下(xia)載量最多的(de)(de)移動應(ying)用(yong)。根據(ju)(ju) Appfigures 的(de)(de) 數據(ju)(ju),DeepSeek 的(de)(de)推理人(ren)工智能聊天機(ji)器人(ren)在(zai) 1 月(yue)(yue) 26 日(ri)(ri)登上(shang)蘋果公司(si) App Store 的(de)(de)榜(bang)首,并(bing)自那時以(yi)來一直保持全球(qiu)第一的(de)(de)位置。同時,全球(qiu) 也開(kai)始了對(dui) DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)的(de)(de)復刻(ke)。以(yi)港科(ke)大(da)(da)(da)團隊(dui)為例,港科(ke)大(da)(da)(da)助理教(jiao) 授 何 俊(jun) 賢的(de)(de) 團 隊(dui), 只 用(yong)了 8K 個(ge)(ge) 樣(yang) 本, 就(jiu) 在(zai) 7B 模(mo)(mo)(mo)型(xing)(xing)(xing)(xing) 上(shang) 復刻(ke) 出(chu) 了 DeepSeek-R1-Zero 和(he)(he)(he) DeepSeek-R1 的(de)(de)訓練。當前,海(hai)(hai)內(nei)外巨(ju)頭科(ke)技公 司(si)及云(yun)服務平臺廠商(shang)已相(xiang)(xiang)繼(ji)接入(ru)了 DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing),部分 AI 應(ying)用(yong)領域 相(xiang)(xiang)關(guan)企業也已開(kai)始了 DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)的(de)(de)部署和(he)(he)(he)應(ying)用(yong)。DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing) 獲得了全球(qiu)的(de)(de)廣(guang)(guang)(guang)泛(fan)關(guan)注,認可度持續提升。我們認為,DeepSeek大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)的(de)(de)開(kai)源、低(di)成本和(he)(he)(he)高性(xing)能將(jiang)(jiang)大(da)(da)(da)幅降低(di)大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)的(de)(de)獲得、部署和(he)(he)(he)應(ying)用(yong)成本,將(jiang)(jiang)加快大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)在(zai) B 端(duan)和(he)(he)(he) C 端(duan)應(ying)用(yong)場景(jing)的(de)(de)落地(di)。另外,DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)的(de)(de)出(chu) 圈將(jiang)(jiang)對(dui)全球(qiu)大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)產(chan)(chan)業的(de)(de)競爭格局產(chan)(chan)生重要影(ying)響(xiang),將(jiang)(jiang)對(dui)海(hai)(hai)外領軍(jun)大(da)(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)廠 商(shang)的(de)(de)領先性(xing)產(chan)(chan)生沖擊,并(bing)同時將(jiang)(jiang)對(dui)算(suan)力的(de)(de)未來發展產(chan)(chan)生重要影(ying)響(xiang)。
DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing)的(de)(de)(de)(de)(de)(de)出圈(quan)預計不改算(suan)(suan)(suan)力(li)整體需(xu)求向上(shang)的(de)(de)(de)(de)(de)(de)態(tai)勢,但(dan)推(tui)(tui)理(li)和(he)(he)端(duan) 側算(suan)(suan)(suan)力(li)有(you)望增長更(geng)(geng)快(kuai)。DeepSeek 在(zai)(zai)算(suan)(suan)(suan)法效(xiao)率和(he)(he)計算(suan)(suan)(suan)成(cheng)本(ben)方面有(you)著較大(da)(da)(da)的(de)(de)(de)(de)(de)(de) 優勢,短(duan)期(qi)內可(ke)能對(dui)訓(xun)練算(suan)(suan)(suan)力(li)的(de)(de)(de)(de)(de)(de)增長有(you)一(yi)定(ding)的(de)(de)(de)(de)(de)(de)平(ping)(ping)抑(yi)效(xiao)應(ying),但(dan)是(shi)(shi)不改 AI 算(suan)(suan)(suan) 力(li)整體需(xu)求長期(qi)上(shang)升的(de)(de)(de)(de)(de)(de)態(tai)勢。AI 作(zuo)為(wei)全球智(zhi)能化(hua)發(fa)展的(de)(de)(de)(de)(de)(de)主(zhu)要(yao)抓手,大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing) 當前已(yi)應(ying)用于端(duan)側、教育、金融(rong)、辦公、傳媒、醫療、智(zhi)能汽車、企業服務等多個(ge)應(ying)用場景,應(ying)用領域(yu)廣闊。DeepSeek 低成(cheng)本(ben)而且開(kai)源的(de)(de)(de)(de)(de)(de)解(jie)決方 案,大(da)(da)(da)幅降低了 AI 在(zai)(zai)各行(xing)各業應(ying)用的(de)(de)(de)(de)(de)(de)技(ji)術和(he)(he)成(cheng)本(ben)門(men)檻,為(wei) AI 的(de)(de)(de)(de)(de)(de)產(chan)(chan)(chan)業化(hua)落地提供(gong)了更(geng)(geng)快(kuai)的(de)(de)(de)(de)(de)(de)路徑。推(tui)(tui)理(li)和(he)(he)端(duan)側的(de)(de)(de)(de)(de)(de)算(suan)(suan)(suan)力(li)需(xu)求增長潛力(li)非(fei)常大(da)(da)(da)。同時,較低訓(xun)練成(cheng)本(ben)以(yi)及開(kai)源的(de)(de)(de)(de)(de)(de) DeepSeek,有(you)望帶(dai)來更(geng)(geng)低 的(de)(de)(de)(de)(de)(de)大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing)開(kai)發(fa)和(he)(he)使用門(men)檻,基(ji)于該大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing)開(kai)發(fa)的(de)(de)(de)(de)(de)(de)主(zhu)體可(ke)能更(geng)(geng)多,也(ye)一(yi)定(ding)程度(du)上(shang)為(wei)訓(xun)練算(suan)(suan)(suan)力(li)需(xu)求提供(gong)了支撐。DeepSeek 并不 是(shi)(shi)壓縮了算(suan)(suan)(suan)力(li)市場,反而為(wei)算(suan)(suan)(suan)力(li)市場增加(jia)(jia)了更(geng)(geng)多的(de)(de)(de)(de)(de)(de)想象空間(jian)。DeepSeek 也(ye)在(zai)(zai)積極與國(guo)產(chan)(chan)(chan) AI 算(suan)(suan)(suan)力(li)平(ping)(ping)臺(tai)合作(zuo)。DeepSeek 大(da)(da)(da)模(mo)(mo)(mo)(mo) 型(xing)(xing)與國(guo)產(chan)(chan)(chan) AI 芯(xin)片適(shi)配的(de)(de)(de)(de)(de)(de)逐步成(cheng)熟,將加(jia)(jia)快(kuai)推(tui)(tui)動(dong)國(guo)產(chan)(chan)(chan) AI 芯(xin)片在(zai)(zai)國(guo)內大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing)訓(xun)練端(duan)和(he)(he)推(tui)(tui)理(li)端(duan)的(de)(de)(de)(de)(de)(de)應(ying)用,加(jia)(jia)快(kuai)國(guo)產(chan)(chan)(chan) AI 芯(xin)片產(chan)(chan)(chan)業鏈的(de)(de)(de)(de)(de)(de) 成(cheng)熟,為(wei)國(guo)產(chan)(chan)(chan) AI 芯(xin)片產(chan)(chan)(chan)業帶(dai)來發(fa)展機(ji)遇,同時加(jia)(jia)快(kuai)我國(guo)大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)(xing)產(chan)(chan)(chan)業的(de)(de)(de)(de)(de)(de)發(fa)展。
![]() |
智能服務機器人 |