迎(ying)賓機器(qi)人(ren)(ren)具有人(ren)(ren)機交互、面部識別、等(deng)高(gao)端技(ji)術,可以根據需求為客戶量身定(ding)制APP功能。
迎賓機器人可(ke)以(yi)顯示預先設定的(de)提示對話內(nei)容,觀眾可(ke)以(yi)使用麥克風按照提示的(de)對話向機器人提出(chu)問題:
“你叫什么名字(zi)?”,
“你(ni)今(jin)年(nian)多大(da)了?”,
“你有(you)多(duo)高?”等等,機器(qi)人(ren)則用(yong)幽默的語(yu)言回答提(ti)問(wen),充分(fen)展示出機器(qi)人(ren)的智能化(hua)程度(du),還可以通(tong)過(guo)語(yu)音輸入對(dui)機器(qi)人(ren)發出指令(ling)。
對話系統(tong)的(de)(de)(de)核心(xin)技(ji)術是自然(ran)(ran)語(yu)(yu)言處(chu)理(li)(li)(natural language process, nlp),廣義的(de)(de)(de)自然(ran)(ran)語(yu)(yu)言處(chu)理(li)(li)可以(yi)根(gen)據(ju)語(yu)(yu)言形式分為語(yu)(yu)音(yin)信號處(chu)理(li)(li)和文(wen)本理(li)(li)解(jie)生成(cheng)兩(liang)個部分。 語(yu)(yu)音(yin)信號處(chu)理(li)(li)包括語(yu)(yu)音(yin)識(shi)別和語(yu)(yu)音(yin)合(he)(he)成(cheng)技(ji)術。這兩(liang)項技(ji)術目(mu)前在(zai)市場上已經(jing)有(you)非常成(cheng)熟的(de)(de)(de)商 業化產(chan)品(pin),谷歌(ge)、百度(du)、科大訊(xun)飛等企業都推出了全平(ping)臺多語(yu)(yu)種的(de)(de)(de)語(yu)(yu)音(yin)識(shi)別和語(yu)(yu)音(yin)合(he)(he)成(cheng)接口, 在(zai)普(pu)通(tong)環(huan)境下能達(da)到很高的(de)(de)(de)識(shi)別率。文(wen)本理(li)(li)解(jie)與生成(cheng)相當于(yu)機(ji)器對人類自然(ran)(ran)語(yu)(yu)言的(de)(de)(de)含義進行(xing) 理(li)(li)解(jie)以(yi)及能夠生成(cheng)符合(he)(he)人類語(yu)(yu)法(fa)(fa)(fa)規則(ze)和句法(fa)(fa)(fa)依存的(de)(de)(de)文(wen)本的(de)(de)(de)過(guo)程,目(mu)前的(de)(de)(de)主流方法(fa)(fa)(fa)有(you)基于(yu)統(tong)計 的(de)(de)(de)機(ji)器學(xue)習方法(fa)(fa)(fa)和大規模深度(du)學(xue)習方法(fa)(fa)(fa)。
一個完整的對話(hua)系(xi)統包括:
1、語音識別:將語音轉(zhuan)換(huan)為文本;
2、文本(ben)解析(xi):從自然(ran)語 言(yan)文本(ben)中提取特(te)征(zheng),生成特(te)征(zheng)向量;
3、特征分析:根(gen)據對話(hua)系統的(de)目的(de),生成和(he)組合特征;
4、文本生成:使用模板、檢索或語(yu)言模型生成可能的回復(fu);
5、語音合成:將文(wen)本合成語音, 完(wan)成一(yi)次進行(xing)交互。
定(ding)制式(shi)的(de)對(dui)話系(xi)統大多(duo)屬(shu)于檢索(suo)式(shi),因(yin)為檢索(suo)式(shi)模型基于大規模問答對(dui)數(shu)據庫,回復相(xiang)對(dui)穩定(ding)且可以避免(mian)語(yu)法錯誤,不會生成(cheng)攻擊性語(yu)言,常用于服(fu)務(wu)行業中。
開放式模型不(bu)依賴(lai)固定數(shu)據庫(ku),可以根據輸入的文本,通過云端知識庫(ku)生(sheng)成答案,較(jiao)為(wei)靈活,常用于開放域(yu)問答。
智能服務機器人 導覽機器人 |