服務機器人在展館迎賓講解
多(duo)模(mo)態檢索成為近期(qi)關注的(de)問題,當前的(de)方(fang)法包(bao)括單流方(fang)法、多(duo)流方(fang)法,以及(ji)不(bu)同(tong)模(mo)態之 間對齊的(de)技術,已經在知識挖(wa)掘領域開展應(ying)用。
圖像問答可以分為三個層次:
1.初級:從圖像識(shi)別啲(di)結果中直(zhi)接得到答案
2.中等:答案需(xu)要簡單事實的支(zhi)持(chi)
3.高級(ji):對于復(fu)雜的問題,答案不在(zai)圖像中,可能(neng)涉及常識、具(ju)體 話題和百科知(zhi)識進行推理
多模態問答的挑戰:
1 多(duo)模態數據具有異(yi)構(gou)性
2 多模(mo)態數據(ju)的關聯難(nan)度表示較大
3 多模態(tai)知識融合困難
4 多模態問答大多只(zhi)能處理簡單的問題
5 多(duo)模態知識問答推理能力弱
6 多模態(tai)知識問答可解(jie)釋性差
古藺智能問答機器人加盟
|