服務機器人在展館迎賓講解
多模態檢索成為(wei)近期關注的(de)問題,當前的(de)方(fang)法(fa)包括單流方(fang)法(fa)、多流方(fang)法(fa),以及不同模態之(zhi) 間(jian)對齊的(de)技術,已經在知識挖掘領域(yu)開(kai)展應用。
圖像問答可以分為三個層次:
1.初(chu)級:從圖(tu)像識(shi)別啲結果中直接得到答案
2.中等(deng):答案(an)需要簡單事實的支持(chi)
3.高級:對于復雜(za)的(de)問題,答案不在圖像(xiang)中,可能涉及(ji)常識、具體(ti) 話題和(he)百(bai)科知識進(jin)行推理
多模態問答的挑戰:
1 多模態數據(ju)具有異(yi)構性
2 多(duo)模態數據的關聯難(nan)度表示較大(da)
3 多模(mo)態知識(shi)融合困難(nan)
4 多模態問答大(da)多只(zhi)能處理簡單的(de)問題(ti)
5 多模態知(zhi)識問答推理能力弱
6 多模態知識問答可解釋性差
綠春智能問答機器人加盟
|