
近日,莫大-北理工-深北莫應用數學聯合研究中心李春團隊研究生薛志鵬以第一作者身份,李春為通訊作者,在國際計算機圖形學領域權威期刊《IEEE Transactions on Image Processing》(TIP)發表題為《Uncertainty Quantification for Incomplete Multi-View Data Using Divergence Measures》的研究成果。該期刊影響因子高達 13.7,為中科院1區、CCF A類頂級學術期刊,論文錄用需在理論與工程實踐上對相關領域有重要推動作用,此次成果彰顯了深北莫團隊強勁的科研實力。
圖一:論文期刊及索引
本研究針對現有多視圖分類與聚類方法在面對噪聲或缺失視圖時,常依賴 Kullback–Leibler 散度而忽視跨模態差異的問題,提出了基于 Proper H?lder 散度(PHD)的 KPHD-Net 模型。KPHD-Net 首次將變分狄利克雷分布用于表征類別概率分布,結合 Dempster–Shafer 證據理論與卡爾曼濾波,實現了多視圖證據的動態融合與不確定性量化。理論分析與大量實驗證明,PHD 相較于傳統 KLD 能更有效地度量分布差異,從而顯著提升分類與聚類的準確性、魯棒性和可靠性。
圖二:不完整多視圖數據不確定性量化框架概述
在 ADE20K、Caltech101-7、MSRC-v1 等多模態數據集上,KPHD-Net 在各種噪聲水平與缺失率條件下均表現出優異性能,分類準確率提升 5% 以上,聚類魯棒性顯著增強。該成果不僅為多視圖學習提供了全新的不確定性量化框架,也為后續在醫學影像、智能感知等領域的應用奠定了理論與方法基礎。
圖三:Caltech101-7 與 Caltech101-20 數據集上的多視圖聚類結果 t-SNE 可視化。
圖四:在不同高斯噪聲水平下 ADE20K 實驗分類結果匯總
本研究提出了 KPHD-Net,一種結合卡爾曼濾波、Proper H?lder 散度與主觀邏輯的多視圖學習框架,通過動態證據融合對分類與聚類進行不確定性量化;在 ADE20K、MSRC-v1、Caltech101-7/20 等數據集上,KPHD-Net 在各種噪聲水平(σ2=0.03)及缺失率條件下均顯著優于現有方法,保持了高準確率與穩定性;此外,無論選用 ResNet50、DenseNet、Mamba 還是 ViT 等主干網絡,均展現出穩定且優異的性能提升,充分證明其通用性與可靠性。該成果不僅為多視圖學習構建了全新的不確定性量化框架,更為醫學影像智能分析、智能感知等前沿領域的應用筑牢理論根基。未來,團隊計劃進一步優化模型,增強其在復雜場景下的適應性,拓展應用邊界。
李春領銜的團隊長期深耕學術研究與成果轉化,聚焦醫學影像、人工智能視覺技術、圖形圖像處理、機器學習等前沿方向,已在多項關鍵技術上取得突破,并積極推動科研成果向臨床應用與產業實踐轉化,持續為相關領域發展注入創新動力。
論文鏈接:https://ieeexplore.ieee.org/document/11045813
深圳北理莫斯科大學版權所有 - 粵ICP備16056390號 - 粵公網安備44030702002529號