
近日,人工智能領域國際學術期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI)刊登了深圳北理莫斯科大學工程系教師王志華為第一作者的論文,論文題目為“Measuring Perceptual Color Differences of Smartphone Photographs”(智能手機攝影色差度量)。論文合作作者為香港城市大學馬柯德教授(Kede Ma)、江西財經大學方玉明教授以及OPPO研究人員。
IEEE TPAMI是人工智能領域內的頂尖學術期刊之一,以其23.6的影響因子在全球范圍內享有盛譽。該期刊在人工智能、計算機視覺、模式識別等多個領域占據著領先地位,全球每年僅有約200篇論文獲得錄用,展現了該刊極高的選稿標準和學術水平。IEEE TPAMI被中國計算機學會(CCF)列為A類推薦期刊,也是大學計算機科學與技術學科推薦的代表性成果目錄中的頂尖期刊之一,在學術界具有重要地位和影響力。
此篇論文重點關注在機器學習助力攝影圖像的深度色差度量。據悉,構建攝影圖像色差度量是成像、視覺科學和色彩科學領域中的一個重要的研究主題,盡管這一領域有著悠久的歷史,但大多數顏色差異測量方法仍受限于均勻色塊的心理物理數據或數量有限的簡單自然攝影圖像。因此,在以內容復雜性增加和基于學習的圖像信號處理器為特征的智能手機攝影時代,現有的顏色差異測量方法是否具有普遍適用性存在疑問。
在該篇文章中,王志華和研究團隊構建了迄今為止最大的用于感知顏色差異評估的圖像數據集,其中包括:由六款旗艦智能手機拍攝的照片、經過Photoshop修改的照片、通過智能手機內置濾鏡后處理的照片以及使用不正確的顏色配置文件再現的照片。他們在一個精心控制的實驗室環境中進行了大規模的心理物理實驗,收集了30000對圖像配對的感知顏色差異數據,基于新建立的數據集,首次嘗試構建一個基于輕量級神經網絡的端到端學習型顏色差異公式,作為之前色差度量方法的泛化。經過廣泛的實驗表明,優化后的公式在很大程度上超越了33種現有的顏色差異度量方法,能夠在沒有密集監督的情況下提供合理的局部顏色差異圖,很好地泛化到均勻色塊數據上,并且在數學意義上表現為一個適當的度量標準。