2024年1月2日,我校工程系邀請澳大利亞阿德萊德大學吳琦副教授和浙江大學計算機學院博士后景宸琛博士分別做了題為“Human-Computer Conversational Vision-and-Language Navigation”和“開放世界下的視覺理解”學術報告,是深北莫大學電子與計算機科學前沿系列講座的首場報告,線下和線上60多位師生聆聽了學術報告,武玉偉長聘副教授主持了這場報告會。
吳琦博士任職澳大利亞阿德萊德計算機系副教授、澳大利亞機器學習研究中心視覺和語言實驗室主任,他是Image captioning、VQA以及Vision-language navigation研究方面的國際知名專家,在TPAMI、CVPR、ICCV、ECCV等著名會議和期刊發表論文100余篇,他還擔任過 CVPR、ICCV 和NeurIPS的領域主席。吳琦教授首先給師生帶來人機對話式視覺語言導航這一國際學界的熱點和前沿話題,介紹了他的團隊近期在該領域的最新研究成果,給出了該領域的關鍵核心和挑戰以及未來發展趨勢,特別是他們搭建的實驗平臺和視覺語言回話式無人機平臺,引起了與會師生的濃厚興趣。



景宸琛博士從當前國內外學界就人工智能領域的通用基礎模型這一前沿熱點問題開始,介紹了通用基礎模型的百花齊放,以及為實現開放世界下的視覺理解帶來的新機遇與挑戰。視覺基礎模型的強大的表征能力為實現通用感知奠定了基礎,多模態基礎模型則使得開集理解成為了可能。報告中,景博士也展示了他在該領域的許多工作進展,分享了他對開放世界下視覺理解的一些深刻的思考,得到了與會師生的廣泛共鳴和討論,受益匪淺。景宸琛博士分別于1997年和2022 年獲得北京理工大學計算機科學與技術學士學位和博士學位,獲北京理工大學優秀博士學位論文獎。目前在浙江大學 CAD & CG 全國重點實驗室從事博士后研究工作,主要研究方向包括計算機視覺、多模態理解與推理以及開放世界的理解,在IEEE-TMM、PR、CVPR、ICCV、AAAI、MM等人工智能及計算機視覺領域國內外高水平會議期刊上發表論文十余篇。
