点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
2023年世界互联网大会乌镇峰会期间,15项世界互联网大会领先科技奖正式公布,由北京交通大学、南开大学带来的“视觉媒体的层次化内容感知”入选基础研究组奖项。
如何模拟大脑的认知机制,实现高效且层次化的视觉内容感知一直是计算机视觉领域的重大挑战。北京交通大学信息科学研究所所长赵耀接受光明网记者采访时表示,近几年,团队以视觉媒体为主要研究对象,系统深入地研究了视觉内容层次化感知的相关理论和方法,形成了从图像级、物体级到像素级粗粒度及细粒度的递进感知理论和解决方案,回答了“图像有何物体,物体有何像素,像素是何类别,类别如何细分”的系列问题。
“多年来,我们一直致力于研究计算机的视觉基础问题,包括图像分类、物体检测和语义分割等内容,经过不断探索,成功用深度学习的方式解决了图像的多标签分类问题。”
赵耀表示,目前的成果属于团队在深度学习时代攻克机器视觉基础问题的开端。未来,团队还将在基础研究方面借助基础大语言模型等能力,不断探索层次化内容感知的边界。
(策划:李政葳 统筹:穆子叶、孔繁鑫 摄像:刘昊 制作:董大正 编辑:雷渺鑫)