为促进黑龙江省青年学者与省内外学者的深度交流与合作,黑龙江省人工智能学会开展“青年科技先锋论坛”。每期论坛将邀请人工智能领域的优秀青年学者分享最新研究进展。本次论坛邀请了北京交通大学 魏云超 教授、华中科技大学 王兴刚 教授、中国科学院深圳先进技术研究院 董超 副研究员、北京交通大学 丛润民 副教授。
论坛时间:2022年6月24日(星期五)9:00-17:00
特邀讲者:魏云超 教授、王兴刚 教授、董超 副研究员、丛润民 副教授
论坛方式:线上 腾讯会议 659-518-962
主持人:任冬伟 副教授、武小荷 助理教授
论坛安排:
黑龙江省人工智能学会副理事长 韩纪庆 教授 致辞
1. 报告一题目:图像超分辨率网络的泛化性分析
报告摘要:基于深度学习的图像超分辨率(超分)方法已经在各种限定条件下取得了出色的性能,但在现实场景中的泛化能力往往差强人意。我们针对超分网络的泛化性开展了细致的分析和研究。首先,我们从可解释性的角度出发,将泛化能力进行可视化。通过将网络中间特征进行降维和聚类(DDR),可以直观的看到网络对不同类别图像的处理差异,并从中发现网络泛化性差的原因。进一步,我们将上述发现进行量化,提出了第一个超分网络的泛化性指标(SRGA)。该指标利用了网络深度特征的统计特性,测量了不同数据集间处理的空间差异,与图像质量评价指标形成了互补。最后,我们引入了一种简单的方法(Dropout),可以有效的提升超分网络的泛化性能,并利用可解释性工具进行了分析和验证。
讲者简介:董超,中国科学院深圳先进技术研究院副研究员,博士生导师。博士毕业于香港中文大学信息工程专业。2014年,在欧洲计算机视觉大会(ECCV)上发表论文SRCNN,首次将深度学习引入图像超分辨领域。2017年-2022年,多次带队参加国际超分辨率比赛,共获得9项冠军。2016年-2018年就职于商汤科技,带领商汤超分团队开发了世界首款基于深度学习的数码变焦软件。2021年被斯坦福大学评选为世界前2%顶尖科学家。2022年入选AI2000人工智能全球最有影响力学者。谷歌引用量超过1万9千次。主要研究方向包括图像视频超分辨率,去噪和画质增强等,团队主页http://xpixel.group/。
2. 报告二题目:面向视频的像素理解
报告摘要:像素级理解是计算机视觉领域的核心研究方向,可被广泛应用到自动驾驶、机器人、遥感图像、医学图像等任务当中。在此报告中,魏博士将主要介绍他在视频像素理解方面的研究成果,涉及视频物体分割、视频语义分割、视频全景分割等。这些成果在国际知名数据集上取得了国际领先的性能,包括DAVIS2016/2017,Youtube VOS;并构建了全球最大的视频语义分割数据集VSPW和视频全景分割数据集VIPSeg。
讲者简介:魏云超,北京交通大学教授、博导。曾在新加坡国立大学、美国伊利诺伊大学厄巴纳-香槟分校、悉尼科技大学从事研究工作。入选MIT TR35 China,百度AI华人青年学者榜单,国家级青年人才计划,澳大利亚人TOP 40 Rising Star,曾获澳大利亚研究委员会青年研究奖,中国图象图形学学会科技技术奖一等奖,ImageNet目标检测冠军。 Google引用10600多次。主要研究方向包括面向非完美数据的视觉感知和多模态数据分析。
3. 报告三题目:面向深度图的增强与应用
报告摘要:随着深度成像设备的普及与推广,深度数据发挥着越来越重要的作用,小到智能手机终端,大到无人驾驶系统都有深度数据的作用。受现有深度成像设备的限制,采集得到的深度图的分辨率往往较低,严重影响了后期任务的实践和应用。本次报告将首先分享面向深度数据的超分辨率重建任务的相关研究成果,并介绍以RGB-D显著性目标检测任务为代表的深度图应用研究成果。
讲者简介:丛润民,2019年6月获天津大学工学博士学位,现为北京交通大学数字媒体信息处理研究中心(科技部重点领域创新团队、教育部创新团队)副教授,硕士生导师,入选中国科协“青年人才托举工程”、“北京市科技新星”计划、北京市科协“青年人才托举”工程、2020全球前2%顶尖科学家等。主要研究方向包括计算机视觉、多媒体信息处理、注意力感知与显著性计算、开放环境下视觉内容增强等。主持、参与了包括国家自然科学基金、国家重点研发计划、北京市科技新星计划、北京市自然科学基金在内的多项科研项目。在TIP、TCyb、TII、TMM、TCSVT、TGRS、NeurIPS、CVPR、ECCV、AAAI、IJCAI、ACM MM等国内外学术期刊及会议上发表论文60余篇,其中CCF A/IEEE/ACM Trans 论文40篇,ESI热点论文2篇、ESI高被引论文9篇;出版英文专著章节2部;授权国家发明专利16项。担任中国图象图形学学会青年工作委员会副秘书长、北京图象图形学学会理事、第六届VALSE执行领域主席,SCI期刊担任Neurocomputing、IEEE Journal of Oceanic Engineering、 Signal, Image and Video Processing编委(Associate Editor)。荣获IEEE ICME最佳学生论文奖亚军、天津市科学技术进步一等奖、ACM SIGWEB中国新星奖、中国图象图形学学会优秀博士学位论文奖、IEEE CVPR杰出审稿人、IEEE JOE年度杰出审稿人奖、第十五届北京青年优秀科技论文奖等。
4. 报告四题目:高性能视频多目标检测、分割与跟踪
报告摘要:视频中的多目标检测、分割和跟踪是计算机视觉中的关键问题,并具有广泛的应用。针对复杂的视频场景、目标外观变化、目标遮挡、目标快速运动、视频模糊等困难问题,我们提出了高效率的自注意力表示机制(CCNet)、基于Query机制的实例分割方法、遮挡视频物体分割评测数据集、基于交叉学习的视频物体稳定表征学习方法、纯序列学习的Transformer目标检测器、ReID和检测特征的公平学习机制、低置信度检测关联方法等,在COCO、YoutubeVIS、MOT 17、MOT 20等大规模评测集上取得了业内领先(SoTA)的结果,构建了稳健的高性能视频多目标检测、分割与跟踪系统。
讲者简介:王兴刚,华中科技大学,电信学院,教授,博士生导师。主要研究方向为视觉目标检测与分割,在IEEE TPAMI、IJCV、CVPR、ICML等顶级期刊会议发表学术论文50余篇,谷歌学术引用次数12000余次,在计算机视觉领域首次提出了空间稀疏自注意力机制(CCNet),该机制在Deepmind AlphaFold中应用,对应的论文在ICCV19最具影响力榜单上排名第五,引用超过1000次。担任CVPR 2022领域主席,Pattern Recognition、Image and Vision Computing 期刊编委。入选了国家级青年人才,中国科协青年人才托举工程,获吴文俊人工智能优秀青年奖,CVMJ 2021最佳论文奖,湖北省自然科学二等奖等。
|
|
主办方
黑龙江省人工智能学会
承办方
哈工大计算学部机器学习研究中心