近年来,以深度学习为代表的新一轮人工智能研究已取得了重大进展,并对计算机视觉的发展和应用产生了巨大的推动作用。然而,由于数据形式多样、标注不完备、真实应用场景的复杂性和多样性等诸多问题,深度学习模型在实际落地应用中仍面临着巨大的挑战与困难。本次论坛将结合视频智能行为计算、真实场景人群计数、三维人脸感知以及不完备学习等计算机视觉领域,探讨面临的挑战及可能的解决方案,推动人工智能和深度学习在计算机视觉领域的发展应用。
论坛时间:2021年7月29日(星期四)9:00-11:50
特邀讲者:郑伟诗 教授、王琦 教授、黄迪 教授、刘贤明 教授
论坛地点:腾讯会议 114 545 796 ( 因为疫情防空要求,本次活动改为线上进行,时间不变,敬请谅解!)
主持人:左旺孟 教授、任冬伟 副教授
论坛安排:
9:00-9:10
计算学部主任 刘挺 教授致辞,合影
9:10-9:50
1. 报告一题目:智能行为计算与评估
报告摘要:基于计算机视频分析的行为分析是计算机视觉的重要任务之一。有别于图像,行为需要在时空全域上分析动作的演化,存在有诸多挑战性问题需要解决。本次汇报主要介绍我们在行为计算与评估上的工作,特别关注交互行为分析、行为意图预测、行为质量评估、以及基于跨场景追踪的异常行为分析。在汇报中,还将演示上述研究如何被应用于中学生实验行为质量的评估和抗疫防护服智能穿脱的智能监测。
讲者简介:郑伟诗,中山大学计算机学院教授、博导,现任中山大学计算机学院副院长、机器智能与先进计算教育部重点实验室副主任、人工智能与数字经济广东省实验室-人工智能模型与算法研究中心副主任、大数据分析与应用技术国家工程实验室副主任。他致力持久研究(跨场景)行为感知信息,并结合多种模态信息,实现高层语义理解与推理。他已发表180余篇主要学术论文,其中在人工智能顶级期刊IEEE T-PAMI及IJCV发表17篇、国际A类学术会议论文80余篇。担任Pattern Recognition、《自动化学报》等期刊的编委,担任国际顶级学术会议ICCV、CVPR、IJCAI 等领域主席。作为课题负责人,主持承担国家重点研发课题、国家自然科学基金委联合重大项目课题、国家科技部重大攻关课题、广东省重点基金、及其他5个国家级项目。获全国2020水下目标检测算法赛光学图像赛项一等奖、获CVPR等国际顶级学术会议竞赛第一名3次;发布了“医用防护用具穿脱流程智能教官”等系统。获中国图象图形学学会自然科学奖一等奖、广东省自然科学奖一等奖、广东省自然科学奖二等奖等。 |
9:50-10:30
2. 报告二题目:面向真实场景的人群计数研究及其应用
报告摘要:近年来,由于大规模群体性事件的频繁发生,基于视觉技术的人群计数就变得具有重要现实意义和研究价值。随着深度学习的不断发展,人群计数方法的性能也得到极大提升。本报告将介绍面向真实场景的人群计数研究及其应用,主要包含三个方面:使用虚拟数据建立大规模有标注人群计数数据集,通过监督学习和域适应算法提升模型泛化能力,从数据和算法层面缓解现存人群计数算法易过拟合的问题;针对现存算法无法有效处理域间差异和生成精细人群密度图的问题,提出域间特征隔离模型将合成数据转译为真实数据,并使用高斯先验重建提高密度图质量;建立大型人群计数数据库和算法测试平台,供科研人员快速公平地测评算法性能,从而促进人群计数领域的快速发展。
讲者简介:王琦,西北工业大学光电与智能研究院副院长,教授/博导,科睿唯安全球高被引科学家,爱思唯尔中国高被引学者。主要研究方向为模式识别、计算机视觉,机器学习,具体包括视频分析理解与遥感图像解析。相关研究论文100余篇,均已发表在本领域内知名国际期刊/会议上,其中30余篇论文入选ESI高被引论文/热点论文,并获IEEE/Springer国际会议最佳论文奖和最佳论文提名奖、吴文俊人工智能优秀青年奖、陕西省科学技术一等奖等。担任IEEE T-SMC:Systems、IEEE T-CSVT、IEEE GRSL、PR、Remote Sensing等多个国际期刊编委。 |
10:30-11:10
3. 报告三题目:三维人脸感知
报告摘要:近年来,三维数据采集设备取得了长足进步,以较低成本快速获取高精度的三维数据成为现实,这促进了三维人脸分析技术的进一步发展和应用。三维数据直接反映了人脸的形状信息,不受环境光照和头部姿态变化的影响,且和纹理信息具有良好的互补关系。正是由于这些优良的特性,越来越多的研究机构投入到与三维人脸相关的工作中来。这次报告将着重介绍三维人脸分析在数据库构建、处理方法、实验评价等主要方面的最新研究进展,涉及人脸标志点定位,人脸曲面配准、曲面几何表示、和二维三维信息融合等多个研究内容,主要涵盖三维人脸识别和三维人脸表情分类两种典型应用。此外,报告还将对我们在三维人脸分析技术实用化道路上正在和将要面对的困难与挑战进行展望和讨论。
讲者简介:黄迪,博士,北京航空航天大学计算机学院教授,博士生导师。研究兴趣涉及计算机视觉,模式识别,情感计算等。曾主持国家自然科学基金(青年/面上/优青)等基础研究课题和微软、达摩院等企业合作项目,还作为主要成员参与了国家重点研发计划、国家973计划等研究任务。已在领域内国内外重要期刊和会议上发表论文八十余篇,谷歌引用4500余次;授权发明专利七项。曾获2013 ACM MM情感计算竞赛(AVEC)第1名,2016 IEEE ICB最佳墙报论文奖,2016 CCBR最佳论文奖,2017 ICCV Workshop最佳论文奖。研究成果应用于网安、公安、医疗、体育等多个国家重要行业,取得了显著的社会效益。曾获中国人工智能学会杰出贡献奖、北京市教学成果一等奖和北航留学生课程优秀主讲教师等荣誉。现任中国人工智能学会理事和智能交互专委会秘书长、中国计算机学会人工智能与模式识别专委会和计算机视觉专委会委员。 |
11:10-11:50
3. 报告四题目:不完备数据学习
报告摘要:有监督深度学习的成功极大依赖于大量精细标注的可靠数据,而这些数据的获取既通常昂贵又耗时。为了降低标注成本,网络检索和众包收集等手段成为了数据获取和标注的重要途径,但是这样的非专家标注会造成数据的不完备,如标签不可靠、类别不均衡、有标注数据量过少甚至没有等。特别是对于某些特定领域和特定任务,如医学、军事等领域和人脸验证等开放集任务,本身就无法获取充分且准确的标注。因此,不完备数据广泛存在且往往无法避免,通常会对深度学习模型的训练和泛化产生严重的负面影响。如何在不完备数据上学习获得鲁棒的机器学习模型是众多应用领域亟待解决的问题。在此次报告中,将介绍课题组在ICML’21、ICCV’21、ACM MM’21等关于带噪声标签学习、少样本学习方面的最新研究进展。
讲者简介:刘贤明,现任哈尔滨工业大学计算机学院长聘教授、博士生导师、院长助理。2013年4月留校,历任讲师、副教授、教授。研究方向为人工智能、图像处理、计算成像,在国际著名期刊和会议上发表论文100余篇。主持国家重点研发计划政府间合作重点专项项目、国家自然科学基金面上和青年等项目。获得中国人工智能学会第八届吴文俊人工智能优秀青年奖、IEEE多媒体领域旗舰会议ICME2016最佳学生论文奖和Springer IFTC2016最佳论文奖。 |
主办方
哈工大计算学部
承办方
哈工大计算学部机器学习研究中心
黑龙江省人工智能头雁团队
黑龙江省视听觉认知重点实验室
仲荣论坛介绍
哈工大是我国最早开展人工智能研究的高校之一。1958年,哈工大计算机专业师生研制成功中国第一台能说话、会下棋数字计算机,时任国家副总理的邓小平同志到哈工大参观了这台计算机,在全国引起强烈反响,被誉为中国人工智能的起点。20世纪80年代初,哈工大计算机专业以李仲荣教授为首,开展了声图文计算机智能接口、语音信号处理、文字识别、机器人足球、机器学习、汉英机器翻译等方面的研究工作,为哈工大在相关领域的发展和领先地位奠定了基础。
在随后的几十年内,哈工大涌现出一大批扎根东北、爱国奉献、造诣精深、勇于拼搏的高水平人工智能领军人才,现有教师队伍中有国家级人才4名,国家重点研发计划首席科学家2名,国家级青年人才6名。已研制出中国手语识别与合成、高效图像编码理论、AVS高效数字视频编解码技术、微软拼音输入法、中文语言技术平台LTP、中文知识图谱“大词林”等一大批标志性成果,获得国家科技奖4项。培养出了高文、张大鹏、徐雷、周明、陈熙霖、王海峰、吴枫等一大批杰出校友。据第三方统计,哈工大培养的人工智能人才的数量全国第一。根据2019年6月21日中国工程院中国新一代人工智能发展战略研究院发布的人工智能专业综合排名,哈工大排名第4。
为打造世界一流的计算学科群,哈工大于2020年6月百年校庆之际组建了计算学部。2021年5月20日,学部决定组织“哈工大计算学部人工智能学科发展系列论坛”(简称“仲荣论坛”,以哈工大人工智能领域的奠基人李仲荣先生的名字命名)。由左旺孟教授担任论坛主席,车万翔教授、刘贤明教授担任副主席。每期论坛选定不同主席,由学部内不同教授担任执行主席。论坛将以AI核心技术和AI+X交叉方向的技术热点和人才培养为话题,以凝聚学部内AI核心力量,厚培其根,根深才能叶茂;进而扎扎实实地推动学部内AI与计算学科群其他方向的交叉融合;同时与校内外其他学科的优秀学者合作深度交流与合作,共同推进AI+X学科的发展。(注:X+AI不是本论坛的重点)