10月19日,正在云南昆明举行的第十八届中国计算语言学大会(CCL 2019)上颁发了中国中文信息学会(CIPS)优秀博士学位论文奖。我院社会计算与信息检索研究中心副主任秦兵教授指导的冯骁骋博士获优秀博士论文奖,论文题目为《基于表示学习的信息抽取技术研究》,冯骁骋博士目前已留校任教。
冯骁骋博士获奖
冯骁骋博士与导师秦兵教授合影
信息抽取是自然语言处理、知识图谱等领域的热点问题之一,目的在于利用计算机自动地从大规模文本中抽取出某些预先定义好类型的事实信息,并形成结构化地数据输出。
冯骁骋博士提出了基于表示学习的文本信息抽取方法,在语义层面,针对稀缺资源语言语义表示不完备问题,提出了基于双语词典的语义映射机制,有效提高现有词向量模型的语义表示能力;在数据质量层面,针对弱监督方法中数据回标所导致的噪声问题,提出了基于实例上下文重要性的深层记忆网络,通过建模实例和标注类别之间的依赖信息提高回标数据质量;在模型层面,提出了基于张量的组合语义表示方法,对不同类型和层次的特征表示进行有效融合,可同时提升实体消歧和三元组消歧结果,达到跨语言知识资源共享的目的,进而全面提高所构建知识图谱的适用性。
上述研究工作发表在相关国际会议和SCI期刊上,其中CCF A/B类会议论文6篇,SCI期刊论文2篇,Google Scholar论文引用数超过430次;冯骁骋博士曾获中国人工智能学会第四届全国青年创新创业大赛特等奖、第二十四届全国信息检索学术会议优秀学生论文奖。
中国中文信息学会于2019年8月21日起开展了2019年优秀博士学位论文评选工作。经过审查、初审、终审,最终评出2019年“CIPS优秀博士学位论文”5篇,其中包括冯骁骋的博士论文《基于表示学习的信息抽取技术研究》。
冯骁骋博士(左二)在颁奖仪式现场