TUhjnbcbe - 2021/6/2 15:48:00
年4月0日,由中国计算机学会自然语言处理专业委员会(CCF-NLP)发起,联合AI研习社及各个知名高校开展的“CCF-NLP走进高校”系列高校NLP研究分享报告会第八期——南京理工大学站,通过线上会议直播的方式进行。本期报告会邀请了哈尔滨工业大学社会计算与信息检索研究中心主任、长聘教授-秦兵,中国科学院自动化研究所模式识别国家重点实验室研究员-刘康,天津大学新媒体与传播学院长聘副教授-张梅山三位特邀报告嘉宾,分别围绕《文本生成相关技术研究》、《ExtractingEventsfromTexts:RecentResearchProgressandChallenges》、《Dependency-BasedSyntax-AwareWordRepresentations》三大主题展开了精彩报告。此外,苏州大学自然语言处理实验室教授-周国栋进行开场欢迎致辞,南京理工大学教授-夏睿对南京理工大学计算机科学与技术学院进行介绍,西湖大学特聘研究员-张岳主持了本次报告会。嘉宾分享回顾苏州大学自然语言处理实验室教授周国栋首先进行了开场介绍。周老师首先对主办方和承办方的精心策划以及各位分享嘉宾的参与表示热烈的欢迎和衷心的感谢,接着介绍了“CCF-NLP走进高校系列活动”的宗旨和目的,并表达了对学科发展的殷切期望,强调了学科“种树人”的使命担当。随后,东道主南京理工大学教授-夏睿向大家介绍了南京理工大学的概况、发展历程、科研成果、学术影响等,并就南京理工大学计算机科学与技术学院的战略目标、研究方向、学术成果等展开介绍。一、秦兵接下来的报告环节中,首先进行分享的是哈尔滨工业大学社会计算与信息检索研究中心主任、长聘教授秦兵老师,分享主题是《文本生成相关技术研究》。秦兵老师首先介绍了当下文本生成研究正在进行的工作,通过大量例证从四个方面向大家介绍了文本生成技术中心的一些基本任务、方法和挑战:一、面向高考议论文的长文本生成,利用一个层次化神经网络编码器学习文本向量的表示,进行立意分析并撰写合规文本;二、面向结构化数据的文本生成,就面向数据化结构市场价值、帮助用户对离散型数据进行理解并作出重要决策、面向结构化数据生成文本的应用空间三点进行阐述;三、面向表格数据的文本生成;四、面向属性标签的文本生成,提出了目前阶段预训练模型存在的一些问题。在最后,秦老师对文本生成的逻辑约束、结构化数据的文本生成技术应用研究和落地情况、以及文本生成的统一评价标准等方面进行了总结和展望。问答环节,秦老师对“如何丰富体育赛事周边报道”、“处理长文本逻辑关系的办法”、“高考作文和普通文本评价有何不同”等问题进行了耐心的解答。二、刘康在秦兵老师之后,中国科学院自动化研究所模式识别国家重点实验室研究员刘康老师进行了题为《ExtractingEventsfromTexts:RecentResearchProgressandChallenges》的报告。刘老师的报告主要是针对“事件抽取”的最新挑战和进展展开。报告中首先介绍了研究背景和研究所涉及的一些关系的定义。先是讨论了事件抽取的任务和概念;继而区别了“以实体为中心的知识图谱”和“以事件中心知识图谱”是什么;解释了当前事件知识图、事件定义、复合价值类型、事件提取任务定义(ACE)、从文本中提取事件所涉及的概念和方法;并将“事件提取”和“关系提取”作了比较。接下来,刘老师总结了在事件抽取方面的所做的工作和最新研究进展,介绍了四部分重点研究问题。一、如何根据训练数据不足来训练有效的事件提取模型,训练抽取信息的类别、上下文约束信息的描述等,以便将抽取信息匹配成便于识别解读的数据;二、如何提取句子之间或文档级别的关系。利用文本中的知识学习表征进行知识提炼与对抗式模仿学习,把传统ACE、TACKBP上的句子级事件抽取拓展到文档级事件提取,将提取到的多个事件归类形成需要的数据集。三、如何从文本中提取事件原因、因果关系。通过文档级事件原因、知识增强识别事件的因果关系。四、刘老师对目前阶段的研究碰到的障碍和需要思考的方向进行了总结,提出了和大家一起探讨学习的愿景。在问答环节,刘老师就“怎样正确抽取事件”、“在文档级事件的抽取中,怎样对多个事件抽取进行建模”、“跨文档的连续指代”等问题进行了耐心解答。三、张梅山最后一位进行报告的是天津大学新媒体与传播学院长聘副教授张梅山老师,报告主题为《Dependency-BasedSyntax-AwareWordRepresentations》。张老师在报告开始时指出依存句法分析是自然语言处理领域的一项基础分析,它能为自然语言处理的各项任务提供基础支撑。随即,张老师提到依存句法分析性能取得了较大的突破,将对依存句法分析的真实应用价值展开探讨,据此从五个部分展开论述。一,张老师介绍了如何进行基础句法分析预训练,经过大量实验调整建立起有效的句法分析架构;二、句子分类任务,介绍了一种基于依存句法导向的词表示方法,并分析了其在“句子分类任务”中的表现;三、“句子匹配任务”中的表现分析;四、“序列标注任务”上的表现分析;五、“神经机器翻译”中的表现分析;五、分析实验结果,这一句法应用方法能在各种级别的自然语言处理基线系统上均能取得有效的提升,而且在使用效率上也能得到较大的改善。问答环节,丁老师对于观众提出的“依存句法分析中效果明显的标签还是结构”、“基础语言知识的性能在实操中的表现及问题”、“多任务学习中语料差异对效果的影响”等问题进行了细致地解答。更详细的报告内容见文末视频回放链接。总结从0年9月份开始,CCF-NLP走进高校系列活动,已举办了八期,更多走进高校更多分享会信息请持续