为促进中文自然语言技术的发展,由中国人工智能学会主办,科大讯飞股份有限公司组织, 认知智能国家重点实验室(科大讯飞)、哈尔滨工业大学社会计算与信息检索研究中心承办了“第三届中国‘AI+’创新创业大赛——自然语言处理技术创新大赛——中文文本纠错比赛”。本次大赛为从事中文自然语言处理研究的研究人员、产业界从业人员以及AI技术爱好者搭建了一个良好的交流平台。日前,本次大赛结果出炉,我校NLP团队和阿里巴巴达摩院联合组队获得第三届中国“AI+”创新创业大赛中文文本纠错比赛第一名。
文本校对任务主要是针对文本中出现的错误进行检测和纠正,属于综合性的自然语言处理研究子方向,能够比较全面地体现自然语言处理技术的水平。过往文本校对相关评测使用的都是外国语言学习者撰写的文本,对于政务公文、新闻出版等行业来说,一款针对以中文为母语的用户所使用的校对系统将会有更大帮助。因此,本届大赛主要选择互联网上中文母语写作者撰写的网络文本作为校对评测数据,从拼写错误、语法错误、语病错误等多个方面考察机器的认知智能能力。
在本届大赛中,由李正华老师指导的章岳、李嘉诚两位硕士研究生组成苏州大学NLP团队,和阿里巴巴达摩院紧密合作,探索了一系列最先进的文本纠错技术,并将其使用在了此次文本纠错评测任务中。复赛阶段,我校学子与来自国内一流高校和企业的16支队伍进行了激烈较量,包括清华大学、南京大学、北京理工大学、新浪、蚂蚁金服等,最终在所有三个指标上均夺得第一名(检错、纠错、总分),展现了现阶段中文母语文本纠错的最高水平。