喜讯!!!

 

10月19日,清博AI团队荣获第十八届中国计算语言学大会CCL单项赛事中文幽默计算第一名的好成绩,获得第二名的是来自华为机器翻译小组的“Huawei MT Squsd”。

 

D8CB2B2C5EAFDF904EF85E069EF9E971.jpg

领奖现场

 

10月18日-20日,“第十八届中国计算语言学大会” (The Eighteenth China National Conference on Computational Linguistics, CCL 2019)在昆明举行。

 

此次大会组织设置了多样技术评测任务,其中多个任务是首次针对中文设置,具有开创性和探索性,为研究者提供了测试自然语言处理相关技术、算法和系统的平台。

 

28D74AC43E67904E67283358575C63F1.jpg

 

清博AI团队参与的技术评测任务CCL “小牛杯”中文幽默计算,就是其中之一。

 

什么是中文幽默计算?

 

我们都知道,幽默是一种特殊的语言表达方式,在日常生活中扮演着化解尴尬、活跃气氛、促进交流的重要角色。

 

幽默计算是近年来自然语言处理领域的新兴热点之一,其主要研究如何基于计算机技术对幽默进行识别、分类与生成,具有重要的理论和应用价值。

 

CCL “小牛杯”中文幽默计算的比赛内容,是设计一个可以辨别幽默等级的系统,别看功能听上去很简单,这可是一个拥有“思考”能力的智能系统。

 

3159BC086A67A0BE975FEF058BD8FE49.jpg

组长陈生做现场答辩

 

划分内容的幽默程度,不仅可以帮助我们判定聊天机器人是不是真的幽默,还可以帮助聊天机器人,对与之聊天的人进行情绪强度的划分,有的人只是想简单幽默一下,而有的人则隐含较强的幽默意味,掌握这些,聊天机器人就能因人而异选择更适宜的方式服务人类。

 

举个例子,假如我们把幽默分成三个等级,分别是弱幽默、普通幽默、强幽默。那么下面这三句话——

A:忧虑并不能阻止灾难,它会阻止快乐。

B:岁寒三友:火锅、白菜、热被窝。

C:程序员:一种红眼睛,笨拙的哺乳动物,能够与无生命的物体无障碍的交谈。

你能够分辨出它们的幽默等级吗?清博小伙伴设计的系统就可以,是不是很厉害?

 

这个第一是怎样拿到的?

 

此次参赛的5位清博AI团队成员,全部来自清博NLP小组。

 

因为比赛采用远程提交的方式,为了不影响日常工作中项目的正常推进,在近半个月的赛程中,他们基本是利用业余时间或者节假日完成的比赛任务,仅在国庆节期间,他们平均加班时间就高达5天。

 

据NLP小组组长陈生介绍,清博AI团队初始排在第三名,中间经过一系列优化,名次提升至第二,当时排在第一的则是来自华为的团队。

 

想要超越华为团队,并不简单。于是,在组长陈生的带领下,清博AI团队开始思考创新性的方法,并将想法逐一进行尝试,终于,在第四阶段,团队排名上升至第一。

 

AE70154C937DC49D7CAF04C50FCA213D.jpg

揭晓最终排名

 

第五阶段(也是最后一个阶段),清博AI团队一直保持领先优势,为了巩固第一名的位置,他们做了极为细致的融合实验,最终,夺得此单项比赛的第一名。

 


 

其实,这并不是他们第一次获奖,在2019世界人工智能大会黑客马拉松(WAIC)AutoNLP大赛中,他们就取得了第三名的好成绩。

 

另外,正在进行的CCF BDCI互联网新闻情感分析比赛中,他们在2221支参赛队伍中暂居第一,并已霸榜一个月;正在进行的智源研究院&中科院计算所联合举办的虚假新闻检测挑战赛-赛道三:多模态中,他们多模态识别初赛排名第一,复赛也暂居第一。

 

1.jpg

CCF BDCI互联网新闻情感分析比赛排行榜

 

WechatIMG57.jpg

多模态识别初赛排行榜

 

之所以参加这些比赛,陈生表示,他们的目标并不是获奖,而是想在比赛中,不管是从深度还是从广度上不断积淀小组的技术能力,做算法创新,申请专利并发表高质量论文,同时立足清博大数据的项目,做出更多更完美的产品。

 

获奖,是意外之喜,也是对他们努力付出的肯定。

 

不忘初心,必定越行越远。我们相信在清博AI团队强大的技术支持下,清博大数据也将会行稳致远,砥砺前行!