2019开年拿下“一血” 百度摘得国际语义评测比赛冠军桂冠

栏目: 编程工具 · 发布时间: 5年前

内容简介:国际赛事上屡传佳报的百度,2019年开年再次拿下“一血”。2019年2月1日,第十三届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2019)落下帷幕。在论坛评论建议挖掘任务评测(Task 9A: Suggestion Mining from Online Reviews and Forums)中,百度一举击败来自全球的210余支队伍,最终以F值78.12%的成绩夺得冠军,表明了百度率先在评论建议挖掘领域尝试并取得喜人的成果。

国际赛事上屡传佳报的百度,2019年开年再次拿下“一血”。2019年2月1日,第十三届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2019)落下帷幕。在论坛评论建议挖掘任务评测(Task 9A: Suggestion Mining from Online Reviews and Forums)中,百度一举击败来自全球的210余支队伍,最终以F值78.12%的成绩夺得冠军,表明了百度率先在评论建议挖掘领域尝试并取得喜人的成果。

2019开年拿下“一血” 百度摘得国际语义评测比赛冠军桂冠

SemEval-2019 Task 9A 最终榜单,百度排名第一

SemEval评测是自然语言处理领域的国际权威竞赛,由国际计算语言学协会(Association for Computational Linguistics, ACL)下属的SIGLEX主办。ACL是自然语言处理与计算语言学领域最高级别的学术会议,是世界上影响力最大、最具活力的国际学术组织。自2001年起,SemEval至今已成功举办十二届,吸引了世界范围内的多所大学和研究机构的参加,在业界和学术界具有极高影响力。本次评测聚焦的任务是论坛评论建议挖掘,旨在抽取从网络论坛或评论中自动识别建议性的句子,用于帮助企业、政府机关等组织持续不断的从海量数据中提取有价值的信息。

如今,用户喜欢在网络中发表评论,表达自己对个人、产品、服务和社会事件等的意见和想法,这些评论不仅蕴含用户丰富的情感表达,有些还包含着用户对产品或服务的建议。比如“我喜欢吃这家餐厅”是用户表达喜欢这种情感的评论,但在“我喜欢吃这家餐厅,如果环境再好一点就更好了”这条评论中,还包含了用户对这家餐厅的建议。以往的情感分析研究更关注用户是否存在负面情感,上述这条评论往往会被忽略,实际上建议类评论对提升企业服务具有极高价值。目前,业界有大量针对用户情感分析的研究,但建议挖掘还处于初步阶段,百度率先在评论建议挖掘领域尝试。

建议挖掘是一项新的研究任务,该任务需要综合考虑句子的语义、语态、 情绪、句式、上下文等信息,才能做出准确的判断。例如“可以考虑在节假日增加几趟航班”,“假如房间里提供热水壶,我下次还愿意订在这里”等句子虽然句式、形态、评论的对象完全不同,但都是有价值的建议。对“建议”内涵和外延的理解存在比较大的主观性,使得问题定义及语料标注难以取得一致,这给建议挖掘带来了很多困难。

此次比赛中,百度团队采用多种技术手段解决难题,并最终取得了亮眼成果。首先,针对任务标注数据过于稀疏的问题,团队构建了以大规模无监督数据为基础的跨领域、多句式深度语义分类模型。采用融合浅层学习和深度学习的Ensemble学习模型,以解决样本不平衡问题。面对网络文本形式多样、表达不规范的现状,团队采用精细化粒度特征和注意力迁移机制进行处理。最终,百度团队以F值78.12%的成绩战胜了来自全球的210余支队伍,夺得冠军。

企业期待及时获取消费者的评价以改进服务、政府和媒体希望从海量文本中提取意见以成为决策参考与新闻素材……而互联网上还有大量评论数据沉淀,亟待深度应用。评论建议挖掘用于辅助决策,无疑是极具实用价值的自然语言处理任务!

赋予机器“认知”能力,是人工智能最具挑战的技术领域之一,自然语言处理属于认知部分的重要内容。更深入地理解语言,让机器具备人类的思考和理解能力意义重大。百度在自然语言处理(NLP)领域已经过十余年积累与沉淀,具备了最前沿、最全面、最领先的技术布局,不仅专注于前瞻技术探索,更致力通过技术应用解决实际问题。目前,百度语义理解技术已广泛应用于百度内外,在搜索、信息流等一系列产品应用中发挥重要作用。


以上所述就是小编给大家介绍的《2019开年拿下“一血” 百度摘得国际语义评测比赛冠军桂冠》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算机是怎样跑起来的

计算机是怎样跑起来的

[日] 矢泽久雄 / 胡屹 / 人民邮电出版社 / 2015-5 / 39.00元

本书倡导在计算机迅速发展、技术不断革新的今天,回归到计算机的基础知识上。通过探究计算机的本质,提升工程师对计算机的兴趣,在面对复杂的最新技术时,能够迅速掌握其要点并灵活运用。 本书以图配文,以计算机的三大原则为开端、相继介绍了计算机的结构、手工汇编、程序流程、算法、数据结构、面向对象编程、数据库、TCP/IP 网络、数据加密、XML、计算机系统开发以及SE 的相关知识。 图文并茂,通俗......一起来看看 《计算机是怎样跑起来的》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

SHA 加密
SHA 加密

SHA 加密工具