摘要: 让谣言止于“人工智能”,仅需要1秒钟的时间。
天下网商记者 黄天然
“谎言飞奔,真理跛行其后。”
英国作家乔纳森·斯威夫特留下的这句话,在如今依然适用。
从去年年底“杭州城管血腥虐杀流浪狗”的谣言引发舆情汹涌、到“一个寒门状元之死”虚构故事刷屏……在信息疯长、传播异常快速的社交媒体时代,朋友圈里时不时就会出现一场关于虚假新闻的风波。
据麻省理工大学的大规模研究《网络中真实与虚假消息的传播》对比实验,通过推特上300万用户转发过的12.6万条新闻的跟踪研究,无论哪种分类信息——政治、娱乐和生活等,假消息都比真消息传播得更快速、更广泛。
因此,容易沦陷朋友圈谣言的不仅仅是不熟悉新媒体套路的长辈们,在那些披着科学与新闻故事的外衣的谬误面前,我们每个人都深受其蛊惑。统计数据显示,“微信辟谣助手”上线未满两年,已辟谣文章数就达到了119.92万篇。
在海量信息肆意横行的社交媒体时代,如何破解谣言难题?
最近,达摩院的科学家们在用AI识别网络谣言的研究上实现新的突破。在刚刚结束的SemEval国际权威语义测试中,达摩院机器智能实验室自然语言处理(NLP)团队创造了谣言识别81%的准确率刷新世界纪录。
“谣言粉碎机”走入我们的社交媒体中,帮助净化网络环境,已经并不遥远。
三招之内让谣言“原形毕露”
达摩院NLP团队核心成员之一李泉志是“谣言粉碎机”的主要研发专家,本科毕业于清华大学的他,而后在美国获得自然语言理解方向的博士学位,目前在达摩院西雅图办公室工作。
在加入达摩院前,他曾是世界级通讯社——路透社重要的“情报官”:通过机器筛选成千上万的网络信息,为数千位一线记者提供可靠线索。
达摩院机器智能实验室科学家 李泉志
“运用AI处理谣言本身就是我们长期研究的方向,社交媒体的蓬勃发展,对于新闻源的判断尤其重要。我们对不同语言的谣言都在研究之中,中国的谣言大多是生活类常识类,而美国的是政治类居多。自达摩院建立以来,我们就开始启动了这项研究。”泉志说。
在研发“谣言粉碎机”的过程中,泉志模拟了人脑的思维的过程,同时发挥AI的特有优势,让谣言的判断可以快速实现。
相比人为的搜索和查证,AI能够更快速和精准地在盘根错节的网络信息里找到最初的信源。分析信源链接的域名,是否来自具有公信力的网站,挖掘出发布信源者的画像。通过发布者在不同社交媒体上的动态与现实生活中的公开信息(专业领域、过去发表内容类型、个人所属的机构、地域、活跃规律等)判断其信誉度。
然后,AI就可以对文章中关键的论证提炼为信息要素,自动化地进行与维基百科、专业学术文献库等知识图谱里的权威知识库做匹配验证。如果发现内容毫无联系、偷换概念、相互冲突,则将立即列入可疑消息的行列。
第三步,对传播路径的深入分析。这可是关键“大招”,一条谣言在社交网络里引爆,其中经过了几次传播?阅读后用户的反馈是肯定,还是反驳和质疑?是否有权威网站转载支撑?AI都可以挖掘出来,由此找到消息传播的增减规律、生成评论和传播消息的用户画像。
这样的统计不仅能统计所有用户的态度,它还会区别对待每条发言的分量。如果行业领域专家、影响力较高的知名人士对于新闻赞同,将增加新闻被判定为真实的权重。
“AI经过语言学训练,还能够读懂评论是否是人类的反话和嘲讽,用语情绪是高兴还是愤怒,连同用户浏览文章的动机和意图都会纳入判断消息真实性的过程。”泉志说。
经过三步中计算出的信息会输入到神经网络模型中,基于这些信息,模型会综合判断出此新闻是否为谣言。凭借强大的机器智能计算能力,三个步骤自动同时进行,最快在1秒内就能得到结论。
2亿条推特信息训练出“世界冠军”
有了这样的神经网络模型,AI就能像一个超级大脑一样“思考”。随着处理的数据库的日益庞大,它的判断能力会越来越好。
为了训练AI“谣言粉碎机”,达摩院NLP团队运用2亿条推特信息、来自上百万条新闻作为素材建立语义网络的最底层,再输入与各类新闻相关的权威知识库建立起了庞大的上层架构。“谣言粉碎机”就如同一个全知全能的“网络警察”,可获知每条新闻的事实来源与反馈情况,了解消息传播的路径和爆发扩散相关的关键人物与时间节点,第一时间发现可疑虚假信息,遏制其扩散势头。
泉志告诉记者,这项技术不仅能控制谣言源头,还能防止大规模扩散,“根据传播路径索引,我们可以针对曾经支持过谣言的人,定向推送官方的辟谣信息,改变造谣容易、辟谣难的局面。比如向相信‘食物相克’谣言的人科普正确的膳食常识,告诉曾经转发过‘酸碱体质说’的用户这是骗局等等。”
在这届SemEval全球语义测试,共有来自哥伦比亚大学、华盛顿大学、艾伦·图灵研究所等20多所研究机构参与。所有参赛者需要根据推特和红迪网上470余条新闻、以及一万多条留言、转发等数据,判断这些新闻的真假。
达摩院NLP团队脱颖而出获得第一,还刷新了本竞赛系列上macro F、RMSE两项关键性指标的世界纪录。达摩院语言技术实验室首席科学家司罗表示,随着社交媒体使用率提升,人工审核的团队越来越庞大,脸书目前已有7000人的人工审核团队,阿里达摩院AI“谣言粉碎机”有望帮助社交媒体的审核机构承担60%的工作量。
在此之前,达摩院NLP团队曾在机器阅读理解顶级赛事SQuAD上,凭借82.440的精准率打破了历史纪录;在国际顶级机器翻译大赛WMT上,连夺英文—中文翻译、英文—俄语互译、英文—土耳其语互译5项第一。
在互联网时代,从海量信息中即时快速地获取信息成为每个人的基本诉求。让AI成为人类大脑的延伸、读懂人类的语言,对抗人们爱让“谣言传千里”的“本性”,建立起更高效的语言与数据传播路径,达摩院的科学家们一直在不断刷新着世界纪录,攻克下一座又一座全球技术的高地。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Learn Python the Hard Way
Zed Shaw / Example Product Manufacturer / 2011
This is a very beginner book for people who want to learn to code. If you can already code then the book will probably drive you insane. It's intended for people who have no coding chops to build up t......一起来看看 《Learn Python the Hard Way》 这本书的介绍吧!