DataVisor创始人谢映莲:无监督机器学习使企业反欺诈化被动为主动

栏目: 数据库 · 发布时间: 5年前

内容简介:2013年感恩节前夕,谢映莲和俞舫离开工作多年的微软研究院,二人从同事关系转变为创业伙伴,在美国硅谷成立了人工智能公司DataVisor。 当时,深耕于网络安全领域的她们已经拥有超过24项专利,并在顶尖学术会议上发表了50多篇研究论文。盛名之下,许多公司听闻DataVisor的成立,纷纷抛出橄榄枝,其中更有一家中国公司,远渡重洋来到美国,向其寻求反欺诈方案——这家公司就是陌陌。

DataVisor创始人谢映莲:无监督机器学习使企业反欺诈化被动为主动

2013年感恩节前夕,谢映莲和俞舫离开工作多年的微软研究院,二人从同事关系转变为创业伙伴,在美国硅谷成立了人工智能公司DataVisor。 当时,深耕于网络安全领域的她们已经拥有超过24项专利,并在顶尖学术会议上发表了50多篇研究论文。

盛名之下,许多公司听闻DataVisor的成立,纷纷抛出橄榄枝,其中更有一家中国公司,远渡重洋来到美国,向其寻求反欺诈方案——这家公司就是陌陌。

作为拥有上亿用户的社交网络产品,如何识别和防止用户账号盗用曾是陌陌所面临最严峻的挑战。DataVisor官网所提供的企业应用案例中,引用了陌陌的首席执行官唐岩的话:

“DataVisor帮助我们提前、高效的检测出了大量的恶意spam(垃圾邮件)群组,使我们能够在这些spam影响正常用户之前有效封禁其账号。这对于我们平台保护用户体验,保证用户数量的持续快速增长至关重要。”

2021年,50%的企业会在反欺诈中运用无监督机器学习

“无监督机器学习”这一技术亮点,无疑是吸引企业主动找上门的关键。

“目前可以说,DataVisor在将无监督机器学习落实到产业服务的创新应用上是做得最好的。”在接受亿欧金融专访的过程中,谢映莲向我们充分地展示了这种自信。

传统的反欺诈方法包括:黑白名单、规则引擎和有监督机器学习。

DataVisor创始人谢映莲:无监督机器学习使企业反欺诈化被动为主动

四种反欺诈方法比对;图片来源:DataVisor提供

其中,黑白名单因为操作简单方便而被广泛采用,但其缺点与优势同样显著,黑白名单受限于时效性,“假设一个电话号码进了黑名单,在6个月后这个号码自动销号,这个黑名单就失效了。”谢映莲举例道,并且这种方式只能用于识别已知的欺诈分子,“黑白名单可以作为一种信号参考,但是企业很难凭此决定是否封禁一个用户。”

时至今日,对企业而言危害性最大的欺诈行为,早已不是来自个人,而是来自规模性欺诈行为,其背后往往是一个有组织、有计划、甚至有技术的黑产生态链。欺诈分子可能同时窃取大量“好人”的个人信息来养数百个账号、申请上百张信用卡,每个账号、每次申请所使用的信息都无懈可击,而以黑白名单为典型的传统反欺诈方法,往往将其作为一个个独立事件进行检测,结果自然是“道高一尺,魔高一丈”,不仅造成企业损失,还会伤害大量无辜的消费者。

面对千变万化的新型欺诈,利用标签化处理已知欺诈行为,并以此训练机器辨别类似行为的传统反欺诈方法显然过于迟缓和被动。“欺诈与反欺诈是非常快速的攻防战,手段是多种多样的,因为欺诈分子了解了有监督机器学习的攻防机制,所以采用的欺诈方法往往是之前没见过的,对于历史数据的标注,也就是标签所训练出来的模型,其实对新的攻击仍然是不敏感的。”谢映莲在采访中介绍, DataVisor研发的无监督机器学习专利技术,最大的优势就在于去标签化,使得模型能够实现“随着欺诈攻击变化的同时,智能地进行攻防策略的调整,主动发现未知的欺诈方法。”

简单来说,有监督的机器学习就是通过人为地标签化某些行为或事物,并使用这些标签对机器进行训练,如圆形且可食用的红色水果是苹果,经过训练,遇到“圆形”、“可食用”、“红色”这三个标签时,机器即可识别出“苹果”;而无监督机器学习则是机器自发地通过发现数据之间的关联关系,寻找出规律,如机器获取了苹果、西红柿、草莓的数据,尽管机器并不认识这三种水果,但却能发现它们之间存在的一个共同之处,即都是“红色”。

不同的算法各有所长,无监督机器学习在寻找数据间的联系方面得天独厚,DataVisor发现在现代欺诈事件中,“坏人”之间往往有着某种隐秘的联系,显示出“坏人扎堆,好人分散”的特征。因此,无监督机器学习尤其适用于识别黑产这一类团伙作案。

Gartner曾预言:“在 2021年, 50% 的企业将会运用无监督机器学习技术到现有的反欺诈检测系统之中。”

事实上,无监督机器学习和传统的反欺诈方法并不是零和竞争的关系。“一个机构要建立完善、严密的风控体系,可以同时采用我们的无监督机器学习产品和黑白名单等产品,它们是互为补充的。”DataVisor的产品体系中,同样包含了有监督机器学习引擎、规则引擎和标签化产品:全球智能信誉库。

DataVisor创始人谢映莲:无监督机器学习使企业反欺诈化被动为主动

DataVisor UML解决方案架构;图片来源:DataVisor官网

对此,谢映莲做了一个形象的比喻:“反欺诈决策就像是做一道菜,算法是菜谱,系统引擎是厨具, 数据源是米,黑白名单是抄过水的半成品,没有半成品可以,但巧妇难为无米之炊,有充足的原始数据是前提。

金融科技赛道,中国超越美国了吗?

尽管两位创始人都是土生土长的中国人,在硅谷成立的DataVisor却更像一家国际化的AI公司,“国内的科技创企是资本驱动的,为了赢得投资人亲睐,往往会在各个赛道布局,以丰富产品线,但在国外,尤其是美国的科技创企往往规模不大,更加倾向于聚焦在某一个赛道中深耕。”

从2013年在硅谷成立至今,DataVisor经过6年的发展,一直专注于反欺诈领域的研究。目前,DataVisor已在金融、社交、电商、移动应用推广等领域积累了丰富的实践经验,其产品被应用在账号盗用、信用卡申请欺诈、信用卡套现、反洗钱、支付欺诈、薅羊毛、刷单等多种场景中。2016年,元生资本创始人彭志坚亲自来到美国拜访谢映莲,双方达成B轮融资协议,这也促使DataVisor正式进入了中国市场。2018年2月12日,DataVisor宣布获得由红杉中国领投的4000万美元C轮融资。

由于DataVisor兼具中美基因,采访中难免提到现在一个热门的话题: 在金融科技赛道,中美发展速度到底孰优孰劣?

对此,谢映莲认为中美两国的金融科技都在快速发展,暂时还没有分出先后。

中国的人口优势使其在互联网化进程中拥有着巨大的市场潜力。对金融领域而言,无疑也是一个巨大的市场体量,但目前中国的金融科技其实没有想象的要快,这一方面是受限于监管,另一方面也受市场体系完善程度的影响。 比如在传统银行的场景,美国的信用卡市场依托于先进的社会征信体系,使用户可以全程在线上完成信用卡申请,而在中国必须配合多重线下审核来进行风控。也就是说,现在中国很多反欺诈并不是通过技术方案解决,这套传统的模式对用户体验而言并不太好,同时也抑制了传统金融机构对新科技的需求。”

在国内拓展银行这一场景时,DataVisor也发现,尽管传统金融机构在积极引入新科技以完成互联网化转型,但其实现周期还是较为漫长。谢映莲表示: “大数据基础体系的建立、对新技术的认知和对新技术的需求,当这三个要素都具备时,DataVisor就能更好地为这些传统企业赋能。”

银行与金融科技融合的理想境界是什么?是银行即服务。

2019年6月14日,亿欧智库研究院将在“2019丨全球新经济年会·金融科技峰会”上发布《 2019开放银行与金融科技发展研究报告 》,深度解读金融科技赋能开放银行的融合与落地应用——上海·虹桥·世贸展馆邀您见证!抢票链接: https://www.iyiou.com/post/ad/id/818

DataVisor创始人谢映莲:无监督机器学习使企业反欺诈化被动为主动

版权声明

本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

追踪Linux TCP/IP代码运行

追踪Linux TCP/IP代码运行

秦健 / 北京航空航天大学出版社 / 2010-4-1 / 69.00元

本书以应用程序为线索,详细描述了数据包在协议栈的分段、重组、发送、接收过程,同时分析了路由的初始化和设置过程,主要包括socket应用程序、 TCP/IP协议、路由、通知链、邻居子系统等内容。全书涵盖了协议栈的全部知识点,对于广大的读者来说这是一本极其难得的技术资料。同时,书中论述了网络设备的工作原理,解释了RTL8169和嵌入式CS8900、DM9000网卡设备的核心过程。一起来看看 《追踪Linux TCP/IP代码运行》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具