内容简介:实习/全职编辑记者招聘ing
大数据文摘出品
记者:张驰
继今年4月 O’Reilly AI Conference在纽约落下帷幕 之后,6月18-21日,O’Reilly AI Conference来到北京。这次的 AI 盛会由 O'Reilly 和 Intel AI 联合举办。大会通过培训、辅导课和主题演讲等多种形式,探讨和分享了AI 技术在实际生活中的落地应用。
大数据文摘作为特约合作媒体也参与了这一盛会,文摘菌此次收获颇丰,趁热打铁先来带着大家看看第一天的报告吧:
迎接外卖个性化场景中的挑战
来自美团的研究员刘怀军分享了关于AI技术在外卖个性化场景中的落地与思考。
外卖的4个个性化场景分别是智能搜索,场景推荐,附近推荐,和智能导购。要实现个性化面临的问题主要是,外卖的菜品相较于电商商品,缺少完备的知识图谱,信息量少,数据挖掘难度大。
另外外卖的链路很长,从用户浏览下单,再到平台发单给商家,商家接单后出餐,最后通过骑手将外卖配送到用户,包括的主体角色有用户,商家,骑手以及中间平台,因此外卖过程中不确定因素多,需要保证链路过程的各角色的多目标均衡。
而且现在外卖平台已经不单单是只供给用户饮食的平台:买药,买鲜花,买生鲜等更多的需求促使外卖发展成为一个更综合的外卖平台。从美团外卖单天订单趋势图可以看出每天的外卖订单存在高峰时段,这就要求平台能够做出及时的决策,保证高时效性。
外卖个性化中存在的这些问题,需要通过资源配置,来实现用户需求和商家供给的精准匹配。对应的需要解决的AI技术问题为:以知识图谱为基础建设,针对有明确需求的用户,为其提供智能搜索,对于非明确需求的用户提供智能推荐。
以知识图谱为基础建设
目前行业内,包括Google,微软,亚马逊,facebook等企业都构建着百亿级知识图谱。美团外卖目前拥有超过300万的商家入驻,有4亿+的商品和超过3亿的用户,构建知识图谱是十分有必要的,也是十分具有挑战性的。
美团提出的知识图谱的构建方案包括整合多源(外卖,团购,点评),异构(文本,图片,行为)数据,采取不同的模型进行多技术融合,并通过用户反馈和商家运营等辅助知识图谱的构建。其中涉及的技术包括图像识别,多源数据处理,以及构建语义模型,图像模型和异构混合模型。
刘怀军说: 技术的发展会遇到局限,产品的发展也会受到局限,但是技术和产品的结合能突破产品的局限和技术的局限。
智能搜索与智能推荐
针对有明确需求的用户,美团希望做的为其提供智能搜索。搜索技术面临的最大挑战包括文本匹配与语义匹配的问题,但是更加关注的是语义匹配的问题,刘怀军依次介绍了BM25算法,DSSM等语义匹配模型来解决这一问题。
针对需求不确定的用户,要做到多层级的智能推荐:商家推荐,商品推荐,套餐推荐,主题推荐。推荐的过程要覆盖全链路,全品类,多场景。全链路要保证用户从进入平台开始点菜一直到下单后的推荐;全品类要包括美食,超市,蔬果,甜点,饮品等各种类别;多场景要负责不同时段,不同地点的推荐。
对此刘怀军介绍了基于时序模型的实时推荐技术,利用LSTM记录用户的长期偏好和实时的短期偏好,通过长期与短期结合实时预测;利用ESMM模型的多目标优化,解决多目标均衡的问题;最后利用知识图谱+情感分析挖掘评论中的推荐理由,以及利用知识图谱+注意力模型生成推荐理由。
刘怀军认为美团外卖未来会进行智能驱动,充分结合AI的优势,来解决外卖个性化推荐的问题,以及利用强化学习进行全链路的全局优化,保证每一环节都能达到最优的平衡,带来外卖领域的革命性成果。
AI“美颜”你的歌声和视频:K歌修音和自动作曲
来自Kwai的音乐检索(MIR)技术专家姜涛分享了用AI来美声的有趣的研究。
姜涛在 报告现场首先展示了其公司成员一段清唱的灾难现场,然后展示了经过AI美音后得到的标准好听的歌唱版本。
由于歌曲原唱的清唱版本在各大公司处作为保密文件,不易获得模型训练的真实标签,是该技术发展的一大瓶颈。
其公司利用MP3等包含背景音乐的原唱歌曲,通过分离技术将歌手清唱音频和背景音乐音频分离开,以此获得歌手清唱音频,再以此作为ground truth进行模型训练。目前该公司的AI美音软件在Server端和手机移动端均可做到一句歌词的延迟水平,而且也可以做到对正常说话的内容进行美声,具有远大的前景。
放大招:TensorFlow 2.0新功能
本次大会演讲中最让文摘菌感兴趣的是来自Google的高级工程师王铁珍关于Tensorflow2.0的介绍。
废话不说,直接上安装方式:
!pip install –pre –U tensorflow
王铁珍介绍 这是TF2.0的测试版,正式版将在今年发布。那么TF2.0到底带来了哪些好处呢?TF1.0又存在哪些缺陷呢?
首先,TF2.0推荐使用tf.keras作为高层级的API接口,keras是tensorflow的高级神经网络接口,里面有大量模型的封装,高度模块化并具有可扩展性,简化了许多复杂算法的实现难度,可以减少开发的成本,TF2.0推荐使用该接口,可以看出深度学习的编程过程趋向简单化。
其次,作为使用过Tensorflow1.0的朋友来说,其并不友好的静态图开发使得众多开发者望而却步。因此TF2.0使用了Eager Execution(动态图模式),使其可以不用再构建完图,通过sess.run来执行,而是可以像普通程序一样直接执行,增强的可用性。这一功能可以说让本来打算放弃TF转向PyTorch的文摘菌又立刻充满干劲,然后激动地跟着谷歌爸爸继续前进。
TF2.0变得更清晰了,去掉了一些复杂的API,如tf.app等,新的API的语法非常友好,并且能兼容Tensorflow的生态系统。
话不多说,来看一下新版的数字分类代码:
可以看出和TF1.0相比几乎没有改变,体现出了很好的兼容性。
王铁珍还介绍到,TF2.0提出了类的概念,以往TF1.0的编程过程都是面向过程,一个流程下来编写的,现在加入了类的概念,引入了面向对象的编程方式。
但是问题来了,就算再兼容,用户还要重新学习TF2.0的新语法规则,那多麻烦啊!别急,马上就要放大招了!新版的TF2.0还提供了自动更新的代码,能直接让你的TF1.0代码直接升级为TF2.0的代码,只需要关键的一个语句:
tf_upgrade_v2。
另外,新版本中不会再有占位符,session.run,feed_fict之类的麻烦了。
接着, 王铁珍 介绍了应用在手机等移动端的TensorFlow Lite框架,在手机也能运行深度学习,文摘菌拿起自己的手机看了看,沉思了一会又默默地放了下来,手机跑深度模型用来干啥呢?
报告结束前王铁珍研究员还放出大招:提供了网页浏览版的Tensorflow.js,这个网页厉害就在于可以直接使用GPU运行程序,啥都不用安装,什么CUDA,CuDnn之类的当时装Tensorflow-gpu的苦大家都懂的,所以这个网页版的Tensorflow简直深得人心。
会议还在继续,关注大数据文摘获得最新报道哦。
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复 “招聘” 了解详情。简历请直接发送至zz@bigdatadigest.cn
志愿者介绍
后台回复 “ 志愿者 ”加入我们
点「在看」的人都变好看了哦
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Cascading Style Sheets 2.0 Programmer's Reference
Eric A. Meyer / McGraw-Hill Osborne Media / 2001-03-20 / USD 19.99
The most authoritative quick reference available for CSS programmers. This handy resource gives you programming essentials at your fingertips, including all the new tags and features in CSS 2.0. You'l......一起来看看 《Cascading Style Sheets 2.0 Programmer's Reference》 这本书的介绍吧!
CSS 压缩/解压工具
在线压缩/解压 CSS 代码
Base64 编码/解码
Base64 编码/解码