内容简介:Vidy是由一支经验丰富的工程团队,和全明星加密如今,因为对广告的泛滥感到厌倦; 6亿人在手机和电脑中安装了广告拦截软件。大多数人不知道的是,他们不想看到的手机广告平均每月占甪超过23美金的数据流量开销,并且使得电池寿命每天约减少21%。这种情况并非自愿。在当今的时代背景下,用户没有发言权,也没有权利去撤除广告,或选择他们想看到的广告。他们唯一的选择就是完全退出这个圈子。广告拦截的强烈抵制使广告商和出版商受到最大冲击。这意味着他们失去了6亿双眼睛,也就是失去了6亿的潜在客户。
Vidy是由一支经验丰富的工程团队,和全明星加密 货币 咨询委员会组成的。Vidy已开始与超过20家的全球最大广告品牌合作,且已经准备将其已投入到测试阶段的视频广告嵌入层推出到其为全球数百万用户提供的合作伙伴发布平台上。
如今,因为对广告的泛滥感到厌倦; 6亿人在手机和电脑中安装了广告拦截软件。大多数人不知道的是,他们不想看到的手机广告平均每月占甪超过23美金的数据流量开销,并且使得电池寿命每天约减少21%。
这种情况并非自愿。在当今的时代背景下,用户没有发言权,也没有权利去撤除广告,或选择他们想看到的广告。他们唯一的选择就是完全退出这个圈子。广告拦截的强烈抵制使广告商和出版商受到最大冲击。这意味着他们失去了6亿双眼睛,也就是失去了6亿的潜在客户。
Vidy保证将使这离开的6亿用户重归广告观看圈。我们建立在 区块链 上的三层解决方案将是一个三赢的局面,这是破碎的广告业公平奖励每一个参与者的必需,增加视频广告相关性,并剔除不透明的、具有欺骗性、滥用性现状的烦人的中间商。
Vidy是通过NLP共识层将视频广告嵌入到网页的文本后的第一个分散视频广告分发者
我们需要一个分散视频广告的平台来确保为出版商和广告商建立-个强大、稳定、公平的利润渠道,同时统一行业中间人、 交易所 、网络和经销商的零散工作流程,复原了原本应该是很简单的环节,就像在广告商和出版商之间握个手一样。
Vidy的专利内容分发模型将永远改变互联网的运作方式。这是一个全新的超链接,其灵感来源于全球领域内的超链接多年使用与实用经验。该专利在改进其鲜明的局限性的基础上,实现为用户和出版商提供无可比拟的便利性、实用性和简单性的目标。
Vidy构建了一个 分布式 系统,通过其嵌入层的跟踪技术记录每位用户观看广告时间。广告商根据广告观看时间,以Vidy币的形式奖励出版者,广告商和用户。
通过这种方式,Vidy恰当地同时激励和补偿用户与出版商,并通过世界,上第一个NLP共识层智能地传递视频广告,同时通过 智能合约 将用户数据证券化。
Vidy的使命是使人们快速在视频中找到精华部分,而不需要成为疯狂逐利的网络世界的一方.在这个疯狂逐利的网络世界中,互联网生活就是向用户不断堆积数据,在此过程中却不向用户提供任何补偿。我们都知道互联网是在广告收入上运行的,其中最多的收入来自与用户相关的广告。然而对我们不利的是,从来没有-种方法可以避免有侵入性的用户数据跟踪来刺激这些有针对性的广告需求的交易、贩卖、公开和利用。
在2017年,Vidy团队找到了一个方法来解决这个长达数十年的难题,从那时起我们就一直在努力来使我们的解决方案成为现实。我们相信,通过对各方的激励,我们能使在线广告生态系统占有一席之地,并以此盈利。通过我们的方法,人们不用再被迫放弃隐私,并因为他们的关注为广告业助力发展而获得应有的奖励。而广告出版商将在视频广告库中解锁一项全新领域,这将使他们比现在赚得更多。
Vidy的解决方案是建立隐形嵌入层,能供全球任何网站无缝对接,允许发布者在其网站文字上直接嵌入小视频。该隐形层能将视频广告嵌入到用户正在阅读的任意一个字中,而不需要占用屏幕.上的任何宝贵空间或缩在段落中。最主要的是,Vidy正在打开互联网用户界面隐藏的新维度,通过自然语言处理将视频广告嵌在相关文本之后。
这使得广告收入第一次直接与网页上的文本相关联,结合用户筛选的喜好,放置在自然语言处理的顶部。相比广告行业糟糕的现状,Vidy的嵌入层将为出版商提供更多的库存量,并且通过Vidy智能合约的数据存储,该嵌入层也将网络用户从广告商急需的入侵性的用户数据中解放出来。因此这是广告行业从未有过的第一次双赢。
作为一种分布式搜索引擎, Vidy在 视频中实现其查询。它套用区块链力量,最后将关联性、透明度、安全性、及物性、分散性等推广到广告视频搜索.上。由于Vidy团队在NLP、区块链开发Al、分布式系统架构和网络工程方面的核心优势,Vidy构想了一个三层解决方案以实现这一愿景。稍后我们将对此进行讨论。
Vidy以其独特的方式实现这一承诺,不只是因为它已经在这项技术发明的背后建立起了技术,更是因为它已经与最优秀的媒体建立了全球伙伴关系,其中包括在中国与百度独家合作的全球合作伙伴关系,并与其他拥有百万用户的几十家公司进行交易。总而言之,感谢Vidy的合作伙伴,使Vidy能接触到数百万的用户。
Vidy还签署了全球-一些大品牌的交易和意向使用声明,并作为第一大广告商在其正在专利的可嵌入层_上亮相。这些广告合作伙伴包括数十亿美元的零售商,财富50强企业,以及十几个跨国品牌。这意味着Vidy将从推出的第一天起开始盈利, 并将几乎立即向发行商提供利润。
产品
1.一键购物模式
Vidy正在将用户最重要的举动-购物-从单页嵌入层网络体验的最前沿。只需一次点击, 用户就可以在按下嵌入式视频广告后,购买产品,预定餐位或交付物品。
一旦用户从广告到达他们的网站,广告商和品牌每年就会花费数十亿美元试图优化购买渠道中的最高转化率。作为广告商,让用户点击广告的战斗只是指标任务的开始。你总是想要一个成功的动作来关闭循环。而不是冒着失去用户的风险来分散产品清单,制定混乱的按钮界面,定制繁复的流程,复杂的付款页面以及一系列其他使用户在到达网站后就放弃下单的失败点。你现在可以直接从发布者页面购买或预定。随后Vidy将加密交易,并登记入分类账中,并仅发送必要的派送、注册信息到你的端口,均可通过控制面板进行管理。
它的工作原理很简单,如果你是白金Vidy币持有者,你将在控制面板看到推广白金广告活动的选项。在所有白金广告中,当用户按下观看视频时,嵌入层上会显示一个购买按钮。购买按钮仅在按触3秒后出现, 以便a)视频的开头受到主要关注,以及b)应用层可以测试用户是否表现出足够的兴趣来了解更多信息并是否有潜在可能执行结束操作的可能性。在购买按钮启动后用户可以立即使用Vidy币,或WePay,支付宝,贝宝、信用卡来支付。所有通过按触嵌入式视窗获得的Vidy币,此时可以由用户获得,并用于一键购买时的支付。
购买价格显示为Vidy币,或是实时换算后的本地法定货币金额。如果通过Vidy币 进行购买,Vidy币会立即从购买用户的帐户中扣除,广告客户可以在几秒钟内收到付款。
此外Vidy的一键式购买模式配备最多2个可变按钮,当广告客户需要它们结账时来指定购买细节比如一个耐克的鞋子广告可以让用户在嵌入图层中选择尺寸,然后点击付费。同样,希尔顿度假村的一-则广告可以让用户选择他们的房间类型和入住日期,然后再预订。
尚未进入Vidy生态系统中的用户将在整个网络中看到Vidy链接,并且能够充分与他们进行交互并持有。但是如果他们想要开始兑换他们从持有中赚取的Vidy币,或者他们试图进行一次购买他们将被提示注册。一旦通过 身份验证,Vidy币收入就会自动记入他们的Vidy账户。在用户首次成功购买后,Vidy会将其送货数据锁定为智能合约,并在下次验证用户进行一键购物时预填具体送货信息。
Vidy进行了一项快速而肮脏的研究,检查了60多家主要在线零售商的购买页面,发现从首页随机选择的产品项目中,在被允许添加进购物车前,不到7%的网站显示了超过2个的可配置变量要求。大多数在线产品定制都很简单,这告诉我们整个购买流程可以加速,简化,并且完全位于用户了解该产品的同一层。
一键购买功能仅适用于白金Vidy币持有者,广告客户需要拥有并持有100万Vidy才能获得访问权Vidy币的可发行总额是100亿,这意味着全球最多只能有10,000家公司可以同时使用该功能。全球有超过1.15亿家公司,所有这些公司都需要做广告来发展业务,但其中只有少于0.01%的公司可以通过Vidy平台提供一键购买功能。
Vidy限制使用一键购买的原因有两个。首先,Vidy未来最大的焦点是为平台的利益和早期信任者带来长期的潜在价值。随着越来越多的公司了解并使用Vidy, Vidy希望建立一个对参与代理商越来越有用和高效的生态系统。第二个原因是因为Vidy希望构建和发展全球最强大,最具增值潜力品牌的名单,这些品牌采用Vidy的嵌入层,为用户提供真正卓越的体验。无论你是一个雄心勃勃的初创公司还是一个跨国零售商, 如果你相信Vidy并早日入股,你将有权访问这个定义板块。拥有自由市场决定谁可以革新人们在线购买东西的方式,基于以及先到先得的方式,这对为投资者、出版商和感兴趣的广告客户来说都是最公平的政策。
2.检测机器人欺诈
Vidy的应用层在后台运行专有的机器人跟踪算法,分析数百万用户的动作和行为,以确定使用模式并绘制出典型的用户行为路由。通过深度学习,Vidy的神经网络可以通过Vidy的签名保持手势和屏幕.上的其他细微的动作来了解人类及机器人如何与其视频广告互动。然后,当它标记人类用户和机器人用户之间的差异时,它会通过数据层的开源欺诈检测脚本自动扣除保留时间。
Vidy通过简单的反馈,如保持时间、保持定位、视频间距、滚动、辅助移动、保持表面积、屏幕位置区域、 手势一致性、用户配置文件背景和长会话活动,来评估超过20个数据点;直至进行更高级的用户资料分析,如宏操作,跨整个页面的扩展手势行为以及跨越时间的持续使用模式。
所有这些信息都被锁定在智能合约中,因此十分安全,任何第三方实体或个人都无法访问。只有Vidy数据层可以实时确定从应用程序层返回的数据是真实的还是虚假的停留,并维护执行。
当Vidy认为当前排队等待数据层添加到分类帐的保留条目已被机器人操纵时,Vidy币仍将向广告商支付,但将在分类帐中添加了“标记为审查” 条目,以便发布商可以通过他们的控制面板看到通知,监控这些警报的频率,并回应对他们提出的异议。一旦发布者帐户通过了“标记为审核”计数的可接受阈值(这 是针对平台上所有其他发布商设置的比率), 发布商就会从系统中移除。在删除发布商后,发布商网站上的所有当前嵌入广告活动都会终止,并且会提示发布商将其累积的Vidy币转移到其他钱包。已经分发给发布者的Vidy币也不被追回,即使对于被认为是机器人增强的保留条目,但是发布者将被禁止出现在平台上。
由于区块链的速度瓶颈使得有实时进行(预付款)欺诈检查的可行性,Rebel AI首席执行官普恩特斯表示,“与返回广告所需的毫秒响应时间相比,区块链太慢而无法成为实时欺诈预防和验证的工具。”这就是为什么Vidy使用延迟和解策略来不断优化其参与发行商的汇总,使其在支付后反复迭代成为一级玩家。
通过这种方式,Vidy促进了-一个透明的分散监控生态系统,并可以抓住试图从广告商盗取信息的战术机器人,同时通过消除分类账的所有长期影响,以至于有效地减轻潜在的财政损失。随着越来越多的用户与嵌入层互动,Vidy的人工智能不断学习,并在识别机器人活动方面越来越强大。用于检测恶意活动的数据层开源欺诈检测脚本基于Vidy的人工智能版本改进而定期更新的。
3.永远免费的产品
将Vidy的广告发布平台先搁置一会,重要的是强调Vidy提供了一个非营利的旗舰驱动产品,与其广告系统一起,为“可嵌入视频”提供全面的用例。本节将重点介绍Vidy的核心产品,并详细说明了它如何影响不想刊登广告的发布商。
Vidy在此基础建立了一个平台,可让发布商在其网页文字背后嵌入任何视频,不仅仅是视频广告。这些视频覆盖所有主题,所有来源、所有格式和所有.上下文。主题层面上,它们包括新闻演讲、预告片和采访、直至娱乐、事件回顾、体育亮点和教育课程。
任何拥有网站或移动应用程序的发布商都可以免费加入Vidy生态系统,并且无需连接广告即可使用Vidy的嵌入层。发布者可以使用全套的产品功能,包括Vidy的 自然语言处理搜索,软件开发 工具 包嵌入层,Vidy连接面向消费者的用户界面,让发布者在几秒钟内制作自己的视频的Vidy上传器,当然还有Vidy日益发展的社区和增多的策展人提供的数百万的精彩剪辑。无需合同,无需锁定,也无需广告需求,即向发布商提供这一完整软件包。Vidy将市场引入其核心产品,没有附加条件的让发布者适应控制面板和Vidy嵌入集的强大功能。那么,当使用Vidy嵌入层的发布商希望通过视频广告增加他们的收入来源时,他们只需点击控制面板中的“启用广告”,并立即在其网站页面中嵌入支持自然语言处理的视频广告。
无论广告商是否选择做广告,世界上都没有广告软件开发工具包为他们提供这种免费服务。Vidy希望首先通过重要的视频嵌入来改变在线市场格局,并且认为如果用户首先感到满意,并且他们的在线体验定期通过顶级发布商提供的优秀嵌入式视频内容进行修饰,那么丰厚的广告收入将伴随而来。
4.巧妙的移动索引
随着用户会话时间和用户关注度逐渐从网络移动到移动设备,广告行业各自在移动和网络之间的收入分配正在逐步跟进。
这意味着视频广告分发平台势在必行,它有望为出版商提供许多便利,就像网页能在移动应用程序上运行一样,并成为他们无处不在的最爱。然而,为了做到这一点,该平台需要能够抓取和索引移动应用程序页面,这对于现有流程和移动开发基础设施来说并非易事。与可以为.上下文广告进行抓取和索引脱机索引的网页不同,移动应用.上显示的内容通常是动态生成的,或者位于二进制文件本身中,因此无法定期访问和删除。
Vidy的解决方案是在运行时抓取合作伙伴发布商应用程序,提取关键字并将它们提供给共识层,从而实时投放相关视频广告。Vidy始终 认识到运行时的定时擦除方法所涉及的开销,并采用成本节约措施,以确保经济和功能的效率。
在iOS上有4个位置用于添加和编辑文本,因此有4个方法供软件开发工具包使用,除了按钮上的文本以外,还有输入视图、网页视图、文本视图和标签。借助Vidy iOS 软件开发工具包,移动应用发布商可以将Vidy平台的所有4个区域都读取为自动嵌入。安卓对文本显示区域也有类似的细分显示区域,每个区域都有相应的操作系统特定条款。
Vidy移动团队目前正在构建一个原生的iOS和原生安卓软件开发工具包对应的网页软件开发工具包,以便在移动应用程序上运行。移动软件开发工具包将在运行时激活,在所有合作伙伴应用视图中分析所有可用的文本页面,并将自然语言处理匹配与访问移动用户的数据相结合,以在他们正在查看的页面上嵌入相关视频。
5.众包完成一个互联网视频地图
作为面向消费者的更好网络实例,对于希望在其他网站上观看视频,并与Vidy互动的用户,无论该网站是否是Vidy生态系统内的合作伙伴发布商,Vidy团队将会开始在谷歌浏览器的扩展部署。
我们知道,Vidy的未来将由我们的用户提供支持和指导,尤其是当平台的功能不断发展来满足他们的需求时。谷歌浏览器扩展程序是我们向用户提供的一一种渠道,让他们在整个网络的所有数字领域留下他们的印记,并且我们希望这会让还不了解Vidy的发布商网站接口的人员开始了解Vidy。
借助谷歌浏览器应用程序,用户可以公开或私密地将视频嵌入到他们导航的任何网站的文本中,并且可以通过自己的用户个人资料获取他们在网络.上公共嵌入的属性。用户将能够看到针对任何特定部分文本制作的所有公共嵌入,并且将来可以通过评论,喜好和其他操作与其他用户的嵌入进行互动。
因此,在发布商自行完成之前,谷歌浏览器应用程序将成为最合适的视频资源众包给发布商页面的一种方式,发布商可以通过其控制面板访问此视频地图,以便他们从Vidy社区创意中获得灵感和想法。
每天运行谷歌浏览器应用程序的Vidy用户将获得15倍的Vidy币,用于支付他们积累的维持时间不运行谷歌浏览器应用程序的用户将不会受到影响,但将失去所持有支出的1.5倍收入增长。
6.嵌入层的社会前景
Vidy的嵌入层具有巨大的潜力,可以成为网络广告,电子商务和娱乐结构中社交联系和网络的驱动力。它运行在志趣相投的人们的交叉点,他们分享相同的兴趣,访问相同的网站,并看到相同的嵌入式视频;这些共同点形成了共享经验的独特纽带。
通过赋予用户语音功能,在嵌入式视频旁边发表评论,给予好评并撰写评价,并在嵌入层购买模块,平台.上会出现一种众包智能,帮助人们对产品和服务做出更明智的选择,并在他们浏览发布商页面时感受到彼此之间更多的联系。用户可以根据朋友的私人网络或普通公众过滤评论并可以始终管理其隐私。
广告商可以直接看到更多的观众对他们视频广告和产品的看法,并且可以从这些免费的见解中学习、迭代。出版商将能够衡量嵌入在其内容中的视频广告的宏观活动和语言情感的水平,并且通过与其交互的观众的反馈来检查其内容与相应广告商之间的主题相关性。
脸书和推特都看到了来自产品和服务广告的对话和评论流量,Vidy的嵌入层可能是其第一个分布式版本。
由于Vidy最初是围绕社交使用案例形成的,因此它非常倾向于社交媒体的倾向,核心产品是有效增强消息传递和社交消费者体验。在社交层面.上,用户可以互相联系,视频广告可以通过社区审查,广告商和发布商可以利用实时互动。
技术执行
1.播放广告的唯一区块链应用
今天市场上有一些很棒的广告区块链项目,它们已经提出了对破碎的广告格局进行分散替换的方案。尽管有很好的概念,但事实是,区块链对于当前的生产级广告整合(加载时间)具有重大的技术限制。目前,通过区块链处理广告请求花费的时间太长,特别是与当今即时页面加载速度和短接用户注意支架并置时。对于分布式共识层来说,区块链响应时间平均长达30秒,以便共识层同意在横幅空间中放置广告,这使得区块链在当前生活的任何网页上加载广告的速度非常缓慢。Rebel Al的首席执行官曼尼.普恩特斯和行业的正式作家都非常认同这个问题。他确信, “由于其分布式性质,全球矿工验证交易,区块链技术无法足够快地分析或处理实时广告交易。当前添加到公共账本的确认交易的确认时间在10到30秒之间。”
在一个共识驱动的生态系统中,速度是网络可靠性的先例和限制,不幸的是,这-延迟将使区块链项目无限期地与广告空间无关。分布式平台的强大程度与其最薄弱的环节一致,因此即使是拥有顶级硬件和互联网速度的矿工网络,也始终受到最慢环节链的阻碍。正如普恩特斯进一步指出的那样,“程序化广告所需的规模和速度意味着基于区块链的平台还有很长的路要走”。事实上,除非克服这个限制,否则任何基于广告的区块链项目都将成为革命性的梦想, 而不是可执行的现实。
Vidy也同样受到区块链速度瓶颈的阻碍。然而,凭借与众不同的设计,Vidy通过在文本之后预先加载资源来有机地操纵它,而不是以简单的视图方式。后者将对用户产生明显的延迟,这对于广告商而言是不可接受的。实质上,如果Vidy通过其共识层加载横幅广告,用户将不得不等待10-30秒本能看到它加载,这是不可接受的。但Vidy不必立即加载横幅广告,相反,它会在页面文本背后的视频广告中预加载,超出用户首次到达页面时的视野范围,因此没有因特定内容产生明显的等待时间。通过这种方式,Vidy的区块链解决方案可以在推出时立即集成到发布商页面上,而无需等待该行业范围区块链问题的性能解决方案。
2.将如何应对扩展
区块链非常难以扩展。 目前,针对每秒可实现的交易次数的限制公开许可的区块链数量受到限制,该数量固定在较低的点。以太坊通常每秒钟处理大约10次事务。我们已经引入例如提高每个块的处理的最高速度一个常数因子的一些修正,但这些只是短期解决方案,这意味着随着世界以太坊当前的指数增长,我们将很快再次最终回到原点。雷电网络基于支付渠道技术,其独特之处在于能够随着用户数量的增加而扩展,因此是最佳的支付解决方案;这意味着,随着雷电网络规模的扩大,其处理能力也随之增加,基本上没有上限。Vidy系统将利用以太坊主网络和雷电网络在三方之间建立一个Vidy转账支付的直接渠道。
VIDY技术
凭借其人工智能引擎和众包的管道系统相互配合工作,Vidy整合了网络,上最好的视频内容,并在几秒钟内以小尺寸的形式提供亮点,称为vidys。该系统的结果是,Vidy已经发展成为一个涵盖数千万视频剪辑的内容数据库,现在所有剪辑都可在发布者页面创建过程中免费访问。
Vidy系列中的数十种微服务和数以千计的服务器聚合在一起,共同促进内容快速检索,直至精心设计的内容被消费。Vidy资源摄取,录制,转录,分析,标签,转换,修剪,索引,下订,策划并提供跨任何主题域和语言的视频集锦。
Vidy通过其获得的专利自然语言所支持的搜索提供内容,该搜索根据其中说出的单词显示视频内容。虽然以前的搜索引擎允许用户通过关键字,主题或主题标签搜索视频,但通过Vidy, 您可以通过查询视频中的实际词汇来搜索视频。这提供了内容相关性和细粒度可发现性的元素,这在更大的搜索引擎行业无法做到。
现在,我们正在采用技术中最重要的组件–NLP搜索和分配算法,使源代码开放,以便它能成为用户至上的分散的分销平台。
Vidy的单页嵌入图层适用于任何具有在线文本的内容,包括文章,网页,列表,社交帖子,评论部分,数字图书,pdf以及通过OCR的图像和视频。
1.Vidy的分割神经网络
Vidy每天都会关注其嵌入式视频的外观和用户界面,因为在现有页面.上需实现视频间的无缝交互对话。为了让这种体验变得轻松自如,Vidy开展了一个项目,通过独特的转换来处理其视频数据库,以便视频的发言人暂停时跳出页面。为此,Vidy已经研发了一个卷积神经网络,可以在任何视频帧中分割出主要说话人的脸部和身体。通过对视频图像进行深度研究,Vidy增强其数字外观,将剪辑的消耗推向了极限,以便当某人与您共享一个视频时,或者您在网上看到视频时,让您知道那是来自可识别视觉特征的Vidy数据。
Vidy的卷积神经网络分割API的运行,依靠的是数据库中的所有视频广告,里面有广告商添加到其活动仪表板的所有新上传的视频。 分割后,Vidy然后将2-D全息蒙版应用于视频。
该视频输出版本及嵌入的基本版本将免费提供给所有广告客户,这样可以使上传的视频保持现有的高宽比。广告客户可以在使用它们之前,根据不同的高宽比,分割类型和蒙版效果定制其嵌入的视频。
Vidy的图像分割技术利用了最新的深度学习技术,并依靠大量的标记数据来研发深度神经网络该技术可以高精度地从背景中分割视频中的人物。该网络基于最近的MASKR-CNN,它是最先进的网络实例分割。原始网络由多个残留块组成,并具有两个分支,一个用于分段掩码,另一个用于分类标签。分割分支用于卷积层与残余块的连接并输出分段掩码,而标签分支则用在完全连接的层来输出对象的类别。由于Vidy平台.上的中央使用案例只需要将人物分割为前景,而不需要对对象进行分类,因此Vidy仅保留网络的分割分支。在试验期间,输入包含人的图像,而事实上该人的分段掩码。每次我们都使用以下公式来更新网络的权重:
这里x是预测的分段掩码,y是地面实况掩码。在整个图像上对所有像素的损失进行求和,其中每个像素p是前景(1) 或背景(0)。预测x是介于0和1之间的数字,而它是前景的概率。我们研究网络,使输出掩码x与地面实况y-致,同时降到最小损失。实验结束后,我们使用较为成熟网络对视频的每- -帧进行分割,以将人从背景中分割出来。该网络拥有高精度结果和实时处理能力。
2.防止不当内容
除了对提交的视频广告的转录数据和广告商指定的关键字进行权衡之外,Vidy还对所有.上传的图像进行识别,以评价其适当性。Vidy的内部图像识别算法建立在SIFT之上,能够识别视频中熟悉的人物,场景和人脸,以确定哪些广告素材可以放,哪些不能。
Vidy还专i ]针对裸体和极端暴力研发了图像识别模型,这些模型建立在Facebook的开源项目之上,如DeepMask, SharpMask和MultiPathNet。 Vidy对数据库中的所有视频上进行面部识别和自己的内部人脸脚本检测,以在调整剪辑高宽比时跟踪其输入坐标的主面。因此,广告商拥有大量的自定义控件从放大视频扬声器到改变边界比例等多种方式展示广告。
当Vidy检测到裸露或非法图像时,它会标记并锁定视频上传并通过控制面板通知广告商。通过这种方式,Vidy可以主动地让出版商在他们的网站.上处理不适当的内容,并保护用户免受侵扰。
3.打断搜索状态
近二十年来目前的搜索环境一直停滞不前。 它是建立在一个单一的中央化的运营商框架之上的,例如美国的谷歌或中国的百度,主要垄断了该地区所有人的所有信息数字门户。
这种中央集权威胁到使用者的自由,安全和进步,因为所有关于提供什么信息,包括何时,何地和如何皆由独裁者控制。
随着时间的推移,它也破坏了引擎本身的效用,因为逆向变化的可能性越大,内部团队必须作出反应并适应的市场外部因素就越多。私有化搜索毕竟不是一个公共事业,公共事业能最大限度地维护公众最大利益,但私有化搜索会回避法律法规。资本家认为,在竞争激烈的情况下,利润压力使私人公司在资本主义社会中保持诚信经营,但当你反观搜索行业时,没有了竞争。
因为所有集中式搜索引擎都具有相同的特征
它们拥有一个通过各种全资应用程序访问的核心财产,它们几乎没有竞争,并且由它们支付的入站流量支撑。这建立了一个利润驱动模型,其中向用户的信息流总是锁定在搜索引擎获得的利润价值.上。这当然是免费知识和信息分配的对立面。
而Vidy则与众不同,因为它通过区块链反转了搜索模式。通过共识层分散视频搜索服务,许多矿工进行实时广告投放,Vidy能够创设生产级实用程序,并匹配以受开放源代码NLP模型驱动的必要可扩展精度。
Vidy的嵌入层SDK在众多不同的平台上运行,赋予众多(而不是少数)平台控制所有嵌入视频的命运和输出。Vidy通过智能合约把信息集装化,来保护其用户的真实性,身份和安全。谷歌和百度通过数据收集将真实身份关联起来,并传输给众多服务,他们通过销售这些独家的数据而获利,而Vidy则不同,Vidy为广告商,发行商和用户提供了完全成熟的透明度。
Vidy的NLP协议
Vidy生态系统运行于自然语言处理的NLP (简称NLP),上, 作为推动所有投放实时视频的决策的燃料。Vidy团队多年来在自然语言领域开发了专业知识,这也是我们对第一一个分 散式NLP布局协议的设想的可能性。本部分将介绍NLP背后的基本前提,该领域的历史进展,以及Vidy将目前的实施方案,这些方案与过去颁布的分销平台并列。
1.什么是NLP?
NLP是计算技术在分析和合成自然语言和语音中的应用。
NLP涵盖了从语音识别和语言生成到自然语言理解的广泛领域。
自从20世纪90年代的统计革命以来,大多数自然语言处理都是建立在机器学习的基础上的,因为基于监督工程和人工规则的方法已经被证明在研究和生产领域中非常耗时,不可扩展而且不成熟。因此,统计推断已经成为一种流行的方法,用于从广泛分析正确和不正确示例的大型语料库中学习一系列规则。
机器学习驱动的自然语言处理领域从早期的决策树经历了漫长的过程,在这些决策树中,系统受到严格的即时规则管理。今天,统计模型方法被广泛使用,其中基于实值权重或输入特征向量来进行软概率决策。
成功的NLP策略的关键在于根源于所建立的联系的细微差别,特别是通过向量分配在多种不同的可能答案中表达相对确定性和不确定性的能力。以下部分将深入分析构成VidyNLP算法的输入列表以及适用于所有视频广告分发的精细方法。
2.Vidy算法分解
Vidy构建了一种先进的多层面方法来确定自然语言位置,通过深度学习和基本的词性定位进行。语言分析是一项复杂的任务,因为思想可以通过书面文本传达出众多的风格。因此,在努力理解单词和短语本身的整体含义时,了解整个文档的每一行和上下文变得极为重要。
正如Vidy在其基于区块链的分散式平台架构中使用分层方法一样,它还使用NLP策略的图层来实现系统过滤,多维分析以及更好地缓解偏离的情况。Vidy的NLP漏斗中的每个降序层越来越细化,因为它专注于句子的不同定义区域。所有这些层面共同运作,并会在瞬间决定相关的广告投放,从而使这-策略既深入透彻又高效地实现大规模可伸缩性。
在最基本的级别上,Vidy的自然语言处理通过结构提取和标记化将字符流转换为一系列词汇项(关键字,关键短语和句法标记),这些结构提取和标记化将划分为针对其他代币进行处理的标记。
刚开始Vidy查看已被摄取系统索引的发布商页面的广泛笔画。Vidy首先对发布商页面进行自动汇总,合并所有句子并输出描述该页面的关键字和关键字词组(多个关键字/短语的片段)。这包括通过最大边际相关性和基于图形的textrank提取摘要技术,以试图突出显示发布者页面中最多的信息子句。Vidy通过评估由该特定页面,整体网站和品牌(伞式关键字)的出版商手动提供的关键字来自动形成汇总。这些分析与其他分析结合使用,以便进行实时比较,并通过自动化和手动输入实现对更多文本的更强大理解。
然后Vidy将这个概述和一系列更微观的层面.上的发布者页面进行分析,以确定句子本身的含义,关键词的共同性,讨论的主题的更大的情感以及编译的可辨别参数列表来了解每条线的情况。
Vidy的NLP协议的核心部分包括情感分析,它需要从文本语料库中提取主观信息,并强调其在意义,情感和意见中的极性。通过认真思考这些极端情况,Vidy可以将大多数视频广告彻底地过滤为更有针对性的广义的情感集合。情感分析是一种 更高级别的方法,它靠近Vidy放置协议的漏斗顶部进行,因为它只提供对相关内容进行宏观过滤并具有匹配的广告资源。但是,当相反的情绪被分辨出来时,无论匹配向量多么高,它都会超过页面,上的任何决定位置,因此与网页的更大情感相反极性的视频广告决不会放在发布者内容那个位置。
这有助于确保广告客户不会将他们的视频广告置于不恰当或不相关的广告库存位置,并且发布商不会面临投诉和删除请求。今天广告错位的最大原因来自发布商页面中与语言相关但内容不恰当的匹配方式。这是许多公司正在努力克服的一个严重的问题,正如早些时候谷歌和Facebook所提到的那样,在尝试手动缓解这一方面的挑战进行了重大的年度投资。Vidy通过 自然的可扩展方式解决了这个问题语言方法,并通过稳定的性能校准,同时也为发行商提供最终决定权,以指定他们不希望在他们的平台.上登广告的广告商,同样广告商也可以指定他们希望避免将哪些发布商置于其中。
Vidy的协议主要信息收集层之一就是每行文本中的参数。参数可以包括列举(从一系列预定义的命名事件)到例如位置,日期,时间,数量,联系人,距离和持续时间等详细信息。 参数不仅有助于简化下游处理,还因为它们通常用作句子中的锚点。例如,功能,目的和目的实例通常是由句子的实体和影响它们的参数之间的关系收集的。
Vidy算法的顶级参数认为命名实体识别是一种手段,用于表示参与广告商及其产品,服务,合作伙伴和竞争对手的专有名词和公司名称,以便更好地将视频分配给关键字。这里采取一揽子方法, 在这里采用公司名称,备用名称和其他高知名度名称,并将其视为与排队的视频广告展示位置“相关”或“无关紧要”。指定实体识别的分裂特征包括首字母缩写标准化,Vidy同时运行以确保与命名实体相关的所有首字母缩略词都被考虑,以及正则表达式提取,可让Vidy从文本中拉出标签,电子邮件,URL和其他类似实体。
然后Vidy通过在解析出名词之后进行关系提取来进一步提高名称实体识别的效率,可以特别关注在页面上的指定实体之间识别的关系。例如,一篇关于可口可乐的文章可能会提到Pepsin新的软饮料,而Vidy则认为这两个命名实体都是竞争对手,并承认百事可乐的产品名称。然后,尽管事实上“软性饮料”是可口可乐视频广告的相关关键字,但它会使用这些信息来消除视频广告中的这一句子,因为主题与可口可乐的视频广告活动之间存在不相关性和冲突。
作为最后一步,Vidy通过将所有识别出来的名词与大部分文本中所有各自的代名词进行匹配,从而能够区分不同句子与原始名词的典故,从而更好地对所讨论的命名实体进行上下文理解。这种技术可以作为对关系提取的额外支持,因为段落中的后续陈述经常用代词来描述,而不是在谈论同一个实体时重复名词。
随着Vidy从其NLP协议的顶层转移到更深入的粒度,它将着眼于词法化,随机语法分析,复合词处理,单词含义消歧和共识解析,以便更好地提取它正在扫描的短语的含义。这些采用的技术代表了Vidy的NLP多层协议的中间部分,下面的段落将对每种协议进行简要说明。
词形化使用一个语言词典来将单词变化准确地减少到更简单的词根。这是-种比词干更为完整的缩减和简化,它是一种基于规则的模式匹配技术来去除标记后缀。复合化也是一个较小的词形化,有时需要用于其他语言的特定词。
随机语法分析是确定给定句子的分析树的过程。在随机语法分析中的两种解析类型包括依赖解析,它着重于诸如句子谓词和主要对象之类的单词之间的关系,以及通过概率上下文无关语法构建出解析树的选区解析。
复合词处理是一种统计信息检索技术, 它由匹配复合词汇组成。查询扩展是一个众所周知的类似实践,但专1 ]建立在面向消费者的搜索引擎中的信息检索上。复合术语处理的一个例子是复合术语“命中三重基础”。对于没有先验知识的更多技术性段落,以及将两个或更多个自由语素结合以创建具有独特含义的复合词时,这显然是一种更比较普遍有用的方法。
词义消歧是指对一个词或一系列具有多种含义的词进行适当含义的选择,这些词通过基于其网站内容性质为每个发布者离线生成的关联词义列表执行。虽然人类的思维尤其精通,但在机器学习领域实现高效的单词意义结果一直 是NL P领域面临的挑战。Vidy的程序使用监督式机器学习方法,其中在手动注释的示例语义的语料库中针对每个唯一词训练词义消歧分类器。
最后,共识解决是识别哪些词指代一行文本中的相同对象的过程。这意味着通过诸如“他从玛丽的房间走向起居室的窗户”等提及的表达方式来建立关系,其中“起居室的窗户”作为联系“玛丽的房子”和“窗户”之间关系的参考表达。Vidy使用这种方法更好地理解描述性复合句子边界内的引用。
在其分层协议的较低层次上,Vidy进行话语分析,该话语分析着眼于句子的阐述,解释和对比以确定连接文本的话语结构。话语分析还认可和分类句子中的各种言语行为,如断言,是一否问题和感叹语。这项技术的范围从基本的词性标注到更高级的内容聚类, 通过短语检测和词汇语义来确定中心主题的话语,以便与上传的视频进行比较。词汇语义,特别是在短语或更大的段落中,单个词的计算含义的确定。
这些方法最终有利于对索引发布者内容的整体自然语言理解,这是所有这种系统语言分析的主要目标之一。
自然语言理解是将文本转换为形式化的一阶逻辑表示,这些表示更易于操作,处理和计算。这涉及从句子的自然语言表达中理解预期的语义。
3.协议的最低级词嵌入
在Vidy的NLP协议的最低级别是词嵌入。词嵌入是执行漏斗中最后一项强大的技术,因为它允许Vidy将其攻击计划简化为所有先前分析的图层之上的一个聚焦和最终的神经网络。词嵌入是映射到具有较低维度的连续向量空间的一维每个词的 数学 嵌入空间。
基本上Vidy生成了几百个不同维度的向量空间,并为训练语料库中的每个独特词汇分配一个向量。当语料库中的词语具有相似的含义或语境时,Vidy将它们放在-起放在向量空间中,作为映射跨越一大堆词语的语境相关性的一种手段。尽管存在许多用于词嵌入的生成方法,跨越概率模型,显式表示和矩阵降维,但Vidy协议关注于深度学习方法。
Vidy采用了Word2vec以及FastText和GloVe等其他一些最好的方面, 并在Tensorflow上建立了自己的专有内部深度学习模型。Vidy的神经网络接受了Vidy积累并定期添加的数十亿数据点的数据库的培训。这些数据包括关键字,短语,段落和文档,这些关键字,短语,段落和文档都是由Vidy的数十位数据管理员团队自动和手动标记的(如下图所示,典型的培训样本游览图)。Vidy今天对NL P领域的其他任何玩家的竞争优势是它必须训练的大量干净的数据,它在过去几年投入了大量资金和人力资源来培育。数据是AI的引擎。
在进入Vidy的神经网络组件之前,下面简要介绍这三种基准方法:
a. Word2vec是一组浅层双层神经网络模型,通过重构语言的语境来产生词语嵌入。Word2vec接受了单词数据库的培训。这意味着当它遇到一个没有出现在被训练的语料库中的词时,它在匹配或识别它时遇到了麻烦。Sen2vec是用于识别匹配句子的项目版本,Doc2vec是经过训练识别匹配的完整文档的更大项目的版本,是Word2vec的另 外两个实例,它们在不同情况下也很有用。然而,Vidy并没有在生产中使用它们。
b. FastText (快速文本)是Facebook对Word2vec的回答。 它是用于确定单词向量表示的无监督学习算法。它与Word2vec相同,但不是专注于单词,而是训练字符。这使得它可以识别和理解它从来没有使用或训练过的单词,而Word2vec对任何不在其训练集中的单词都会失败。
C. GloVe是全球矢量的缩写,是斯坦福大学以外的一个开源项目,也是一个分布式词表示模型。与其他两个类似,GloVe是一种无监督学习算法,用于获取单词的向量表示。它是根据来自语料库的汇总的全球单词对词共现统计进行训练的,GloVe的输出是单词向量空间的线性子结构。
Vidy协议在其低级架构中使用这些项目的元素,并通过对其数十亿点数据集的培训进行扩展。Vidy的嵌入式神经网络方法不仅适用于单词对单词的向量表示,还可将句子分类为跨页面主题识别的一组类别和关键字。提取有意义的标签以匹配视频广告的关键字有助于通过局部过滤更快速地实现干净的匹配,并且更重要的是有助于使可用的排队视频集小得多。下图显示了将城市映射到国家和描述性术语的示例。
尽管Vidy协议的顶层结合了命名实体识别,关系提取和指代分辨率的方法,但Vidy的底层更进一步,并采用了精简的术语提取, 以便衡量这种特定页面的多少,以及对该特定页面的重要性到所有索引页面),一个术语可能适用于特定的发布者及其内容。Vidy通过分析数百万页索引中的该词的出现,然后在与同一平面上的所有其他矢量进行比较对该词进行打分来实现向量空间确定。Vidy同时使用基于字典和基于复杂模式的抽取技术,与罕见的术语抽取技术相结合,通过脱机渲染的主要术语列表来识别发布商网站中的代币序列何时出现。
这里的想法是类似的词语出现在类似的语境中,这就是所谓的分布假说。将单词表示为其上下文的预测的概念,从而产生嵌入在向量空间中的单词的连续表示,对于该单词的语义表示而言,结果是非常稳健的技术。代替连续的单词方法,根据其.上下文预测单词(如. 上图所示),协议选择一种跳过单词方法来预测哪些单词在给定目标单词的上下文中。
以下是该方法的工作原理。我们首先从对语料库的检查中构建一个词汇表,标记出我们发现超过n次的所有单词并将它们添加到集合中。然后,对于编译后的词汇集中的每个词,我们初始化两个向量,由维度和向量随机化。这两个向量一个是表示单词,s含义的目标向量,另一个是表示单词上’下文的上’下文向量一分配给所有单词并组合在一个矩阵中,给我们两个|V| D矩阵 , 其中D是维数,| V| 是词汇表中单词的数量。
这两个矩阵被称为嵌入矩阵(容纳每个单词在词汇表中的主要嵌入)和上下文矩阵(其容纳每个单词的上下文嵌入)。 我们的目标是训练D维目标向量(从随机值开始)来预测它们的上下文,从而表示目标词的含义。对于我们在其.上进行的每一个训练周期,我们从语料库中抽取一个目标词wt,然后估计给定目标词wt的上下文词wc的概率:
这个softmax函数将值V设置为词汇表中所有词语的列表,u是来自上下文矩阵的向量,v是来自嵌入矩阵的向量。这意味着.上下文单词概率是目标矢量和,上下文矢量的函数。只计算词汇表的全部概率分布将导致产生上下文词概率。之后,我们通过使用梯度下降的目标和上下文向量反向传播预测误差,以便最大化上下文词汇集上的对数概率Cwt
我们通过|反向传播Cwt|上下文矩阵中的单 词以及每个后续训练周期的嵌入矩阵中的-一个单词。这样做的目的是使目标词有效地预测其.上下文单词,目标是使所有目标单词集T上的平均对数概率最大化
你有更多的词的话,这个过程就变得非常昂贵。一百万字的词汇成为一个巨大的挑战,以保证在每次迭代过程中产生高效的概率。为了解决这个问题,2013年Word2vec创建者Mikolov提出了一个负面抽样函数,这样就可以取代在整个词汇表中计算softmax,而只是抽取一些没有出现在当前上下文中的单词,然后修改最大化目标是一个二进制分类任务,它使用sigmoid函数来估计一个单词是否属于该上下文。这为我们带来了一个更有效的最大化目标,具体如下:
该等式将N的值设置为负样本的集合。通过目标,背景和负样本向量反向传播目标的预测误差,我们类似地更新模型,同时享受效率的巨大提高。在负面采样情况下,我们调整嵌入矩阵中的一个字和|C|+|N|上下文矩阵中的单词。随着每个训练周期的进行,嵌入矩阵逐渐包含对词汇表中每个单词越来越有意义的矢量表示。
Vidy的神经网络实现的一个组件也受到应用于字嵌入的图像识别模型的逻辑和结构的启发。虽然图像基本上是一个像素矩阵,但是一个句子也可以被认为具有同样的意义。然而,这个句子不是像素,而是一个2d的单词矩阵,你可以将它用于计算机视觉技术以识别文本。
在这个矩阵中,你有-一个由n维向量表示的单词,就像图像中的一个点也是一个n维向量。对于句子中的每个标记,我们使用单词嵌入(每行嵌入一个单词)来获得具有固定尺寸的矢量(尺寸为d, 长度固定为n)。所以输入是一个2维矩阵(n, d),它类似于使用CNN的图像。当比较图像以确定相似性时,您将- -幅图像中所有矢量的匹配得分与另一幅图像中的所有矢量进行比较,并且这里的相同练习用语言来完成。即使是缩放方法和生成图像聚类中心的代码以及图像识别方法中的高效匹配, 也直接应用于该协议层。为了解决困扰所有雄心勃勃的识别项目的维度诅咒,这些项目将大量维度打包到每个向量中以获得更高级的匹配能力,该协议采用了产品量化,该量化已被证明是用于最近邻居搜索的强大而通用的方法。
4.提供协议
Vidy在获取,提炼和发送进行NLP匹配所需的信息时执行两项主要任务。第一个是发布方的索引组件(抓取文本并通过协议的最上层进行准备),第二个是广告客户端的内容预处理组件。
当广告客户将视频广告,上传到Vidy平台时,Vidy会 在其上运行信号处理音频清理算法,以消除任何非固定的噪音和其他干扰,然后通过语音到文本引擎转录视频。它还为每个发出的单词添加时间戳。在录制上传的视频后,Vidy采用句子边界消歧,这是一种句子打破技术,即使在转录输出中没有标点符号来帮助分割,也可以划分句子边界。这是为了进一步了解短语之间所说的内容的含义。从那里开始,视频广告的一般情绪被标记并列在Vidy随文件存储的元标记关键字中,以及广告客户在.上传时为视频广告提供的手动输入的关键字。
一旦这些信息被打包并发送出去,它就会达到共识层,这是对两个布局决策层面的划分。第一个平面纯粹是由所有矿工运行的开源协议驱动的NLP级别;第二个平面位于用户配置文件过滤级别。然后,将用户的人口统计资料通过一系列数据点构建并锁定在智能合约中,然后将其应用于所有NLP匹配,以筛选该访问的正确嵌入;并且输入以下内容:
·通过关键字和自动汇总的更大发布者页面的上下文
·通过关键字和自动汇总的大型发布商网站的背景
·通过转录,摘要和广告客户关键字的视频广告背景
·索引发布者页面上所有适用句子的关键字提取
·一组匹配的视频广 告排队等候转移到第2阶段的配置文件分配
·通过人口统计和访问者数据进行用户档案检查和进一步过滤
·根据广告客户的广告系列需求,将选定的视频广告投放到相应的发布商文字中
·根据数据层反馈重新校准所有已投放广告的效果
随着数据层接收关于视频广告表现和用户特定的嵌入广告活动的反馈,NLP匹配的评分将迭代进行调整,并将这些评分反馈到主题矢量分配中,以获得更好的未来表示分配。
对于在发布商页面中确定将所有短语嵌入到所有符合条件的短语中的哪些短语进行选择时,广告系列需求是一个普遍的决策者。除了提取摘要建议之外,不需要确定与页面相关性相关的短语相关性,也不需要在进行NLP+人口统计匹配后使环境相关性取代纯粹的广告活动需求。其原因在于,购买的整体广告支出和广告系列展示量在一天结束时仍然驱动广告平台本身,并最终决定视频广告在托管发布商网页中的频率和位置。
关于更多 Vidy 信息: https://vidy.com/
更多区块链项目:http://www.qukuaiwang.com.cn/news/xiangmu
风险提示 :区块链投资具有极大的风险,项目披露可能不完整或有欺骗。请在尝试投资前确定自己承受以上风险的能力。区块网只做项目介绍,项目真假和价值并未做任何审核!
声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
以上所述就是小编给大家介绍的《Vidy基于以太坊开发的新一代无缝嵌入技术》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 腾讯云发布新一代数据库,支持企业低成本无缝“上云”
- Android 视频无缝切换2.0
- 漂亮~pandas可以无缝衔接Bokeh
- H5移动端获奖无缝滚动动画实现
- 进阶运维:SSH无缝切换远程加密
- 支持企业无缝上云,CynosDB应“云”而生
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Python Algorithms
Magnus Lie Hetland / Apress / 2010-11-24 / USD 49.99
Python Algorithms explains the Python approach to algorithm analysis and design. Written by Magnus Lie Hetland, author of Beginning Python, this book is sharply focused on classical algorithms, but it......一起来看看 《Python Algorithms》 这本书的介绍吧!