金色财经讯本期金色沙龙将以区块链行业数据挖掘和解读为主题,邀请Chaindigg创始人/CEO 叶茂、BTC.com CEO 庄重、PeckShield创始人蒋旭宪、TokenInsight CEO 呼涛、同济金融人工智能协会会长乔烨、链塔智库CEO张翔、港盛科技CTO&联合创始人史亮、拾斗量化创始人牛神、库神COO,联合创始人 张玉等业内知名人士进行观点分享。
在本期金色沙龙最后的圆桌论坛环节,BTC.com CEO 庄重、港盛科技联合创始人cto史亮、链塔智库联合创始人于睿、chaindigg创始人叶茂、拾斗量化创始人牛神、库神联合创始人coo张玉,在金色学院创始人安鑫鑫的主持下,就“区块链数据挖掘及应用”话题,展开了精彩讨论。
安鑫鑫 : 今天的主题是数据,大家刚刚听了各位嘉宾的分享,有没有一些思考呢?在这个行业里面,数据是大家不太关注的一个企业类别。但是它对行业的价值,是非常大的。数据主为分为两个大的方向:一个是链上数据,可以反映出来很多方向;另一个是交易数据,是偏金融、行情的数据。接下来从不同的角度和各位嘉宾,再深组分享一下,再讨论一下。
很多嘉宾都是有非常强的传统数据或者传统金融的背景,所以 第一个问题 是: 与互联网大数据挖掘相比较,区块链领域的数据挖掘,有什么相同和不同点?
于睿:我们观察这个行业有几点很有趣:和传统互联网相比最大的不同, 传统互联网行业 是 先兴起, 才 有数据。但是在区块链行业 则相反 ,数据研究机构 是在 推着行业往前走。 这个背后的逻辑不同之处在于,面对的客户需求不太一样。我们观察这件事遇到了很多尴尬,比如链上的数据,我们做了很多调研,想去参访这些用户。但大家给我们的反馈,你就告诉我买哪个能赚就行。这是在座的各位,应该去琢磨的事,这是区块链的一个特点。
第二点,真正推动这个行业的发展,大企业和传统企业还没有进场,我们怎么通过数据吸引他们进来,这也是一点。
张玉:因为我做钱包之前,一直做人工智能方面的事情,主要给银行、保险公司做数据分析。我谈一下我的理解, 传统互联网和区块链数据挖掘不一样,从数据形态来看,目前区块链数据以结构化数据为主,非结构化数据 ,例如 像语音、图片,还没有大规模上链,所以现在数据量还是比较小。第二是量,虽然刚刚统计数据有很多T B ,但是跟任何一家银行、保险公司的量都没有办法比。所以在量和形态上,有很大的差距。第三,从分析方法来看,传统的数据挖掘主要是做异常检测、放量分析等 事情 。目前来看,区块链还在这个范畴之内,可能会偏统计一些 , 真正的数据挖掘的工作才刚开始。
第四,关于应用场景,从深度来看还比较初级。在传统金融行业,已经从业务层面,比如从获客到风控、运营、服务,每个环节都有非常多的业务场景。 区块链目前还主要服务于交易,所以在分析深度上,还远远没有达到这么深的层次。
叶茂:先说一下我的观点。关于传统数据挖掘跟区块链数据挖掘的异同点, 相同的地方,整体的基础框架是类似的,是用类似的方法做数据的分析、关联、挖掘,基础框架是类似的。特别是区块链里面一些非链上数据,比如我们抓取数据,会提取论坛、网站的数据。这些数据跟传统的大数据挖掘更相似,用到的方法也相关。不同点在于哪?一方面区块链的链上数据它有一个特点,区块链的链上数据会有分叉的该。分叉意味着,如果要做实时的数据挖掘,我们要关注后面最新的区块怎么来处理数据的变动。如果没有处理好这个环节的话,数据通常在我们的结果里面,在某些时间点上,出来的数据是不太准确的。所以分叉怎么去处理,这可能跟传统不太一样。第二方面,因为在区块链里面,有一块是链上数据,链上数据很规则,它包括区块、交易和规则。我们还要结合非链上数据,就是刚刚讲到的从点论坛、暗网拿过来的数据。这类数据跟链上的数据如何关联进行挖掘,这一块也是一个要考虑的。这不是一个纯数据的关系,会有这么一个差别。
史亮:我之前在传统金融做了十多年,所以对传统金融IT和数字资产的IT有些了解。对于刚刚叶总讲的我非常认同,其实数据挖掘,就是大数据、人工智能如果大家真的关心,并且想在区块链行业未来做这块的话。原先在互联网里的一些技术,或者对应的基础框架是可以照版照用的,这是过去五年积累的非常有用的。 差异点在于,区块链是一个有序的数据,所以它把原先互联网上一些无序的数据存储直接在底层进行了有序,所以它的数据可靠性更高。 大数据分析做人工智能数据挖掘的时候,有很大一部分时间用在数据清洗上面。一些可靠性不高、波动的数据,甚至历史的数据会有变化。这些在未来区块链应用的时候,这些情况会变得更加好。所以到时候整体的数据存储,会变得更加可靠、有效。在数据抽取、清洗和规格化方面,我相信原先投大量资源在人工智能和大数据上做的事情,通过区块链底层,就可以省下来了。像分析的方法,这个部分一定会在区块链上面大放异彩的。
庄重:刚刚各位嘉宾聊了,区块链上的大数据有一点,最初做区块链行业的人不太多,偏统计的比较多一些。随着这个行业的发展,这一步门槛过了以后,重新去发掘大数据领域积累的技能。我们也是有一些困惑,有些数据信息怎么样让普通用户觉得是有趣的,另外提供这样服务的时候,怎么保证有公信力。因为一些链下数据的抓取,存在一些公信力的问题,这也是我们在产品上遇到的一些困惑。
安鑫鑫:刚刚大家聊到这个行业还是很初期,很多在通过数据推动行业的发展,整个数据的产业也处于初步阶段。 接下来大家站在行业的角度上,思考一下数据这个板块,因为在座的朋友更多是一些从业者,大家在看一些方向。在数据板块,哪些方面未来还有机会,以及一些瓶颈,难点在哪?
庄重:跟各家厂商的定位有关系,因为我们自己的定位是面对不同的区块链爱好者,包括一些开发者。从我们自己的角度出发,我们是更希望自己是一个只提供最客观数据的提供方,同时怎样让开发者在接入我们API的时候更方便,查询接口也更友好。也是怎么样能够基于我们平台,可以做一些比较复杂的查询任务,或者做一些定制化的需求。我们自身比较希望偏技术一点,希望让用户自己在上面发掘探索出,基于这些数据想要达到的效果。
安鑫鑫 : 接下来有没有一些大的方向的规划呢?
庄重:首先是API的易用性。今年会看目前的情况,会类似推出一个,你可以在我们平台定制一些比较复杂的企求,这些企求不是实时返回的。我们想给开发者做一些深度的支持。
安鑫鑫 : BTC.com,大家平时有用吗?我用得最多的是上面查地址、查交易。
庄重:关于地址的话,可能会在今年推出一个新的改进。当然是比较初级的,就是针对一个地址,我们会尝试给你反馈,我们认为它们的关联性,这样对于呈现一个比较完整的基于比特币的信息。这是接下来我们会在地址查询上,做的迭代。
史亮:我跟在座的各位不太一样,我本身不是一个数据挖掘分析方面的专家,我偏向于金融IT,对投资标的、业务这块比较了解。在这个沙龙之前请教了一些朋友,包括一些大数据、人工智能的朋友,去看利用区块链的方式,去解决一些数据的问题会怎么样,接下来的发展趋势会怎么样。
整体聊下来,在一些顶尖的人来看来,这个行业还是有比较大的前景。在于区块链领域的深度数据挖掘和人工智能这一块。因为它跟现有的大数据和人工智能比较典型的差异在于,它颠覆了一些底层的东西。现在我们看到的大数据也好,数据挖掘也好,是基于谁能够抓到数据,谁能够获取数据,并且存储到这个数据。它的使用者和所有者之间是不一样,大家知道数据并不在你的手里,而是在存储者的手里,它是真正的使用者,去深度理解和使用这些数据。甚至所有者和使用者有一个对抗的过程,我们发现很多对抗,我不愿意把这个东西放到支付宝上,但是没办法,有时候为了便捷就这么做了。这个过程会被区块链颠覆掉,这是大家在认知上有所共识的东西。因为 区块链能保证数据可靠性的同时,会引导数据所有权的保有。让你保有这个数据,允许让别人使用数据的同时,你会得到对应的收益。这种收益转移,不是把数据卖给了某个大公司,你就再也无关了,不是的。 接下来大家会更乐意去分享真实可靠的数据,并且把真实可靠的数据聚拢到区块链上。这时候我们做深度挖掘和分析,精准性会更高。我拿到的所有信息都会真实,我做的所有事情都会让信息的所有权获益。你得到便捷的同时,说不定还能得到一些额外的奖励,比如币。
所以我觉得这个行业未来的发展空间非常大。这个行业的数据非常有限,而且链上存的内容非常有限,很多实际场景的数据还没有到链上去。链上的数据,都可能是为了某些活动,比如某个游戏随意放在上面的数据,它的数据还没有到生产领域的时候。但是这会改变的,改变过程中需要很多技术专家、业务专家,和相关从业者一起来推动。当下我们做大数据挖掘,又走在区块链上,这是一个很有前景的方向。
如果整个区块链行业起来了,区块链金融对应的、数字资产的交易、数字资产跟全球其他资产之间的交换,都会成为大的可能性,这个行业也会顺起来。
安鑫鑫 : 刚刚讲到了一个新的方向,就是数据与区块链的结合的应用,这是区块链应用的一个很大的方向。第二,发现链上的数据,现在可能大部分都是偏交易的,币与币之间的交易数据,还可以增加更多的新的数据点。
叶茂:刚刚史总讲得很好。从我来讲,区块链行业的数据分析才刚刚起步,传统方向上每个领域都会有很好的数据分析公司出来,因为数据是一个底层的基础。区块链还属于比较早期,里面有很多机会。比如对数字货币的一些跟踪应用,它的能力就可以帮我们更好地做链上数据规整,还有出现问题之前的预警,还有出现问题之后的弥补。这一块对于行业非常有帮助。
第二部分, 区块链数据有个很大的特点,它是容易获取的。什么意思呢?数据只要在区块链里面有一个节点,公链的数据都可以同步过来,这给大家很多机会,因为已经不存储获取的门槛了。大家所要关注的就是怎么样把数据利用起来,比如一个利用的方向,利用数据做量化交易,或者用数据去做一些跟分析报告相关的事情。 以量化来讲,量化策略非常多,不同的人可以根据数据研究出来不同的策略,这些策略就可以在现实生活中进行利用和回测。
第三部分,区块链数据和其他数据的关联,比如跟非链上数据的关联,比如行情数据、其他地方采集的数据。链上数据跟这些数据的关联,会产生一些很好的组合效应,看能够应用到什么地方。目前区块链的数据应用还比较窄,DApp上面也可以做一些分析,比如哪些DApp更容易获得用户的DApp,都可以算出来。
安鑫鑫 : TokenInsight是行业比较领先做链上数据的,现在很多做数据的方向,都在偏向为投资者服务。大家知道如果数据能指导你多赚一分钱,或者少赔一点钱,意义就很大了。第一步是发现数据,第二步是处理数据,第三步,做一个显性的数据,让数据的作用更加直白的表现出来。
张玉:现在大家对于区块链认为是价值互联网,目前大家对现有的数字资产的定义说白了,是对数学模型、经济模型比较信任,产生的信任资产。像大规模增值的资产,尤其是数字资产,有我们个人的身份数据,还有个人账户的行为数据,大量的上链以后,才有可能产生真实的数据资产。这个部分还有待于新的技术能够突破,才能够完全解决。因为目前的量,希望有更多的技术方,能够在底层的公链上有所突破,把数据资产上链的事情给解决,再谈数据挖掘、大规模的应用,才比较现实。
安鑫鑫 : 等于提了一个需求,给数据提供方。
于睿:几位讲得太好了,我再说一个点。目前好像数据行业实现数据资产定价,包括交易过程,希望未来链上链下数据打通,包括分析的框架和方法论。应用方面刚刚几位谈到了,现在链上可以呈现的数据非常单一,未来数据量变大以后,这个情况会怎样,也需要大家去探索。
然后, 给大家提一个问题,我看到前两天一个新闻,日本发行了数字货币,今天央行有消息,央行也要发。这个市场形成以后,在座的各位做的事情,是不是能够应用过去 ?
牛神:其实所有数据的基础性的分析或者工作,今天叶总讲了一个比较好的应用方向和场景。我能够想到了,因为我们是做量化交易的,这些数据分析我考虑到两个方面。第一,在金融科技上的应用上。第二,在区块链产业上的应用,在数字资产上它是一个自由金融的市场。一些数据团队,给这个行业提供了比较系统化、真正的数据分析,对行业的是非常有帮助的。
安鑫鑫 :刚刚各位嘉宾讲得很深了,把我后面的问题已经回答了。接下来再聊一个问题,每个人、每家的数据产品,有非常定向的服务需求。大家更加分散地去看,看现在的市场对数据的真正需求是怎样的,是怎样的用户人群,更加需要什么样的数据。各位对这块有什么更深的思考,它不局限于自身的产品,而是对整个数据行业有一个思考。甚至于对行业外的人, 也 有一些思考。
牛神:我想了三个方面。
第一,我看叶总的PPT讲了比较一个刚性的需求,政府部门监管的需求,对数据非常重要。
第二,做量化交易,对基础性的数据API也是一种刚性需要。
第三,区块链行业的投资人也好,还是行业从业者也好,对数据的需求也是比较强的。所以从这种角度来讲,这个市场刚性的需要还是比较重要的。因为在整个币圈区块链是一个非常自由的市场,公信力是非常重要的。
于睿:我们希望结合数据,让更多的传统的钱和行业建立认知,然后再建立信心,这样才能推动行业的发展。
安鑫鑫 : 链塔智库在传统行业有很深的资源,现在链塔做的事情是对行业非常有帮助的,一直在总结和汇总行业各种各样的信息。向传统行业的人传道布道。
张玉:我的观点是这样的,如果是从目前区块链应用的场景来看,我们叫交易行业。交易行业从获客到风控、运营、产品的定价和最后的服务,整个环节大家都开始用了。举一个例子,比如钱包支持某个币种,肯定要看这个币种它的地址用户量、活跃活度,全球那么多币种,我们不可能把每个币种都加进去。数据挖掘和数据分析的工作,对整个产业链有一个比较明确的应用了。包括金色最近也在做数据分析,这是从当前的状态来看。我们作为从业者,更大的希望还是希望区块链未来能应用到其他行业,这个里面非常重要的一个点。 我们必须要能解决一些资产上链的问题 , 有哪些资产能够数据化,把数据化的资产能够搬到区块链上来应用, 这里面我认识到非常多的公链在尝试,目前还没有大的突破。我相信这是一个大的趋势,我觉得传统大数据分析的方法和成果,都可以直接过来应用。我更看好的一个点,我们早期做金融行业数据挖掘的时候,做不到全生命周期分析。就说客户跟企业的关联,分散在不同的渠道里面,有电话、网络、微信,各个渠道都没有打通。现在能解决这个问题,但是没有办法搬到链上去。如果没有一个好的技术,即使有区块链也没有办法满足。所以如果要更快的发展,很多东西要突破,这需要大家一起努力。
叶茂:刚刚我讲了几个点,包括对政府、对个人、对量化,这也是一部分应用。其实在区块链上还有很多可以做的事情,举个例子,怎么在传统世界,我们会用数据挖掘会做精准营销,在区块链上面,一个项目方它也需要做营销,但是这个营销怎么做呢?可以在区块链上利用数据去做一些分析,可以让项目变得更有效率。第二方面,我们现在关注数字货币这个方向,除了数字货币,现在在国家层面上更提倡无币区块链,也就是区块链应用完以后,区块链上的数据是存在的。这个数据跟实体结合,如何用,也有一些相关的方法。这个方法去借鉴,去做其他链上的数据挖掘,这里面也会有很多空间。更大的范围和空间,是在以后。因为这些链随着区块链不断的推进,会不断的产生结合。用怎样的方式,推动实体经济,这是非常厉害的。
安鑫鑫 : 刚刚提的大部分偏链上数据,港盛科技做的是偏交易所相关,所以它和交易所的数据相关。讲一下在整个措施过程中,交易所的交易产生的哪些数据,是有很多价值,对市场是用指导意义的。
史亮:我讲一下金融交易相关的话题。数据分析和数据挖掘, 在金融里面有三个方面的应用,可以帮助大家很快去落地,并且是有很大的前景。第一,清算结算业务,清算结算业务大家毋庸置疑。数字货币的交易大家对清结算还没有感受,但是在传统金融里面,区块链在清算结算上的应用已经开始了。 国内也好,国际也好,一些大的银行、大的交易机构,已经开始用一些区块链的技术做清算结算,来保证数据的可靠性、准确性。这个领域里面在于数字货币的交易里面清算结算的业务,一定是基于区块链技术来充分使用的。这一部分给普通的炒币者和机构带来很大帮助。
第二个是风控,因为数字资产涨幅、跌幅非常大,所以大家觉得我已经做了高风险的事情,但是高风险在哪里,大家没有特别深的判断。所以实际上来说,你做金融交易、做金融投资,最关注的就是风控,这是它的核心所在。所以实际上你如何做好风控,在这个过程当中是非常重要的事,而风控的分析需要用到大量的数据。这不是交易过程中的风险控制,有事前、事中、事后三个方面都要做。这里面有大量的模型、数据的处理、数据的挖掘,我要看投资交易数据以后,到底风险收益比率是怎样的,我做这笔交易,如果投前还有一个分析的过程,我们还会有一些场景分析的做法,就可以更有帮助。所以这个里面需要大量准确的数据,数据的准确性会帮助到大家很多。这一部分是风控要做的,这对于普通数字货币投资者来说,一个是反欺诈,一个是我的币去了哪,所有的交易过程是可追溯的,现在是不可追溯的,所以才有了去中心化的交易所。这也区块链可以在交易里面的一些布局。
第三方面是分析。这在传统行业里面都是刚起步,大家知道人工智能神经网络在投资领域里面,模型在量化里面刚开始的应用,而且在过去几年的表现都还是不错的。甚至在非交易里面也表现非常不错。 实际上在数字资产交易里面,也可以大量使用分析类数据。分析类数据,也需要大量的数据做支撑,并且还需要分析模型。 这三方面的应用,肯定会帮助到个人投资者也好、机构投资者也好,还是投资机构、管理机构,把整个交易做得更加健康健全,让整个数字资产、投资交易变成一个大的金融体系,合规合法地往前走。
安鑫鑫 : 大家知道BTC.com是比特大陆旗下的子品牌,为整个区块链行业来服务的。真正通过链上数据,尤其是比特币的链上数据来反映一些情况。 近期有没有一些数据,比如挖矿的人数上升还是下降,交易的人数有没有变动,或者持币的用户有没有变动,有没有发现这样的数据呢?
庄重:因为我们有矿池业务,我关注更多的还是全网的算力,包括这些算力的来源。我们也发现了一些奇怪现象, 我们观测到算力下降,这些算力会从B TC 流入到B TH ,但是整体算力确实有一些减少。 最近的价格和矿机价格也有一定的关系。近期有一定的算力减少, 但是跟最近的价格也没有太大的关联,这也是最近注意到一个比较奇怪的现象。
最后我们从欧洲地区新了一些新的算力增长,用户数很多,但是平均的量跟国内差别还是很大。大家之前关注的伊朗,确实能看到,但我们不能给提供服务。我们自身也注意到,从去年丰水期、枯水期,从我们内部可以看到算力迁移的情况。 所以做区块链数据分析,我们自己也需要知道把链上链下数据打通。 比如在我们这里很难拿到交易所的数据,刚刚有嘉宾谈到数字货币,从现在开始会有一些闪电网络新的应用。这些我们也是想尽量能够抓住这些新的热点,我们的强项还是在于新的技术探索上。我们对比一些传统做数据分析的厂商,这方面我们还是有所欠缺的。我们还是先在技术服务上,帮助大家先知道一些策略,或者一些其他情况。这是目前我们的考虑。
安鑫鑫 : 今天聊得挺深入的,圆桌到此结束了,祝大家新年快乐。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 数据挖掘竞赛指南:曾经的数据挖掘少年,如今的阿里算法大佬
- 数据挖掘复习笔记---02.数据
- 数据挖掘建模:如何从数据中“淘金”?
- 大数据产品经理必备的数据挖掘知识概述(一)认识数据之数据可视化
- 大数据产品经理必备的数据挖掘知识概述(一)认识数据
- 数据挖掘复习笔记---03.数据预处理
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Nginx高性能Web服务器详解
苗泽 / 电子工业出版社 / 2013-10 / 59.00元
《Nginx高性能Web服务器详解》全面介绍了当前Internet上流行的一款开放源代码的Web服务器——Nginx。全书一共分为四大部分,分别从入门、功能、实现和应用等四个方面对Nginx服务器的知识进行完整阐述,从而满足广大读者在应用Nginx服务器时的普遍性需求。同时也深入剖析了Nginx服务器的工作原理和实现技术,对其中使用到的数据结构和方法进行了详细阐述,并且结合实际的应用情况给出了多个......一起来看看 《Nginx高性能Web服务器详解》 这本书的介绍吧!