数学向丨加密资产的分类化是市场驱动的还是基本面决定的？

栏目: 数据库 · 发布时间: 7年前

内容简介：为了更好地理解加密货币间的相互关联性，我们对100多种加密货币进行了聚类分析（clustering analysis）。这项研究背后的动机是看加密货币是基于其价值主张的独立资产，还是它们围绕某些市场指标相互有关联。我们发现，有多个组别的加密资产并不完全跟随比特币的活动变化。结果还表明，可比（comparable）架构和通证经济学并不能解释可比市场的活动。自从加密货币进入市场以来，全世界都在问：我们如何为它们赋予价值？在评估加密经济中的去中心化项目时，可以使用清晰且无偏见的基准——聚类（clustering

为了更好地理解加密货币间的相互关联性，我们对100多种加密货币进行了聚类分析（clustering analysis）。这项研究背后的动机是看加密货币是基于其价值主张的独立资产，还是它们围绕某些市场指标相互有关联。我们发现，有多个组别的加密资产并不完全跟随比特币的活动变化。结果还表明，可比（comparable）架构和通证经济学并不能解释可比市场的活动。

自从加密货币进入市场以来，全世界都在问：我们如何为它们赋予价值？在评估加密经济中的去中心化项目时，可以使用清晰且无偏见的基准——聚类（clustering）——来回答这个问题。分类通常是围绕加密代币的，例如平台代币、效用代币、品牌代币和证券代币。一种常见的分类形式如下：

数学向丨加密资产的分类化是市场驱动的还是基本面决定的？

OnChain FX分类

然而，这些并不是唯一可能出现的聚类。仔细观察，聚类显示了哪些加密货币与头部加密货币同步移动，同时也值得研究一下这其中的相似之处可以告诉我们什么。

由于聚类似乎被用于制定交易策略，因此了解基本面的相似性（分成不同的组）是否由市场指标支持是很重要的。找出和理解资产之间的关系对于在加密货币行业制定成功的价值战略至关重要，并有助于使加密行业对投资者更加可行。检查在同步状态下变化的自然加密货币群可以清楚说明它们之间的关系并作为策略的基础。

开发一种聚类方法

时间序列分类用一个函数表示：

数学向丨加密资产的分类化是市场驱动的还是基本面决定的？

图1：基于tsfresh的聚类可视化图表

其中T是时间轴长度，K是特定的簇（集群）。这应该以时间序列的表示作为固定大小D的一组选定特征值进行，独立于T.

每个图的节点代表一种加密货币。当两个加密货币属于一个簇时，它们就会连接起来。我们可以使用这种表示来使用标准聚类算法，并且本次研究中，我们找出了描述每个加密货币的多个时间序列，并构建了导数参数来定义这些序列。

接下来，我们设计了一种在识别分类方面从简单到复杂的方法：我们为每个时间序列（参数）使用了通用的标准特征值：平均值、中位数、标准差、偏度和峰度。我们使用tsfresh库来实现特征值提取过程的自动化。我们将两种方法应用于由BTC状态而分散开的时间序列。

具有噪声的基于密度的聚类方法（DBSCAN）

这项研究的目的是确定群集，而不预先假定它们应该是什么样的。DBSCAN是一种聚类（clustering）算法，它将簇简单地视为由低密度区域分隔的高密度区域，这使我们能够实现我们的目标。不仅可以快速应用DBSCAN以便于交易和轻松扩展，简单的（如果是通用的）函数还允许DBSCAN找到的集群以任何样子存在。这与诸如k均值的方法相反，该方法假设簇仅是凸的。选择DBSCAN使我们获得的研究数据非常准确。

DBSCAN的核心部分是核心样本的概念，即高密度区域的样本。因此，一个簇是一组核心样本，每个核心样本彼此接近（通过距离测量），以及一组接近核心样本（但本身不是核心样本）的非核心样本。算法有两个参数，min_samples和eps，它们正式定义了密度的含义。较高的min_samples或较低的eps表示形成簇所需的较高密度。

使用DBSCAN的另一个好处是我们能够计算它允许的预估簇数。使用DBSCAN，可以使用所有给定加密货币的数据获得头部集群（如比特币、以太坊等）。当将基本特征值的Extractor函数应用于所识别的每个大型簇时，可以在头部集群内进行分组。

这种用于获得加密货币概况的特征值基本提取方法可以扩展：例如，可以为不同的时间段，提取特征值，并为每个加密货币形成更宽的特征值组。或者，可以在不同时期找到相似性度量，并在所有时段的统一度量中进行编译。简而言之，可以跨多个变量作为输入进行聚类。确定最佳聚类结果的下一步是依靠提取的特征值执行聚类，另外使用tsfresh库作为替代方法。

头部集群内的集群

为了在使用DBSCAN识别的头部集群内完成聚类，具有噪声的基于密度的分级聚类方法（HDBSCAN）被用于在不同的epsilon值上执行DBSCAN并集成结果以找到在epsilon上提供具有最佳稳定性的聚类。 HDBSCAN允许我们找到不同密度的簇（与DBSCAN不同），并且在参数选择方面更加稳健。

这种方法的局限性在于它只能反映总体情况。它不会检测相互依赖性、遵循的趋势或其他复杂的安排。从本质上讲，它是按基本时间序列特征进行聚类。头部聚类是一个相当必要的度量，但描述每个时间序列的特征值列表很短；但是，它可以通过其他额外的特征值轻松扩展。

作为DBSCAN方法的扩展，HDBSCAN将紧密堆积在一起的点（具有许多邻近的邻居点）组合在一起，标记为单独位于低密度区域的异常点（其距离最近邻居点太远）。这种方法允许“非集群加密货币”的出现：它们是分类在-1标签下的异常值。该组由两种类型的加密货币组成：

1. 没有收集大量数据的加密货币

2. 实际异常值：每个非集群加密货币应该被认为是特殊的，包括那些市值最大的加密货币。通过几组不同的参数，如平均值、中位数、标准差、峰度、偏度，这些加密货币是实际的异常值。

市场状态与集群

为了确定市场状态，有必要根据看涨、看跌或稳定的BTC趋势获得不同市场状态的持续时间。要使用基本特征值提取器执行聚类，首先必须执行头部聚类，将加密货币分成与数据存在相对应的组。

头部聚类的结果显示了三个独立的具有相应时间段的的市场状态，需要根据状态创建三组簇。将算法和传递的参数组合起来允许我们发现一个短暂的看跌期（2018年早期BTC急剧下跌）。

数学向丨加密资产的分类化是市场驱动的还是基本面决定的？

聚类也会出现在看涨期。大体来说，看涨器出现了更多的聚类。在稳定期（横盘）中，也出现了聚类。这很重要，原因如下：

在BTC时间线上检测到几个稳定期。因此，这部分样本是迄今为止最具代表性的。

与看涨和看跌的BTC状态相反，稳定或横盘状态可以凭直觉假设。看涨和看跌这两个词是模糊不清的，并且对它们也没有有力的定义，因为它们直到事件发生多年后才被真正理解，用于回顾——但是每个人都可以看到BTC何时处于平稳或横盘阶段。在这种背景下，稳定的交易市场提供了最具预测性的价值。而这是基于以下观察的：虽然市场（尤其是BTC价格）稳定，但人们已准备好投资竞争币。先前的观察还表明，某些竞争币与BTC稳定状态具有良好的相关性。反之亦然：强烈显着的BTC增长期和下降期通常会导致预测价值不佳。

如前所述，有几个头部集群是根据数据存在而构建的。使用我们自己的特征值提取算法在每个大集群中获得三个不同的聚类：看涨、看跌和稳定期。因此，我们为每个大集群制作了3个不同的集群。这些插图的目的是显示哪些加密货币的连接最多。正如我们在上面所看到的，一些加密货币可能属于使用一种方法的不同集群，但是也属于使用另一种方法的另一种集群。

结论

1. 基本面似乎不能解释加密价格动态和相应的集群。

2. 某些加密货币架构中的相似性不能总结性地表明群集组之间的市场行为有反差。

3. 加密货币的实际使用与大多数项目的使用有很大不同。

我们发现，在这个时间点，具有可比软件架构和代币经济性的加密货币并未被证明具有可比市场的变动。

加密货币是真正的投资工具，但在很大程度上是投机性的。将来回顾这些结果将会很有吸引力，大家也会很想看看市场行为是否已经变为通过基础架构分析呈现的更多分类。

为了更准确地了解加密货币市场行为，可能需要采用全新的指标。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

自制搜索引擎

[日]山田浩之、[日]末永匡 / 胡屹 / 人民邮电出版社 / 2016-1 / 39.00元

《自制搜索引擎》聚焦于Google和Yahoo!等Web搜索服务幕后的搜索引擎系统，首先讲解了搜索引擎的基础知识和原理，接着以现实中的开源搜索引擎Senna/Groonga为示例，使用该引擎的源代码引导读者亲自体验搜索引擎的开发过程。这部分讲解涉及了倒排索引的制作和压缩、检索的处理流程以及搜索引擎的优化等内容。又简单介绍了一些更加专业的搜索引擎的知识和要点，为读者今后进一步学习打下了基础。本书适合......一起来看看《自制搜索引擎》这本书的介绍吧!

码农工具