QKL123研报:怎样动态检验交易所的真实成交状况
一. 市场成交概况
作为区块链生态体系中重要的参与者与建设者,加密货币交易所一直与加密货币的发展息息相关。
自2009年比特币创世区块的诞生,至2010年世界上第一家比特币交易所Bitcoin Market的诞生,再到如今形成的数千亿美元的加密货币市场,加密货币交易所的数量也伴随着市场规模的扩大而上升。如今,市场上已有数百家加密货币交易所为用户提供包括现货、杠杆、期货期权、ETF等多种形式的投资服务。
在交易所数量增长和业务范围拓展的同时,不少交易所为夸大自身的市场影响力,采取对敲等手段虚报成交额,严重影响了投资者对交易所的评价与选择,也影响着研究人员对市场发展趋势的判断。
2019年3月,Bitwise Asset Management在向SEC提出比特币的ETF申请时,在附加的报告中指出,通过多种统计方法得到“交易所的报告成交量中虚假成交量占比达95%以上”的结论。无独有偶,2019年7月Alameda Research发布报告,通过6种指标对交易所成交的真实性进行检测,统计结果反映出市场头部交易所的虚假成交量约占报告成交量的1/3。
此后,市场上出现了多种检测交易所成交量真实性的检测方法,均在一定程度上推定部分交易所存在大量虚假成交。
二. QKL123的真实成交研究
QKL123作为区块链数据服务机构,接入了上百家交易所的K线数据,依托于对市场的认知和其他研究机构的研究成果,对大部分交易所进行了样本数据的统计,旨在辅助研究人员动态辨识交易所的真实成交状况,辅助投资者选择更优质的交易所。
QKL123按照如下规则选取样本进行观测和统计:
① 该交易所的每日成交量位于市场前100名;
② 以各个交易所上现货成交量最大的BTC交易对为样本交易对;
③ 排除24小时交易笔数低于5000的样本交易对;
④ 排除共享交易深度的云交易所。
在经过数天的统计和分析之后,本文认为:当前市场的报告成交量中近五成为虚假成交量,如按交易所真实性将其划分为真实性极高、真实性较高、真实性一般、真实性较低四档,其占比分别为18%、26%、21%、35%。
针对具体某个交易所的成交统计数据,用户可以从“交易平台排行榜”中点击交易所名称进入对应的“交易平台详情页”,并通过真实成交按钮查看统计结果。目前,QKL123正在结合AI等技术,将在不久之后为用户实时展示各个交易所的真实成交比例。
三. 统计依据
QKL123页面中展示的真实成交模块共7个部分,分别为样本交易对基本数据、逐笔成交量分布、成交量同步性、本福特定律分析、成交量尾数、交易所对比及FTX实时量鉴。
下面将针对页面展示数据及统计依据进行讲述。
1. 长尾定律
1.1基本描述
BTC的财富分布情况和成交统计数据中均遵循着“二八定律”。在财富分布上,少数地址积聚了大量的BTC,多数用户却只持有少量的BTC。该种不平衡的财富分布也导致了市场成交数据中的不平衡性——即少量的大额成交单和大量的小额成交单。
若对样本交易对的成交数据进行统计,在成交笔数足够多时,每笔成交量X与成交单数Y形成的曲线与反比例函数有一定相似之处(远端长尾),其具有以下两个特点:
① 持续下降:随着每笔成交量X的增长,成交笔数Y呈下降趋势;
② 先陡后缓:曲线在每笔成交量X较小时表现陡峭,在每笔成交量X较大时表现平缓;
1.2 样本示例
下图为近24小时内某平台的逐笔成交数据,其中,横轴为每笔成交量(每个区间间隔为0.03 BTC,最后一个区间为“≥3 BTC”),纵轴为交易笔数。为便于查看详细数据,QKL123同时提供线性坐标轴和对数坐标轴。数据表明,该交易平台近24小时的成交数据具有“先陡后缓”和“持续下降”两个特点,符合长尾定律的要求。
异常数据示例:
2. 本福特定律
2.1 基本描述
本福特定律(Benford's law)是指在数量足够大的数组中,首个数字(即首位有效数字)通常不会在1至9之间平均分布,而是随着数字的增大,出现频率逐渐减少,每个数字d出现的概率公式如下:
2.2 样本示例
下图为近24小时内对交易平台A与B的成交数据的本福特统计数据。其中,横轴为对应的首位有效数字,纵轴为交易笔数占比;蓝色为标准的本福特分布比率,黄色为样本交易对的数据。数据表明,交易平台A成交数据统计中,首位有效数字的分布虽与标准分布不同,但整体趋势相近,基本符合分布要求;但交易平台B则不符合依次下降的规则。
3. 整数定律
3.1 基本描述
根据众多样本的统计结果及对行为学的思考,人们对于整数形式的交易应具有更强的偏好性,即在交易中人们更倾向于交易5.0000个BTC而非5.0001或4.9999个BTC。反映在交易数据统计中时,0.99~1.02BTC区间范围内的成交单数会高于0.96~0.99BTC和1.02~1.05BTC,因此在柱状图上将形成一个凸起。此外,若对每笔成交量的第四位小数进行频率统计,该位数字为0的概率应大于其他数字。
但需要特别说明的是,由于在部分交易平台中用户调整下单金额时仅能以USDT或其它法币为单位而非BTC为单位,或是因部分交易平台的成交单统计规则影响,该类统计结果可能会出现异常情形。故该定律在本文中被认定为充分条件而非必要条件,即满足整数定律可以部分证明交易平台成交量的真实性,但不满足整数定律不一定代表着交易平台成交量的失真。
3.2 样本示例
下图为近24小时内某交易平台的成交数据。其中,左图为逐笔成交量数据的对数坐标轴形式,右图为成交量尾数(小数点后第四位)的分布图。数据表明,该交易平台的逐笔成交量柱状图中,数个整数位置均存在明显凸起,成交量位数分布中数字0对应的频率最高,符合分布要求。
4. 成交量相关性
4.1 基本描述
随着加密货币交易市场的成熟和交易用户的增多,因不同交易平台价格差异而出现跨平台套利的可能性逐渐降低,不同交易平台之间价格变动的相关性进一步增强,交易量变动的相关性也随之增强。
由于样本交易对均选取BTC相关交易对,因此单个交易平台的样本交易对的成交量与市场成交量理应具有相似的趋势,特别地,对于某些成交量较小、市场深度较浅的交易平台,其成交量变化趋势可能稍滞后于市场整体变化趋势。
4.2 样本示例
本文选取BitFlyer、Bitstamp、Coinbase三家合规交易平台作为标准,将其作为标准与各交易平台的样本交易对的成交量变化趋势进行对比。下图为近24小时内,上述三家标准交易平台的成交数据,时间间隔为5分钟。图表表明,三家交易平台的成交量变动趋势在大部分时间内存在同步性。
5. 其它相关指标
客单价(Volume/User):BTI (Blockchain Transparency Institute)将交易平台的成交量与UV值进行比较,得到客单价指标,并认为该指标能一定程度上反映交易平台中虚假成交的比例。
QKL123在页面中同时展示单个交易平台的样本交易对的30日成交量、交易平台访客量数据、交易平台30日客单价数据,从而辅助用户进行判断。需要特别说明的是,由于部分交易平台存在多个备用地址,本处访客量数据的选取或会小于实际数值。
FTX实时量鉴:FTX交易平台展示了Alameda Research的研究成果,从网站交易真实性等六个维度衡量交易平台的真实性比例,并估算出对应交易平台前一日的真实成交量。
四. 结语
本文为投资者提供了一种判断交易所虚假成交量的一般性方法,但投资者在判断具体某个交易平台成交真实性时,需要综合考虑各项统计数据及交易所成交机制设置,不能一概而论。另外,本文所说的统计方法适用于大样本数据,且随着统计方法的公开,部分交易所会有针对性地修改数据,同样会影响统计数据的有效性。
来源:QKL123
Scan QR code with WeChat