全比特币交易图量化分析

Unknown view 40 2013-8-1 22:03
share to
Scan QR code with WeChat

摘要:比特币方案是一种罕见的例子,一个大规模的全球支付系统,在这个系统中所有的交易都是公开的(但是以一种匿名的方式)。我们下载了这个方案全部的历史,并分析了它的许多相关交易图的统计特性。本文第一次回答了关于比特币的各种各样有趣的问题,包括比特币用户的典型行为,他们怎样获得又怎样花掉他们的比特币,他们在比特币账户里保留的余额,以及他们为了保证更好的隐私是如何在各种账户之间转移比特币。另外,我们隔离了系统中所有大型的交易,发现几乎所有的大型交易都与2010年9月发生的一起交易密切相关,尽管相关用户明显试图用交易图中许多奇怪的看起来很长的链和分叉合并结构来隐藏这个事实。

关键词:比特币,数字硬币,电子现金,支付系统,交易图,量化分析

1、介绍

比特币是一种数字货币,不由任何政府、银行、或组织发行,依赖于加密协议和一个包括挖矿、存储、转移比特币的各种用户组成的分布式网络。这个方案是在2008年由中本聪第一次提出的,2009年1月开始全面运作。它吸引了大量的用户和很多媒体的关注,但是到目前为止已经很难对一些简单的问题得到确切的答案,例如:系统中有多少不同的用户?每个账户通常保留多少比特币?随着时间推移这个平衡如何变化?是否大多数的比特币都掌握在一些大用户手里?他们是把比特币保存在“储蓄账户”还是立即消费?有多少用户某种程度上会适时保持大笔余额?比特币交易的大小分布是怎样的,它们中有多少是小额交易?

本文会回答所有这些问题(以及许多附加问题)。我们利用这个事实,就是比特币系统中发生的所有交易都在网上可获得(以一种匿名的方式)。2012年5月13日我们以它的两种主要形式之一下载了该系统全部的公共记录[1],大约包括180,000个HTML文件。在剖析和运行这些文件之后,我们建立了到那个日期的所有比特币地址和交易的一个图。然后,我们使用了下一节描述的方法,试图确认哪些地址可能属于同一实体,并利用这个信息通过合并这样的地址来缩小这个交易图,这是为了获得对每个用户的全部金融活动一个更精确的描绘。然后我们分析了原始和缩小的交易图的许多统计特性(我们大部分的统计结果在这两个图里非常相似)。我们发现的最有趣信息量最大的分布在一系列的表里有描述。另外,我们隔离了系统里记录过的所有大型交易(≥50,000BTC),并分析了这些金额是如何累积然后又花费的。我们发现几乎所有的这些大型交易都是一个涉及90,000BTC的大型交易的子节点,这个大型交易发生在2010年11月8号,这些交易的子图包含许多看起来很奇怪的链和分叉合并结构,在子图中一个大的余额或者在几小时内通过数以百计的临时中间账户被转移,或者分成许多小数额被发送到不同的账户只为了在不久之后重组到一个新的账户里,本质上总数额是一样的。

之前有一个报道说有尝试下载和分析全比特币历史,也用了同样的方法试图缩小所有被认为属于同一个用户的地址。他们在2011年7月12日创建了交易图,那个时候比特币还没有真正流行起来。因此,在我们的图中比特币参与的所有交易的总数量是他们的3倍。另外,我们期待在我们更成熟的图中的交易能更好的代表这个系统的典型应用,而他们的图则主要代表了由早期采用者运行的实验。然而,本论文最大的不同在于他们主要关注隐私问题,而我们主要对比特币交易图的统计特性感兴趣。比特币交易图的另一个分析在2011年12月德国的混沌电脑俱乐部会议上被提出。再次,他们主要对如何打败网络的匿名性感兴趣,但也包括一些有关比特币背后的经济原理的有趣的评论,失去对比特币的操作的影响,它的协议的弱点,以及交易图的一般拓扑属性。

本文组织如下。第二部分,我们描述了比特币的整个方案。第三部分,我们总结了主要的统计分布,提取自下载的交易记录,它描述了比特币许多有趣甚至是惊人的性能。最后,第四部分,我们提出了最近的交易图并分析其奇怪的结构。

[1]我们相信(但还未证明)这两种形式包含的是完全相同的信息,即使有极小的区别,对于我们的统计结果的影响也是可以忽略的。

2、比特币方案

比特币系统是一个分散的电子现金系统,采用点对点网络使得支付各方之间不依赖相互信任。它是由中本聪(普遍认为是一个假名)在2008年第一次提出的。支付由bitcoins(BTC’s)完成,是由比特币网络发行和传输的数字硬币。所有这些交易的数据,在被一个工作量证明系统确认之后,会被收集到block chain中。

参与者开始使用比特币首先要获得一个程序叫做比特币钱包以及一个或多个地址。比特币地址被用来接收比特币,就跟邮箱地址是用来接收邮件一样。尽管比特币系统被认为是一个实验性的支付系统,它也已经大规模的展开了(在某种意义上,发行的所有硬币当前值远远超过100,000,000美元)并且吸引了很多媒体的关注。

它的支持者声称它是第一个真正意义上的全球货币,不会基于公民身份或位置区别它的用户,它会一直运行着没有假期,它很容易获得以很低的使用费用,它还不会有退款,等等。另一方面,它的批评者声称它被广泛滥用于非法物品购买和洗黑钱,而且通过网络攻击可以很容易地从钱包里偷到比特币。

不像法定货币,是由政府宣布成为合法货币,尽管它并没有什么内在价值,也并没有准备金支持,而比特币方案就没有集中发行机关。比特币网络被编程以缓慢增加的等比级数规律来增加货币供应直到比特币总数量达到上限2100万BTC’s。比特币是被奖励给比特币矿工的,因为他们解决了越来越难的工作量证明难题,它可以确认交易并阻止双重支付。该网络目前确认一个block并收到一个奖励(目前是50BTC’s)的工作量超过第一个block被确认时的100万倍。

这几年来比特币的汇率波动的很厉害,从仅仅0.01美元涨到超过30美元。现在(2012年10月)的价值在12美元多一点。比特币网络的整个活动是以两种主要的形式通过网络公之于众的,我们决定下载的形式表现为一个block chain,从block 0开始(在2009年1月3号创建)。每个block报告了少则一个交易多则上千个交易,提供了其它block的超链接和每个地址的其它活动的超链接。

许多用户采用比特币支付系统是由于政治和哲学的原因。每个用户都可以独自拥有不限数量的地址(以它们的公钥/私钥对为特征)。比特币交易是常规的银行交易的一般化,在这个意义上同一个交易它允许多个发送地址和多个接收地址。它详细说明了发送地址发出了多少比特币而接收地址又收到了多少比特币,却没有透露交易者的信息。一个地址或者接收到新挖出来的比特币或者收到的比特币有明确的发送地址。比特币交易和常规的银行交易另一个重要的不同点在于兑换这个概念上,这与比特币是保存(可能是小部分)在块(chunks)中有关,它转移的时候必须全部转移要不就一点都不转。例如,一个用户的每10个BTC 就可以有三个chunks。一个交易花12.5BTC,转移第一个完整的chunk,从第二个chunk加上2.5BTC,然后剩下的7.5BTC要被发到由同一用户拥有的一个新的地址,要有新的公钥和私钥。该用户可以选择将第三个chunk转移到新地址或者把它留在旧地址。实际上,即使不必要,对于每一个交易,用户生成一个新地址被认为是良好的实践,也就是公私密钥对。为了更好的保护他们的身份,用户应采取以下的步骤:他们没有透露任何识别信息与他们的地址有联系;他们可以重复发送BTC’s的不同部分给他们自己,使用多个(新生成的)地址;他们也可以使用一个可信的第三方,以一种共享电子钱包的形式将他们的交易和其他人的混在一起。

比特币方案的这些运作和隐私策略让我们可以去尝试收缩交易图,这样可以得到一个信息量更大的关于用户的总资产和金融活动的图,这个图与许多地址相关,还让我们可以尝试去区别比特币的“内部”和“外部”转移。用一个完全准确的方法执行此收缩似乎极其困难,但是我们可以利用可获得的数据试着找到一个好的第一近似值。因为许多交易有多个发送地址,我们可以合理的假设所有这些地址有相同的所有者。然后我们计算所有交易里财产的转移情况。例如,如果有一个交易,1和2被用作发送地址,另一个交易2和3被用作发送地址,我们推断这三个地址是联合所有的。但这会导致两种类型的错误:我们可能会低估一些地址的共同所有权,因为数据里并没有证据证明这一点,我们也可能高估了,如果几个用户决定联合行动然后对同一个交易都贡献一些发送地址。和几个比特币社区成员的讨论使我们相信,目前这种高估的错误类型很少,但是会有不少低估错误。例如,当我们试图使用所有可用的交易来合并一个特定的大用户的地址,我们被告知,我们设法识别出的大约只有他的真实地址的四分之一。注意,地址的可连接性并不意味着用户的身份变成了已知的。然而,如果我们有关于任何人的合并地址的真正所有权的任何外部信息,我们可以获得特定的个人或组织的更全面的比特币活动。例如,因为维基解密在它要求捐款时会公开宣传其地址,我们就可以用我们的方法估计维基解密拥有至少83个地址,其涉及到至少1088个交易,它的所有这些地址的总收入为2605.25BTC’s。

我们在2012年5月13日获得了比特币交易系统的完整状态,它包含了该系统从其一开始即2009年1月3号到2012年5月13日进行的所有交易。这要求下载180,001个分开但有链接的HTML文件,从block180,000开始,按照链接倒推回09年1月启动系统的block0。每个文件都被剖析过了,为了提取其中所有的多发送者或多接收者的交易,然后交易的收集被编码为一个标准数据库存在我们的本地机器中。我们再运行一个合并查找算法的变体来找到被认为属于同一用户的一组地址。我们合并所有的节点并结合所有与他相关联的的交易(没有消除内部转移,这在新的图中表现为自我循环)。我们称原始交易图为地址图,收缩的交易图为实体图(我们避免使用这个词“所有者”这个词,因为其复杂的法律内涵,而我们也确实不知道谁拥有哪个地址,我们使用中性的词“实体”来代替,作为我们多个地址的共同所有者的最佳近似称呼)。第三节描述的所有统计结果都来自于地址图和实体图,正如表中所示。在大多数(但不是所有)的情况下,当我们从地址图到实体图,然后到(未知的)所有者图,我们预计统计结果会单调变化,因为每个实体通常是我们设法合并的几个地址的集合,然而每一个真正的所有者却是我们没有合并的几个实体的集合。例如,因为每个地址的平均余额是2.4 BTC,而一个实体的平均余额是3.7,我们可以认为,一个所有者的平均余额可能大于3.7 。这个单调性就可以用于给真正的所有者图的统计性质提供合理的上限或下限,尽管我们不知道。

3、基于比特币交易图的统计计算

当时我们下载的图有3,730,218个不同的公钥,每个公钥关联着不同的地址:其中的3,120,948个作为发送方涉及到至少一个交易,而出现在网络中另外的609,270个只作为接收方。通过运行合并查找算法,我们可以将这3,120,948个地址和1,851,544个不同的实体联系起来。由于其它609,270个地址从未用作发送方,他们就不能通过合并查找算法和其他地址合并,这样他们就都作为实体只有一个地址。增加了这些单一实体后,我们一共有2,460,814个实体,这意味着他们每个人平均有大约1.5个地址。然而,这个统计数据有一个很大的方差,实际上,有一个实体与156,722个地址有关。通过分析这些地址并追踪他们的交易,可以很容易地确定这个实体是Mt.Gox,它是最受欢迎的比特币交易网站(负责了网络中所有交易操作的几乎90%)。每个实体的地址数量完整分布如表1所示。 

 表1. 每个实体的地址数量完整分布

(地址数量)大于等于

小于

实体数量

1 2 10 100 500 1,000 5,000 10,000 50,000 100,000

2 10 100 500 1,000 5,000 10,000 50,000 100,000

2,214,186 234,015 12,026 499 35 41 5 5 1 1

在我们减少后的实体图中,每个m到n的交易有一个单一的发送者(因为m个发送地址一定属于同一实体)和最多n个接收者。这样就可以分解为最多n个不同的交易,从与m个发送方有关的单一实体到与n个接收方有关的实体。假如一些接收方被确认为属于同一实体,他们的数量将累积起来创建一个单一的共同交易,而如果一些接收方被确认与某一发送者等同,我们将创建一个单一的自我循环的组合数量。由此产生的实体图有7,134,836g个单一发送方和单一接收方的交易,其中的814,044个(大约11%)涉及Deepbit(最大的矿池),477,526个(大约7%)涉及Mt.Gox。交易的10%左右是自我循环。实体图是不连贯的,因为它是由133,742个不同的有连接的部件组成,大小不一。例如,有多达 43,710个部件 (大约33%)组成了一个单一的地址只用于接受(一个或几个批次的)新产生的比特币,从来没有参加过任何传入或传出交易。注意,地址图有一个大量的13,734,847笔小型交易,因为一个有2个发送地址和3个接收地址的交易在地址图中表现为6个单一发送者和单一接收者交易。

有许多关于比特币网络的各种各样的统计数据和图表,这可以很容易从网上下载。然而,这些类型的统计数据往往描述的是该网络的一些随着时间推移的全球性质,例如日常交易的数量,它们的总量,目前为止挖出了多少币,以及比特币和美元之间的汇率。我们可以比这走的更远,因为整个交易图可以被用来确定每个实体的财务历史,包括其所有的发送/接收活动,各个地址每天的余额,以及它们随着时间怎样变化。手里掌握了这个实体图是我们能够研究网络的各种统计特性,这个想通过Blockexplorer里少量的网络链接来确定的话是不容易的。在本节余下的部分,我们将目前的发现描述了一下。

这是我们第一个惊人的发现,与大多数的比特币是否被储存还是花掉有关。该系统的比特币总量与块的数量呈线性关系,每个block都与50个新产生的比特币有关,这样就有9,000,050个BTC’s在我们的地址图中(从180,001个block中产生,在block0到block180,000之间)。如果我们总结出609,270个只接收且从未发送任何BTC的地址积累的比特币数量,我们发现它们有7,019,100 BTC’s,几乎是现在所有BTC’s的78%。通过这种方式比特币可以反复搬到新的地址,其中一些可能就在最近,我们不能认为所有这些比特币都没有流通。然而,78%中的76.5%(也就是总的59.7%)是“旧币”,定义为在截止日期2012年5月13日的三个多月之前某些地址接收到的比特币,在它们被收到之后就不再流出交易了。你也可以认为这些旧的闲置比特币只是被早期尝试这个系统的用户抛弃了或是丢失了,那个时候很难可以用比特币买东西或是兑换成美元。为了使闲置比特币的估计更加谨慎,我们决定忽略2010年7月18日之前的所有交易,当时Mt.Gox开始其交换和报价服务。从那个日期开始没有活动的所有地址的余额总量为1,657,480BTC’s。显然,把所有这些比特币看作“丢失了”而非“囤积着”,我们就低估了“储蓄账户”里保持闲置的比特币的数量。通过忽略这些非常旧的比特币并且重复相同的计算,我们发现,剩下的所有比特币的73%都积累在只接收且从不发送比特币的地址里,这73%里的70%都是闲置比特币,也就是说,它们是在我们的截止日期的3个月多月之前接收的,但在那之后就变得很容易兑换它们。如果不去计算交易值的总量而是计算所有在2010年7月18日之后很活跃但在最后3个月变得不活跃的地址的最终余额总量,我们发现系统所有比特币的55%从这个意义上来说都是闲置的。这是强力的证据,说明了多数的比特币没有在系统内流通,由于它是基于地址而不是实体图,这个结论不受我们把地址和用户联系起来的方法的有可能的不准确所影响。注意,参与自系统确立以来的所有交易的比特币总量(除了实际的生产操作)为423,287,950BTC’s,这样的话每个在流通的币不得不被移动很多很多次来达到这个总的流量。

另一个有趣的发现是大多数实体和地址接收到的比特币总量是极小的。在本节余下的部分,我们使用没有括号的数字显示来源于实体图的值,有括号的数字来显示来源于地址图的值。例如,从表2可以看到,36%的实体(40%的地址)接收的BTC都小于1BTC,目前价值大约12美元,在他们的一生,52%(59%)接收的小于10BTC’s,88%(91%)小于100BTC’s。在分布的另一端,只有四个实体(一个地址)接收的比特币超过800,000BTC’s,有80个实体(129个地址)  接受的比特币超过400,000。

表2. 每个实体或地址累计接收的BTC分布

大于等于

小于

实体数量

地址数量

0 1 10 100 1,000 10,000 50,000 100,000 200,000 400,000 800,000

1 10 100 1,000 10,000 50,000 100,000 200,000 400,000 800,000

893,763 389,302 881,273 255,826 36,713 3,593 181 55 30 76 4

1,497,451 698,132 1,206,209 285,820 38,484 3,723 190 50 29 129 1

类似地,正如表3所示,目前(2012年5月13号)几乎97%(98%)的实体(地址)的余额小于10BTC’s。如果不看某一特殊的时刻,而是看看一个实体(地址)的一生中曾经有过的最大的余额,那么这个数字会减少到88%(91%)。这个统计数据总结在表4中。另外,可以看出有78个实体(70个地址)目前的余额大于10,000BTC’s。如果看最大余额的话,这个数字会增加到3,8152(3,876)。

另一个可能表明一个实体(地址)的活跃水平的衡量标准是其参与的交易数量。它的分布在表5体现。值得注意的是,97%(93%)的实体(地址)交易次数小于10,而75个实体(80个地址)经常使用比特币网络,并且至少与5,000个交易有关。

表3. 每个实体或地址目前(2012.5.13)的余额(BTC’s)分布

大于等于

小于

实体数量

地址数量

0 0.01 0.1 10 100 1,000 10,000 50,000 100,000 200,000 400,000

0.01 0.1 10 100 1,000 10,000 50,000 100,000 200,000 400,000

2,097,245 192,931 95,396 67,579 6,746 841 71 5 1 1 0

3,399,539 152,890 101,186 68,907 6,778 848 65 3 1 1 0

  表4. 每个实体或地址最大余额(BTC’s)分布

大于等于

小于

实体数量

地址数量

0 0.1 10 100 1,000 10,000 50,000 100,000 200,000 400,000 500,000

0.1 10 100 1,000 10,000 50,000 100,000 200,000 400,000 500,000

547,763 668,247 945,083 259,142 36,769 3,513 163 40 26 68 2

1,063,876 1,160,170 1,188,596 276,613 37,087 3,521 159 41 26 129 0

  表5. 每个实体或地址的交易数量分布

大于等于

小于

实体数量

实体数量

1 2 4 10 100 1,000 5,000 10,000 100,000 500,000

2 4 10 100 1,000 5,000 10,000 100,000 500,000

557,784 1,615,899 222,433 55,875 8,464 287 35 32 7 1

495,773 2,197,836 780,433 228,275 26,789 1,032 51 24 3 2

我们也计算了两个图的交易规模大小的分布,如表6所示。再一次,显然许多交易非常小,有28%(47%)的交易小于0.1 BTC。比特币方案使得发送小交易可以进行,小至10-8BTC的订单(这是比特币可以分成的最小部分,称作satoshi)。当我们考虑中型数量,我们看到,73% (84%)的交易涉及不足10 BTC。另一方面,大型比特币交易是很稀少的:只有364(340)个交易大于50,000BTC’s。我们小心调查所有的大型交易,并在下一节描述我们的发现。

研究比特币系统里最活跃的实体在是很有趣的,这些人要么有最大的比特币收入要么有规模最大的交易。表7显示了19个这样的实体,按累积收入的BTC数量的降序排列,如第三列所示。最左边的列将实体与A到S之间的字母联系起来,其中,3个字母是有定义的:B是Mt.Gox,G是Instawallet,L是Deepbit。8个附加的实体:F,H,J,M,N,O,P,Q在最大交易图(图1)中被指出,该图在下节显示。第二列给出了合并成每个实体的地址数。第四列显示了实体涉及的交易数。

表7显示了Mt.Gox拥有最大数量的地址,但并没有最大累积收入的BTC,也没有做大数量的交易数。表7第一行的A实体拥有第二大数量的地址,大约是Mt.Gox的50%,但它接收的比特币比Mt.Gox多31%,Deepbit已发送的交易比Mt.Gox多70%。这些实体中有13个实体的地址数量是他们执行的交易数量的五分之一或更多,意识到这点是很有趣的,这可能表明每个地址确实只用于一些交易。另外一个很明显的是,这19个实体中的6个每个发送的交易数量都小于30,但其交易的比特币总量超过了400,000BTC’s。由于这些实体利用的是大型交易,我们就可以很容易的分离他们,跟踪他们交易的流向,这可以查看第四节。另一方面,A实体从未发送任何大型交易,这样它就没有被包含在我们的最大交易图里。

表6. 比特币交易规模大小分布

大于等于

小于

实体图里的交易数量

地址图里的交易数量

0 0.001 0.1 1 10 50 100 500 5,000 20,000 50,000

0.001 0.1 1 10 50 100 500 5,000 20,000 50,000

381,846 1,647,087 1,553,766 1,628,485 1,071,199 490,392 283,152 70,427 6,309 1,809 364

2,315,582 4,127,192 2,930,867 2,230,077 1,219,401 574,003 262,251 67,338 6,000 1,796 340

表7. 最活跃的实体列表,或者有最大的比特币流入,或者有最大的交易数量。 第一列的某些字母:F, H, J, M, N, O, P , Q 可参阅图1中用红色字体指出的这些实体

实体ID

地址数量

累积流入BTC数量

交易数量

A B(Mt.Gox) C D E F G (Instawallet) H I J K L (Deepbit) M N O P Q R S

78,251 156,722 13,289 12,520 191 12 23,649 9 10,561 4 134 2 9 128 10 1 14 2,124 1,037

2,886,650 2,206,170 941,013 867,996 692,864 660,000 633,606 580,000 514,066 500,021 479,254 452,929 442,000 432,161 432,286 432,078 430,490 321,866 20,308

246,012 477,526 77,525 48,347 1,353 23 92,593 59 49,550 6 1,039 814,044 10 137 14 3 23 300,486 197,334

4、比特币最大交易图

我们已经识别并分析了实体图中所有的大型交易(≥50,000BTC’s,大约有364个这样的交易,正如表6最后一列所描述的),并跟踪了他们的流向。我们以最早的大型交易开始,即2010年11月8号的90,000BTC’s的那个交易。通过跟踪其它363个此类大型交易,我们可以表明有348个交易都是这个最初交易的实际后继者。由此产生的有向图如图1所示。这个图揭示了几个比特币交易图流向的典型行为:交易的连续长链;分叉合并模式,可能包括自我循环;通过二进制树形结构留出BTC’s和大宗款项的最终分布。

长链。

比特币用户的一个常用的突出实践是创建连续交易的区块链。有些链可以由兑换机制来解释,在这种机制里小交易都伴随着新地址的创建,用户可以往里转移差额。这种链在图2、图4、图5、图7中都可以看到,长度分别为3、15、26、80、88和350个交易。然而,图3所示的行为明显脱离了这种模式,因为相同数量的5,000BTC’s被反复从一个总额中分裂出去,并被放进没有额外相关交易的账户。

分叉合并模式和自我循环。

比特币另一个常见的方案是通过几个中间地址从一个地址转移大量的BTC到另一个,每个地址接收总额的一部分然后发送出去,大多数是全部发送,直接发送或是通过其它中介到相同的目的地。可以在图6、图8、图9中看到这样的例子。图5显示了一个很难跟踪的分叉合并模式:一个实体以自我循环3次将90,000BTC’s发送给自己。每次他都将其分裂成不同的数额,76+14,72+18和69+21。它使用相同的地址接收较小的数额,不同的地址接收较大的数额。然后在Mt.Gox上交易了全部的90,000BTC’s。最后,这90,000BTC’s通过一个包含了90个交易使用了90个地址的长链被转移(可能属于同一个所有者,也有可能不是),其中的每一个都将1,000BTC’s发回了第一个实体,本质上重新组合成了最初的90,000BTC’s。

将比特币保存在“储蓄账户”。

另一个2011年3月开始的交易长链如图3所示。这个链与上一个不同,因为它30个步骤中的28个都将5,000BTC’s保留在 “储蓄账户”中。累积总额140,000BTC’s从未被发送。这些比特币是我们的发现的一个例子,即大多数的比特币都没有在系统中流通。

二进制树状分布。

经常有大量的BTC的被分散到许多地址,每个步骤都将其分裂成两个相似的数量。这个导致了一个二进制树形结构,如图10和图4所示。

5、总结

比特币系统是最著名和最广泛使用的替代付款方案,但到目前为止还是很难得到它是如何用于实践的准确信息。本文描述了比特币交易图大量的统计特性,该图包含了2012年5月13号之前用户进行的所有交易。我们发现大多数刚产生的比特币都在地址中闲置,从来没有参与任何流出交易。我们发现有数量巨大的微小交易,其只移动一个BTC的一小部分,但也有数以百计的交易移动了将近50,000BTC’s。我们分析了所有这些大型交易,详细跟踪了这些总额积累的方式和他们被分散的方式,意识到几乎所有这些大型交易都是一个交易的子节点, 在2010年11月进行的。最后,我们注意到包含这些大型交易的子图连同他们的附近有很多看起来很奇怪的结构,可能是为了试图掩盖这些交易的存在和它们之间的关系,但是这样的尝试可以通过一个足够持久的方式跟踪资金链来阻止。

致谢

这项研究由花旗基金会支持。我们要感谢魏兹曼科学研究所的计算机科学和应用数学部门的Ronen Basri,Uriel Feige,Michal Irani,Robert Krauthgamer,Boaz Nadler,Moni Naor 和 David Peleg,感谢他们有趣且非常有益的讨论。我们还要感谢Aharon Friedman在获取和处理比特币数据库方面的帮助。最后,我们要感谢比特币社区的所有成员,特别是Meni Rosenfeld 和 Stefan Richter,他们给了我们优秀的评论、批评和建议。我们修改了论文的原始版本来回应他们的给予。

参考文献

1. Nakamoto, S.: Bitcoin: A Peer-to-Peer Electronic Cash System, 2008.

2. Wallace, B.: The Rise and Fall of Bitcoin, Wired Magazine, 23 November 2011,http://www.wired.com/magazine/2011/11/mf_bitcoin/all/

3. NPR Sta : Silk Road: Not Your Father's Amazon.com, 12 June 2011, http://www. npr.org/2011/06/12/137138008/silk-road-not-your-fathers-amazon-com

4. Brett, W.: Senators seek crackdown on "Bitcoin" currency, Reuters, 8 Jun 2011,http://www.reuters.com/article/2011/06/08/us-financial-bitcoins-idUSTRE7573T320110608

5. Reid, F., Harrigan M.: An Analysis of Anonymity in the Bitcoin System, arXiv:1107.4524v2 [physics.soc-ph] 7 May 2012.

6. Hamacher, K., Katzenbeisser, S.: Bitcoin - An Analysis, 29 Dec 2011, http://www. youtube.com/watch?v=hlWyTqL1hFA

7. Bitcoin's block number 0, http://blockexplorer.com/b/0

8. Bitcoin's block number 180,000, http://blockexplorer.com/b/180000

9. Cormen, T.H., Leiserson, C.H., Rivest, R.L., Stein, C.: Introduction to Algorithms, Second Edition. MIT Press and McGrawHill, 2001. Chapter 21: Data structures for Disjoint Sets, pp. 498-524.

10. Forbes: Top 10 Bitcoin Statistics, http://www.forbes.com/sites/jonmatonis/ 2012/07/31/top-10-bitcoin-statistics/ 11. Block chain: Bitcoin charts http://blockchain.info/charts

附录比特币网络的大型交易流



图1 比特币网络大型交易图(大于50000 BTC’s)的主干。红色的字母指的是比特币网络里一些最活跃的实体,如表7所示。

注:上图中左下角各个图案的含义依次为

很多小交易的流入

一个实体的一个地址的余额为X*1000BTC’s

在下面有详述的子图

通过Mt.Gox的一些交易

X和Y地址(可能还有其它地址)由同一个实体拥有

收到X*1000BTC’s后从未发送

X*1000BTC’s在2011年m月d号被转移(除非另有说明)



图2  指向2010年11月8号第一个90,000BTC’s的大型交易的比特币流向的追溯

图3  一个长链的交易,每个地址保留了少量的BTC。总额高达140,000 BTC’s

图4  一个长链的交易,每个地址转移了它的大部分BTC。其余的部分分布成一个二进制树形结构。

图5  一个实体以自我循环发送90,000BTC’s给自己,然后转移掉又通过90次转移每次1000BTC’s又拿回了这90,000BTC’s,所有这些都在同一天进行。其中的31,000BTC’s之后又转移了。

图6  大量的BTC从一个地址转移到另一个,通过发送其中的部分到中间地址,然后合并到同一目的地。



图7  大量的BTC迅速转移,在很短的时间内以数以百计的交易形成了一条非常长的链



图8  大量的BTC’s被转移,通过将其分裂成相同数量的部分,每部分直接转移到属于同一实体的不同地址,然后大多数的累计金额就被转移到一个单一接收者了。



图9  与图8有类似的情况,但有更多的中间地址



图10  数量最大的被转移的BTC’s最终通过一个二进制树形结构被分布到许多地址

论文原文:http://124.254.47.36/download/43561911/63831110/6/pdf/139/62/1367844305803_574/584.pdf

作者:Dorit Ron, Adi Shamir

翻译:qiurong910326

来自:http://bbs.btcman.com/forum.php?mod=viewthread&tid=5212

btcfans公众号

Scan QR code with WeChat

From the Internet
Disclaimer:

Previous: Litecoin创造者Charlie Lee加入Coinbase Next: 我来说说Bitstamp和还有和MtGox的区别

Related