中本聪在伦敦,创造比特币
拔开云雾,层层分析。
本文最初发表于 The Chain Bulletin 网站,InfoQ 中文站翻译并分享。
通过对中本聪在 Bitcointalk 发的帖子、在 SourceForge 的提交和电子邮件,以及其他可获得的数据进行分析,研究人员指出,匿名比特币发明者最有可能在伦敦。
在 2011 年 4 月,当中本聪决定永远 离开 这一领域时,他并没有留下多少东西。但是,他确实留下了足够的线索,足以让我们彻底调查他在研究 比特币 时的行踪。
调查方法
为了开展这项调查,我们从以下方面收集数据:
中本聪的 Bitcointalk 账户(539 个可用帖子);
他在密码学与比特币邮件列表发的 34 封 电子邮件;
他在 SourceForge 上的 169 次 提交;
2008 年 和 2009 年 比特币白皮书版本的元数据;
创世 区块;
各种 互联网档案馆 的资料。
这项调查的数据驱动部分主要集中在中本聪在 Bitcointalk 发布的帖子、在 SourceForge 的提交以及电子邮件的时间戳,这些时间戳总共代表了 206 天(并非连续的)的 742 个活动实例。时间戳数据从 2008 年 10 月 31 日开始,也就是他第一次在密码学邮件列表上宣布比特币,到 2010 年 12 月 13 日结束,也就是他发送最后一封已知带有 UTC 时间戳的邮件。
利用这些数据,我们绘制了不同可疑时区的散点图,以查看他何时活跃,何时不活跃。然后,我们利用收集到的其他数据,进一步证实他称之为家的最有可能的地点。
常见的可能地点是英国时间(GMT)、美国东部时间(EST)、美国太平洋时间(PST)、日本(JST)和澳大利亚(AEST)。最后两个地点很容易被排除,但前三个地点需要进一步检查。
Bitcointalk 活动
从 2009 年 11 月 19 日开始,中本聪在 Bitcointalk 上发布了 539 个帖子。
欧洲 / 伦敦时区
中本聪在 Bitcointalk 活动的散点图,从 2009 年 11 月 22 日的第一个帖子到 2010 年 12 月 12 日的最后一个帖子,基于欧洲 / 伦敦时区的星期几和一天中时间。
重要提示:
上图很容易让人感到迷惑,他们可能会观察中间的空白区域,然后断定中本聪在早上 6 点左右上床睡觉,在这个时区一直睡到下午 1 点。然而,例如,他一天中最后一次活动是在早上 6 点到 7 点之间进行的情况,只占我们有活动数据的所有日子的 2% 左右。这意味着他通常不会在凌晨之前进行活动(特定于这个时区),但只在少数情况下会这样活动。
事实上,仔细研究数据就会发现,他在这个时区一天中的最后一次活动的大部分时间是在凌晨 1 点到 3 点之间,占所有日子的 20%。为了消除可能的误解,我们还基于我们所测试的每个时区的可用数据及其代表性,以 6 小时为范围、一个任意的起点,绘制出最后一次活动的中位数。
美国 / 东部时区
中本聪在 Bitcointalk 活动的散点图,从 2009 年 11 月 22 日的第一个帖子到 2010 年 12 月 12 日的最后一个帖子,基于美国 / 东部时区的星期几和一天中时间。
美国 / 太平洋时区
中本聪在 Bitcointalk 活动的散点图,从 2009 年 11 月 22 日的第一个帖子到 2010 年 12 月 12 日的最后一个帖子,基于美国 / 太平洋时区的星期几和一天中时间。
第一眼看上去,这三个地点似乎都是合理的。在伦敦,中本聪是个夜猫子,工作到凌晨,睡到中午。在美国东部,他一直工作到一天结束,然后睡到凌晨。而在美国西部,他是一个早起的人,晚上很早就上床睡觉,但也很早就起床了。单看这些数据本身,毫无疑问,我们无法确定中本聪所处的时区。
提交活动
在比特币的早期阶段,中本聪和少数几个一开始就加入项目的开发者可能是在没有 SVN 的情况下工作,也可能使用本地仓库。但在 2009 年 8 月 30 日,该项目被上传到了 SourceForge。所有的提交,仍然可以在 这里 查看。总共有 169 次提交是由中本聪本人完成的,或者说他在 SourceForge 上的用户名是 “s_nakamoto”。每次提交的时间戳仍以 UTC 格式保存(证明 时间戳是以 UTC 格式)。
与我们对 Bitcointalk 帖子所做的类似,我们绘制了散点图,并查看中本聪在三个可能时区在 SourceForge 上活跃的时间。
欧洲 / 伦敦时区
中本聪在 SourceForge 活动的散点图,从 2009 年 10 月 21 日的首次提交到 2010 年 12 月 15 日的最后一次提交,基于欧洲 / 伦敦时区的星期几和一天中时间。
美国 / 东部时区
中本聪在 SourceForge 活动的散点图,从 2009 年 10 月 21 日的首次提交到 2010 年 12 月 15 日的最后一次提交,基于美国 / 东部时区的星期几和一天中时间。
美国 / 太平洋时间
中本聪在 SourceForge 活动的散点图,从 2009 年 10 月 21 日的首次提交到 2010 年 12 月 15 日的最后一次提交,基于美国 / 太平洋时区的星期几和一天中时间。
提交的散点图与在 Bitcointalk 发帖的散点图相一致。尽管这是个好消息,也是意料之中的事情,但它并没有指向三个可能地点中的任何一个。不过目前来看,这三个地点都是合理的。
邮件列表活动
2008 年 10 月 31 日,中本聪在密码学邮件列表上 宣布 了他的项目后,继续与该邮件列表中对比特币感兴趣并想了解更多信息的成员进行交流。在中本聪自己 创建 的密码学邮件列表和比特币邮件列表上的一系列 34 封邮件中,他详细讨论了这个项目的特点,很多人都集中在双重支付(double-spending)问题以及比特币如何解决这个问题上。这批邮件的 最后一封 是 2010 年 12 月 13 日的。
这里 有更多中本聪发给其他人的邮件,但我们无法验证这些邮件中的时间戳是否使用了 UTC 格式。这包括他给 Mike Hearn、Wei Dai、Lazlo Hanecz、Jon Matonis 和 Dustin Trammel 的邮件。所以对于这些图表,我们只使用密码学和比特币邮件列表中的数据。
欧洲 / 伦敦时区
中本聪在邮件列表活动的散点图,从 2009 年 10 月 31 日的第一封邮件到 2010 年 12 月 13 日的最后一封邮件,基于欧洲 / 伦敦时区的星期几和一天中时间。
美国 / 东部时区
中本聪在邮件列表活动的散点图,从 2009 年 10 月 31 日的第一封邮件到 2010 年 12 月 13 日的最后一封邮件,基于美国 / 东部时区的星期几和一天中时间。
美国 / 太平洋时区
中本聪在邮件列表活动的散点图,从 2009 年 10 月 31 日的第一封邮件到 2010 年 12 月 13 日的最后一封邮件,基于美国 / 太平洋时区的星期几和一天中时间。
再说一遍,这只是对我们已经建立的模式的确认。电子邮件的散点图仍然没有显示出倾向于三个可能地点中的任何一个。现在让我们把所有的时间戳组合起来,看看我们能得到什么。
所有活动
将所有 539 个 Bitcointalk 帖子的时间戳与 169 个提交时间戳和 34 个电子邮件时间戳合并,我们可以更好地了解中本聪的活动模式。
在这个综述中,第一个活动是 2008 年 10 月 31 日,他在密码学邮件列表中宣布了比特币。最后一个活动是 12 月 13 日,当时他宣布 0.3.19 版本的发布。
欧洲 / 伦敦时区
中本聪在 Bitcointalk、SourceForge、邮件列表活动的散点图,从 2008 年 10 月 31 日的第一次到 2010 年 12 月 13 日的最后一次,基于欧洲 / 伦敦时区的星期几和一天中时间。
美国 / 东部时区
中本聪在 Bitcointalk、SourceForge、邮件列表活动的散点图,从 2008 年 10 月 31 日的第一次到 2010 年 12 月 13 日的最后一次,基于美国 / 东部时区的星期几和一天中时间。
美国 / 太平洋时间
中本聪在 Bitcointalk、SourceForge、邮件列表活动的散点图,从 2008 年 10 月 31 日的第一次到 2010 年 12 月 13 日的最后一次,基于美国 / 太平洋时区的星期几和一天中时间。
还有人注意到欧洲 / 伦敦市区和美国 / 东部时区的大“S”吗?不管怎样,将所有的时间戳数据绘制成一张图,仍然不能判断出中本聪的位置。它仍然可能是这三个可能地点中的任何一个。
顺便说一下,这是一个好主意,可以快速将日本和澳大利亚排除在外。
亚洲 / 东京时区
中本聪在 Bitcointalk、SourceForge、邮件列表活动的散点图,从 2008 年 10 月 31 日的第一次到 2010 年 12 月 13 日的最后一次,基于亚洲 / 东京时区的星期几和一天中时间。
很显然,中本聪的家不大可能在日本。虽然这张图本身就大大降低了中本聪在研究比特币时家住东京的可信度,但我们从调查中发现的其他事实完全排除了日本作为一个可能地点的可能性。我们很快就会讲到这一点的。
澳大利亚 / 悉尼时区
中本聪在 Bitcointalk、SourceForge、邮件列表活动的散点图,从 2008 年 10 月 31 日的第一次到 2010 年 12 月 13 日的最后一次,基于澳大利亚 / 悉尼时区的星期几和一天中时间。
除非中本聪是个吸血鬼,否则这个根本不可能,而且你不需要更多的数据来证明这一点。如果下次当你无法说服某人相信 Craig Wright 不是中本聪时,你可以随时把上图发给他们看。
总之,中本聪在 Bitcointalk 和 SourceForge 上的活动以及他的电子邮件,都形成了一个清晰的模式。利用这种模式,我们可以合理地猜测这位神秘的比特币发明者在从事该项目时的居住地。
上面所有图表所显示的模式都清楚地证实了三个最有可能的时区:格林威治标准时间 (GMT)、东部时间(ET)和太平洋时间(PT)。
“财政大臣站在第二轮救助银行的边缘”
当我们看到比特币 创世区块 和其中嵌入的信息时,事情真的开始指向格林尼治时区,特别是伦敦:
英国《泰晤士报》,2009 年 1 月 3 日,财政大臣站在第二轮救助银行的边缘。(The Times 03/Jan/2009 Chancellor on brink of second bailout for banks)
这里的关键细节是标题:“财政大臣站在第二轮救助银行的边缘”。这个标题出现在 2009 年 1 月 3 日的《泰晤士报》(The Times)上:
《泰晤士报》2009 年 1 月 3 日的头版显示了现在传说中的“财政大臣站在第二轮救助银行的边缘”的文章
问题是,如果中本聪生活在美国的任何地方,他会在创世区块中加入这一信息,而这期《泰晤士报》并没有在美国发行。
2006 年 5 月 26 日,《纽约时报》(The New York Times)宣布,《泰晤士报》计划从 2006 年 6 月 6 日,在纽约和华盛顿地区发行美国版。抛开《泰晤士报》美国版有限的发行区域不谈,它似乎也与英国版相差很多。一位居住在美国的《泰晤士报》热心读者就 发现 了这一点:
《泰晤士报》美国版为 64 页,周六版为 96 页。美国版包含了《泰晤士报》最精华的内容:Times 2 和周六版的部分内容,特别是杂志。页数少,意味着必须有所选择!美国版第 1 页至少有 10 个国际(不包括英国)摘要 / 交叉参考故事(文字和图片)。它的重点是第二页的商业新闻:在这页的标题《全球商业简报》(Global Business Briefing)下面有许多摘要。与英国版不同的是,新闻版面是以《世界新闻》(World News)开篇,一直到社论版 / 评论版(Comment/Opinion)(该部分与英国版相同)。
而《泰晤士报》英国版是从评论版之后开始的,然后是专题版(Features),这是 Times 2 的精华(周六版则是《周六号外》(Saturday Extra))。这之后就是商业版(Business),接下来就是讣告版面(Register),然后就是一整版的谜题与游戏(英国版没有),最后就是体育运动和一些独家专题(如 Michelle Henery 在伦敦的《纽约客》(New Yorker)专栏)。
所有的美国记者和评论员,比如 Gerry Baker,都得到了很好的展示——而且报纸规模小于英国版的事实,意味着你会自然而然地感觉到对美国新闻的偏见。美国版的读者对象是纽约和三个州的通勤地区的严肃、国际化的商务人士。
这样一来,2009 年 1 月 3 日《泰晤士报》美国版头版版面与英国版版面相同的可能性就极小了。事实上,从上述解释提供的信息来看,当天美国版的头版很可能刊登了许多国际新闻的标题。有关标题可能有,也可能没有。但我在任何地方都找不到 2009 年 1 月 3 日美国版《泰晤士报》的截图。如果你正好有,请发给我们。
话说回来,谁还在乎报纸呢?2009 年的时候,互联网已经非常发达了,连媒体都有网站了。也许中本聪只是直接用了《泰晤士报》的网站?也不尽然。虽然《泰晤士报》确实已经建立了网站(当时是 timesonline.co.uk),但有关文章的标题却 略有不同:
财政大臣 Alistair Darling 站在第二轮救助银行的边缘(Chancellor Alistair Darling on brink of second bailout for banks)
这个标题包含了财政大臣的名字,如此一来,中本聪读到《泰晤士报》网站上的文章的可能性就变得很小了,因为如果他读到了的话,他很可能会把这一确切的标题写进创世区块,而不是报纸版头版上的那个标题。
在这一点上,天平严重倾向于格林尼治时区,这还没有提到所有指向中本聪是英国人的线索,比如他用 -ise 代替 -ize,用 -our 代替 -or,例如,analysis,organise,neighbour,color 等等。还有就是他对 bloody 这个词的 使用。更具体地说,我们不仅认为他是英国人,而且认为他在研究比特币时也住在伦敦。
同样,争论的焦点是《泰晤士报》的文章。
2008 年 7 月 8 日至 2008 年 12 月 8 日期间,《泰晤士报》读者人口统计轮廓
2008 年全国读者调查的 数据 显示了当年《泰晤士报》的人口结构,在印刷版 180 万读者群中,有 77 万(43%)来自伦敦。其余的则被分到了大不列颠的不同地区。几乎每两个人中就有一个人在阅读《泰晤士报》。结合我们迄今为止所提供的所有其他数据,再加上伦敦是世界上最大的金融中心,这一数据使得中本聪在 2008 年至 2010 年期间居住在伦敦的可能性很大。
反驳
一个论点如果我们不从各个角度去攻击,那么它就不会是好的论点。我们提供的时间戳数据是没有争议的。但关于创始区块的信息,有几件事我们需要考虑。
白皮书元数据
PDF 文件包含元数据。当中本聪写出比特币白皮书 第一稿 并将其保存在他的计算机上时,其中包含了一个时间戳。更重要的是,它包含了计算机的时区。元数据如下:
CreationDate(D:20081003134958–07’00’)
这相当于 2008 年 10 月 3 日 13:49:58 UTC-7。在太平洋时区,夏令时(DST)从 3 月的第二个星期日开始,一直持续到 11 月的第一个星期日。因此,比特币白皮书第一稿中的日期来自美国 / 太平洋时区,通常是 UTC-8,但在使用 DST 时变成 UTC-7。
在比特币网站上目前可用的白皮书版本中,元数据如下:
CreationDate(D:20090324113315–06’00’)
这相当于 2009 年 3 月 24 日 11:33:15 UTC-6。这个日期也属于夏时制,但显然不是太平洋时间。它是北美山区时区(MT)。属于这个时区的州包括新墨西哥州、亚利桑那州和犹他州。
关于这个元数据有几种解释。最明显的一种解释是中本聪使用虚拟机进行了一些活动,并将时区设置为任何时区。另一种可能是他在处理这些文件时,手动设置了电脑的时区。
还有一种可能是,就是中本聪并没有亲自制作 PDF。他可能是在 Word 文档中写了论文,然后发给别人做最后的编辑。这也许可以解释两个版本的论文的不同时区,因为他可能把第二个版本发给了不同的人。
说到这里,如果中本聪确实创建了那些 PDF 文件,而且我们知道他在涉及隐私时非常谨慎,那么他极有可能忘记清除或修改其中的元数据。因此,我们可以合理地假设,他并不认为 PDF 中有任何元数据会以任何方式暴露他,使得其中的时区数据变得无关紧要。
《泰晤士报》的数字化访问
正如我们之前提到的,中本聪在《泰晤士报》网站看到了《财政大臣站在第二轮救助银行的边缘》的标题后,没有将其列入创世区块,因为那里的文章标题与报纸上的不同。不过,互联网档案馆 显示,《泰晤士报》网站上有一个网页,每天都上传了报纸封面的截图。
2008 年 11 月 19 日《泰晤士报》网站报纸页面的互联网档案,上传了其印刷版的封面快照
遗憾的是,这一页没有 2009 年 1 月 3 日的互联网档案馆快照,但很有可能存在当天报纸封面的截图。此外,其他出版物也刊登了来自世界各地报纸的每日头条新闻摘要。其中包括路透社(Reuters),该社在 2009 年 1 月 3 日的一篇 评论文章 中收录了《泰晤士报》的《财政大臣站在第二轮救助银行的边缘》一文。
《泰晤士报》还提供了一个 电子报纸订阅服务,订阅者可以付费购买该报纸的数字版。所有这些都表明,即使中本聪家住美国,他也有很多途径可以看到他列入创世区块的标题。
然而,当一个人可以直接打开网站的主页,在那里阅读新闻时,为什么要去《泰晤士报》的报纸页面或使用他们的电子报纸订阅选项来查看报纸的封面呢?此外,对于任何读过中本聪的电子邮件和论坛帖子的人来说,很明显,他知道自己正在进行一些特别的事情。他试图不引起太多的炒作,但很明显,他认为比特币可以做大。这可能使创世区块成为中本聪的重要历史事件,以至于他决定在其中加入一条永远经得起时间考验的信息。自然,这就意味着他要寻找一些主题性的、特殊的、值得纪念的东西。这样的体验,是很难通过阅读一篇包含 20 个标题的综述文章,或者听一个早间节目主持人读报纸标题来实现的。
但也许有可能中本聪在几天后听说了这篇文章,并认为这篇文章作为创世区块的信息是最合适的。创世区块之后的第一块比特币区块于 2009 年 1 月 9 日被挖出。在这个情况中,例如,他在 1 月 7 号得知了这篇文章,在那一天重新编写了创始区块的代码,然后在第二天挖掘了第一个区块,在他和 Hal Finney 之间创建了有史以来第一笔比特币交易。对于那些不知道的人来说,创世纪区块不是被挖出来的。它是比特币源代码中的几行文本。这里是该软件的 0.1.0 版本(Nakamoto 于 2009 年 1 月 8 号首次公开发布):
char* pszTimestamp = "The Times 03/Jan/2009 Chancellor on brink of second bailout for banks";
CTransaction txNew;
txNew.vin.resize(1);
txNew.vout.resize(1);
txNew.vin[0].scriptSig = CScript() << 486604799 << CBigNum(4) << vector((unsigned char)pszTimestamp, (unsigned char)pszTimestamp + strlen(pszTimestamp));
txNew.vout[0].nValue = 50 * COIN;
txNew.vout[0].scriptPubKey = CScript() << CBigNum("0x5F1DF16B2B704C8A578D0BBAF74D385CDE12C11EE50455F3C438EF4C3FBCF649B6DE611FEAE06279A60939E028A8D65C10B73071A6F16719274855FEB0FD8A6704") << OP_CHECKSIG;
CBlock block;
block.vtx.push_back(txNew);
block.hashPrevBlock = 0;
block.hashMerkleRoot = block.BuildMerkleTree();
block.nVersion = 1;
block.nTime = 1231006505;
block.nBits = 0x1d00ffff;
block.nNonce = 2083236893;
这种情况不太可能,因为创世区块的时间戳(block.nTime),转换过来就是 2009 年 1 月 3 日 18:15:05 UTC。在 财政大臣的文章发表几天后听到,然后返回并将创始区块的时间戳设置为 2009 年 1 月 3 日的随机一个小时,这是很不可能的。
最后,如果《泰晤士报》网站上的文章标题后来被改成了财政大臣的名字,但最初并没有,而且与创始区块中的标题相同,那该怎么办?这是不可能的,因为我们发现 2009 年 1 月 3 日的帖子(1、2)引用了《泰晤士报》网站上的文章标题,因为它仍然可以在那里找到。
结论
我们不可能绝对肯定地说,中本聪在研究比特币时住在哪里:至少从现有数据来看是不可能的。但是,我们可以合理地肯定地说,他当时位于伦敦。综合来看,他的写作风格、他的活动模式,以及创世区块的信息,公然指出英国伦敦是中本聪最有可能居住的地点。
Scan QR code with WeChat