Arweave:一场永久存储的实验
几句话看懂 Arweave:
优点:
Arweave 是一个试图以去中心化、抗审查的方式实现永久数据存储的协议/网络。
内置一种创新的经济模式——「捐赠池」(endowment pool)——以支持长期可持续发展。
因为永久存储和数据托管特性,Arweave 对 NFT 和 Web3 应用有更强的吸引力。
存储价格以 AR 计价,但 Arweave 有一个无需依赖预言机的、精心设计的定价机制对抗价格波动。
基于上述种种,Arweave 拥有更阔的应用场景如数据溯源、数据可用性、存在证明等。
缺点:
“永久”意味着一段很长的时间。如果用户今天支付了比其他解决方案更高的价格是因为他们提前支付了未来的存储成本、且这些数据在未来几十年都可用,这样才有意义。
随着 Arweave 的普及,它存储的数据量将呈指数级增长(现在已经达到了 8.5 TB)。尽管 Arweave 已经尽可能做出了努力(如全节点不需要同步整条链的数据),但矿工的集中化仍然是一个问题。
「牺牲型挖矿」(Sacrifice Mining)可能会成一种新的基于剥削的收益方式。这里的风险在于,矿工为了提高自身获得区块奖励的机率而上传无效数据到 Arweave 以扩大整个网络的数据规模。
尽管有捐赠池机制(endowment pool),考虑到 Arweave 极长的项目生命周期,Arweave 可能需要再斟酌一下长期激励的可持续性。
永久存储的故事需要多个同时存在的复杂技术的高度配合。由于 Arweave 的解决方案仍处于起步阶段,不排除未来会不断有新技术涌现从而对 Arweave 造成威胁。作为这一领域的先驱,Arweave 必须意识到这个问题,并做好应对。
一场永久存储实验
Arweave 是一个令人兴奋的项目,其目标是让用户仅支付一次就能将其数据永久存储在 Arweave 上(至少 200 年)。现今的互联网,虽然数据呈指数级增长,但往往有旧数据丢失或被盗事件发生。这是因为目前几乎所有数据都是中心化地存储的,而这些数据托管者的动机也许与希望访问自有数据的用户不一致。在数字时代,永久存储将是一种未来视角下非常新颖的价值主张。从更恒远的视角来看,数据永久性将以一种人人可访问但无人可编辑的方式保存历史真相。人类的历史将不再是胜利者的历史,每个人都能永远保存自己的数据。
Arweave 上的信息由去中心化且可持续的激励设计来保证其可持续性。利用 PoW 的恒定特性,Arweave 实现了可扩展的和永久数据存储。它雄心勃勃地设计了能够承载比当今网络更大规模的数据容纳量。不过,当前的区块链并不适合存储大量数据。数据越多,全节点的同步成本越高,这必然有悖于去中心化和可拓展性。那么 Arweave 怎样保证这一点呢?我们先从一个小例子聊起。
PoW 链需要全节点同步所有区块以验证整个链的合法性。随着时间的推移,一条链上的区块会越来越多,链的数据规模会越来越大,需要占用更多的资源来维持整个链。这通常被称为状态通胀(state bloat)。因此,这一定程度上限制了全节点的数量,还降低了去中心化程度和访问性能。
这个关系如下图所示。
https://codaprotocol.com/blog/solving-the-scalability-trilemma
许多区块链状态增长往往是被限制的,以平衡其维护成本,如在比特币上区块大小和时间是强制线性增长的。然而,在 Arweave 的 case 中,我们看到了截然不同的增长轨迹。下面是两种数据结构的比较。Arweave 上的状态数据已经比特币网络的 25 倍,但整个链仍然可以存储在市面上常见的笔记本电脑上。
Arweave 的可扩展性可以由 Blockweave、Wildfire、Blockshadows 和 SPoRA 等多种技术解决,且这些技术可以共存。如果这听起来像胡言乱语,别担心。在本文中,我们会从顶层设计出发讲述他们,而不是逐个吃透。
Blockweave(简称 Weave)是与 Arweave 类似的区块链数据结构。它与传统的区块链不同,Blockweave 不需每个节点同步整个链。无论 Weave 的网络有多大,矿工们仅需下载部分区块就可以立即开始挖矿。这降低了达成共识的门槛,但新的问题是,如何保证网络账本不会因为矿工作恶产生分叉?
基于 Weave 的技术,每个区块将通过密码学算法从前序区块中随机选择区块验证数据(recall chunk)。这意味着随机被选中的历史数据将参与新区块的产生。在这种机制下,为了获得出块奖励,矿工不仅要赢得 PoW 哈希率竞赛,而且还要保证历史数据的随时可用。新的挖矿游戏是这样的:
Probability (win reward) = Probability (has old data) x Probability (finds hash first)
赢得区块奖励的概率 = 拥有历史数据的概率 x 第一个找到 hash 的概率
因为存储成本比算力成本低,所以矿工们自然会在优化算力硬件之前优化他存储硬件,这间接导致整个网络偏向存储而非计算。在未来,如果 weave 变得很庞大(这毕竟是他们的初衷)、无法由任何单一矿工维护,那么其他矿工将主动寻找还没有被复制得很广泛的“稀有”块,从而有效地使用它们的算力。这种激励机制正是 Arweave 的核心,这确保了无论 Weave 网络变得多么庞大,每一个区块的数据都会被某个矿工保存到某处。因此,从本质上来说,矿工不需要根据 Weave 网络的规模来扩展他们的存储设备,因为他们可以只存储整个网络的一部分。
这种机制被称为“访问证明”(Proof of Access,“PoA”,不是 Proof of Authority 的 PoA)。PoA 的确可以确保矿工存储了网络数据,但矿工也可以使用远程服务器以降低成本,而服务器都是中心化的,这不可避免地有悖于去中心化理念。团队承认了这一点,并随后将共识升级成了「SPoRA」(Succinct Proofs of Random Access,随机访问的简洁证明)。SPoRA 通过加强数据检索速度在区块奖励中的权重来遏制矿工使用诸如 AWS、谷歌云等云服务器存储数据,如此一来,使用本地硬件参与网络的矿工将获得更高的激励。简言之,SPoRA 的出台不是为了防止矿工的集中,而是为了防止存储资源的集中。目前市场对 SPoRA 的看法是积极的,且网络资源已经自 2021 年 2 月起已经切实有了改变。话虽如此,SPoRA 的安全性和涉及更大规模数据时的同步效率还有待考证。
SPoRA 是首个鼓励存储资源去中心化的矿业实验之一。相比纵容中心化存储的对手,这就是创新。
永久存储的经济设计实验
除了网络共识和数据存储,Arweave 的通证经济对于整个网络能否(在理想情况下)长期自主运作至关重要。Arweave 采用了一种新的商业模式,用户只需付费一次就可以将其数据永久存储在 Arweave 上。Arweave 经济的基础设计很棘手,因为:
用户以法币购买网络资源,而网络内的价值则以 AR 捕获。
与其他链不同,矿工体验问题从未很快得到解决。事实上,这些问题从未得到解决。
鉴于上述原因,Arweave 网络必须确保矿工有足够的盈利空间。如果利润空间变薄、导致矿工。为了一个健康的网络,必须很好地预估成本、平衡矿工收益。
存储成本
Arweave 的一次性付费模式是基于整个网络不断降低的存储成本的。根据已有资料,全球网络的数据存储成本正在随着时间的推移显著下降。如下图所示,近 50 年来,数据存储成本正以年均 30.57% 的速度降低。
https://www.arweave.org/yellow-paper.pdf
更重要的是,由于存储技术仍远未达到理论上限的技术瓶颈,这种逐年下降的趋势仍将延续。如果我们把 Arweave 网络的所有成本无穷相加,这种可以预见的成本下降意味着永久存储的成本边际是可以预见的。下面,我将用最简单的方式讲解 Arweave 如何计算永久存储的成本。
首先,Arweave 基于市面上不同容量和规格的硬盘价格预估了在硬盘上存储 1GB 数据 1 小时的价格。接下来,它根据这个初始价格,保守估计了未来的存储成本,即,假设存储成本的年平均降幅为 0.5% 而不是 30.57%,再将所有未来成本加起来,Arweave 就可以得出未来成本的边界,这便是假定的矿工永久存储成本。这个成本构成了所有用户端费用的基础。上述成本将随着市场价格定期重新计算。
矿工收入方式
矿工们在 Arweave 中有两个收入来源:
网络手续费
区块奖励
区块奖励遵循算法设计呈下降趋势,不受外部因素的影响。手续费主要来源于用户的一次性付费,每一笔用户付费中至多有 14% 会直接分给矿工,并加入流通量。
另一部分(~86%)将进入捐赠池(endowment pool ),以支持 Arweave 上的数据运维。当矿工无法覆盖其挖矿成本时,捐赠池就会发放补贴给矿工。不然捐赠池内的资金只会无限积累,以备不时之需。因此,捐赠池中的通证是长时间不流通的。目前,捐赠池中约有 50 万美元的 AR。随着捐赠池中 AR 的积累,捐赠池补贴可能会超过区块奖励。这个通证经济实验如下图所示:
永久存储实验的目的是确保链上数据总是有足够的备份从而避免有数据丢失。而想要实现这一点就要让矿工有足够利润。如图所示,矿工利润漏斗一定不能为空。
需要注意的是,上图的比例并不能准确反映手续费的分红。目前,交易费用收入只占矿工总收入很小的一部分(<0.1%)。同样,捐赠池中积累的费用也小于流通量的 0.1%。
抗波动机制
当 AR 价格上涨 10 倍时,如何避免存储成本增加 10 倍?反之,当 AR 价格下降时,Arweave 该如何激励矿工?
为了解决上述问题,Arweave 设计了一个以 AR/MB 为单位动态存储价格调整模型。该模型使用挖矿难度而非预言机价格作为价格调整依据。原理如下:
当 AR 价格下降时,矿工利润空间变薄,矿工可能会离开网络。此时,Arweave 会使一定程度上降低哈希率和挖矿难度,间接增加矿工收益;
反之,当 AR 价格上升时,矿工变多,Arweave 就会增加哈希率和挖矿难度,间接降低矿工收益。
比起单纯地依赖预言机,这个模型通过调整挖矿难度和矿工收益抵消价格波动,从而实现了对法币稳定性。如果 AR 下跌,该模型将增加 AR/MB 的一次性付费价格;反之亦然。这一机制虽然无法阻止 AR 价格的波动,但长期来说是优秀的抗波动机制。
如下图所示:
用户引导
Arweave 上的大多数数据交互都发生在应用层,也就是「永久互联网」(permaweb)。顾名思义,永久互联网是普通互联网的永久版本。目前,永久互联网上已经运行着数百个网站和应用程序。用户不需要区块浏览器,仅仅使用传统浏览器就可访问这些网站和应用。然而,用户数据的每次写入(上传 Dapp、文件、URL 等等)需要使用 Arweave 钱包支付手续费。好在新用户可以在创建钱包后转发一个 Arweave 推特完成验证,从而获得 Arweave 水龙头免费发放的初始 AR。
作为 Arweave 应用平台,Permaweb 对于开发者构建顶层应用有一定原生优势,如永久数据存储、数据可用性、数据完整性、数据合法性、抗审查性、可访问性、防篡改性。这为 Arweave 吸引各种各样的应用和用户打好了基础,如 DeFi、研究者、律师、记者、政府机构等。
如今,permaweb 托管着数百个集成了这些优良特性的一个或多个的 DApps。以下是其中的佼佼者:
ArDrive – 永久存储的去中心化百度云
Weave mail – 永久存储邮箱软件
Verto.exchange – 为利益共享型通证而生的去中心化交易所
Koi.rocks – 看展可以获得奖励的虚拟NFT画廊
Pianity – 音乐 NFT 平台
此外,Permaweb 上的应用大多使用主流编程语言如 HTML、JavaScript 和 CSS 来实现,无需开发者重新学习区块链编程语言。
利益共享社区
利益共享社区(Profit Sharing Communities)是 Arweave 推出的一种旨在激活开发者社区活力的新型社区模式。在这种社区中,开发者和创始人们可以通过 PST(Profit Sharing Tokens )实现新的变现方式。开发者可以选择是否在自己的应用中添加利益共享机制,添加之后,用户在这个应用上的每次 tx 消耗都将转化为 AR 小费。AR 小费积攒到一定数量,就会按 PST 持有比例分给所有持有者。PST 可以在交易所买卖。
利益共享计划已经在 permaweb 上孵化了上百个项目并极大促进了全球开发者对 Arweave 的需求,这无疑也是长期有利于整个存储网络成长的。
牺牲型挖矿
Arweave 网络的一个重要增长来源于「牺牲型挖矿」(Sacrifice Mining)。促成这个行为的需求不仅源于数据提供方,同时也源于数据需求方。在理解牺牲型挖矿之前,我们先回顾一下矿工是如何获得奖励的。正如前文所说,矿工需要尽可能增加他们的存储空间和算力来增加他们赢得区块奖励的机会。而当一个矿工存储的数据备份相对稀有的时候,他还可以在这份竞争中获得加权。
最近,Arweave 团队发现矿工中存在一种作弊行为,即矿工仅上传数据而不与其他矿工分享这份数据。这样做可以利用数据稀有性提高他们获取区块奖励的概率。诚然,他们需要“牺牲”(花费)一部分 AR 去上传这份数据。这便是“牺牲型挖矿”一名的由来。不过,这些数据并不具备生产性,只是单纯地扩大网络规模。矿工的收益依赖许多因素,但最主要的因素显然是 AR 的价格。所以,Arweave 很难对这种行为一刀切,但同时也不希望矿工们仅仅为了自己的利益就用垃圾数据无谓扩大网络规模。
重要的是,blockweave 的机制不允许任何矿工长期囤积数据。每个新区块产生的时候,矿工都必须分享他们藏着掖着的数据。在一群人看来,这意味着牺牲型挖矿的潜在回报是短暂的;但在另一群人看来,这也意味着矿工可以继续给网络塞垃圾数据,只不过只能藏一小段时间,但仍然有获利的可能。理论上,矿工很有可能会继续这样做,直到概率调整后区块奖励的边际收益低于上传垃圾数据的费用。这可能需要很长时间,Arweave 也不得不继续接受垃圾数据;而此行为对于抬升 AR 的价格毫无意义,因为矿工可以用自己赚取的 AR 来做这件事。在我们看来,“牺牲型挖矿”这个名字仍然过于纵容这件本质不过是矿工内卷的事。
Arweave 与 NFT
尽管 NFT 存在于链上,但它们通常承载着“链下资产(如数字艺术品、音频/视频文件、GIF、活动门票等)”的价值,因为想把这些文件完整存储上链的成本非常高昂。@RealAllenHena 一条推文清楚地说明了当前主流 NFT 平台的存储解决方案。由此可见,目前主流方案仍然是通过 IPFS 或图床 URL 链接在通证和资产之间建立联系的。
尽管 IPFS 的确是一种较为流行的分布式存储解决方案,且具有一定抗审查性,但 IPFS 并不能保证其数据的永久性。各个保存文件的关键节点并没有必要的理由来永久保存这份文件。因此,无论是在中心化服务器上、还是在 IPFS 上,数据资产的存储时间都依赖于托管者的善良。在 IPFS 上,如果附近无节点响应,你可能连接不上、或永远丢失这份文件;而如果托付给图床,一旦无人运维,URL 链接也可能会失效。
此外,在 IPFS 上搜索内容可能需要数分钟。这对于某些 NFT 产品的使用体验来说不太理想。Mintbase 是最早在 Arweave 上存储 NFT 元数据的平台之一。基于 Arweave 的优良特性,Arweave 可能会吸引越来越多的 NFT 平台、艺术家和相关开发者入驻。
加密行业的脊梁
正有越来越多的项目正在使用 Arweave 存储加密行业有关的数据,其中不乏 DeFi 领域的杰出用例:Uniswap 和 Compound 已经把前端程序整个存放到了 Arweave 上。
对于单机状态的早期区块链(standalone blockchains)来说,Permaweb 也不是不错的状态数据存储选择。例如,著名公链 Solana 就曾和第三方开发者合作以把 SOLAR 桥上的交易都存储到 Arweave 上去,以实现永久、去中心化的状态数据存储。像这样把源码或状态数据放到 Arweave 上的项目和团队还有很多,在此不再赘述。
局限性
诚然,Arweave 及其生态有一定的局限性。
首先,Arweave 无意从价格层面去和头部中心化云(如 AWS、谷歌云、Azure 等)或去中心化云(Filecoin、Sia、Storj 等)抢夺市场。Arweave 有其独特的价值主张——一种基于经济、博弈论、激励的去中心化永久存储基础设施。Arweave 毫不避讳它在价格和价值之间的取舍。事实上,正如前文所言,Arweave 的成本计算模型是非常保守的,并未采用业界 30.57% 的存储成本衰减率、而是以 0.5% 的衰减率去计算的。好在总体来说,存储服务都是便宜的。此外,由于目前有区块补贴覆盖大部分成本,用户得以从中受惠。Arweave 现下的数据存储成本往往低于 0.004 美元 /MB。
其次,如果没有新的上层协议,permaweb 对于实时用户交互体验来说并不理想。一次操作可能要等待几分钟。在博客或网站这种体验或许可以忍受,但对于更多其他应用来说显示是不合理的。
另一个较为严重的局限是数据检索速度。通常情况下,用户是通过网关接入网络的,而不是直连矿工节点。网关的主要作用是为用户检索全网、获取特定数据。尽管 Arweave 鼓励矿工节点相互存储和共享数据,但 Arweave 和每个用户家里的网关并无直接激励关系,网关也不能确保用户可以快速、高效地获取矿工节点中的数据。因此,Arweave 最近推出了一个新的共识协议 Amplify 以弥补这部分的不足。
最后,Arweave 的 permaweb 不具备隐私性,所有数据都永久公开、可直接访问,不适合存放个人数据或一些敏感数据。
结论
很多人可能不知道, Internet Archive 是目前全球排名第 209 位的网站,在 2018 年时就存储了超过 40 pd 的数据(> 13 万台笔记本电脑)。而 permaweb 的功能远远超出了单纯的数据归档。因为构建于其上的应用层,Permaweb 拥有更多可能,如 NFT 存储 / NFT 交易、流量变现、交互变现等等远远超出想象的场景。而如今的 Arweave 尚处于襁褓时期,存储于其上的数据仅有 8.5 TB。捐赠池中的资金已达到 50 万美元,但这仍然不到流通量的 0.1%。
正如前文所说,Arweave 不会通过价格抢夺市场,因为用户需要为未来预支费用。如果 Arweave 想要实现其主张的永久存储,问题的本质只有一个:“如果我为未来支付了费用,Arweave 能保证我在未来几十年乃至几个世纪使用我的数据吗?”但现在很难得出答案,因为有太多的未知数。Weave 网络会有多大?多大才算大?矿工会逐渐中心化吗?会不会 AWS 的更贵版本的智商税?网络激励设计是否可持续?对于上述种种,我们只得拭目以待。
话虽如此,Arweave 当下的目标是成为一个有趣的应用(特别是对 NFT 而言),而众多的市场正面反馈是有目共睹的。毕竟,大量的 NFT 数据都需要长期存储在某个地方。Arweave 开发团队也已经提出了 SPoRA 这样一个经过深思熟虑的创新机制,试图应对长期挑战。SPoRA 的问世让我们看到了他们试图使网络更健壮的调整和努力。这是一件好事,因为“实现永久存储”和“承诺永久存储”有着本质上的不同。
Reference
Arweave: The Permanent Storage Experiment, https://www.delphidigital.io/reports/arweave-the-permanent-storage-experiment/
SPoRA, https://github.com/ArweaveTeam/arweave-standards/blob/ans-103/ans/ANS-103.md
ArDrive, https://ardrive.io/
Weave mail, https://weavemail.app/
Verto.exchange, https://verto.exchange/
Koi.rocks, https://koi.rocks/contents
Pianity, https://pianity.com/
Profit Sharing Tokens: A new incentivization mechanism for an open web, https://arweave.medium.com/profit-sharing-tokens-a-new-incentivization-mechanism-for-an-open-web-1f2532411d6e
Arweave 团队发现矿工的 Sacrifice Mining 作弊行为:https://twitter.com/samecwilliams/status/1374062282817290247?s=20
主流 NFT 平台及其存储选择:https://twitter.com/RealAllenHena/status/1379769287171309571?s=20
Arweave 与 Solona 的 SOLAR 桥:https://arweave.medium.com/introducing-solar-an-arweave-solana-bridge-for-housing-high-performance-blockchain-data-on-arweave-229a28eaa65d
Internet Archive:https://archive.org/
2018 年的 Internet Archive 的存储数据:https://thehustle.co/inside-wayback-machine-internet-archive
Scan QR code with WeChat