Filecoin等去中心化存储网络指南
随着全球数字化,云存储市场近年来经历了显著增长。 2022 年市场价值约为 800 亿美元,预计到 2029 年将达到 3760 亿美元,复合年增长率 (CAGR) 为 23%。国际数据公司 (IDC) 还预测,全球数据圈,即每年创建的数据量,到 2026 年将达到 221,000 艾字节,复合年增长率为 21%。物联网 (IoT)、人工智能 (AI) 和自动化等新技术的采用推动了数据创建和存储需求的指数级增长。
截至 2022 年 12 月,亚马逊、微软和谷歌以合计 66% 的市场份额主导云服务行业。由此产生的数据存储集中化会产生垄断定价,并对数据隐私、安全性和完整性构成风险。
分散式云存储网络的出现是为了应对集中式云存储网络的缺点。这些网络旨在消除单点故障,并提供更安全、更有弹性的模型,以经济高效的价格存储和访问数据。
集中式与去中心化式存储模型对比
集中式模型
在传统的云存储模型中,数据存储在由中心化提供商拥有和运营的数据中心。供应商的数据中心战略性地位于世界各地,以中心辐射模型运行,以确保全球可访问性。这种模式迫使客户信任集中式供应商,以确保他们的数据安全并保持其完整性。
建设数据中心的复杂性和成本造成了巨大的进入壁垒,导致云存储市场的竞争相对较少。因此,大型云实体可以收取额外费用并通过高昂的转换成本锁定客户。多年来,他们的主导地位侵蚀了整个云存储市场的竞争力和效率。
去中心化模式
在分散的云存储模型中,数据分布在由单独操作的节点组成的全球 P2P 网络中,而不是分布在位于数据中心的单个服务器上。数据通常被分成碎片、复制并分发到各个节点,以确保其可用性、安全性和持久性——这些过程的完整分解在下面的技术部分提供。
去中心化存储模型消除了第三方信任并提高了存储系统的弹性,同时让用户可以完全控制他们的数据。该模型还消除了集中式系统面临的单点故障,例如网络攻击或自然灾害。
去中心化存储模型依赖于利用未使用存储容量的经济模型。在全球范围内,有大量的闲置存储空间,从大公司未使用的服务器空间到拥有几个硬盘架甚至游戏电脑的个人。任何实体都可以使用其现有资源为网络贡献存储容量,而无需前期或间接费用。因此,去中心化网络可以提供越来越便宜的存储服务。
去中心化模式的优点和缺点
优势
更具成本效益:分散式网络利用闲置存储容量,无需昂贵的数据中心和添加新硬盘。通过允许个人和公司将未使用的存储空间货币化,去中心化网络将原始硬盘驱动器空间与中心化提供商提供的服务和支持分离开来。正如 Protocol Labs 所说,去中心化网络使云存储更像是一种可以按市场价格购买的商品或公用事业,而不是一种带有合同和锁定成本的服务。
提高数据安全性和隐私性:分布式存储使黑客难以访问或破坏数据,因为他们需要破坏多个节点。分布式存储还可以防止未经授权的访问(包括来自提供商本身的访问),因此对于存储敏感数据很有用。
增加备份:分散式网络通常将数据分成小块并将组件存储在多个节点上。此过程会创建数据的多个副本并提高对数据丢失的恢复能力。
弱点
较慢的检索时间:数据检索的速度可能受到存储数据的各个节点的带宽的限制。这会使网络不太适合高频访问,因为低带宽的节点会减慢检索过程。但是,去中心化内容分发网络 (CDN) 可以通过缓存靠近用户位置的数据副本来帮助克服这一限制。
尚未证明具有弹性:去中心化网络中使用的许多共识机制相对较新,尚未被证明是可靠或安全的。此外,他们的激励模式尚未被证明是可持续的,从长远来看会导致一些不确定性。
高学习曲线:不熟悉区块链技术的个人可能会发现理解和使用去中心化存储网络具有挑战性,尤其是因为这些网络通常需要使用代币。
去中心化存储网络技术
去中心化存储网络利用区块链创建存储节点的 P2P 网络。这些网络使用加密经济协议来激励硬盘驱动器空间的供应,即,它们用网络的本地资产奖励存储提供商以提供存储服务。这些网络包括一个市场,将需要存储的用户与具有可用存储容量的提供商联系起来。
持久性机制
去中心化存储网络使用持久化机制来确保数据随时间持续存储。这些机制可以是基于合约的,也可以是基于区块链的。
基于合约的持久性机制使用合约协议来确保链下存储的数据的持久性。与主流观点相反,大多数去中心化存储网络并不将数据存储在区块链本身上。相反,他们与节点达成协议,在定义的时间段内将数据存储在链下。该设计使用智能合约或支付渠道,其中存储提供商使用网络的本地资产锁定抵押品。在合同期结束时,存储提供商会收到他们的抵押品和服务付款。如果存储提供商违反合同或未能存储数据,他们将被“罚没”并失去抵押品。
基于区块链的持久化机制将数据存储在区块链上,使用激励结构来激励节点存储数据。然而,由于可扩展性问题,将数据存储在链上可能具有挑战性并且可能不可行。
数据保留
在去中心化存储网络中,存储提供商需要证明他们正在按照约定存储数据。这些网络确保数据保留的一种方法是使用加密挑战,也称为存储证明方案。在密码挑战中,存储提供商需要执行特定计算或提供特定信息,以证明他们正在存储数据。
数据持久性和可用性
数据持久性是指确保数据在发生故障时仍然可用的过程,数据可用性是指根据用户请求检索数据的过程。为了实现这两个原则,去中心化存储网络使用纠删码和数据复制方法。
擦除编码是一种编码数据的方法,即使某些数据丢失或不可用,也可以重建数据。它通过将数据文件分成更小的段并向每个段添加冗余数据来实现这一点。数据复制是指将数据的多个副本存储在不同的节点上。这两种方法都提高了存储的可靠性,并消除了由于单点故障而导致数据丢失的风险。
数据隐私和安全
去中心化存储网络通过加密机制优先考虑存储数据的隐私和安全。这些机制确保只有预期的接收者才能访问数据,从而防止未经授权的访问。有些网络会自动加密所有存储的数据,而另一些网络则允许用户有选择地加密上传的数据。
扇区大小
扇区大小是指存储合约中可以存储在网络上的最小数据量(以字节为单位),由协议确定。扇区大小会影响成本和可以上传到网络的最小文件大小。
去中心化储存网络分类
虽然去中心化存储网络近年来越来越受欢迎,但只有四个主要网络脱颖而出,成为最成熟和使用最广泛的网络:Filecoin、Sia、Storj 和 Arweave。所有四个网络都提供去中心化存储解决方案,它们的底层技术和网络架构各不相同。
Filecoin/IPFS
Filecoin 建立在星际文件系统 (IPFS) 之上,这是一种用于存储、寻址和传输数据的协议。简而言之,IPFS 使用内容寻址来告诉用户他们的数据存储在哪里,但它缺乏一种机制来激励数据的持久性和可用性。这导致了 Filecoin 的发展。
Filecoin 充当 IPFS 的激励层,同时还充当开放存储市场。 Filecoin 使用基于合约的模型来确保数据的持久性,并结合零知识证明,特别是时空证明和复制证明。这些证明会定期验证存储提供商是否正在履行其存储义务。此外,Filecoin 允许用户存储数据的多个副本,并根据需要上传加密数据。
Arweave
Arweave 是四个主要存储网络中唯一将数据存储在链上并且只专注于永久存储的协议。 Arweave 使用“一次支付,永久存储”模式,一次性支付涵盖永久存储数据的成本,检索该数据不收取额外费用。存储价格由一个模型确定,该模型使用对永久存储成本的高度保守估计。
每笔存储交易费用的一小部分立即支付给矿工,而其余部分则进入协议的存储捐赠。捐赠基金用于随着时间的推移支付给 Arweave 矿工,保证至少 200 年的存储。
Arweave 的访问证明共识机制也用作其存储证明和持久性机制。为了有资格生产一个区块,矿工需要证明他们正在存储来自随机选择的前一个区块(称为召回区块)的数据。这种机制激励矿工存储先前区块的数据副本,以获得挖矿奖励。
Sia
Sia 将工作量证明区块链与基于合约的存储模型相结合。当用户和存储提供商签订存储合同时,他们各自将原生资产 (Siacoin) 存入托管账户。存储提供商必须提供加密证明,证明他们正在托管所需的数据。
数据上传过程默认对数据进行加密,并利用纠删码来帮助实现数据的可靠性和冗余性。上传的文件被分成 30 个片段,分发给各种存储提供商。鉴于 Sia 的纠删码提供的冗余,重建原始文件只需要 10 个片段。
在合同到期时,存储提供商会收到大部分托管资金,一小部分将流向 Siafunds 代币的持有者。
Storj
Storj 是一个分散的存储网络,它利用以太坊作为其底层区块链。与其他去中心化存储网络不同,Storj 不使用区块链进行数据持久化或保留。相反,它仅使用区块链来促进向存储提供商的支付以及与本地令牌的高效交易。
Storj 的网络架构以卫星实体为中心,它充当存储提供节点和用户之间的协调点。每个卫星都有自己的可信节点子集,并负责执行数据保留和分配付款。在撰写本文时,Storj Labs 是唯一的卫星运营商,使 Storj 成为四种主要存储协议中最中心化的。
将数据上传到 Storj 时,文件被分成 80 个加密段并分发到全球,只需要其中的 30 个段就可以重构文件。在 Storj 上存储和检索数据的成本是固定的,由 Storj Labs 决定。
存储市场现状
在整体市场低迷的情况下,到 2022 年底,前四大存储协议的总市值接近 16 亿美元,比 2021 年底的 94 亿美元下降了 83%。而四大存储协议的市值分别下跌了 79% 至Filecoin 90% 的市值以美元计算同比增长,继续占据最大的市场份额 (67%),其次是 Arweave (19%)、Sia (8%) 和 Storj (6%)。
存储利用率
存储利用率表示已用存储相对于网络总存储容量的百分比。 Arweave 缺乏矿工向网络提交可用存储容量的机制,因此无法计算网络的存储利用率。
2022 年,Filecoin、Sia 和 Storj 的总存储容量超过 1700 万太字节 (TB),同比增长 2%。 Filecoin 占总容量的比例高达 99.7%,而 Storj 占近 0.25%,Sia 占 0.03%。就同比增长而言,Storj 的网络容量增长了 176%,而 Filecoin 增长了 2%,涨幅更高。唯一经历存储容量下降的协议是 Sia,同比下降 17%。
总存储容量的增长可部分归因于存储提供商的增加。 Filecoin 存储提供商的数量激增了约 300%,达到 3,030 家。 Storj 存储提供商的数量增长了 63%,达到 20,200 家。相反,Sia 的存储供应商数量下降了 15%,到年底共有 511 家供应商。 Arweave 以 66 家存储提供商结束了这一年。
在已用存储方面,Filecoin 占 515,000 TB,占 2022 年总市场份额的 97%,而 Storj 占 16,100 TB (3%)。 Arweave 和 Sia 合计约占 0.25%。值得注意的是,Filecoin 在使用存储方面的年增长率为 1,800%,而 Arweave 和 Storj 分别增长了 183% 和 70%。唯一一个使用存储量下降的协议是 Sia,由于 Skynet 的停用,同比下降 30%。
在网络利用率方面,Storj (38%) 领先,其次是 Sia (25%)。虽然 Filecoin 的可用容量最大,但其存储利用率最低。它在 2022 年仅达到 3%,高于 2021 年的 0.2%。除 FIlecoin 外,所有其他协议的存储利用率年增长率均出现名义下降:Sia (-4%)、Storj (-24%)。
收入
以下收入分析侧重于需求方收入,其中包括使用网络服务产生的收入。它不包括来自供应方参与者的收入和未捕获实际使用情况的通货膨胀代币奖励。此数据来自 Web3 Index。
注意:由于其独特的收入框架,Filecoin 是唯一未在 Web3 Index中列出的存储协议。由于该协议目前正在补贴存储成本,导致存储费用几乎为零,因此其需求方收入是通过假设需求方参与者产生的总网络交易费用的 45% 来估算的。
2022 年四种存储协议的总收入为 1450 万美元,比 2021 年的 5.97 亿美元下降近 98%。下降的主要原因是 Filecoin,其收入从 2021 年的 5.95 亿美元下降 98% 至 2022 年的约 1300 万美元。 Filecoin 占 2022 年总收入的近 91%,其余 9% 为 Arweave(5%)、Storj(3%)和 Sia(<1%)。
2022 年,Arweave、Storj 和 Sia 产生的收入约为 140 万美元,比上年下降 17%。尽管没有增长,但考虑到充满挑战的市场条件和过去一年链上活动的减少,所产生的收入相对稳定。
Filecoin 的收入下降可部分归因于 Filecoin 在 2021 年 7 月进行的 HyperDrive 网络升级。虽然 HyperDrive 升级通过减少拥塞和释放区块空间使网络参与者受益,但它也导致整体交易费用降低,从而降低需求方收入。此外,激励矿工免费提供服务的 Filecoin Plus 计划也导致需求方收入下降。
代币模型
四个主要的去中心化存储网络中的每一个都有自己的代币经济模型。
Filecoin 和 Sia 使用 Stake-for-Access (SFA) 代币模型来获取价值。在这个模型中,存储提供商必须锁定网络的本地资产才能接受存储交易。锁定量与存储提供商可以存储的数据量成正比。这创造了一种动态,存储提供商必须在存储更多数据时增加抵押品,从而增加对网络原生资产的需求。从理论上讲,资产的价格应该随着网络上存储的数据量的增加而增加。
Sia 还有一个收益分享代币 Siafunds。在每份合同到期时,Siafunds 持有人将获得存储、带宽成本和主机抵押品租赁费用总和的 3.9%。
Arweave 利用一种独特的捐赠代币模型,其中每笔交易的一次性存储费的很大一部分被添加到捐赠中。随着时间的推移,捐赠中的代币以存储购买力的形式产生利息。随着时间的推移,捐赠将分配给矿工,以确保网络上的数据持久性。这种捐赠模型有效地长期锁定了代币:随着 Arweave 上存储需求的增加,更多代币从流通中移除。
与其他三个网络相比,Storj 的代币模型是最直接的。与所有其他网络一样,代币作为网络上存储服务的支付方式,适用于最终用户和存储提供商。因此,STORJ 的价格是对 Storj 服务需求的直接函数。
服务成本分析
存储成本
去中心化存储提供商在各种指标(即成本)上与中心化存储提供商展开竞争。在集中式方面,AWS 对使用其标准 S3 存储产品存储的高达 50 TB 的数据收取 23 美元/TB/月的费用。同时,与中心化提供商相比,去中心化存储网络的价格更低。
去中心化存储提供商在相对价格点比较方面优于中心化提供商。去中心化存储网络比 Amazon S3 便宜 70% (Storj) 到 99% (Filecoin)。
为了降低成本,Sia 和 Filecoin 利用了一个开放市场,其中存储价格是供需周期的函数。 Storj 实际上对其网络上的存储使用有固定定价。由于 Arweave 的目标是保证永久存储,它为其存储定价约 200 年的时间范围,这使得其前期成本(约 1,160 美元/TB)高于其去中心化(市场模型)竞争对手。
Filebase(用于 Sia)和 Bundlr(用于 Arweave)等访问层抽象出与底层存储提供程序交互的复杂性。对于这种易于使用的服务,一些供应商可能会选择在基本定价之上收取额外费用,而其他供应商可能会选择补贴成本以扩大用户群并增加需求。
带宽成本
供应商还在带宽价格方面展开竞争。上传带宽称为入口,而下载带宽称为出口。通常,出口是更重要的指标,因为它与数据检索有关。与存储成本一样,带宽成本因网络而异。
Storj 对下载数据(出口)收取 7 美元/TB 的费用,但上传数据(入口)是免费的。 Sia 的带宽定价根据其市场结构而波动——目前,出口价格为 1.05 美元/TB,入口价格为 0.20 美元/TB。 Sia 的价格自 2022 年 7 月以来一直呈下降趋势,2022 年出口下降 38%,进口下降 57%。
Filecoin 上的数据检索是在链下处理的。实际上,Filecoin 的检索成本和定价可以在逐个合同的基础上进行管理。存储提供商处于特权地位,因为他们有效地控制了对底层数据的访问。
鉴于 Arweave 的独特架构(即,将数据直接存储在其类似区块链的结构上),检索数据不同于其他存储网络。 Arweave 使用网关,允许用户从 blockweave 查询和检索数据。有几个不同的网关提供商,例如 ar.io 和 Warp。 Graph 还为 Arweave 建立了索引,Goldsky 团队创建了一个利用 GraphQL 功能查询数据的网关。目前,没有关于出口或数据检索的标准货币化方法,尽管有一个基于围绕该主题的讨论的可用实现。
目标用户和用例
去中心化存储网络提供两种主要类型的存储解决方案来满足其用户的不同需求:热存储和冷存储。热存储是指经常访问并且需要更快检索时间的数据。快速和频繁访问的需求通常使热存储更加昂贵。另一方面,冷存储是指不经常访问并用于长期存储的数据。
Filecoin 主要面向企业和开发者提供冷存储解决方案。其具有竞争力的价格和易于访问的特性使其成为寻求具有成本效益的替代方案来存储大量档案数据的 Web2 实体的有吸引力的选择。
Storj 针对为企业提供热存储进行了优化,提供与 Amazon S3 兼容的云对象存储。其独特的架构提供了快速的检索时间,并已证明对大型视频文件共享非常有效。这些功能使 Storj 专注于媒体和娱乐行业。
Sia 定位于热存储市场,主要针对开发人员。 Sia 吸引寻求具有快速检索时间的完全去中心化和私有存储解决方案的用户。它目前不具备原生 S3 兼容性,但 Filebase 等访问层提供此类服务。
永久存储将 Arweave 与其他去中心化存储网络区分开来,后者主要针对热存储或冷存储进行优化。永久存储在存储 Web3 数据方面特别受欢迎,例如区块链状态数据和 NFT。
可用性框架
去中心化存储网络使用二级产品和服务来轻松集成和利用底层存储网络。同样,AWS 不仅提供全套存储解决方案,还提供分析、计算和机器学习等辅助服务。
在为去中心化存储网络开发这一层堆栈之前,它们需要达到一定的成熟度。产品和服务层仍处于早期开发阶段,但访问层、CDN 和企业级存储提供商等重要组件已经在边缘形成。
存储网络本身充当协调点,允许形成供需市场。存储提供商(零售和企业参与者)构成供应,而访问层和 CDN 代表需求。
供应方参与者
企业存储供应商
在供应方面,Filecoin 与 Seal Storage 等企业存储提供商建立了关系,并帮助创建了一个程序来引导新的企业存储提供商群体。
企业存储提供商是供应方的关键支柱。相对于零售供应商,他们拥有专门的存储业务,他们自然有更多的存储空间可以提供给这些网络,从而扩大了他们的规模。例如,Seal Storage 拥有超过 20PB 的可用存储空间,并与许多需求方实体建立了联系。
零售参与者
尽管如此,任何拥有未使用存储容量的人都可以加入去中心化存储网络并为他们的成功做出贡献。零售参与取决于解释如何成为存储提供商的清晰文档、帮助解决问题的强大社区,以及对其服务的需求,以帮助支付运行基础设施的成本。
需求方参与者
访问层
直接访问去中心化存储网络可能很复杂。它通常涉及下载软件、获取网络的原生资产、创建钱包和签署链上交易。例如,为了抵消这种复杂性,Sia 正在重新设计他们的本地用户界面,供零售用户访问网络。另一方面,访问层抽象出这些复杂性,创造更流畅的用户和开发者体验。
访问层是需求方参与者的关键组件,可以由存储网络本身或第三方开发。例如,Filebase 允许用户使用传统帐户设置来存储数据,提供免费服务等级,并允许客户使用信用卡支付服务费用。
Filebase 目前是 Sia 和 IPFS 的访问层,它将添加与 Filecoin 和 Arweave 的集成。它充当聚合器,提供各种存储选项和内容交付解决方案。其简单的拖放体验对零售用户很有吸引力,并且已经使许多企业(如 Artiffine)能够利用其服务。文件库服务是关键的需求驱动因素,因为它们提供无缝的用户入职和额外的用户保留属性。
随着近年来 NFT 市场的发展,Protocol Labs 发现了一种方便访问存储 NFT 和 Web3 相关数据的需求。他们构建了 nft.storage 和 Web3.storage,简化了开发人员对 Filecoin 和 IPFS 的访问。
Arweave 网络使用 Bundlr 作为访问层。使用 Bundlr,应用程序可以在 Arweave 上处理和存储他们的数据。 Bundlr 对 Arweave 的成功起到了重要作用,约占其所有上传数据的 69%。展望未来,访问层将继续推动对底层存储网络的巨大需求。
内容分发网络 (CDN)
虽然一些数据存储在分散的冷存储中,但许多数据类型需要热存储或在线存储。这意味着快速交付和检索数据至关重要。理论上,可以直接从底层存储网络访问数据,但实际上,服务数据的能力也必须扩展以满足需求。 CDN 提供了一种快速且低成本地传送数据的解决方案。
Meson Network 通过创建带宽市场为去中心化存储网络执行 CDN 功能。任何拥有空闲带宽的人都可以将其贡献给网络使用。例如,如果 Arweave 网关因检索 NFT 相关数据的请求而过载,Meson 网络可能会缓存该 NFT 相关数据,使其随时可供最终用户使用。
直到最近,Skynet 还是 Sia 的 CDN。开发人员可以利用天网基础设施构建应用程序,包括去中心化的 Dropbox 和 YouTube 等应用程序。然而,天网实验室无法获得资金并于 2022 年 8 月关闭。从那时起,Sia 基金会创建了一个新的资助计划,Lume Web 是首批项目之一。该项目将继续建立天网门户的初步工作,并进一步改善对 Sia 的访问。
Protocol Labs 构建了自己的 CDN,名为 Saturn,于 2022 年第四季度推出。虽然 Filecoin 存储了超过 15 PiB 的数据,但它缺乏快速检索这些数据的方法,尤其是在去中心化的方式下。因此需要 CDN 来构建令人垂涎的“Web3 杀手级应用程序”。这是土星旨在填补的空白。
最近,Fleek 网络宣布获得 2500 万美元的 A 系列融资。 Fleek CDN 网络将位于 Filecoin 和 Arweave 等主要去中心化存储提供商之上。
创建去中心化的 CDN 具有挑战性。所有这些网络都必须适当地激励和引导参与,并确保更快的数据检索。协议致力于开发去中心化 CDN,因为它们将是解锁去中心化存储网络中存储的数据的关键。
应用生态系统
接入层和 CDN 的自然延伸是广义的应用生态系统。 Arweave 和 Filecoin 都支持智能合约(通过 Filecoin 虚拟机的 Filecoin 和通过 SmartWeave 的 Arweave)并且还允许外部集成。 Sia 和 Storj 完全依靠集成来为其生态系统提供动力。
在 Arweave 和 Filecoin 等网络之上构建本机应用程序并在外部与它们集成的能力扩大了潜在网络活动的范围。例如,使用 Lens 构建的开发人员可以选择与 Arweave(或 IPFS)集成,而像 Verto 这样的去中心化交易协议则原生地构建在 Arweave 上。
Arweave 和 Filecoin 应用程序生态系统有专门的页面,对在这些网络上构建的各种项目进行分类。
总结
分散式存储网络为传统的集中式存储解决方案提供了一种有前途的替代方案。它们的去中心化架构可以提高数据的安全性、持久性和可用性,同时还提供具有成本效益的存储服务。随着这些协议的不断成熟,将重点放在减少检索时间和扩大所提供服务的范围上。
利用去中心化存储协议的产品和服务仍处于早期阶段。然而,访问层、CDN 和企业级存储提供商等重要元素开始出现在市场上。这些组件将在进一步开发产品和服务层方面发挥关键作用,从而提高去中心化存储网络的采用率。
随着 Web3 生态系统的不断发展,去中心化存储网络将在为协议和 dApp 实现安全、去中心化存储方面发挥至关重要的作用,使它们成为 Web3 技术堆栈的重要组成部分。
Scan QR code with WeChat