一文读懂 IPFS 的商业应用:Arbol
“当谈到数据安全性与易访问性时,这通常是一种权衡。IPFS在这两个方面都没有妥协,这一点令人敬畏——抛弃Amazon S3云存储而改用开源软件,感觉很棒。”-Ben Andre,首席技术官,Arbol
1
Arbol概述
Arbol是一个软件平台,它将农民和其他气候相关方等农业实体与投资者和其他资本提供者联系起来,以确保和防范与天气相关的风险。Arbol的平台在一个创新的、数据驱动的风险管理方法的市场上销售参数化天气保护协议的合同,省去了通常的传统保险索赔过程,即进行实地损失评估。
为了建立Arbol用于处理其合同的数据索引,该团队收集并标准化了数十亿个数据文件,这些数据文件包括来自各种知名来源的数十年天气信息,所有这些信息都存储在IPFS上。
IPFS对于Arbol的服务模型至关重要,因为它的内容寻址体系结构提供了固有的可验证性,而且它是一个分散的数据交付模型,有助于Arbol的日常聚合、同步和分发大量数据。
简言之,Arbol的平台是一个风险市场,在这里,终端用户可以获得价格有竞争力的风险管理解决方案,资本供应商可以从利润丰厚但不发达的天气风险市场中获益。而且,由于Arbol使用IPFS来满足其数据存储和交付需求,最终用户和承销合作伙伴可以确定Arbol用于确定合同价格和支付的数据是防篡改和值得信赖的。
Arbol通过类似这样的基于区块链的合同交付天气风险管理解决方案,消除了昂贵的支付延迟,以及与欺诈、腐败和官僚管理相关的风险。它还带来了点对点分散的好处:Arbol用户不需要依赖Arbol作为金融中间人,因为资金被锁定在终端用户和资本提供者之间,而Arbol没有控制资金的转移。
然而,即使是最好的智能合约,也只有从中提取的数据才是最聪明的。“甲骨文问题”可能是智能合约的一个基本障碍,但Arbol使用IPFS消除了这种风险。对于Arbol来说,IPFS是绝对关键的。
IPFS的内容寻址体系结构使Arbol能够确保其数据集的完整性和公共可验证性,这是传统的集中式服务器体系结构无法提供的。智能合约指向特定的、不可变的IPFS cid,而不是指向可能被篡改的数据位置,这要归功于其oracle的完整性。
“IPFS是我们在Arbol所做一切的核心。IPFS作为我们独立可验证的数据存储,用于存储与我们销售的合同相关的所有天气数据。它为我们的平台注入了去中心化、数据安全和公共可验证性的基本原则。”-Ben Andre,首席技术官,Arbol
2
IPFS优点
Arbol的商业模式取决于IPFS所提供的好处—如果没有其不变的内容寻址和固有的数据可验证性,Arbol提供的好处将不可能以经济高效的方式实现。总的来说,IPFS通过提供以下方面对Arbol的服务模式至关重要:
不可变寻址:因为使用IPFS存储的所有数据都是通过唯一内容标识符(unique content identifiers,CID)来引用和访问的,所以对数据项的任何更改都意味着它将接收到一个新的CID,而这个CID是该修订版所独有的。不改变CID就不可能改变数据。
数据可验证性:Arbol平台上的合同与特定的、可验证的、未更改的内容寻址数据相关联。由于参数化天气风险管理完全依赖于用户对源数据的认同和信任,Arbol的方法提供了市场上其他产品无法提供的保证。
分散式数据交付:Arbol使用由数十亿个文件和兆字节信息组成的海量数据集。IPFS支持Arbol发布和添加到大型数据集的方法,同时仍然允许Arbol通过分散存储网络发布和同步这些数据集。
3
Arbol如何使用IPFS
Arbol的最终用户享受参数保护的“it just works”优势,但在幕后进行了大量工作来支持这种数据驱动的解决方案。Arbol的气象数据集大小从1GB到1TB不等,每一个都要经过详细的摄取过程才能使用。
一旦确定一个数据集满足Arbol的有用性和有效性标准,就应该将其添加到Arbol的IPFS管道中,这是一个多阶段的过程,如下所述。
查询/发布:如果一个数据集被直接上传到Arbol的网络(一种“推”的方法),维护人员会自己启动这个阶段,作为数据发布过程的一部分。如果Arbol或其他实体独立于数据集维护者“拉”到网络,则需要定期查询数据集,以确定何时发布新数据。由于许多数据提供程序都遵循一个常规计划,因此可以相应地配置查询。
解析:Arbol解析提供者的大数据数据文件,必要时在地理位置(而不是时间)上重新索引它们,并且经常压缩格式,这样可以更方便、更快地查询Arbol创建特定位置天气契约的主要用例。
解释:当数据集存在漏洞或明显错误时(例如,气象站数据可能容易丢失或个别台站的错误数据),Arbol根据需要通过运行统计“清理和填充”过程对数据进行插值。
压缩:此步骤是将数据导入IPFS之前的最后一步。Arbol压缩每个文件以节省磁盘空间并减少同步时间。
验证:为了确保在解析阶段不会向文件引入错误,对源数据文件进行查询,并与对解析的哈希数据执行相同查询的结果进行比较。
发布:一旦hash被验证,它就被发布到Arbol的主heads参考文件中,此时可以通过Arbol的网关访问它,并且可以在合同中使用。
固定和同步:当Arbol网络中的存储节点检测到有一个新的散列被添加到heads文件中时,它们会对其运行标准的、递归的ipfs pin-r命令。然而,数据也会定期与“冷节点”(档案存储节点大多保持离线)以及Arbol开发人员和农学家个人计算机上的单个IPFS节点同步。
垃圾收集:一些旧的Arbol数据集在添加新数据时都需要垃圾收集,这是因为传统的方法是用新的哈希覆盖旧的哈希。然而,Arbol所有较新的数据集都使用了一种架构,其中保留了旧的哈希值,新的帖子引用了之前的帖子。系统合并中间节点并向头部添加新的路由,从而创建一个DAG(分布式无环图)结构。
4
Arbol+IPFS:未来
Arbol团队将dWeather视为未来最重要的举措之一。这套用于标准化和提供来自各种来源的可寻址天气数据的开源工具将主要面向科学家、学者、政府机构和小型气象数据采集器。dWeather将包括一组健壮的包和存储库—用于整个摄取管道的代码,以及用于使用IPFS访问数据的各种客户端库。
Arbol还计划将dWeather与即将发布的服务进行集成,如果参与者愿意,该服务将允许他们的数据收集和天气预报货币化,从而为提供专业化、信誉良好的天气数据和预报的独立数据提供商开辟一个新的、精度等级较高的市场。
另一个令人兴奋的未来计划是开放资源并扩展Arbol数据管道的解释阶段。“我们认为IPFS是大数据的Git。当涉及到像weather这样的分布式协作工作时,这是一个非常强大的概念—在这种情况下,有成千上万的研究团队从世界各地生成数据,无数的团队将其用于任何可以想象的用途。”-Ben Andre,首席技术官,Arbol
Scan QR code with WeChat