EpiK Protocol:基于Filecoin的知识图谱平台
什么是铭识协议?
铭识协议致力于借助区块链技术打造一个去中心化的共建共享共益的安全可信知识图谱协作平台,通过可信存储、可信激励、可信治理和可信金融四大核心能力,以极低的管理成本组织全球知识社区用户共同协作,将人类各领域知识转化为知识图谱永久保存,开阔 AI 的认知,推动认知智能时代的到来。
铭识协议的可信存储能力得益于去中心化存储技术 Filecoin。Filecoin 底层为 IPFS 协议,IPFS 是一种分布式网络传输协议,该协议将接入的计算机设备连接为同一个文件系统,并将所有文件处理成Merkle Trie 的形式,形成唯一的 Root Hash。这种结构有一个好处,即重复数据块不会被重复存储而且节点彼此之间仅需同步 Root Hash 即可保持对全局文件系统的一致性视角。
但 IPFS 也有其现实中的问题:缺乏激励机制和防作弊机制。于是,Filecoin 在 IPFS 基础之上,设计了存储证明来解决激励问题,并结合零知识证明技术设计了复制证明和时空证明来解决作弊问题。相比于 Hadoop 之类的传统分布式数据库,Filecoin 独创的复制证明、时空证明和存储证明技术,能让完全互不信任的各方将其闲置的机器自组织成一套统一的分布式存储系统,允许各方在预设的规则下以无需许可的方式进行数据存储和访问。
铭识协议的作用是什么?
如果 Ethreum 定义了去中心化计算框架,那么 Filecoin 便是定义了去中心化存储框架。作为通用存储框架,Filecoin 便需要照顾到各类存储应用场景,这也导致 Filecoin 一层网络在极其有限的吞吐量下会更加聚焦于大文件存储。而铭识协议构建的知识图谱协作网络中,大多为频繁协作产生的小型日志文件。
为了更好地实现双方生态的融合,铭识协议依托于 Filecoin 核心技术为知识图谱协作网络定制了 Filecoin 二层存储网络,在二层网络上通过各种激励手段收集上来的知识图谱数据,将定期汇集成快照大文件传回 Filecoin 一层网络永恒存储。
铭识协议二层网络保留了 Filecoin 一层网络的可信存储能力,并且更加聚焦于知识图谱协作行为和各领域知识图谱日志小文件的存储。各领域数据在铭识协议网络中以日志文件的形式有序存储,任何人可以按照规则在无许可的情况选择自己需要的领域,将这些领域的日志文件下载下来,并有序执行一遍,便可以在本地恢复出一个包含所选领域的知识图谱数据库,并可以将这些数据压缩后上传到 Filecoin网络中获得奖励。
铭识协议的可信激励能力来自于通证经济理论(Token Economy)。通证是基于区块链账本技术构建的一种全新价值载体,具备两大基础属性,一是通,即可使用、可转让和可兑换;二是证,即可识别、防篡改。该价值的登记无需依赖于任何第三方中心化机构,结合区块链智能合约,通证是一个可编程的交易成本极低的价值载体。
借助通证这一价值载体,铭识协议基于知识图谱协作网络的各个核心参与方,设计了图4所示围绕原生通证 EPK 的通证模型,让各个参与方在追求个人利益最大化的情况下,协作完成将人类知识库转变为知识图谱的宏大工程。
铭识协议的代币情况和经济模型
EpiK Protocol 原生代币为 EPK,总量10亿,在主网上线后连续50年内全部释放完毕,永不增发。
整体经济模型的设计目标只有一个,即让生态内每个角色在谋求自己利益最大化的同时,能形成合力推动去中心化人类永恒知识库的壮大。
知识被永久地存储在不可篡改的环境中,将是 EpiK Protocol 知识图谱能被大规模应用的基本要求,而去中心化存储是我们目前能找到的能跨越时空的最优方案。EpiK Protocol 参考了 Filecoin 的存储技术,以扇区 (sector) 为单位,通过复制证明 (proof-of-replication, PoRep) 和时空证明 (proof-of-spacetime,PoSt) 来确保数据在去中心化环境下被完整地保存着。
但因为 Filecoin 服务于通用存储场景,在有限的吞吐量的情况下,更加适合存储大文件。而 EpiK Protocol 的知识图谱协作场景中,更多是高频率的微协作产生的小文件,为了充分利用网络资源,EpiK Protocol 基于 Filecoin 核心技术搭建了针对知识图谱协作平台定制的二层存储网络,在二层网络收集的小文件汇集为大文件之后,再回传到Filecoin一层网路上存储。
在 EpiK Protocol 中,任何人抵押 1,000 EPK 即可成为矿工,矿工需要为领域专家提供免费的数据存储服务。领域专家要上传数据时,先发送消息上链登记数据信息,然后寻找在线的矿工达成免费的存储订单(Deal),将数据传给矿工。
矿工在本地接受完数据并完成复制证明后,发送消息上链公布自己存储对应数据的扇区信息,告知全网已存储该数据完整副本。在此之后,矿工需要周期性地发送消息上链公布自己已激活扇区的时空证明,告知全网本地一直存储着该数据。知识图谱数据每份不会太大,为了避免浪费空间,EpiKProtocol 中扇区大小设置为 8MB。
EpiK Protocol 使用预期共识(Expected Consensus)算法进行出块,任何算力大于 0 的矿工都有机会获得出块权。在预期共识中,算力越大,获得出块权的概率越高。每 30s 出一次区块,每轮可能会有 0 个或者多个矿工获得区块权,获得出块权的矿工谁最先完成打包将区块同步给全网其他大多数矿工,则可以获得出块奖励,每个区块将包含 96 个 EPK 区块奖励,其中 75% 将已“7 + 7”的方式给到当前出块的矿工,
即 7 天后开始释放奖励,7 天线性释放完。另外,如第 4 章提到,其中 1% 会按比例分配给为领域专家投票的用户,其中 9% 会按比例分配给当前有效的领域专家。除此之外,还有 15% 将根据全网知识图谱数据的供需情况,补贴到知识基金。区块奖励将每过 90 天将衰减一次,每次衰减为上一个阶段区块奖励的 0.9573501。按照此衰减比例,每四年会减半,用于挖矿的 700M 代币将在50年左右的时间全部释放完。
Scan QR code with WeChat