如何更合理地评估NFT的稀有度(Rarity)?
什么是NFT的稀有度?
一般来说,NFT的稀有度包含两个概念:特征稀有度与资产稀有度。
特征稀有度:衡量每个特征的出现频率,即拥有该特征在此集合中的占比。例如,特征 "Background_Blue "的稀有度得分是10.44%,因为Short Bear Club总数是5000只,其中有522只 "Background_Blue "熊。
图1: Short Bear Club的特征稀有度
资产稀有度:代表该项资产的总稀有度分数,可用于横向对比与排名。单个 NFT 的价值通常很大程度上受到稀有度的影响。对于 NFT 收藏家来说,当他们在考虑购买哪种 NFT 时,他们希望花费相同数量的 ETH 带来最大的回报,于是,稀有度成为最重要的参考指标之一。
已有的稀有度评分模型
Rarity.Tools 稀有度评分
Rarity.Tools 是目前使用最广的稀有度评分工具。它的核心计算方式是:将每个特征出现频率的百分比的倒数总值相加。
图2:rarity.tools 的稀有度模型(来源 Medium)
不过,Rarity.Tools 在近期调整了它的计算模型,且没有公开披露具体细节。
Rarity.Tools 是 NFT Summer 爆发前就有的一款 NFT 稀有度数据分析工具,它的优势在于计算模型简单易懂。用户可以很直观地看出哪个特征在整体稀有度分数中贡献度更大。但是简单加总法的缺点是可能会高估或低估一项资产的真实稀有度。例如,若某个特征或者特征数量的分数过高,会在一定程度上拉高该 NFT 的排名,但用户可能对该特征并不是很关注。
NFTEXP 稀有度评分
在 NFTEXP 的稀有度计算更为复杂,目前尚未披露。我们只能从 NETEXP 官网中获得NFTEXP模型的大概思路。
以 "Chubbies"项目为例,其中两个特征的频率如下:
脸部: Blushed,有1053个(10.5%)。
发型: Afro,有1110个(11.1%)。
图3:"Chubbies"项目一览(来源NFTGO.io)
从百分比上来看两个特征的稀有度几乎相同。但是:「Blushed」的特征稀有度评分为8,而 Afro 的特征稀有度评分为17。这是因为发型特征只有四种,脸部特征一共有13种。所以,一个 「Blushed」 的真实稀有度低于“平均脸”(13种脸部特征占7.7%,「Blushed」占10.5%),而一个「Afro」的真实稀有度高于平均水平(4种发型特征=25%,Afro 有11%)。
NFTEXP 的特征稀有度考虑到了特征中类别数的影响。每个特征的出现频率会与平均频率进行比较,相应的调整特征评分。但 NFTEXP也存在和 Rarity.Tools 同样的缺点,会在下一节“异常情况对比”中详细阐述。
更合理的稀有度评分模型
一般来说,稀有的同义词还有特殊、独特。一件事物是否稀有,主要取决于它与群体内其他事物的差异性。差异性越大,代表这件事物更加特殊和罕见。那么,若能量化这件事物与群体内其他事物的综合差异,即能反映出它在群体内的稀有度。NFTGO 基于这一原则,研发出一种更科学的方法来评估 NFT 的稀有度 —— 基于 Jaccard 距离的稀有度评分方式(以下简称为 NFTGO 稀有度评分)。
什么是 Jaccard 距离?
Jaccard 距离是一个统计学的方法,用于测试样本集之间的不相似性,范围为从0到1。其数学公式为:
Jaccard 距离是一种常见的数据科学测量方法,用于计算对象之间的差异性。其逻辑看起来类似于维恩图,衡量样本集之间的交集大小。
如何计算NFTGO稀有度评分?
NFTGO 基于Jaccard 距离来纯粹地统计 NFT 特征的相似度。我们以计算 BAYC#1154 稀有度评分为例:
计算#1154 与同系列中其他9999个 NFT 的 Jaccard 距离
计算 Jaccard 距离的平均值,这就是稀有度分数的初始数据
使用极差法处理上一步的数据。极差法的数学公式为:
用上一步得出的 z-score 乘以100,即为 BAYC#1154 的最终稀有度分数。然后在一个集合中根据分数进行排名 (稀有度分数的范围从0到100),得到该 NFT 的最终稀有度排名。
NFTGO 稀有度评分的优势
通过实验对比发现,Rarity.tools 和 NETEXP 的稀有度评分可能会高估或低估一项 NFT 资产的稀有度,而 NFTGO 稀有度评分却能在这些异常情况里给出比较合理的结果。
下表展示了 NFTGO、Rarity.Tools 和 NFTEXP 三种稀有度评分模型,在计算Bored Ape Yacht Club(BAYC)系列NFT的稀有度排名时的异常情况。
表1:各工具稀有度排名结果对比(数据:2021年10月2日)
在26个异常值中,前22个猿猴的稀有度评分被 Rarity.Tools 和 NFTEXP 高估了,因为 “有四个特征属性的猿猴” 在总分中占了很大的比例。最后4个猿猴的稀有度评分被 Rarity.Tools 和 NFTEXP 低估了,因为 “有五个特征属性的猿猴”在总分中占的比例很小。
以 BAYC #947 为例,NFTGO 将其排名为#9994,这几乎是最不稀有的猿猴,稀有度为406。然而,Rarity.Tools 将它排在第775位,稀有度为168.23。这是因为 Rarity.Tools 仅将每个特征和特征数进行简单相加(然而它实际没有额外的特殊特征)。如下图所示,这只猴子并无特别的特征。那为什么这只猿猴在 Rarity.Tools 中排名前10%?很明显,特征数占稀有度分数的比例过高,在168.23的总分中占136.7分。有四个特征属性的猿猴总数为254个,有六个特征属性的猿猴总数为5,323个。根据 Rarity.Tools 提供的稀有度计算公式,有四个特征属性的猿猴会比有六个特征属性的猿猴相对稀缺,这其实并不太合理。
图4:Rarity.tools 针对 BAYC #947 的稀有度评分细节(数据:2021年12月2日)
图5:NFTGO 针对 BAYC #947 的稀有度评分细节 (数据:2021年12月2日)
再看 BAYC #2832 和 BAYC #8742 ,很明显,BAYC #2832 的评分应该更高,因为它有多样化的特征。并且,BAYC #8742 的最高报价也高于 BAYC #2832,因此,购买 BAYC #2832 是更有利可图的,而Rarity.tools低估了它的稀有度。
图6:Rarity.tools 针对 BAYC #2832 和BAYC #8742的稀有度评分细节(数据:2021年12月2日)
图7:NFTGO 针对 BAYC #2832 的稀有度评分细节 (数据:2021年12月2日)
图8:NFTGO 针对 BAYC #8742 的稀有度评分细节 (数据:2021年12月2日)
图7和图8是NFTGO对BAYC #2832 和BAYC #8742的稀有度评分。从页面右侧“特征”视图可以看到,BAYC #2832的各特征属性基本浮动在1%-3%之间(甚至比BAYC#1154还要稀有!),而BAYC #8742特征属性的最低值足有12.42。显然,NFTGO的稀有度评分比Rarity.Tools更加合理。
此外,Rarity.Tools 和 NFTGO 对于 CryptoPunks 的稀有度评分也能反映其准确性的差异。在 Rarity.Tools v2 中排名前二十名的 Punk,有接近一半是没有特征的。NFTGO 对此类 Punk 的排名更低一些,因为这些零特征的 Punk 缺乏多样性, 理应降低稀有度评分和排名 。
图9: Rarity.Tools中排名前21的CryptoPunk
图10:NFTGO中排名前20的CryptoPunks
表2:CryptoPunk的稀有度排名对比(数据:2021年11月2日)
综上,与 Rarity Tools 和 NFTEXP 稀有度评分相比,基于 Jaccard 距离的NFTGO稀有度评分是合理且准确的,您可以将其作为收藏NFT的参考。
总结
在购买或出售 NFT 时,稀有度得分是一种辅助手段。虽然我们使用的稀有度模型在统计学上是正确的,但是不同 NFT 项目方会给出关于某种属性的更重要的公告。例如 Cool Cats 的官方声明,无檐小便帽或帽子这样的普通物品比电脑头或猿人服装等稀有物品的价值要低。除此之外还有其他方法可以判断 NFT 资产的价值,如艺术欣赏价值或流动性溢价。再者,也许您更喜欢绿色背景而不是红色背景,这受到了个人主观审美的影响。
基于 Jaccard 距离来计算一项 NFT 资产的群体性差异,帮助用户发现NFT的群体性综合差异,实际是更本质地量化了“稀有度”这一概念。您已可以在 NFTGO 上查看所有 NFT 的稀有度排名和稀有度评分,希望 NFTGO 稀有度评分能帮助您在购买或出售 NFT 时做出更合理的决策。
Scan QR code with WeChat