搞懂 “柏林” 之后的合约 Gas 开销
“柏林” 硬分叉将在 4 月 15 日激活,该硬分叉所包含 EIP 中的两个(EIP-2929 和 EIP-2930)都会影响事务的 Gas 开销。本文会解释 “柏林” 激活之前,一些操作码的 Gas 消耗量是如何计算的,而 EIP-2929 对此有何影响,以及,2930 引入的访问清单(Access List)功能应如何使用。
摘要
这篇文章很长,你要是只想知道结论,看完这部分就可以把网页关掉了:
柏林硬分叉改变了某些操作码的 Gas 开销。如果你在自己的应用中硬编码了一些操作可使用的 Gas 数量,这些操作可能会卡死。如果真的出现了这种情况,而你的智能合约又是没法升级的,用户就需要使用 “访问清单” 功能来使用你的应用。
访问清单功能可略微减少 Gas 开销,但有些时候也可能会提高总的 Gas 消耗量。
geth 客户端引入了一种新的 RPC 方法,叫做 eth_createAccessList
来简化访问清单的生成。
“柏林” 升级以前的 Gas 开销
EVM 所执行的每一个操作码都有一个对应的 Gas 消耗量。大部分操作码的消耗量都是固定的:PUSH1
总是消耗 3 gas,而 MUL
消耗 5 gas,等等。有一些操作码的消耗量是可变的:举个例子,SHA3
操作码的开销由输入值的长度决定。
我们先了解 SLOAD
和 SSTORE
操作码,因为这两个操作码受 “柏林” 影响最大。后面我们会再谈谈那些以地址为目标的操作,比如所有的 EXT*
类操作码和 CALL*
类操作码,因为它们的 Gas 开销也被改变了。
“柏林” 以前的 SLOAD
在 EIP-2929 实施前,SLOAD
开销的计算方式很简单:总是消耗 800 gas。所以,也没啥可展开的。
“柏林” 以前的 SSTORE
要讲到 Gas 消耗量的计算,SSTORE
操作码可能是最复杂的了。因为消耗多少取决于该存储项槽当前的值、要写入的新值、该存储项是否已经修改过。我们只会分析少数几种场景,了解个大概。如果你想了解更多,请阅读本文末尾所附的 EIP 链接。
如果存储项的值从 0 改为 1(或者任意非零的值),Gas 消耗量是 20000
如果存储项的值从 1 改为 2(或者任意非零的值),Gas 消耗量是 5000
如果存储项的值从 1(或任意非零的值) 改为 0,消耗量也是 5000,但你会在事务执行结束后获得 gas 补贴。我们这里也不讨论 gas 返还机制,因为它不会受到柏林的影响
在一笔事务中,如果存储项已不是第一次修改,则后续每一次 SSTORE
都消耗 800 gas
细节在这里并不重要,重要的是,SSTORE
是昂贵的,具体消耗多少 gas 则依赖于多个因素。
EIP-2929 之后的 Gas 消耗量
EIP-2929 改变了所有这些数值。但在展开之前,我们要先谈谈该 EIP 引入的一个重要概念:被访问过的地址和被访问过的存储项的键(storage key)。
当一个地址或者一个存储项的键,在一笔事务中被 “使用过” 之后,在该笔交易余下的执行过程中,这个地址(或者这个键)都会被当成 “已被访问过的”。举个例子,如果你在一笔事务中 CALL
(调用)另一个合约,那么该合约的地址就会被标记为 “访问过的”。类似地,如果你 SLOAD
或者 SSTORE
过一些存储项槽 ,在该笔事务余下的执行过程里,这些槽也会被当成已经访问过的。到底用的哪个操作码是没有关系的,即使你只 SLOAD
过某个槽,接下来使用 SSTORE
时该槽也会被当成已访问过的。
注意:存储项的键是 “内在于” 某些地址中的,一如该 EIP 所解释的:
执行事务时,保持一个集合:
accessed_addresses: Set[Address]
以及accessed_storage_keys: Set[Tuple[Address, Bytes32]]
也就是说,当我们说某个存储槽已被访问过了,我们的实际意思是:(address, storageKey)
已被访问过了。
搞清楚了这个概念,我们来谈谈新的 Gas 消耗量计算模式。
“柏林” 以后的 SLOAD
升级前,SLOAD
的 Gas 消耗量是固定的 800。但升级后,Gas 消耗量要看这个存储槽是否已经被访问过。还没访问过的,消耗量就是 2100 gas;访问过的,就是 100 gas。所以,如果某个存储项槽已经在 “已访问过的存储项键` 的集合里了,就可以省掉 2000 gas。
“柏林” 以后的 SSTORE
我们逐个逐个对比下,在 EIP-2929 实施后,上面的几个例子会发生什么样的变化:
如果存储项的值从 0 改为 1(或者任意非零的值),Gas 消耗量是 20000
如果该存储项键还未访问过,消耗 22100 gas
若已访问过,消耗 20000 gas
如果存储项的值从 1 改为 2(或者任意非零的值),Gas 消耗量是 5000
如果该存储项键还未访问过,消耗 5000 gas
若已访问过,消耗 2900 gas
如果存储项的值从 1(或任意非零的值) 改为 0,消耗量保持不变,gas 返还机制也不变
在一笔事务中,如果存储项已不是第一次修改,则后续每一次 SSTORE
都消耗 100 gas
由此可见,如果某个槽此前已访问过,则对它的第一次 SSTORE
操作会节约 2100 gas(相比于从未访问过)。
汇总一下
上面的文字实在啰嗦,我们就直接做一张表,把上面提到的值都汇总一下:
操作码 | “柏林” 前 | “柏林” 后 | |
---|---|---|---|
未访问过 | 访问过 | ||
SLOAD | 800 | 2100 | 100 |
SSTORE from 0 to 1 | 20000 | 22100 | 20000 |
SSTORE from 1 to 2 | 5000 | 5000 | 2900 |
SLOAD + SSTORE* | 5800 | 5000 | 3000 |
SSTORE* + SLOAD | 5800 | 5100 | 3000 |
SSTORE 一个已经被写过的槽 | 800 | 100 | 100 |
*从一个非零值改为另一个非零值,就像第三行所示的那样 |
注意看最后一行:此时已不再需要区分它到底有没有被访问过,因为,如果此前已写入,则必定已被访问过。
EIP-2930:可选 “访问清单” 的事务类型
另一个 “柏林” 升级包含的 EIP 是 2930。该 EIP 加入了一种新的类型的事务,可以在事务的负载中包含一个 “访问清单”,意思是,你可以在事务执行前就声明哪些地址和存储槽应被认为是 “访问过的”。举个例子,对一个未访问过的槽执行 SLOAD
需要耗费 2100 gas,但如果该存储槽被包含在了事务的 “访问清单” 中,则操作的消耗量机会降为 100 gas。
但如果只要地址和槽被当成 “已访问过的” 就可以降低操作的 Gas 消耗量;而访问清单可以把地址和槽标记为 “已访问过的”;那岂不是说我们可以把这些东西都放在访问清单中,来获得 Gas 消耗量的减免?真棒,天赐 Gas!
额,并不完全如此,因为你每添加一个地址或存储项键,都要支付额外的 Gas。
举个例子。假如我们要向合约 A
发送了一条事务。我们编写了一条这样的访问清单:
accessList: [{ address: "", storageKeys: [ "0x0000000000000000000000000000000000000000000000000000000000000000" ]}]如果我们发送了一条带有这条访问清单的事务,而使用 0x0 存储槽的第一个操作码就是 SLOAD,则 Gas 消耗量会是 100 而非 2100,也就是减免了 2000 gas。但是,在访问列表中声明一个存储项键需要额外支付 1900 gas,所以我们只节约了 100 gas。(如果对该存储槽的第一个操作是 SSTROE,我们在单个操作中就省下了 2100 gas,也就是总共省下了 200 gas,因为访问清单本身需要消耗 gas)。
这是不是说,每次使用访问清单我们都能节省 gas 呢?很遗憾,也不是,因为在访问清单中填入地址也需要支付 gas。(也就是我们示例中的 "
"
)
访问过的地址
迄今为止,我们只讨论了 SLOAD
和 SSTORE
操作码,但 “柏林” 升级还改变了别的操作码。举个例子,CALL
操作码原来的 Gas 消耗量为固定的 700,但 2929 实施后,如果所调用的地址不在访问清单中,消耗量将提高到 2600;如果在,则降低为 100。而且,就像访问过的存储键一样,到底哪个操作码访问过那个地址并不重要(比如,如果用户最先调用的是 EXTCODESIZE
,这一个操作的消耗量是 2600,但后续的调用,只要是对同一个地址的,无论是 EXTCODESIZE
、CALL
还是 STATICCALL
,都只消耗 100 gas。
那个这个设计对带有访问清单的事务有何影响?假设我们向合约 A 发送一条交易,而合约 A 调用了合约 B,而我们在访问清单中写入这样的内容:
accessList: [{ address: "", storageKeys: [] }]我们首先需要为在这条事务的访问清单中加入这个地址支付 2400 gas,但对 B 使用的第一个操作码就只需要消耗 100 gas 而不是 2600 gas,这就剩下了 100 gas。如果 B 也需要使用其存储项,我们又知道它将使用哪个键,我们也可以把这些键包含在访问列表中,然后为每个键的操作省下 100 或 200 gas(取决于第一个操作码是 SLOAD 还是 SSTORE)。
但为啥我们要加多一个合约来举例子?我们不是可以这样写吗?
accessList: [ , ,]你当然可以这样做,但不值得,因为 EIP-2929 指明了你一开始调用的合约(也即是 tx.to 的目的地)必定会被包含在 accessed_addresses 列表中,所以你就是额外花了 2400 gas,什么好处都没得到。
所以,回头看我们上面举的例子:
accessList: [{ address: "", storageKeys: [ "0x0000000000000000000000000000000000000000000000000000000000000000" ]}]这样做其实是浪费,除非你在里面加多几个存储项键。如果我们假设所有的存储项键的第一个操作都是 SLOAD,那你要至少 24 个键,才能赚回来。
而且,如你所见,自己一五一十地分析这些因素、手动生成访问清单,显然是极其繁琐而令人崩溃的事。好在,还有更好的办法。
eth_createAccessList
RPC 方法
Geth 客户端(从 1.10.2)开始将包含一个新的 eth_createAccessList
RPC 方法,你可以用它来生成访问清单,就像使用 eth_estimateGas
一样,只不过返回的不是 Gas 消耗量估计,而是形如这样的数据:
{ "accessList": [ { "address": "0xb0ee076d7779a6ce152283f009f4c32b5f88756c", "storageKeys": [ "0x0000000000000000000000000000000000000000000000000000000000000000", "0x0000000000000000000000000000000000000000000000000000000000000001" ] } ], "gasUsed": "0x8496"}也就是告诉你一笔事务将会用到的地址和存储项键的清单,以及,假定纳入这份访问清单 将耗用多少 gas。跟 eth_estimateGas 一样,这也是估计出来的,该笔事务真正上链时,会访问到哪些数据仍有可能改变。但是,再说一遍,这绝不意味着你只要使用了访问清单,所用的 Gas 就会比不用清单更少!
我估计随着时间推移,我们会越来越知道怎么利用这个功能,但我个人估计,方法的伪代码形式会像这样:
let gasEstimation = estimateGas(tx)let { accessList, gasUsed } = createAccessList(tx)if (gasUsed > gasEstimation) { delete accessList[tx.to]}tx.accessList = accessList;sendTransaction(tx)防止合约变砖
值得提醒,访问清单功能的主要目的不是节省 Gas。如该 EIP 自身所述:
缓解由 EIP-2929 带来的合约变砖风险,因为事务可以预先指定、预先支付自身尝试范文的账户和存储槽,因此,在实际的执行中,SLOAD 和 EXT* 操作码都只会消耗 100 gas:这个值低到既足以防止 2929 打破某些合约,也可以 “解封” 被 EIP-1884 封印的合约。
原本,只要一个合约预设了执行的 Gas 开销,操作码的 Gas 消耗量变动就有可能导致它变砖。比如,如果一个合约预设另一个合约的 someFunction
只会用到 34500 gas,因此总是用 someOtherContract.someFunction()
调用那个合约,这个合约就有可能变砖。但只要你在事务中添加合适的访问清单,这个合约就还能工作。
自己验证
如果你想自己测试一下,克隆这个仓库,这里面有很多例子,可以使用 Hardhat 和 Geth 客户端来运行。请仔细阅读 README。
觉得有趣吗?
如果这些非常底层、诘屈聱牙的东西你也喜欢,Nomic Labs 正在招人。
参考文献
EIP-2929 和 EIP-2930 是两个跟本文有关的 “柏林” EIP。
EIP-2930 依赖于 “柏林” 升级纳入的另一个 EIP:EIP-2718,也叫标准化的事务信封。
EIP-2929 大量参考了 EIP-2200,如果你想更深入地理解 Gas 消耗量,你应该从那里开始。
微信掃描關注公眾號,及時掌握新動向
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場