网易首页 > 网易号 > 正文 申请入驻

Arweave第17版白皮书解读(四):存储完整数据副本才是王道

0
分享至

作者:Gerry Wang @ Arweave Oasis,原文首发于 @ArweaveOasis 推特

在解读(三)文中,我们通过数学推导对 #SPoRes 的可行性进行了论证。文中的 Bob 与 Alice 一起参与了这场证明游戏。那在 #Arweave 挖矿中,协议部署了这个 SPoRes 游戏的修改版本。在挖矿过程中,协议充当了 Bob 的角色,而网络中的所有矿工共同扮演 Alice 的角色。SPoRes 游戏的每个有效证明都用于创建 Arweave 的下一个区块。具体说来,Arweave 区块的产生与以下参数相关:



其中:

BI = Arweave 网络的区块索引 Block Index;

800*n_p = 每个检查点每个分区最多解锁 800 个哈希次数,n_p 是矿工存储的大小为 3.6 TB 的分区的数量,两者相乘是该矿工每秒最大可以尝试的哈希运算次数。

d = 网络的难度。

一个成功有效的证明是那些大于难度值的证明,而这个难度值会随时间变化而被调整,以确保平均每 120 秒挖出一个区块。如果区块 i 与区块(i+10)之间的时间差为 t ,那么从旧难度 d_i 到新难度 d_{i+10} 的调整如下计算:



其中:



公式注解:从上面两个公式中可以看出, 网络难度的调整主要靠参数 r,而 r 意味着实际的区块产生所需要的时间相对于系统期望的 120 秒一个区块的标准时间的偏移参数。

新计算的难度决定了基于每个生成的 SPoA 证明,挖掘区块成功的概率,具体如下:



公式注解:经过以上推导可以得到新难度下的挖掘成功概率是旧难度下成功概率乘以参数 r。

同样,VDF 的难度也会重新计算,目的是为了保持检查点周期在时间上能够每秒发生一次。

完整副本的激励机制

Arweave 通过 SPoRes 机制来生成每个区块是基于这样一个假设:

在激励下,无论是个体矿工还是群体合作矿工,都会以维护完整数据副本作为挖矿的最佳策略来执行。

在先前介绍的 SPoRes 游戏中,存储数据集的同一部分的两个副本所释放的 SPoA 哈希数量与存储整个数据集的完整副本是相同的,这就给矿工留下了投机行为的可能。于是 Arweave 在实际部署这套机制的时候,对其作了一些修改,协议通过将每秒解锁的 SPoA 挑战数量分成两部分:

  • 一部分在矿工存储的分区中指定一个分区来释放一定数量的 SPoA 挑战;
  • 另一部分则是在 Arweave 所有数据分区中随机指定一个分区来释放 SPoA 挑战,如果矿工没有存储这个分区的副本,则会失去这一部分的挑战数量。

这里也许你会觉得有些疑惑,SPoA 与 SPoRes 之间究竟是什么关系。共识机制是 SPoRes,为什么释放的却是 SPoA 的挑战?其实它们之间是一种从属的关系。SPoRes 是这个共识机制的总称,其中包含了需要矿工做的一系列 SPoA 证明挑战。

为了理解这一点,我们将检查前一节中描述的 VDF 是如何被用来解锁 SPoA 挑战的。



以上代码详细表述了如何通过 VDF(加密时钟)来解锁存储分区中由一定 SPoA 数量组成的回溯范围的过程。

  1. 大约每秒钟,VDF 哈希链会输出一个检查点(Check);
  2. 这个检查点 Check 将与挖矿地址(addr),分区索引(index(p)),和原始 VDF 种子(seed)一起用 RandomX 算法计算出一个哈希值 H0,该哈希值是一个 256 位的数字;
  3. C1 是回溯偏移量,它是由 H0 除以分区的大小 size(p) 而产生一个余数得来,它将是第一个回溯范围的起始偏移量;
  4. 从这个起始偏移量开始的连续 100 MB 范围内的 400 个 256 KB 的数据块,就是被解锁出来的第一回溯范围 SPoA 挑战。
  5. C2 是第二回溯范围的起始偏移量,它是由 H0 除以所有分区大小之和而产生的余数得来的,它同样也解锁了第二回溯范围的 400 个 SPoA 挑战。
  6. 这些挑战的约束是第二范围内的 SPoA 挑战需要在第一个范围的对应位置也有 SPoA 挑战。

每个已打包分区的性能

每个已打包分区的性能指的是每个分区在每个 VDF 检查点所产生的 SPoA 挑战数量。当矿工存储的是分区唯一副本 Unique Replicas 时,SPoA 挑战数量将大于矿工存储相同数据的多个备份 Copies 时的数量。

这里的「唯一副本」概念与「备份」概念是有极大区别的,具体可以阅读过去的文章《Arweave 2.6 也许更符合中本聪的愿景》的内容。

如果矿工只存了分区的唯一副本数据,那每个打包过的分区将会产生所有第一回溯范围的挑战,然后根据存储分区副本的数量产生落在该分区内的第二回溯范围。若整个 Arweave 编织网络中共有 m 个分区,矿工存储了其中 n个分区的唯一副本,那么每个打包分区的性能为:



当矿工存储的分区是相同数据的备份时,每个打包过的分区仍然会产生所有第一回溯范围挑战。但只有在 1/m 次情况下,第二回溯范围会位于这个分区内。这便给这种存储策略行为带来了一个显著的性能惩罚,产生 SPoA 挑战数量的比率仅为:





图 1:当一个矿工(或一组合作的矿工)完成打包他们的数据集时,给定分区的性能会提高。

图 1 中的蓝色线为存储分区唯一副本的性能 perf_{unique}(n,m) ,该图直观地表明了,当矿工只存储了很少的分区副本时,每个分区的挖矿效率仅为 50%。当存储和维护所有数据集部分,即 n=m 时,挖矿效率达到最大化的 1。

总哈希率

总哈希率(见图 2 所示)由以下方程给出,通过将每个分区(per partition)的值乘以 n 得到:



以上公式表明了随着编织网络(Weave)大小的增长,如果不存储唯一副本数据,惩罚函数(Penalty Function)随着存储分区数量的增加而呈二次方增长。



图 2:唯一数据集和备份数据集的总挖矿哈希率

边际分区效率

基于这个框架,我们来探讨矿工在添加新分区时面临的决策问题,即是选择复制一个他们已有的分区,还是从其他矿工那获取新数据并打包成唯一副本。当他们从最大可能的 m 个分区中已经存储了 n 个分区的唯一副本时,他们的挖矿哈希率是成比例的:



所以增加一个新分区的唯一副本,其额外收益为:



而复制一个已打包分区的(更小的)收益是:



将第一个数量除以第二个数量,我们得到矿工的相对边际分区效率(relative marginal partition efficiency) :





图 3:矿工被激励去构建成一个完整的副本(选项 1),而不是制作他们已经拥有的数据的额外副本(选项 2)

rmpe 值可被视为矿工在添加新数据时复制现有分区的一种惩罚。在这个表达式中,我们可以将 m 趋向无穷大来处理,然后再考虑不同 n 值下的效率权衡:

  • 当矿工拥有接近完整数据集副本时,完成一个副本的奖励最高。因为如果 n 趋近于 m 并且 m 趋向于无穷大,则 rmpe 的值就为 3。这意味着,接近完整副本时,寻找新数据的效率是重新打包现有数据效率的 3 倍。
  • 当矿工存储一半编织网络(Weave)时,例如,当 n= 1/2 m, rmpe 是 2。这表示寻找新数据的矿工收益是复制现有数据收益的 2 倍。

对于较低的 n 值,rmpe 值趋向于但总是大于 1。这意味着存储唯一副本的收益永远都是大于复制现有数据的收益。

随着网络的增长(m 趋向无穷大),矿工构建成完整副本的动力将会增强。这促进了合作挖矿小组的创建,这些小组共同存储至少一个数据集的完整副本。

本文主要介绍了 Arweave 共识协议构建的细节,当然这也只是这部分核心内容的开篇。从机制介绍与代码中,我们可以非常直观地了解到协议的具体细节。希望能够帮助大家理解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
首尔这一夜:42岁宋慧乔娇俏,裴秀智是全民初恋,汤唯美得很轻松

首尔这一夜:42岁宋慧乔娇俏,裴秀智是全民初恋,汤唯美得很轻松

娱乐圈酸柠檬
2024-05-08 00:29:36
1亿+1亿!AC米兰狮子大开口,拜仁不信邪:凯恩开先例却是败笔

1亿+1亿!AC米兰狮子大开口,拜仁不信邪:凯恩开先例却是败笔

叁炮体育
2024-05-07 23:14:27
理想汽车时隔近2月再发布周销量数据

理想汽车时隔近2月再发布周销量数据

三言科技
2024-05-07 21:05:10
陈海涛大格局!亲自劝阻球员回座位,尊重辽篮,避免广东心态变化

陈海涛大格局!亲自劝阻球员回座位,尊重辽篮,避免广东心态变化

祝晓塬
2024-05-08 06:31:08
河南的老乡们,请看好你的粮食,捂紧你的口袋。

河南的老乡们,请看好你的粮食,捂紧你的口袋。

特特农村生活
2024-05-06 13:57:32
顶不住了?哈马斯抵达埃及主动要求和谈!

顶不住了?哈马斯抵达埃及主动要求和谈!

项鹏飞
2024-05-05 15:38:17
25张难得一见的精彩照片,你没见过的世界,看后眼界都提高了

25张难得一见的精彩照片,你没见过的世界,看后眼界都提高了

农人老寓
2024-04-23 19:55:20
曼晚:拉爵曾称穆帅把曼联带至灾难,并指责他摧毁了卢克肖

曼晚:拉爵曾称穆帅把曼联带至灾难,并指责他摧毁了卢克肖

懂球帝
2024-05-07 21:46:20
79年我未能提干退伍回家,我去赶集卖烧饼,没想到命运从此改变

79年我未能提干退伍回家,我去赶集卖烧饼,没想到命运从此改变

玉玉
2024-05-02 18:35:02
中国大使参加摩洛哥国王宴会,士兵闯入开枪扫射,众人倒在血泊中

中国大使参加摩洛哥国王宴会,士兵闯入开枪扫射,众人倒在血泊中

百年历史老号
2024-04-02 19:37:39
疯狂小杨哥回应“电音节宰客”:明码标价非欺诈,以后电音节水免费

疯狂小杨哥回应“电音节宰客”:明码标价非欺诈,以后电音节水免费

每日经济新闻
2024-05-07 21:41:08
女子称被前夫打到骨折,声泪俱下:不给我钱还带异性回家

女子称被前夫打到骨折,声泪俱下:不给我钱还带异性回家

福建第一帮帮团
2024-05-07 20:05:54
102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

娱乐团长
2024-04-18 21:00:03
幸亏没听老妈的话,次卧坚持装修成“不欢迎亲戚风”,效果真香!

幸亏没听老妈的话,次卧坚持装修成“不欢迎亲戚风”,效果真香!

装小宅
2024-05-07 12:12:36
西方风向大变!公然对华下毒手?朔尔茨白忙活一场,中方把话挑明

西方风向大变!公然对华下毒手?朔尔茨白忙活一场,中方把话挑明

壹号评论
2024-05-08 06:30:16
一场“疯狂”推高气温的大暖热即将上演 这样的暖热我们经历很多次了…

一场“疯狂”推高气温的大暖热即将上演 这样的暖热我们经历很多次了…

北青网-北京青年报
2024-05-07 19:23:09
河南又一条高铁获批!全线新设5座车站

河南又一条高铁获批!全线新设5座车站

鲁中晨报
2024-05-07 11:23:06
美国太狂了!美军核轰炸机冲进南海!解放军重型战机强势出动!

美国太狂了!美军核轰炸机冲进南海!解放军重型战机强势出动!

乐阳聊军事
2024-05-07 12:10:31
永远乐观向上

永远乐观向上

小兔子爱旅游
2024-05-07 20:26:14
大数据“扫黄”来了?若符合以下特征,你有可能已经“涉黄”了!

大数据“扫黄”来了?若符合以下特征,你有可能已经“涉黄”了!

元芳
2024-04-13 10:46:11
2024-05-08 07:26:44
金色财经区块链
金色财经区块链
国内最有影响力的区块链媒体
2317文章数 11097关注度
往期回顾 全部

科技要闻

新款iPad Pro发布:搭载M4芯片,8999元起

头条要闻

陕西一干部被妻子举报出轨前妻还"吃空饷" 纪委回应

头条要闻

陕西一干部被妻子举报出轨前妻还"吃空饷" 纪委回应

体育要闻

尼克斯与步行者,欢迎来到魔兽争霸

娱乐要闻

44岁董洁携顶顶拍杂志 与儿子相互依偎

财经要闻

中国首富的公司,业绩暴雷了

汽车要闻

配国产首颗车规级7nm芯片 吉利银河E5官图发布

态度原创

本地
手机
时尚
数码
公开课

本地新闻

畅游中国 幸福生活

手机要闻

“机圈首场AI数字人发布会” 真我GT Neo6官宣5月9日发布

潇洒、柔美的意大利女人,她们的时髦精髓太值得借鉴了

数码要闻

60秒速览苹果春季发布会:M4芯片如期而至 新款iPad Pro国行起售价8999

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版