从数据库发展规律看区块链技术
区块链技术的出现并不是来自于空中楼阁,其今后发展也不可能脱离互联网和技术原来的脉络,作为一种数据存储机制,必然也会承接数据结构发展的既定规律,在深入分析后,可以发现这些发展其实从来都是和人类整体思想的发展一脉相承的。随着计算机技术在以惊人的速度向前推进,也许我们接近人工智能的奇点也越来越近。有些人拥抱发展,推动发展,也有些人害怕发展拒绝发展,认为任何的变化都是洪水猛兽,但技术发展的步伐是谁也不能阻止的,我们也许只有遵循着这些规律,成为发展的推动者,而不是阻碍者。
设计思想的根本变化
比特币的哈希算力在2013年9月就已经达到了1PH/s,这意味着它毫无疑问的成为了全球最大的算力网络,这也意味着全球Top500的超级计算机的算力加在一起都对它来说可以忽略不计。面对着有史以来人类建造的最强大的计算网络,很多传统的系统架构会发生巨大的改变。随着算力的空前发展,正在逐步从“大数据”开拓进入一个“大计算”的时代。
应该说,比特币的计算力加上区块链技术已经处于互联网下一阶段的门槛,所以可以从许多去中心化网络的系统架构上,发现很多设计思路和用户需求都已经发生了质的改变,而这些改变可能在未来将对整个IT产生重大而深远的影响。
随着计算能力的充分增加,我们对信息的需求已经不仅是快,而是更好更安全。但是在过去,绝大部分的系统设计都是按照越快实现功能越好的要求来设计的。因为对于过去大多数应用而言,先要实现信息交互的功能才是最重要的。而当人们在互联网上已经有了足够的应用时,就会提供更高的需求。而区块链技术就是顺应这样的要求而出现的。
举一个典型的例子,BitMessage,这是一个实现类似于电子邮件系统的区块链应用。对于过去传统模型,无论是电子邮件还是其他信息传输系统,总是以快捷为最主要的需求,要求点对点的发送,在点和点之间寻求最短的路径。但是这也很容易让别人追查是谁发给谁,从美国斯诺登事件中披露的信息来看,无论你如何加密信件内容,其实国安局更感兴趣的是发送给谁,而不一定是内容。
但BitMessage的设计思路和传统电子邮件的系统就完全不一样,它在发送一份邮件时,会发送给网络系统中每一个人,每个人都会尝试解密内容,但只有真正有着私钥的人才能解开。
这对于过去的软件工程师来说是不可想象的方式,如此浪费计算力和带宽,如此“奢侈”的方式是不是太浪费了。不,因为现在的网络和计算力已经到达允许这种“浪费”了,因为我们的需求已经从温饱上升到“小康”阶段。
在充沛的计算力之前,我们愿意并且也能够通过浪费一些来换取更多的安全,这仅仅是一个简单的例子。目前已经有很多试图以区块链技术为基础的应用开始发展,在基于强大安全和算力的基础上开始建立全新的模型,这也许是一个目前还很少有人涉足的金矿。但相信随着区块链技术的发展,会有越来越多和过去截然不同的网络模型和架构会出现。
数据库进入全新阶段
在我参与翻译的《区块链-新经济的蓝图》一书中,作者Melanie Swan以宏观的角度检视互联网依赖数据发展的阶段,它将数据发展阶段分为三个阶段,最初的第一阶段,数据是无序的,并没有被充分检验过的数据,然而当大数据和大规模社交网络的兴起,进入了第二阶段,通过大数据的交叉检验和推荐,所有的数据将会根据质量进行甄别,这些数据将不再是杂乱无章,而是能够一定人工智能算法进行质量排序。到了现在,区块链能够将让数据进入第三阶段,即有些数据将通过采用全球共识的区块链机制,这些数据可以获得基于互联网全局可信的质量,这几乎可以说人类目前获得最坚固信用基础的数据,这些数据的精度和质量都获得了前所谓未有的提升。
由于Melanie Swan是金融专业背景,所以更容易从数据质量角度来提出数据三阶段设想。而从我个人的角度来看,这三个阶段恰好符合了互联网数据库发展需要经历的三个阶段 。即从关系型数据库发展到非关系型数据库,再到区块链数据库。
在互联网诞生初期,数据库主要的类型是关系型数据库,这是一种采用了关系模型来组织数据的数据库。这是在1970年由IBM的研究员E.F.Codd博士首先提出的,在之后的几十年中,关系模型的概念得到了充分的发展并逐渐成为主流数据库结构的主流模型。简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。
随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而NoSQL的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL,泛指非关系型的数据库,它产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
我们可以拿谷歌举例看一下,谷歌公司大数据三篇著名论文(GFS,Bigtable,MapReduce)奠定了谷歌大数据的基础,而谷歌的Pagerank算法实现了当时几乎最先进的数据搜索算法。PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单的说,一个高等级的页面可以使其他低等级页面的等级提升。而这个技术正是本章所指的数据第二阶段,通过复杂的设计网络和算法进行重新整理和归纳,将原本看似并无关联的数据成为了可以分级分类的高质量数据,让大数据和复杂网络模型成为可能。
但是构建在这之上的大数据,最大的问题就是无法解决信任问题。因为互联网将使得全球之间的互动越来越紧密,伴随而来的就是巨大的信任鸿沟。目前现有的主流数据库技术架构都是私密且中心化的,在这个架构上是永远无法解决价值转移和互信问题。所以区块链技术将成为下一代数据库架构。通过去中心化技术,将能够在大数据的基础上完成全球互信这个巨大的进步.
区块链技术作为一种特定分布式存取数据技术,它通过网络中多个参与计算的节点开共同参与数据的计算和记录,并且互相验证其信息的有效性(防伪)。从这一点来,区块链技术也是一种特定的数据库技术。这种数据库将会实现Melanie Swan所说的第三种数据类型,即能够获得基于全网共识为基础的数据可信性。在目前互联网刚刚进入大数据时代,但是从目前来看,我们的大数据还处于非常基础的阶段。但是当进入到区块链数据库阶段,将进入到真正的强信任背书的大数据时代。这里面的所有数据都获得坚不可摧的质量,任何人都没有能力也没有必要去质疑。
数据的马斯洛层次
从前面的发展我们可以注意到,数据的发展和马斯洛需求层次理论有些接近,在实现了生存和使用的需求后,自然会朝着更高的需求进行发展。当然,安全仅仅是数据发展中的一个阶段,而最终会朝着人工智能这个数据自我实现的需求发展。尽管我们还不能确定当数据能够实现人工智能,甚至是数据自我智能时,数据库会是怎样的形态,也许未来的人工智能数据库会变得和复仇者联盟中贾维斯和奥创这样的形态吧……
在经过对于区块链发展技术的调查和分析之后,我们非常有信心认为现在正处在一个重大的转折点之上——和工业革命所带来的深刻变革几乎相同的重大转折的早期阶段。不仅仅是新技术指数级、数字化和组合式的进步与变革,更多的惊喜也许还会在我们前面。在未来的24个月里,这个星球所增长的计算机算力和记录的数据将会超过所有历史阶段的总和。在过去的24个月里,这个增值可能已经超过了1000倍。这些数字化的数据信息还在以比摩尔定律更快的速度增长。
我们这一代人将很可能会幸运地经历人类历史上两个最让人吃惊的事件,地球上的所有人和所有机器通过区块链技术以前所未有的互信展开了空前的大规模协作,其次就是基于此真正的人工智能将被创造出来。这两个时间将会深深地改变这个世界的经济发展模式。创业者、企业家、科学家以及各种各样的极客将利用这个充裕的世界去创造能让我们震惊和快乐。
微信掃描關注公眾號,及時掌握新動向
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場