深度:探索Web3与生成式AI的联姻
自 2022 年底 OpenAI 的 ChatGPT 上线以来,人工智能已经风靡全球。这台机器能够回答大多数问题,它已迅速成为增长最快的应用程序,吸引了超过一亿的用户。然而,与许多风投支持的初创公司一样,它每天都在烧掉数百万美元。
但这么烧钱也不是什么大问题,因为微软刚刚向 OpenAI 投资了 100 亿美元。加上 Azure 的硬件和 Bing 的流量分发,ChatGPT 的流行度已经跨越了成见的鸿沟。
不过,参与竞争的不仅仅是微软。Alphabet 的生成式 AI 产品 demo 版失败后,其股票市值损失了 1000 亿美元。阿里巴巴和亚马逊相继宣布入局,与 ChatGPT 争夺人工智能的主导地位;而苹果很可能会把 Siri 作为进入该市场的前锋产品。
人工智能工具的这种爆炸性增长是因为人们现在可以真正的使用人工智能。与其他趋势不同,如 Crypto、无人机或自动驾驶汽车,人工智能没有高准入门槛的限制。任何人都可以使用人工智能来完成家庭作业,甚至提高他们在 Bumble 等约会软件中的成功机会。相比之下,在 Crypto 中,你只能购买一个 Token,并假装它是你人格的全部。
Arthur C. Clarke 曾经说过:「任何足够先进的技术似乎都与魔法无异。」人工智能已经变得如此复杂,以至于现在许多人认为它就是魔法。在 2022 年第二季度,人工智能相关企业获得了高达 170 亿美元的资金投资。这种来自 FAANG、风险投资公司和散户投资者的资金激增表明,人工智能已经准备好吸引大众的注意力。
我们花了几周时间调查了人工智能行业的现状及其在未来十年的潜在影响。本文介绍了我们对该行业的有限理解,以及为什么我们认为区块链和人工智能将在未来十年内融合。然而,在深入研究这个话题之前,让我们首先重温一下经济学中的一些基本概念。
注意:我在整篇文章中用了 AI 模型/模型两个说法。为了便于阅读,任何提到「模型」一词的地方都是指生成性人工智能模型。
稀缺性的消亡
人类的历史是与稀缺性作斗争的历史,为寻找资源而进行的迁徙可以追溯到数万年前。当我们学会利用火和农业的力量之后,我们的祖先便成功茁壮成长了起来,并创造了整个文明。为了确保社会拥有必要的资源,我们冒险漂洋过海,参与贸易。
随着文明的发展,人类将注意力从基本需求转移到了地位的竞争上。中国的长城、埃及的金字塔、印度的泰姬陵和欧洲的文艺复兴时期的大教堂都是地位象征的例子,在当时那些时代的社会经济结构中发挥了关键作用。人们之所以可以动用数千人,花数十载的时间完成这些恢宏建筑,是因为那时的人们已不再为寻找食物而发愁。
当我们过渡到追求地位的社会之后,技能和服务变得稀缺起来。到了 14 世纪,战争英雄的庆祝活动减少了,而艺人、艺术家和发明家变得更加受人尊敬。莎士比亚、米开朗基罗和班克斯的作品说明了艺术家可以用独特的方式解释世界,而这往往需要几十年的文化体验。没有对文化的深刻理解,就无法创造文化。
我们今天面临的稀缺性与其说是围绕着物质商品,不如说是围绕着那些影响我们精神状态的商品。杰出的艺术家在一代人中只会出现一次,因为产生他们的环境很难复制。即使数百人经历了同样的环境,也只有少数人,如说唱明星 Jay-Z,能够成为数十亿美元的富翁。这些人的出现往往是不可预测、难以捉摸的。
在技能稀缺的社会里,杰出的人才会得到高昂的奖励。在欧洲的文艺复兴时代,为大教堂工作的艺术家往往被委托进行多年的创作。然而,在过去几个世纪的大部分时间里,经济产出与所消耗的能量成正比。能源要么被燃烧来为工厂提供动力,要么被人类用来生产商品。
过去的财富生产主要取决于人的数量或一个人能够获得的资源,这就是为什么我们的历史上会出现奴隶制这样可怕的阶段。财富的增长是一个线性的轨迹,往往依赖于征服。
在 20 世纪,代码和服务器改变了传统的财富生产途径。人们不再需要入侵外国土地或征服人民来获得筹码。正如 Naval Ravikant 所指出的,代码和媒体是新的筹码,人们能够通过代码来驾驭机器人军队。
看看 Instagram 或 Tiktok 这样的平台你就会发现,员工的数量与用户的数量并不成正比。相反,可扩展性是通过增加硬件来支持不断增长的用户群而实现的。
这个富足的时代可以追溯到 90 年代初互联网的出现。例如,通信成本的降低产生了垃圾邮件的问题。数字存储和带宽变得更容易获得,如 Limewire 和 Napster 等平台就是证明。今天,游戏和社交网络成为数百万用户的数字聚会场所,空间的稀缺性不再是一个问题。
在数字时代,满足一个额外用户需求的边际成本已经大大下降。随着数字技术的发展,稀缺性已经成为一个过去的概念。Naval 在这个视频中更详细地讨论了这个话题。
开发者拥有巨大的权力,类似于文艺复兴时代的熟练工匠,因为他们可以利用自己的时间和专业知识创造出强大的工具。然而,这种权力动态正在慢慢演变。微软最近的行为——裁员 1 万名员工,同时向 ChatGPT 的公司 OpenAI 投资 100 亿美元,鲜明地说明了这种对比。
我无意于灌输恐惧或暗示开发者将被淘汰。相反,我们有可能见证由人工智能赋予的替代工作的崛起。这种转变正体现在当前生成性人工智能技术的发展之中。
富足时代的到来
我们目前正处于一个数字消费极为丰富的时代。与此同时,传播的成本也越来越低。无论读者数量是 1000 还是 100000,分发这篇文章的成本都是一样的。Substack 的基础设施可以快速扩展,因此,它不按浏览量收费。不过,虽然我们已经可以随意分发内容了,但由于人们的注意力有限,内容创作量和文章阅读量都很匮乏。
作为一位作者,我的生产力受限于我在特定的时间框架内能创造多少有意义的内容。作为一个读者,你想从我这里读到的东西也只有这么多。
ChatGPT 和生成性人工智能等概念的兴起,正在颠覆生产和消费的经济学理论。我们上一次见证类似的情况可能还是在印刷业出现的时期。书籍的普及极大地降低了人类思想的存储和传播成本。虽然英国花了四个世纪的时间才将识字率从 5% 提高到 50%,但人们现在每天的阅读时间已经达到了差不多两个小时。
这种智力行为的变化直接推动了启蒙时代的到来,这一时期的特点是科学和哲学的快速发展,康德、伏尔泰、笛卡尔和亚当·斯密等人永远改变了我们的世界观。纵观历史,从洞穴壁画到谷歌上的数字文件,存储、分享和迭代思想的过程每一次都创造出了伟大的成就。
为了理解生成性人工智能的影响,我们必须认识到其降低生产和消费成本的潜力。诸如 ChatGPT 和 Midjourney 这类的应用程序会根据现有数据生成结果:ChatGPT 使用来自书籍、维基百科和期刊的数据来创建其文本回复,而 Stable Diffusion 最初依靠的是库存图片;Github 的 Copilot 利用数十亿行的代码来协助开发者。
从本质上讲,生成式人工智能综合了公开可用的信息,并根据用户的要求进行处理,从用简单的术语解释复杂的概念到创建特定场景的视觉画面。人工智能可以在几分钟内给出指令要求的结果,即便这些输出结果可能并不总是令人信服。但经过充分的调整,你最终会得到一些可能被认为是人类生成的内容。前提是主题通用,而且你不期望有任何个性化的元素。
摘自红杉关于生成式 AI 的文章
那么我们目前发展到哪个阶段了?上图来自 Sequoia 的博客,为我们提供了一个对当前情况的良好展望。如今,AI 模型能够实时处理文字输入、编辑文本以及调整语气,并且可以编辑图片和代码。这些功能的实现离不开生成式 AI 模型利用数据集进行的大量训练。如果我们可以在短时间内从多本书中获取并整合知识,或者生成艺术作品,那么我们最终将面临信息过载的问题。在处理复杂任务,如编辑电影或音乐方面,人类参与仍然必不可少,但 AI 确实可以加速这一进程。
讽刺的是,AI 已经开始用于总结大量文献并提供关键见解。然而,挑战在于我们无法确认其引用来源。例如,ChatGPT 在公共领域没有充分信息的情况下,可能会给出错误的答案,它也不会说明用于生成回答的数据来源。——这正是当前生成式 AI 面临的风险。
我们可以创作无尽的作品,却无法追踪其灵感来源或作者。在某个时刻,我们将依赖 AI 处理这些内容,并告诉我们其中哪些才是重要的信息。
过去几周我的推特内容
如果没有追溯来源的基础设施或验证 AI 模型的机制,生成式 AI 将无非是今日互联网的翻版而已:一大堆由算法生成的虚假新闻,并根据用户喜好推送信息。虽然生成式 AI 能让每个人都成为艺术家,但它也可能会边缘化那些为 AI 模型提供训练素材的初始作品创作者。这将是信息爆炸时代的一个关键挑战:如何确保艺术、文本或代码等形式的作品在每个人都从中受益时得到有效的归属和商业化处理?
互联网已经为这个问题提供了一些答案。像 Instagram 的 Reels 和 TikTok 这样的平台,非常依赖第三方艺术家的音乐作品。用户将音频片段进行混剪,制作出朗朗上口、时尚、涉及舞蹈、烹饪等各种主题的短片。TikTok 推出了 SoundOn,以帮助艺术家上传并变现他们的作品。在这些情况下,平台需负责授权和支付版税。当音频相同,且分发由平台自身控制时,处理这一问题就变得相对简单了。
然而,当音频内容涉及多个作品并由平台外的用户混剪时,情况就不同了。还记得我之前提到的以莎士比亚风格改写《哈利·波特》的事情吗?考虑到这只涉及两人的作品,处理起来会相对容易。但如果我们以莎士比亚的风格改写《哈利·波特》,并加入《权力的游戏》的情节,那么最终作品就有三位作者需要分享版税了。
当前生成式 AI 面临的挑战在于,你需要处理数百个作者的作品,以生成数千个输出结果;而其中没有一个作品能够被准确地识别、归属或追踪。
通常,创作这些作品并无任何成本。我可以每天在 ChatGPT 上运行数百个指令,直到获得满足我要求的回答。现今的社交媒体网络在很大程度上类似于赌场老虎机,用户花费数小时寻找那个能给他们带来巨大惊喜的内容。
随着生成式 AI 的出现,我们激励人们不断尝试各种指令,直到得到一个理想的回答。但是有一种方法可以解决这个问题,那就是强制实施成本。在 NFT 领域我们有关于此的一些早期尝试。
可验证的事实真相
自上世纪 70 年代以来,复制粘贴功能就已经存在了。翻阅年轻一代的 Instagram 标题,你会发现我们无数次使用了这一功能。一项简单的技术改变了我们对复制粘贴功能的认识——NFT。
你当然可以复制一张无聊猿的图片,但要拥有它,你通常需要花一大笔钱把它买下来才行。区块链使得这种独一无二的资产在可以轻易复制的情况下仍然具有吸引力,同时实现了全网实时验证该资产的所有权。
有人可能会认为这项技术在现实生活中并没有太多用途。然而,一旦将生成式 AI 考虑在内,这两个工具便可相互融合。很快,生成式 AI 将在很大程度上依赖于版权。迪士尼或 Netflix 这样的大型影视公司拥有我们从孩提时代到青少年时期喜爱的角色版权。
影视公司可以利用 AI 挖掘观众最深刻、最珍贵的记忆,为他们打造个性化的角色。如果钢铁侠能教孩子们数学呢?Darth Vader 能给出约会建议又会怎样?没准这将帮助许多人脱单。
毫无疑问,影视公司可以拥有并发布这些 AI 生成的聊天机器人或互动角色的产品。但利用区块链技术他们将能够追踪、验证并索取版税。他们可以建立一个开放的市场,任何人都可以参与并创作,而不仅仅局限于影视公司内部开发人员所能生产的应用程序。实际上,任何拥有大量 IP 的公司都可以通过允许衍生作品,将自身发展为一个大型平台。
让我解释一下这意味着什么。想象一下,我决定让 Linkin Park 的 Chester Bennington(已故)来朗读我为您写的这篇长文,持有他 IP 的遗产继承人和持有他声音合成版本的工作室很快就可以让我获得授权。但这将是一个漫长而繁琐的过程,涉及律师和大量的文书工作。这似乎很愚蠢,但围绕已故名人和 IP 的产业已经出现了。
设想一下,Chester 的声音版权在链上的话会是什么情况。这样一来,它可以被授权给世界各地的数百个人。当然,人们可能担心这种声音会被滥用,比如用于制作深度伪造视频,或者用于逝者不愿意与之相关联的内容。但是,如果将使用权定价足够高,入场门槛将筛选掉大部分恶意行为者。
这种情况已经在某些领域得到了实践,那就是谜因。我最近在 Instagram 上看到了一系列由 Stoa 创始人之一 Raj Kunkolienkar 发布的帖子。用他自己的照片重新制作了几张流行的谜因,这是生成式 AI 的一个有趣应用。
谜因是文化的一部分,而且属于公共领域,人们曾尝试将它们制作成 NFT。但是,如果我们要以自己的身份「重塑」文化,我认为这些谜因需要有可验证的来源,而且还应该尽可能地奖励那些谜因原型人物。
Raj 是否应该「授权」对这些图像二次创作的权利?文化是否应该可以变现?我不知道。他可能只是在美丽的果阿度过一个周六早晨,似乎有途径可以做到这一点。
对不起,Raj——我只是想找一种方式来推销我在 Stoa 的投资。这就算是增值了,对吗?
以前,超级英雄和游戏角色那样的知识产权更容易与观众产生共鸣。在漫展活动上,人们装扮成蝙蝠侠或 Darth Vader 都不会让人感到奇怪。我们不太可能让粉丝们购买许可证才能装扮成他们喜欢的角色。
但部分粉丝确实有可能会集资取得版权,从而合法地重新制作和发布新作品,对原创作者的思想内容进行补充。
你可能觉得这很离谱,但在 Web3 生态系统中,这已经成为现实。去年,一个社群筹集了 4700 万美元,试图在苏富比拍卖行竞拍美国宪法。尽管竞标失败,但仍有数千人汇集自己辛苦赚来的钱为此付出努力。最后,用户可以选择退款或持有 PEOPLEToken。截至目前,约有 17,000 名用户持有该 Token,其估值约为 1.4 亿美元。
Token 和链上溯源让社群能够团结起来购买知识产权,这些产权可以与 AI 共同创作出衍生艺术作品。
人类与机器协作已经得到了大规模的应用。2022 年 6 月,《大都会》杂志使用DALL-E创作了杂志封面。他们制作了一个 Darth Vader 登上杂志封面的版本,但选择不予发行。
在这种情况下,如果要组建大型社群的话,操作手册将由 DAO 来制定。工作室本身发行代表这些权利的链上工具,它可能是一个社区通过众筹获得的单一 NFT。Token 的发行比例与成员为购买知识产权所贡献的资金量成正比。然后,DAO 将决定如何管理和使用许可证。
社群可以规定使用许可证所需的最低 Token 数量,而其他更复杂功能的执行,如创建生成性艺术作品,则可能需要 DAO 进行投票。DAO 可以通过要求将上述 IP 的部分收入返还来产生现金流。
由于大型工作室无法承受这样的风险,新兴艺术家更可能采用这种商业模式。尽管这看似遥不可及,但每当我们尝试一种新的分发形式或更好地与观众互动的方式时,艺术家总是先行者。在过去的十年里,Spotify 和 Soundcloud 已成为发现新兴艺术家的关键工具。在未来十年中,艺术家将把链上原语和生成性音乐进行结合以创造收入,从而加速自己的职业发展。
重新思考技术栈
来自 A16z 的文章「谁拥有生成式 AI 平台」
我想了解生成式 AI 技术栈的哪一部分可能被颠覆,以及哪些部分已经取得了显著的增长。上图来源于 A16z 的文章《谁拥有生成式 AI 平台》,揭示了过去 18 个月里价值正在哪里积累。
文章摘录:
我们观察到,基础设施供应商可能是迄今为止这个市场的最大赢家,占据了通过技术栈流动的大部分资金。应用程序公司的营收增长迅速,但往往在用户留存、产品差异化和毛利率方面存在困难。大多数模型提供商虽然形成了这样一个市场,但尚未实现大规模商业化。
换句话说,创造最大价值的公司(即训练生成式 AI 模型并将其应用于新应用程序)并未捕获大部分价值。虽然我们很难预测接下来会发生什么,但我们认为,问题的关键在于技术栈的哪些部分真正具有差异化和可维护性。这将对市场结构(如横向与纵向公司发展)和长期价值的驱动因素(如利润率和用户留存)产生重大影响。到目前为止,我们很难在技术栈的任何地方找到结构上的可维护性,除了现有公司的防御体系。
这篇文章表明,尽管多个领域的收入已超过 1 亿美元,但人们对于盈利能力和留存率仍存在担忧。当所有人都可以使用底层 AI 模型(如 Stable Diffusion 或 ChatGPT)时,就不会有人了解可维护性了,而且我们很难准确预测新鲜后退去后的用户留存率。
大部分的价值捕获发生在硬件和云平台领域。亚马逊 AWS、谷歌云和微软 Azure 已经花了几十年时间来完善存储和计算方面的技术,以符合实际需求的单位经济效益提供大规模硬件;而 Filecoin、Render 和 Akasha 等则成为了 Web3 领域的对应平台。
尽管如此,在现有形式下我仍不清楚该如何通过众包硬件击败目前中心化服务提供商所提供的可靠性和规模。根据 A16z 的分析,价值可以在三个方面积累:物理基础设施、AI 模型或应用程序。我们相信,在基于 Web3 的 AI 领域,我们可以通过策划利用 Token 激励的细分用户群体,制定可通过社区参与扩展的数据流和盈利模型,构建竞争壁垒。
我们已经看到了这方面的一些实例。
目标用户
Numeraire 的原始 MVP 为我们提供了一个例子。该 Token 背后的公司向研究人员发布有关股市的标准化数据集,研究人员使用自家的 AI 和机器学习模型对这些数据进行分析,进而得出一个「信号」。简单来说,该信号展示了他们对资产价格走势的预测。根据提供信号的人质押的 NMR 原生 Token 数量,信号会被赋予一定的权重。
向用户提供虚假信号的 Token 将被销毁。由于这些 Token 在流动性市场上交易,因此用户不会为了获得真实货币而提供错误信号。相反,提供准确信号的研究人员会得到奖励。随着时间的推移,这样做的实际效果是让准确预测的用户群体能够收集更多的 NMRToken,从而影响公司投放资金的模式,尽管这一切看似虚幻。
那么,一个通过 Token 激励的去中心化研究人员群体能否击败市场呢?事实上确实如此。自成立以来,该基金的回报率约为 48%。据该公司网站称,已有价值约 5500 万美元的 NMRToken 奖励给了曾开发超过 5000 个模型的数据科学家。
在 Numerai 的情况下,数据本身并非专有资源。真正具有价值的是信任该产品并愿意质押 Token、分享模型输出结果的数据科学家网络。该网络利用 Token 激励机制,打造了一个针对特定领域的数据科学家社群,这本身就是一道护城河。
数据流
插件可以在浏览器或硬件级别收集、匿名化数据,并将其传递给能从中受益的第三方。互联网本身已经在执行这一操作。我们的数据被收集并传递给那些向我们推销不必要商品的公司。
这样的系统不再依赖于像谷歌或 Facebook 这样的平台垄断,而是依赖于一个规范收集数据并在市场上提供数据的协议。公司可以提供福利(如高级访问权限),以换取用户分享数据的同意。我们已经在 Pocket上看到了这种模式的早期版本。
Pocket 背后的团队正在创建一个标准化的协议,该协议代表用户构建数据结构,让企业可以请求 Pocket 用户以便于使用的形式分享数据。同时,用户可以根据解锁的福利来选择分享哪些数据。Brave 浏览器的 BAT 奖励就是这种模式的早期版本。
模型变现
Web3 原生产品与 AI 之间可能通过租赁 AI 模型进行交互。Ocean Protocol 市场上已经有这种模式的早期版本。在这种情况下,研究团队可以开发并向第三方授权 AI 模型,后者将其应用于自身的硬件和数据中。
部分观点认为,在模型开源的世界中,不存在验证输出来源的原语。将 Crypto 经济原语(如 DAO 或 Token)与开源模型相结合,可以为研究人员的工作提供其他现金流来源,同时验证输出的来源。
AI 模型供应端通过与研究人员合作进行维护并更新,他们将获得通过租赁 AI 模型所产生的现金流的一部分。在这种背景下,我们可以将生成式 AI 模型视为 NFT,将研究人员视为艺术家。这种模式可能适用于数据过于敏感而无法共享的情况,例如医疗数据、专有财务数据或用户数据。我们在Hugging Face和Replicate等平台上已经可以看到这种模式的早期版本(尚未包含任何 Web3 元素)。
A16z 的文章在最后这样写道:
现今,生成式 AI 似乎没有任何系统性壁垒。初步估计,应用程序缺乏显著的产品差异性,因为它们使用相似的模型;这类模型在长期差异化方面前景不明,因为它们在几乎一致的数据集上使用相似的架构进行训练;云服务提供商缺乏深入的技术差异性,因为它们运行相同的 GPU。
生成式 AI 公司想要实现差异化的唯一方法是将所有权和控制权交给用户。就目前情况而言,数据通常是众包的。AI 模型是开源的,价值向下流动以支付硬件费用。
激励用户分享数据或 AI 模型可以减少团队的负债和开支。反过来,当模型由社区而不是独立的看门人来管理时,它可能会大大改进生成式 AI 平台的产出结果。
这似乎有些离谱,但业内已有团队将区块链基础设施(如 NFT)、版权和生成式 AI 结合起来了。我们在 Alethea AI 中看到了早期尝试。但在我们讲这个之前,最好先了解一下生成式 AI 共生领域正在发生的事情。
生成式人工智能 DApp
上周二,Packy McCormick的Not Boring by Packy McCormick发布了一篇关于 Replika 的文章,揭示了未来几年生成式 AI 产品用户将面临的问题。简而言之,Replika 曾是一个允许人们通过聊天进行浪漫互动的应用程序。不幸的是,驱动该应用程序的 GPT 模型突然间认为骚扰用户并向 13 岁以下儿童发送不适当内容并不存在问题。因此,应用程序的开发者迅速禁用了应用中的所有成人内容,以控制局势。
在 Replika 的 Subreddit 中,有用户发现与之建立情感联系的机器人不再像以前那样运作。
最初,这款应用承诺提供陪伴甚至是热情洋溢的对话。用户对此寄予期望,应用也履行了承诺,然后突然之间决定不再为用户提供此类服务。对于许多在现实世界中难以与他人互动或形成亲近关系的用户来说,该应用本了是一个很好的避世之所。但霎时间,他们就失去了逃避的机会。
这反映了未来几年生成式 AI 产品用户将面临的挑战。在这些应用上花费数小时的人几乎不拥有其中的任何创意、模型或内容。少数早期占据优势的公司可以从公开可获取的资源中获得巨大利益。
这种情况将让权力格局转向发布生成式 AI 模型的公司。因此,OpenAI 可能开始优先考虑他们投资的公司,并阻碍竞争对手的发展。缓解这种风险的一种方法是将模型作为公共产品并保持开源,同时让社区进行管理。
Alethea AI 一直在朝着这个方向努力。他们将自己定义为「生成式 AI 经济的产权支柱」。假设你创建了一个尖端模型,只想让持有特定 Token 的用户能够访问。或者,你想嵌入一个具有人工智能的 NFT,将其从一个毫无生气的静态资产转变为一个能够实时对话的交互式智能资产(通常通过与 Alethea 的模型互动来实现)。Alethea 的协议允许开发者和创作者无需许可地进行这些操作。
为了构建基于链上的智能 dAPP 和智能 NFT,专门从事生成式 AI 领域的服务提供商,如文案撰写、蛋白质折叠科学研究或编写 Python 代码编写等,可以共享他们的产品来训练 Alethea 的模型。
然后,下游创作者可以将他们的 NFT 与 Alethea 模型中的特定技能相结合,并训练他们的智能 NFT 来提供服务。Alethea 作为一个协议,可以管理由 AI 模型、服务提供商与寻求 AI 服务的 NFT 用户所组成市场的 Crypto 经济激励措施,并处理所有交易。
当然,我们也需要注意一些事情。生成式 AI 现在所处的阶段就如同移动互联网的 2007 年代。每当出现一种新的媒介,人们在开始发布自己的版本之前总需要一段时间。人们仍在探索如何为特定领域创建 AI 模型。我本人非常愿意提供一种生成式 AI 模型,用于每周分析链上活动,并有无聊猿 NFT 那样的讨论热度。不过,我还没有实现这一目标的技能。
正如我们目睹了从金融科技应用逐渐演变为去中心化金融(DeFi)的过程,一段时间内,中心化、闭源的提供商将主导市场。只有当团队认识到,将所有权交给更大的用户群体可能以中心化企业通常无法实现的方式激发网络效应和数据来源时,我们才会看到更多开源、社区治理的模式。特定生成式 AI 模型往往会形成一个群体,而唯一加入该群体(或获得 AI 模型访问权限)的方式是上传自己的数据。这就像是流动性挖矿,但适用于生成式 AI 时代。
去年,Alethea 展示了一个可能的样貌。他们通过苏富比的拍卖发布了一个智能 NFT(iNFT),最终售价接近 50 万美元。这个 NFT 是一种可以与 OpenAI 的 GPT-3 进行对话的艺术形式。Web3 原生企业早已习惯了在中心化平台上建设的风险。游戏、钱包和交易所经常会从应用商店上下架。
依赖 OpenAI 的 NFT 也存在同样的风险。因此,该项目背后的团队开发了他们自己的 GPT 模型,名为 CharacterGPT。与你现在在 ChatGPT 上获得的基于文本的回应不同,他们开发的模型能够生成合成语音、面部动画和个性。所以差别在于:首先,生成式 AI 模型无法存储在链上;而且,Alethea 的团队认为未来也不会发生这种情况。就目前而言,CharacterGPT 是私有且中心化的。
但可能逐渐实现的是该模型治理的去中心化。类似 Alethea 的本地 Token(ALI)可以决定该模型在某些情况下的响应方式。这并不一定意味着该模型会避免自我调节。如果社区成员出于自身利益行事,他们可能会推动那些可能引起很多麻烦的边缘用例,但这仍然是一个更为去中心化的过程。即使在我提出 DAO 可以治理生成式 AI 模型的技术前沿,亚当·斯密的无形之手也无所不在。
Alethea 本身只提供智能合约、CharacterGPT 以及将链上原语(如 NFT)与生成式 AI 连接的协议。他们相信,在某个时候,第三方开发者会在其基础上创建提供多种服务的去中心化应用(DApp)。您可以通过在 Polygon 上构建的第三方 DApp - Mycharacter 尝试这一功能。它允许您生成一个具有可调整属性的合成角色,并将其作为链上 NFT 铸造。您可以在这里与 Sandeep Nailwal 的数字化形象进行对话。
这个机器人模仿 Sandeep 说话的逼真程度,有点让人感到恐惧。
Noah』s Ark是一个展示 AI 服务和链上原语言将如何结合的去中心化应用。用户可以使用少量预选的 NFT 产品,并将其托管为人们可以互动的 AI 角色。其运作方式是:用户将他们的 NFT 与平台上称为「pod」的东西进行「融合」。截至撰写本文时,每个 pod 在 OpenSea 上的售价为 300 美元。本质上,pod 是使用 Alethea AI 服务的通行证。你可以将 pod 与 NFT 连接,以启用诸如背诵歌曲或告知天气情况等功能。
在当前形式下,这些产品看起来就像玩具。当然,没有人会想整天与 NFT 对话。我对消费类产品的衡量标准之一是其能否激起我用它的兴趣,比如我就很期待使用我的 PS-VR 设备。但与一个类似 NFT 的机器人交谈可能就没有那么让人期待了。了解这一点,对创业团队选择产品开发的方向很有帮助。
Alethea 的使命不仅仅是建立对话界面。就目前的状况而言,实际上大部分 Web2 都是为 OpenAI 收集数据的前端。即使是使用 Chat-GPT 或 Stable Diffusion 的用户,也在不知不觉中为其发展做出了贡献,但却无法分得其收益。Alethea 的理念是,将来我们会看到多个由用户拥有的模型出现。目前还没有协议能够轻松地开发出这些模型,并将其与现有的链上原语结合起来,但这正是 Alethea 追求的目标。
但这样的未来会涉及哪些方面呢?要了解这一点,我们需要回到文章开头提到的问题——在富足的时代里,稀缺性如何体现?
就像我们在互联网诞生之初所看到的那样,通过 torrent 和 P2P 文件共享,我们将经历一段盗版猖獗的混乱时期。建立一个类似希特勒的 AI 模型是否合乎道德?如果第三方开发者使用工作室专有的知识产权,版税应如何分配?在这样的时期,将知识产权带入链上将会大有裨益。我们现在已经有了实现这一目标的工具,那就是 NFT。
工作室和创作者都将从中受益。突然之间,你有机会从那些闲置的资产中创造现金流。另一方面,生成式 AI 工具的创作者可以在不担心触犯法律的情况下实现扩展。Github 的 Copilot 功能已经允许你在编码时使用 AI。但如果你能复制你最喜欢的开发者的风格呢?或者 Rick Rubin 为你制作的音乐提供意见又如何呢?
有人利用 Paul Graham 的所有文章制作了一款能模仿他答问的机器人。你可以在下面的推文中看到它的演示。
在这种情况下,我们如何确保版权获取和版税支付?
我们在这项技术周围看到的突出应用案例是文本和艺术,因为这是两种最常被记录和易于训练模型的工作媒介。随着创建模型的便利性以及输入模型的信息复杂性的提高,我们将看到个人发布他们自己的 AI 服务。反过来,这将减少人们在回答基本问题上花费的时间。也许我的 AI 版本会向创始人推荐风险投资基金,或解释与他人合作的风险。
所需的智能和知识模式越稀缺,用户支付以访问这些服务的成本就越高。现实世界也是在基于类似的经济原理运作,即你需要支付高额溢价以获取越来越专业的机构所提供的服务,如擅长 Web3 的律师或对游戏了如指掌的风险投资公司。
社区 VS 企业
我经常思考,为什么在 2020 年代初,DeFi 会如此迅速地发展起来。事后看来,原因在于人们通过 Crypto 经济原语(如 Token)被激励去贡献资本和使用这些产品。从历史上看,金融科技公司从事交易或贷款的资金成本要远高于发行 Token 并将其作为奖励所需的成本。
利用这些 Token 对 DeFi 产品进行治理,反过来又给人们提供了一种享有所有权的乐趣。这种所有权在私人企业中不容易复制。当然,你可以购买股票并通过声称所有权而蒙受损失,但这与通过使用产品而产生的所有权是不同的概念。
在 Blur 与 OpenSea 之间的斗争中,NFT 是二者相同的主题。通过 Token 激励外包流动性,并将治理权交给用户——Web3 与 AI 也将以同样的原因发生碰撞。
社群将围绕收购他们所欣赏的创作者的知识产权而聚集,并以 DAO 的形式组织起来。像 Mike Shinoda 和 Snoop Dogg 这样的创作者已经成为 Web3 生态系统的一部分。我认为 Snoop Dogg 将自己的声音进行 Token 化并出售给社群并非不可能。他最近在 Eminem 的音乐视频中就炫耀了他的无聊猿。
他可以使用 Noah's Ark 等工具将自己的声音与无聊猿融合。一旦知识产权被 Token 化并上链,它就可以嵌入到模型中,而这些模型又可以从大众处获取数据。
这可能听起来有些牵强,但考虑到 Stable Diffusion 是一个开源项目,现在因为使用了来自 Getty 的库存图片而陷入困境。如果他们决定允许用户上传多年来创作的艺术作品,以换取对模型的治理权,情况又会如何呢?
数百万创作者可以在不受损害的情况下贡献自己的作品。基于区块链的 Stable Diffusion 可以轻松追踪生成图像所用的艺术作品来源,并向下载艺术品的人收取费用。然后,为其做出贡献的艺术家可以获得版税分成。
上述模型展示了它可能的样子。这是对 A16z 建议的当前生成式 AI 技术栈的重新组合。Web3 原生 AI 平台可以通过提供 Token 激励措施来从众包数据集(如图像)。艺术家这类的贡献者可以分享他们的作品,进而通过模型生成特定风格的艺术作品。
如果输入查询指令的用户决定使用某个作品,他们可以铸造一个显示所使用模型和输入数据的 NFT。这样的生成性艺术作品将与过去的 NFT 一样具有价值,因为其出处是可以验证的。
下一个 Open Sea 可能会整合这类生成性艺术形式、提供数据或运行查询的贡献者,以及链上原语来证明作品中所包含的各个组成部分。负责维护和优化模型的团体可以将其租赁给用户想要铸造 NFT 的市场。或者,一个数百万人使用的大型模型可以开源并作为 DAO 运行,这将让人们在生成式 AI 工具的维护和扩展方面拥有更多的发言权。
你可能认为这无关紧要——只是一个无用的解决方案。但你可以问问 Replika 的用户,当应用中的产品决策在未征求他们意见的情况下进行时,他们会作何反应。
如今,只需要少量数据就可以训练这些工具。因此,最初为创建这些工具做出贡献的艺术家可能会成为多余的人。要想保证公平性,我们可以根据他们作品的使用程度给予他们相应比例的 Token。
想象一下,如果那些在 OpenSea 早期为其发展做出贡献的艺术家能够在平台中获得股权或 Token 作为回报。那么,他们或许就不必像现在这样担心版税问题了。
我尝试将 Web2 和 Web3 在哲学意义上对待 AI 的不同方式进行了梳理:
乍一看,Web3 原生 AI 似乎是一个无用的解决方案,这也是我过去几个月的想法。但关注一下 OpenAI 在过去几个月的发展情况,你就会明白我们缺乏工具来应对平台垄断。在 Token、NFT 和链上来源之间,行业已经创造了充足的工具集,以应对未来几年我们将面临的虚假新闻和失业潮。这已不再仅仅是关于 Crypto,而是关系到如何建立一个强有力的的系统来避免人工智能生产无意义的内容并造成混乱。
我们要在 AI 的背景下运用 Web3 的原则,因为 AI 技术过于强大,不能任凭少数企业对其加以控制。当网络刚刚兴起时,我们没有工具来验证出处或治理平台垄断。而现在情况已经发生了变化,Uniswap 这样的 DeFi 平台向我们展示了一个分布式、社区拥有的基础设施以及可行的中心化替代方案。随着时间的推移,我们在生成式 AI 模型上看到同样的情况只会是早晚的问题。
Scan QR code with WeChat