什么,还必须要关注“技术”想要什么。
昨天凌晨,整个AI界发生了一场地震,在被视为“首届AI春晚”的OpenA开发者大会上,GPT-4进行了史诗版本的更新。
128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能以及文本转语音(TTS)技术,都让新版的 GPT-4Turbo 模型变得性能更强大,同时也更具扩展性。
图源备注:图片由AI生成,图片授权服务商Midjourney
然而,除了上述功能外,最令人惊艳的,莫过于GPT商店的问世。
CEO山姆·奥特曼现场登台演示,全程不到3分钟,无需任何编程操作,只需在对话框内告诉GPT自己的需求,一个“创业导师GPT”就应运而生。
是的,所有想实现的功能,都能通过聊天构建!
不仅如此,OpenAI还宣布,GPT商店将在本月晚一点的时候推出。
这意味着,任何人都能靠制作专属GPT来赚钱了!
此言一出,网友即刻群起沸腾,并纷纷惊觉:AI的致富之路,真的对所有人敞开了!
那么,在这种百花齐放的应用生态中,AI时代的爆款应用,是否会就此诞生?而由此催生的应用生态,又将打造怎样庞大的市场?
1
如何建立壁垒?
自从互联网时代以来,几乎每一次技术的迭代,都会造就一批爆款。
而总结这些爆款的特征时,人们往往会发现如下的共同点:
它们不仅有长期的留存率,能构建商业模式,且有一定的护城河。虽然当时很难估算市场规模,但未来可能就是千亿美金的公司,可遇不可求。
例如移动互联网时代的抖音,就是个典型的例子。
而现在,GPT商店的推出,无疑为这类AI时代的“抖音”,提供了诞生的土壤。
然而,兴奋过后,冷静下来的人们也发现了个问题,那就是:在目前OpenAI打算构建的GPT商店 中,那一个个上架的应用,刚需点和壁垒究竟何在?
是的,无门槛的开发,意味着人人都能上,可既然人人都能上,那谁又会为别人制作的GPT而付费呢?
大家想要什么功能,自己做不就完了吗?
为了解开这一悖论,我们有必要对当前GPT商店所构建的这种UGC生态,与前AI时代的UGC生态进行一个对比。
如果说,要想在前AI时代,为GPT商店的这种UGC模式,找一个最接近的例子,那恐怕最先入选的,就是以Roblox、蛋仔派对为代表的各种游戏类UGC社区。
在Roblox中,用户可以使用平台提供的易用的编辑工具,创建游戏场景、角色和道具,并将这些游戏资产发布到平台上,供其他用户玩耍、购买。
在这样一种生态中,所有的玩家,都是基于同一个平台或工具进行创作,谁也不会比谁拥有更多先天的、硬性的优势。
这样的特点,与GPTs通过对话创建专属GPT,从而抹平用户创作门槛的做法,几乎如出一辙。
而且由于“玩法”、“创意”之类的东西是抽象的,是依赖于用户灵感,而非知识、技能的,因此在Roblox这类UGC社区中,所谓的“壁垒”从根本上说是没有的。
可既然没有壁垒,为何人们仍然愿意为其他玩家/用户创作的内容付费?而不是自己创作?
其实原因很简单,因为在这类UGC生态中,用户创造的内容,是一种“易学难精”的东西。
换句话说,表面上看人人都可以创造,但精品的、高质量的内容,却很难复制。
具体地说,在这类UGC社区中,用户/玩家虽然可以使用游戏内的编辑器,创造出各种道具、地图等虚拟物品,但真正受欢迎的、爆火的内容,往往需要付出很大的心血,或是需要天才的构思。
于是乎,最后懒得细细打磨的人,就会选购买别人创作好的、现成的游戏内容。
然而,尽管Roblox这样的UGC模式,给将来GPT商店上的创作者提供了一个启示,但它同样有回答不了的问题,那就是:
Roblox这类平台,终归是个以娱乐为主的游戏平台,而游戏是不讲究“实用性”的,只要做得有趣,即可让人掏钱。
但在GPT商店这种明显带有工具性、实用性的平台上,各类基于GPT的应用,该怎么找到自己的“刚需”点呢?
2
“刚需”的误区
很多人在讨论大模型(LLM)与“刚需”问题时,往往会陷入一个误区:那就是以当下的、静止的视角,来看待人们对LLM的需求。
实际上,如果用“刚需”的逻辑来看待当初的抖音、快手,那它们根本就不应该存在。
因为以当时的标准来看,它们根本就不“刚需”。
其实,所谓的需求,不是一成不变的,今天很多理所当然的“刚需”,也不是当时就产生的。
它本质上是一个随着技术逻辑运动,而不断发展的结果。
具体来说,抖音、小红书这样非工具性、非刚需的APP之所以会出现并爆火,本质上是移动互联网技术逻辑的一种运动结果。
在移动互联网的技术逻辑中,最重要的有两点,一是便捷性,二是个性化。
便携性,使得用户可以随时随地访问互联网,获取信息。
这种情况下,用户的时间变得更加碎片化了。在等待、通勤、休息等场景下,用户希望利用碎片时间进行娱乐、学习或购物等活动。
于是,人们使用手机等移动设备的需求,开始变得越来越多样了。那么,面对如此多样的内容,用户该如何选择?
这时,推荐算法和大数据登场了。
移动互联网的普及,使得用户在移动设备上产生了大量的数据,这些数据为推荐算法和大数据分析提供了丰富的数据来源。
通过对这些数据的分析,各大APP可以更好地了解用户的兴趣和需求,从而提供个性化的内容和推荐。
于是乎,在便携性和个性化两大技术逻辑的推动下,抖音、小红书这些爆款APP就诞生了。
它们可以说是移动互联网技术逻辑的一种终极体现,必然结果。
由此可见,在分析某种新兴技术是否能满足“刚需”时,我们除了关注“人”想要什么,还必须要关注“技术”想要什么。
那么,按照这样的逻辑,今天以ChatGPT为首的LLM,究竟想要什么呢?
从最近大半年LLM的发展趋势,以及昨日OpenAI发布会的情况来看,目前的LLM,至少显现出了两大越来越明显的倾向:
一是想“看”到和“听”到更多,即多模态方向的发展;
二是想与更多的“同伴”协作,即智能体(Agent)方向的发展。
而这两大愈发明显的倾向,就构成了未来LLM发展的两大技术逻辑——信息融合和自主决策。
信息融合,意味着LLM可以通过融合多种模态的信息(如视觉、听觉等),实现对跨模态、跨领域任务的深入理解,从而更好地胜任不同场景的需求。
而自主决策,则通过多个智能体之间自动化的协作、配合,使LLM能实现在复杂环境、任务中的自主决策和行动,从而大大地解放了人类的时间、心智。
正如移动互联网的诞生,催生了碎片化时间的场景一样,上述两大逻辑的演化和推进,也终将催生出一些人们从来没见过的,新的场景与需求。
3
可能的应用形态
在自主决策和信息融合催生的新场景与需求中,最能代表其本质的,就最有可能产生新时代的“抖音”。
从上述技术逻辑的特点来看,至少有两个方向的需求,可能性是最高的。
一是个性化的智能助理。
由于多模态技术的存在,这样的智能助理,将很有可能脱离单一领域,或单一模态的限制,从而最大限度地深入人们的生活。
举例来说,如果某人使用了某个翻译类的GPT,那么该用户也许在翻译之外,还希望该应用兼具机票预订的功能,帮跨境出行做好准备,又或是在此基础上,成为一个智能的跨境电商的助手,对比不同国家、地区的商品。
第二个方向的需求,则是智能决策支持
如果一种技术,用与不用有很大区别时,它就会逐渐成为一种“刚需”。而智能决策,也许正在创造这样的需求。
自动化的智能体系统,最大的意义,不在于让打工人每天节省那么几个小时的时间,干些批量处理文档之类的“牛马活”,而在于其通过快速、高效和多角度的分析,为用户提供“单一大脑”所难以得出的洞见。
例如,最近一家名为Fantsy的企业,就用了类似于ChatGPT和Bard的机器学习技术,创建了一些具有详细背景和思想、性格的智能体,让它们在虚拟的小组中进行讨论,从而对尚未发布的产品进行评估。
同样的,类似的技术思路,也可以用于个人的财务规划、职业规划中,从而为个人在现实中的生活、工作,提供高质量的辅助决策。
综上所述,GPT商店的出现,虽然为各类AI应用的繁茂生长提供了土壤,但所谓“爆款应用”,却并非完全靠人为的、主观的“穷思竭虑”就能想出来的。
所谓爆款的诞生,本质上仍然要遵从技术发展的一般规律,唯有参透了这样的规律,并在此基础上思考、构建产品,才能长久地在智能时代扎下根脉。