11 月 30 日消息:Perplexity AI,这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司,通过结合网络索引和最新信息与会话式 AI 聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」,付费用户可以在这两者之间切换。
Perplexity AI 网站截图
如今, 首选搜索引擎目的地迈出了又一步,发布了自己的大型语言模型(LLMs)——pplx-7b-online 和 pplx-70b-online">Perplexity 公司向成为首选搜索引擎目的地迈出了又一步,发布了自己的大型语言模型(LLMs)——pplx-7b-online 和 pplx-70b-online,分别以它们的参数大小 7 亿和 70 亿命名。这些模型是基于 Mistral 和 Meta 的开源 mistral-7b 和 llama2-70b 模型进行微调和增强的版本。
AI 中的参数指的是每个模型的人工神经元之间的连接数,通常表明模型的强大和「智能」程度,参数越高通常意味着模型更加知识渊博、智能和高效。
为什么 Perplexity 的新在线 LLMs 很重要,它们与 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在线 LLMs 之所以重要,以及它们与 ChatGPT 等的区别,在于它们不仅可供其他组织通过 Perplexity 的 API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(为 ChatGPT 提供动力)难以做到的。
Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称,新的 PPX LLMs 是「首个实时 LLM API,它们基于网络搜索数据,没有知识截止日期!」
GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点,该功能于 2023 年 9 月底恢复。
通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力,这要归功于它与姐妹公司 X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付 X Premium 订阅。
其他 LLM 提供商,如加拿大多伦多的企业级 Cohere,旨在通过结合 Web 浏览功能和检索增强生成(RAG),将更多最新知识纳入其 LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。
在新的 PPLX 在线 LLMs 的情况下,Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」
在提供最新信息方面,Perplexity 是否优于 OpenAI 和 Meta?
为了证明其新 LLMs 的有效性,Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity 也称之为准确性)和新鲜度(后者指信息的最新程度)。
承包商被要求比较两个模型的回应,其中一些是 Perplexity 的新 PPLX 在线 LLMs,另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。
然后,Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨询顾问认为 LLM 回应的实用性,GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。
「总的来说,评估结果表明,我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌,甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好,」公司在描述新模型的博客文章中写道。
如何使用和影响
新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用,并按照那里发布的文档操作。此外,Perplexity 在其博客文章中指出,API 正从测试版可用性转向公众普遍可用性。
然而,这是有成本的:尽管是基于免费的开源模型进行培训的,Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用,现在将为用户提供 5 美元/月的信用额度,他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。
除此之外,用户还需要为额外的 API 调用(使用查询或提示访问模型)付费。Perplexity 尚未提供公开的定价信息,而是指示有兴趣的各方直接通过电子邮件与其联系。
虽然个人和企业对新模型的接受程度,无论是直接使用还是在新应用程序中使用,尚待观察,但 Perplexity 已经赢得了一些热心粉丝的支持,他们认为这是搜索的未来,包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己与该公司「没有财务联系」。
随着谷歌的 Bard 因一些争议和差评而陷入困境,以及谷歌的后续 GPT 杀手 Gemini 据说被推迟,现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中,AI 助手与您对话并从网络中提取答案,而不是用户自己对搜索结果进行排序以找到最佳结果。
AIbase 上的 Perplexity AI PPLX 在线语言模型介绍:https://top.aibase.com/tool/pplx-online-llms