11 月 9 日消息:人工智能初创企业 Hugging Face 近日宣布,其由两人组成的 H4 团队正致力于开发工具和「配方」,以帮助 AI 社区构建类似于 ChatGPT 的人工智能聊天机器人。自 ChatGPT 发布以来,H4 团队的成立便是为了复制其功能,使用开源库和模型。
H4 团队——名称代表「有用、诚实、无害和友善」——现已推出多个开源的大型语言模型,包括最近由法国 AI 初创企业 Mistral 发布的 Mistral 7B 模型的精调、以聊天为中心的版本 Zephyr-7B-α。此外,H4 还对阿布扎比技术创新研究所的 Falcon-40B 模型进行了分叉,修改该模型以更有助于以自然语言响应请求。
为了训练其模型,H4 团队——如同 Hugging Face 的其他研究团队一样——依靠一个拥有 1000 多个 Nvidia A100 GPU 的专用集群。团队成员 Lewis Tunstall 和 Ed Beeching 虽远程工作于欧洲,但得到了来自 Hugging Face 内部多个团队的支持,其中包括模型测试和评估团队。
H4 团队强调,小团队的规模是一个有意的选择,因为它使他们能够更加敏捷地适应不断变化的研究环境。此外,他们还与如 LMSYS 和 Llamaindex 等团队进行了外部合作。
最近,H4 团队一直在研究不同的对齐技术,并构建工具来测试社区和行业提出的技术到底有多有效。本月,该团队发布了一本手册,包含了构建 Zephyr 所使用的所有源代码和数据集,H4 计划随着未来 AI 模型的发布更新这本手册。
面对是否有来自 Hugging Face 高层将工作商业化的压力的问题,Tunstall 表示 H4 并不直接通过其工具获利。然而,他承认这些工具确实为 Hugging Face 的企业级服务——专家加速计划——提供了支持,该计划提供来自 Hugging Face 团队的指导,以构建定制的 AI 解决方案。
在被问及 H4 是否认为自己与其他开源 AI 倡议(如 EleutherAI 和 LAION)竞争时,Beeching 表示这不是 H4 的目标。相反,他说,意图是通过发布 H4 聊天模型的训练代码和数据集来「赋能」开放 AI 社区。
Beeching 补充说:「如果没有社区的许多贡献,我们的工作将无法实现。」