10月12日 消息:智源研究院发布了最强开源中英双语大模型 —— 悟道・天鹰340亿 (Aquila2-34B)。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。
同时,智源研究院还发布了开源全家桶,包括 Aquila2模型系列、语义向量模型 BGE 的新版本、FlagScale 高效并行训练框架、FlagAttention 高性能 Attention 算子集。这些开源项目将促进大模型研究的协同创新。
据悉,Aquila2-34B 基座模型在综合能力方面超越了 Llama2-70B 和其他开源基座模型。AquilaChat2-34B 对话模型在综合评测中领先,而 AquilaChat2-7B 在同量级对话模型中取得最佳成绩。AquilaChat2-34B 在推理能力方面仅次于 GPT4。AquilaChat2-34B-16K 通过扩展上下文窗口长度到16K,在长文本任务中取得了领先水平。
此外,智源团队还开发了 NLPE 方法来提升模型的外延能力。AquilaSQL 成为最优的文本 - SQL 语言生成模型。智源研究院还发布了 FlagScale 高效并行训练框架和 FlagAttention 高性能 Attention 算子集,进一步推动大模型研究的发展。
Aquila2模型全系开源地址:
https://github.com/FlagAI-Open/Aquila2
https://model.baai.ac.cn/
https://huggingface.co/BAAI