数据统计：157个主题分类，53996个优秀站点，1740个站点正在排队审核，4759篇站长资讯

【通知】本站经过两年的运营，得到了广大站长的支持与帮助，现对网站进行前台部分修复与改版，希望大家多提宝贵意见(2019-11-21)。

阿里通义千问开源Qwen1.5-MoE-A2.7B模型(阿里通义千问开放了吗)

来源:网络　浏览：65次　时间：2024-03-29

网站分类目录网址免费收录网址提交网站免费收录网址收录网站大全

3月29日消息:通义千问团队推出了 Qwen 系列的首个 MoE 模型，命名为 Qwen1.5-MoE-A2.7B。这个模型只有27亿个激活参数，但性能却与当前最先进的70亿参数模型相媲美。与 Qwen1.5-7B 相比，Qwen1.5-MoE-A2.7B 只有20亿个非嵌入参数，大约是原模型大小的三分之一。此外，相较于 Qwen1.5-7B，Qwen1.5-MoE-A2.7B 的训练成本降低了75%，推理速度提升了1.74倍。

阿里云、通义千问

Qwen1.5-MoE 模型采用了特别设计的 MoE 架构。与传统 MoE 方法不同的是，Qwen1.5-MoE 使用了64个 finegrained experts，并引入了新的 routing 机制 DeepSeek-MoE 和 DBRX。这种 finegrained experts 设计的目的是在不增加参数数量的情况下生成更多 expert。Qwen1.5-MoE 模型在训练成本和推理效率方面表现出色，性能接近最先进的7B 模型。

Qwen1.5-MoE-A2.7B 模型拥有14.3亿激活参数和2亿非嵌入参数，训练成本降低了75%。在实验中，使用单个 NVIDIA A100-80G GPU 测试时，Qwen1.5-MoE-A2.7B 的推理速度提高了约1.74倍。Qwen1.5-MoE 模型已在 ModelScope 社区开源，可直接下载使用。

除了性能和效率，Qwen1.5-MoE 模型还将持续更新对第三方框架的支持，包括 llama.cpp、MLX 等。

总体来说，Qwen1.5-MoE 模型在性能、效率和推理速度方面取得了显著的优势，是推理训练的最佳实践之一。

Qwen1.5-MoE体验链接:

https://modelscope.cn/studios/qwen/qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4-demo

转载请注明－原文链接：阿里通义千问开源Qwen1.5-MoE-A2.7B模型(阿里通义千问开放了吗)

上一篇：特斯拉新款Model 3现身得克萨斯工厂新车停放区可能产自加州下一篇： Kimi Chat使用技巧：掌握这些步骤，让智能聊天更顺畅！

本文关键词：模型,参数,性能,阿里

推荐资讯

推荐站点

分类目录网
爱网站 - 是国内第一个专注于推广优秀网站的开放式网站，具有分类目录及资讯发布平台,收录国内外各行业优秀网站,以为站长和网站提供服务为己任,有优秀网站目录为参考,还有网站优化推广及互联网资讯服务。
www.awz.cc
77分类目录
77分类目录(www.77dir.com)中国优质分类目录平台,为您提供免费分类目录提交,网站目录提交入口,中文网址目录收录,网址大全,网站大全,网站外链推广,软文发布等服务,为您分享优质正规的中文网站！
www.77dir.com
零目录
零目录（www.dir0.com）专业的网站分类目录平台！为您提供网站分类目录索引及网址大全库的建立，是目前较为专业的网站分类目录平台，为用户打造大型正规分类目录网，提供高效便捷的网址存储和查询服务的分类目录网站。
www.dir0.com
99网站目录
99网站目录采用全人工编辑的开放式网站分类目录，99网站大全免费收录国内外、各行业优秀网站网址，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.99dir.com
高仿包
竭誠精品-高仿世界名牌包包專賣網主營高仿LV包,高仿GUCCI古奇包,高仿HERMES愛馬仕,高仿CHANEL香奈兒,高仿PRADA，高仿巴黎世家等國際高仿包包、1比1高仿女包、高仿包、精仿奢侈品、世界名包、皮帶、皮具、手表、飾品等。LV新款包包同步香港LV專櫃及LV官方網站，LV行業最好品質!
awhso.net
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com