数据统计：157个主题分类，53981个优秀站点，1740个站点正在排队审核，4756篇站长资讯

【通知】本站经过两年的运营，得到了广大站长的支持与帮助，现对网站进行前台部分修复与改版，希望大家多提宝贵意见(2019-11-21)。

魔搭社区开源多模态对齐统一框架OneLLM(魔搭科技公司)

来源:网络　浏览：66次　时间：2023-12-22

网站分类目录网址免费收录网址提交网站免费收录网址收录网站大全

12月22日消息:OneLLM 是一种多模态对齐的统一框架，它使用通用编码器和统一的投影模块与 LLM（Large Language Model）对齐多模态输入。OneLLM 还通过使用 modality tokens 实现了在不同模态之间的切换。

OneLLM 的核心组件包括多模态 token 的 tokenizer、通用编码器、统一的投影模块和大语言模型。

多模态 token 的 tokenizer 将输入的各种模态信号转换为 token 序列，以便进行后续处理和对齐。

微信截图_20231222082654.png

通用编码器是在 LAION（Language and AI ON）平台上训练的 CLIP VIT Large 模型，它具有强大的语义理解能力，可以对多模态输入进行编码。

统一的投影模块（UPM）是将各个模态的输入投影到 LLM 的 embedding 向量空间中，以实现多模态的对齐。UPM 由 K 个投影专家组成，每个专家包含多个 transformers 块和大量的参数。

大语言模型是 OneLLM 采用的开源 LLaMA2-7B 模型，它在大规模文本数据上进行了预训练，可以对输入进行更深入的语义理解和生成。

OneLLM 支持多种不同模态数据的理解，包括图像、音频、视频、点云、深度 / 法线图、IMU 和 fMRI 大脑活动。

实验证明，OneLLM 在视频 - 文本、音频 - 视频 - 文本、音频 - 文本等任务中优于现有方法，表现出了较强的零样本能力。

Github代码链接:

https://github.com/csuhan/OneLLM

模型权重链接:

https://modelscope.cn/models/csuhan/OneLLM-7B

模型创空间:

https://modelscope.cn/studios/csuhan/OneLLM

转载请注明－原文链接：魔搭社区开源多模态对齐统一框架OneLLM(魔搭科技公司)

上一篇： Google 通过主动安全检查更新桌面版 Chrome(手机谷歌雇主会看到浏览活动) 下一篇：微软关闭Windows Mixed Reality 聚焦HoloLens混合现实生态系统(微软关闭数字权利激活)

本文关键词：模型,多模,编码器,文本

推荐资讯

推荐站点

分类目录网
爱网站 - 是国内第一个专注于推广优秀网站的开放式网站，具有分类目录及资讯发布平台,收录国内外各行业优秀网站,以为站长和网站提供服务为己任,有优秀网站目录为参考,还有网站优化推广及互联网资讯服务。
www.awz.cc
77分类目录
77分类目录(www.77dir.com)中国优质分类目录平台,为您提供免费分类目录提交,网站目录提交入口,中文网址目录收录,网址大全,网站大全,网站外链推广,软文发布等服务,为您分享优质正规的中文网站！
www.77dir.com
零目录
零目录（www.dir0.com）专业的网站分类目录平台！为您提供网站分类目录索引及网址大全库的建立，是目前较为专业的网站分类目录平台，为用户打造大型正规分类目录网，提供高效便捷的网址存储和查询服务的分类目录网站。
www.dir0.com
99网站目录
99网站目录采用全人工编辑的开放式网站分类目录，99网站大全免费收录国内外、各行业优秀网站网址，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.99dir.com
高仿包
竭誠精品-高仿世界名牌包包專賣網主營高仿LV包,高仿GUCCI古奇包,高仿HERMES愛馬仕,高仿CHANEL香奈兒,高仿PRADA，高仿巴黎世家等國際高仿包包、1比1高仿女包、高仿包、精仿奢侈品、世界名包、皮帶、皮具、手表、飾品等。LV新款包包同步香港LV專櫃及LV官方網站，LV行業最好品質!
awhso.net
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com