数据统计：157个主题分类，53971个优秀站点，1740个站点正在排队审核，4755篇站长资讯

【通知】本站经过两年的运营，得到了广大站长的支持与帮助，现对网站进行前台部分修复与改版，希望大家多提宝贵意见(2019-11-21)。

哈工深发布多模态大模型九天性能提升5%(哈工大深)

来源:网络　浏览：65次　时间：2023-12-04

网站分类目录网址免费收录网址提交网站免费收录网址收录网站大全

12月4日消息:哈尔滨工业大学（深圳）近期发布了名为九天(JiuTian-LION)的多模态大语言模型，通过融合细粒度空间感知和高层语义视觉知识，取得了在13个视觉语言任务上的state-of-the-art性能，尤其在Visual Spatial Reasoning任务上实现了5%的性能提升。

论文链接:https://arxiv.org/abs/2311.11860

GitHub:https://github.com/rshaojimmy/JiuTian

项目主页:https://rshaojimmy.github.io/Projects/JiuTian-LION

传统的多模态大语言模型在视觉信息提取上存在不足，导致了视觉定位偏差和幻觉等问题。九天模型通过双层视觉知识增强策略，解决了这一问题。

其方法框架包括分段指令微调策略和混合适配器，首次分析了图像级理解任务和区域级定位任务之间的内部冲突，实现了两种任务的互相提升。通过注入细粒度空间感知和高层语义视觉知识，九天在包括图像描述、视觉问题、和视觉定位等17个视觉语言任务上实现了显著的性能提升，其中13个评测任务达到了国际领先水平。

与现有的多模态大语言模型相比，九天通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据，有效地提升了视觉理解能力，生成更准确的文本回应，减少了模型的幻觉现象。总体而言，九天为多模态大语言模型领域带来了新的思路和性能突破，为视觉语言任务的研究提供了有力的支持。

转载请注明－原文链接：哈工深发布多模态大模型九天性能提升5%(哈工大深)

上一篇：腾讯视频回应APP崩了：出现技术问题已逐步恢复(腾讯视频反馈有用吗) 下一篇： AI为涂鸦注入生命：一句话让涂鸦变动画！人人都是“神笔马良”(为艾涂鸦)

本文关键词：视觉,语言,模型,语义

推荐资讯

推荐站点

分类目录网
爱网站 - 是国内第一个专注于推广优秀网站的开放式网站，具有分类目录及资讯发布平台,收录国内外各行业优秀网站,以为站长和网站提供服务为己任,有优秀网站目录为参考,还有网站优化推广及互联网资讯服务。
www.awz.cc
77分类目录
77分类目录(www.77dir.com)中国优质分类目录平台,为您提供免费分类目录提交,网站目录提交入口,中文网址目录收录,网址大全,网站大全,网站外链推广,软文发布等服务,为您分享优质正规的中文网站！
www.77dir.com
零目录
零目录（www.dir0.com）专业的网站分类目录平台！为您提供网站分类目录索引及网址大全库的建立，是目前较为专业的网站分类目录平台，为用户打造大型正规分类目录网，提供高效便捷的网址存储和查询服务的分类目录网站。
www.dir0.com
99网站目录
99网站目录采用全人工编辑的开放式网站分类目录，99网站大全免费收录国内外、各行业优秀网站网址，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.99dir.com
高仿包
竭誠精品-高仿世界名牌包包專賣網主營高仿LV包,高仿GUCCI古奇包,高仿HERMES愛馬仕,高仿CHANEL香奈兒,高仿PRADA，高仿巴黎世家等國際高仿包包、1比1高仿女包、高仿包、精仿奢侈品、世界名包、皮帶、皮具、手表、飾品等。LV新款包包同步香港LV專櫃及LV官方網站，LV行業最好品質!
awhso.net
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com