数据统计：157个主题分类，53983个优秀站点，1740个站点正在排队审核，4756篇站长资讯

【通知】本站经过两年的运营，得到了广大站长的支持与帮助，现对网站进行前台部分修复与改版，希望大家多提宝贵意见(2019-11-21)。

清华大学开发出新视觉语言模型可更准确理解 GUI(清华大学开发出哪些专业)

来源:网络　浏览：77次　时间：2023-12-27

网站分类目录网址免费收录网址提交网站免费收录网址收录网站大全

12月27日消息:清华大学智普AI的研究人员开发了一种新的视觉语言模型（VLM），名为 CogAgent。该模型专门设计用于理解和导航图形用户界面(GUI)。

CogAgent 通过采用低分辨率和高分辨率图像编码器而脱颖而出。这种双编码器系统允许模型处理和理解复杂的 GUI 元素和文本内容，这是有效 GUI 交互的关键要求。

CogAgent 的架构具有独特的高分辨率跨模块，这是其性能的关键。该模块使模型能够有效处理高分辨率输入（1120x1120像素），这对于识别小型 GUI 元素和文本至关重要。

QQ截图20231227153006.jpg

CogAgent 在各种任务中优于现有的基于 LLM 的方法，特别是在 PC 和 Android 平台的 GUI 导航方面。该模型还在多个文本丰富和一般视觉问答基准上表现优异。

这项研究的结果表明，CogAgent 代表了 VLM 的重大飞跃，特别是在涉及 GUI 的环境中。其在可管理的计算框架内处理高分辨率图像的创新方法使其有别于现有方法。该模型在不同基准测试中优异的性能表明其在自动化涉及 GUI 操作和解释的复杂任务方面的潜力。

CogAgent 的潜在应用包括:

自动化 GUI 操作，例如点击按钮、输入文本和选择菜单。
提供 GUI 帮助和指导，例如解释功能和提供操作说明。
开发新的 GUI 设计和交互方式。

CogAgent 仍处于早期开发阶段，但其潜在影响是巨大的。该模型有可能彻底改变我们与计算机交互的方式。

地址：https://github.com/THUDM/CogVLM

转载请注明－原文链接：清华大学开发出新视觉语言模型可更准确理解 GUI(清华大学开发出哪些专业)

上一篇：小米汽车向华为比亚迪致敬比亚迪回应：欢迎加入大家庭(小米汽车华为概念股票) 下一篇：小红书博主用AI画出无价的饭获赞21.9万网友感动哭(小红书博主用的p图软件)

本文关键词：模型,高分辨率,这是,是在

推荐资讯

推荐站点

分类目录网
爱网站 - 是国内第一个专注于推广优秀网站的开放式网站，具有分类目录及资讯发布平台,收录国内外各行业优秀网站,以为站长和网站提供服务为己任,有优秀网站目录为参考,还有网站优化推广及互联网资讯服务。
www.awz.cc
77分类目录
77分类目录(www.77dir.com)中国优质分类目录平台,为您提供免费分类目录提交,网站目录提交入口,中文网址目录收录,网址大全,网站大全,网站外链推广,软文发布等服务,为您分享优质正规的中文网站！
www.77dir.com
零目录
零目录（www.dir0.com）专业的网站分类目录平台！为您提供网站分类目录索引及网址大全库的建立，是目前较为专业的网站分类目录平台，为用户打造大型正规分类目录网，提供高效便捷的网址存储和查询服务的分类目录网站。
www.dir0.com
99网站目录
99网站目录采用全人工编辑的开放式网站分类目录，99网站大全免费收录国内外、各行业优秀网站网址，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.99dir.com
高仿包
竭誠精品-高仿世界名牌包包專賣網主營高仿LV包,高仿GUCCI古奇包,高仿HERMES愛馬仕,高仿CHANEL香奈兒,高仿PRADA，高仿巴黎世家等國際高仿包包、1比1高仿女包、高仿包、精仿奢侈品、世界名包、皮帶、皮具、手表、飾品等。LV新款包包同步香港LV專櫃及LV官方網站，LV行業最好品質!
awhso.net
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com