您好!欢迎来到99网站目录! 提交网站流程-> 注册会员 -> 提交网站 -> 等待审核...
数据统计:157个主题分类,52476个优秀站点,1732个站点正在排队审核,4576篇站长资讯
【通知】 本站经过两年的运营,得到了广大站长的支持与帮助,现对网站进行前台部分修复与改版,希望大家多提宝贵意见(2019-11-21)。

Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话(meta l)

来源:网络 浏览:36次 时间:2024-03-04

3月2日 消息:Meta AI 最近发布了 MMCSG 数据集,该数据集包含使用 Project Aria 录制的25小时以上的双向对话。CHiME-8MMCSG 任务的重点是转录使用智能眼镜录制的对话,这些眼镜配备了多个传感器,包括麦克风、摄像头和惯性测量单元(IMUs)。该数据集旨在帮助研究人员解决问题,如活动检测和说话者分离。该模型的目标是在实时转录中准确记录自然对话的两个方面,考虑到说话者识别、语音识别、对话和多模态信号的整合。

传统的对话转录方法通常仅依赖于音频输入,可能只捕获一些相关信息,尤其是在使用智能眼镜录制的对话等动态环境中。提出的模型利用多模态数据集 MSCSG 数据集,包括音频、视频和 IMU 信号,以增强转录准确性。

该方法整合了各种技术,以提高实时对话的转录准确性,包括目标说话者识别 / 定位、说话者活动检测、语音增强、语音识别和对话。通过整合来自多种模态的信号,如音频、视频、加速度计和陀螺仪,系统旨在提高传统音频系统的性能。此外,在智能眼镜上使用非静态麦克风阵列引入了与音频和视频数据中的运动模糊相关的挑战,该系统通过先进的信号处理和机器学习技术解决了这些挑战。Meta 发布的 MMCSG 数据集为研究人员提供了实际数据,用于训练和评估其系统,促进自动语音识别和活动检测等领域的进展。

CHiME-8MMCSG 任务解决了使用智能眼镜录制的对话的准确实时转录的需求。通过利用多模态数据和先进的信号处理技术,研究人员旨在提高转录准确性,并解决说话者识别和降噪等挑战。MMCSG 数据集的提供为在动态现实环境中开发和评估转录系统提供了宝贵资源。

论文网址:https://ai.meta.com/datasets/mmcsg-dataset/?utm_source=twitter&utm_medium=organic_social&utm_campaign=research&utm_content=image

推荐站点

  • 分类目录网分类目录网

    爱网站 - 是国内第一个专注于推广优秀网站的开放式网站,具有分类目录及资讯发布平台,收录国内外各行业优秀网站,以为站长和网站提供服务为己任,有优秀网站目录为参考,还有网站优化推广及互联网资讯服务。

    www.awz.cc
  • 77分类目录77分类目录

    77分类目录(www.77dir.com)中国优质分类目录平台,为您提供免费分类目录提交,网站目录提交入口,中文网址目录收录,网址大全,网站大全,网站外链推广,软文发布等服务,为您分享优质正规的中文网站!

    www.77dir.com
  • 零目录零目录

    零目录(www.dir0.com)专业的网站分类目录平台!为您提供网站分类目录索引及网址大全库的建立,是目前较为专业的网站分类目录平台,为用户打造大型正规分类目录网,提供高效便捷的网址存储和查询服务的分类目录网站。

    www.dir0.com
  • 99网站目录99网站目录

    99网站目录采用全人工编辑的开放式网站分类目录,99网站大全免费收录国内外、各行业优秀网站网址,旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。

    www.99dir.com
  • 高仿包高仿包

    竭誠精品-高仿世界名牌包包專賣網主營高仿LV包,高仿GUCCI古奇包,高仿HERMES愛馬仕,高仿CHANEL香奈兒,高仿PRADA,高仿巴黎世家等國際高仿包包、1比1高仿女包、高仿包、精仿奢侈品、世界名包、皮帶、皮具、手表、飾品等。LV新款包包同步香港LV專櫃及LV官方網站,LV行業最好品質!

    awhso.net
  • YY分类目录YY分类目录

    YY分类目录全人工编辑的开放式网站分类目录,收录国内外、各行业优秀网站,旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。

    www.yydir.com