[论文分享]多移动终端轻量化感

文章正文
发布时间:2025-01-16 06:39

能够高效搜索手语视频集合的系统被强调为手语技术的一个有用应用。然而,在文献中,超越单个关键词搜索视频的问题受到了有限的关注。为了解决这一差距,本文引入了手语检索任务,该任务使用自由形式的文本查询:给定一个书面查询(例如一个句子)和一个大型的手语视频集合,目标是找到与书面查询最匹配的手语视频。我们提出通过在最近引入的大规模How2Sign美国手语(ASL)数据集上学习跨模态嵌入来解决这一任务。我们发现系统性能的关键瓶颈在于手语视频嵌入的质量,这受限于标记训练数据的稀缺性。因此,我们提出了。

首页
评论
分享
Top