小心！AI能「看懂」你的唇语，悄悄话不再安全！

2024-09-12 阅读 35 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

实测 Readtheirlips 效果如何

量子位整理了一些视频，为大家亲测了一下Readtheirlips的使用效果。

先试了一下奥特曼在斯坦福的访谈视频，把生成的文本和原始对话对照了一下，内容完美契合~

小心！AI能「看懂」你的唇语，悄悄话不再安全！

而面对小表情比较多的老马，Readtheirlips的发挥依旧稳定。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

不过以上两个视频都是人物全程正脸对着镜头的。

换成了说话时爱比划的小扎，Readtheirlips直接显示错误。（视频中人物不是全程正脸）

小心！AI能「看懂」你的唇语，悄悄话不再安全！

而主角换成卡帕西之后，因为他说话太快，生成的文本出现了识别错误的情况。（左侧为Readtheirlips生成，右侧为文字处理软件生成）

小心！AI能「看懂」你的唇语，悄悄话不再安全！

最后，我们尝试着上传了一个16分钟的视频，Readtheirlips直接显示错误，无法识别内容。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

总结一下：

Readtheirlips识别视频的时间在一分钟左右 。

就像他们标明的那样如果人物的正脸不能正对镜头，那么模型就很难给出正确答案。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

而面对语速过快的视频内容，Readtheirlips只能识别出其中的一些内容。

对此，团队成员回应道：

是的，我们还没有研究到这里，但是会很快解决这个问题！

小心！AI能「看懂」你的唇语，悄悄话不再安全！

而关于上传视频的时长限制，他们这么说：

现在只支持3分钟以内的视频，但是以后我们会一点一点往上提升的！

小心！AI能「看懂」你的唇语，悄悄话不再安全！

AI如何“听”悄悄话

看完亲测视频，咱们也来唠一下Readtheirlips的工作原理。

看看它是怎么读取人类唇语的：

首先，研究团队用大量的标注数据（已知的嘴唇运动动作及其对应的文本内容）来对模型进行训练。

在此基础上，用户要上传一段视频，这段视频要包含说话者的面部特写，尤其是嘴部动作。

然后模型会对视频进行嘴部运动的分析：先是通过面部检测识别嘴唇的位置，然后再提取嘴唇的几何特征，（形状、开合程度、运动轨迹等），最后分析嘴唇在说话过程中的动态变化。（速度、方向和形状变化）

之后，模型会将提取的嘴唇特征与训练数据中的特征进行匹配，来识别出视频中人物所说的内容。

将识别出的单词或短语组合成完整的句子，进行一下上下文理解，确保语法和语义的正确性。

最终将识别出的内容输出为文本形式。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

开发团队

Readtheirlips的开发团队Symphonic Labs是一家初创公司。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

领英上显示它今年4月份才刚刚成立，截至目前，公司人数不到10人。

小心！AI能「看懂」你的唇语，悄悄话不再安全！

他们之前还研发过一款通过阅读唇语即可完成实时文本转录的软件Symphonic

两款软件的试玩链接都已附上，感兴趣的朋友们可以去尝试一下~

Readtheirlips 试玩链接：

https://www.readtheirlips.com/

Symphonic 试玩链接：

https://symphoniclabs.com/

参考链接：

https://x.com/crsamra/status/1833494380357013879

文章来自于微信公众号“量子位”，作者“叨乐”

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3664 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

158 用户在看

小心！AI能「看懂」你的唇语，悄悄话不再安全！

实测 Readtheirlips 效果如何

AI如何“听”悄悄话

开发团队

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

字节入局AI硬件赛道，一切为火山引擎卖方案服务？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3664 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

185 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

158 用户在看

小心！AI能「看懂」你的唇语，悄悄话不再安全！

实测 Readtheirlips 效果如何

AI如何“听”悄悄话

开发团队

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

字节入局AI硬件赛道，一切为火山引擎卖方案服务？

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿