语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具-99科技

6月10日，OpenAI再次针对其备受瞩目的文本转语音（TTS）工具进行了说明，明确指出该工具目前并未大范围开放，且未来也可能不会广泛部署。这一消息再次引发了业界对于AI语音技术的关注与讨论。

“无论我们最终是否会大规模部署这项技术，让世界各地的人们理解这项技术的发展方向都非常重要，”OpenAI 公司周五在其网站上发布的一份声明中表示，“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育，以及我们如何围绕该技术实施安全措施的原因。”

据了解，去年年底，OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑，即可“生成听起来自然的人声，并与原始说话人非常相似”。该工具可以创建以假乱真的多语言人物声音，当时该公司表示他们选择预览这项技术而非大规模发布，是为了“增强社会抵御能力”，以应对“越来越逼真的人工智能生成模型”带来的威胁。

作为这些努力的一部分，OpenAI 表示他们正在积极淘汰使用语音识别进行银行账户验证的方式，探索保护个人声音在人工智能中使用的政策，教育公众有关人工智能的风险，并加快开发跟踪视听内容的技术，以便用户识别他们是在与真人还是合成内容进行互动。

然而，尽管做出了上述努力，人们对这项技术的担忧仍然存在。美国总统拜登的人工智能负责人布鲁斯・里德 (Bruce Reed) 曾表示，声音克隆技术是他夜不能寐的原因之一。美国联邦贸易委员会 (Federal Trade Commission) 今年 3 月表示，诈骗分子正在利用人工智能技术来提高他们欺诈行为的可信度，他们使用声音克隆工具，使得人们更难区分人工智能生成的声音和人类的声音。

OpenAI 在周五更新的声明中试图缓解这些担忧，“我们继续与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴接触，以确保我们在构建过程中纳入他们的反馈。”该公司还指出，一旦“语音引擎”配备了其最新模型 GPT-4o，它也将带来新的威胁。该公司表示，他们内部正在积极地“对 GPT-4o 进行‘红队测试’，以识别和解决来自社会心理学、偏见和公平以及错误信息等领域的已知和未知风险。”

语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具

保时捷加速电动化布局，Cayenne EV 最新谍照曝光

小米智能摄像机 C300 双摄版发布：一机双画面

文章聚合

美国媒体：NASA无法研究中国带回的月球月背样品背后原因极其愚蠢

洪州大桥：世界级桥梁工程正式通车

微软Windows天气应用全新升级：首页焕新设计，信息展示更加全面

韩国釜山人口萎缩风险加剧，成为首个显现“消失阶段”迹象的大城市

三星Galaxy Ring智能戒指功能：集成心率、压力、体温监测等

河南许昌：女子错转226万元货款至陌生阿姨账户，对方全数退还

安耐美发布全新风晶凌LIQMAXFLO一体水散热器

华为宣布：Apollo Version即将发布，引领5G-A时代新篇章

Cybertruck越野旅行车与FSD自动驾驶技术新突破成焦点

TechInsights：2024年全球智能手机换机率将不再以北美为首

相关文章：