6月10日,据外电BI报道,人工智能领域的领军者OpenAI,近期再次对其文本转音频工具进行了说明。这是几个月内OpenAI第二次就该工具进行公开解释,而此次的重点依然是强调该工具目前并未被广泛使用,且可能永远不会被大规模推广。
该公司周五在其网站上发表的声明中表示:无论我们最终是否会广泛部署这项技术,让世界各地的人们了解其发展方向都很重要。这就是为什么我们要解释该模型的工作原理、我们如何将其用于研究和教育,以及我们如何围绕它实施安全措施。
去年年底,OpenAI 与公司外部的一小群用户分享了其语音引擎,该引擎依靠文本输入和 15 秒的人类声音片段来生成听起来与原始说话者非常相似的自然语音。
该工具可以用多种语言创建听起来令人信服的人类声音。
当时,该公司表示,它选择预览该技术但不会广泛发布,以增强社会韧性,以抵御越来越令人信服的生成模型的威胁。
作为这些努力的一部分,OpenAI 表示正在积极逐步淘汰基于语音的银行账户身份验证,探索保护个人声音在人工智能中使用的政策,教育公众了解人工智能的风险,并加快跟踪视听内容的开发,以便用户知道他们正在与真实内容还是合成内容进行交互。
但尽管做出了这些努力,人们对于这项技术的恐惧依然存在。
总统乔·拜登的人工智能主管布鲁斯·里德曾表示,语音克隆是让他夜不能寐的一件事。
美国联邦贸易委员会在 3 月份表示,诈骗者正在利用人工智能来提升他们的工作效率,他们使用的语音克隆工具使得区分人工智能生成的声音和人类的声音变得更加困难。
OpenAI 在周五更新的声明中试图缓解这些担忧。
该公司表示:我们将继续与美国及政府、媒体、娱乐、教育、民间社会等领域的国际合作伙伴合作,以确保我们在建设过程中采纳他们的反馈。
它还指出,一旦 Voice Engine 配备了其最新型号 GPT4o,它也将带来新的威胁。在内部,该公司表示正在积极对 GPT-4o 进行红队测试,以识别和解决社会心理学、偏见和公平以及错误信息等各个领域的已知和不可预见的风险。
当然,更大的问题是,当这项技术被广泛发布时会发生什么。看来 OpenAI 也做好了准备。
尚未立即回应 Business Insider 的置评请求。