6月22日消息,昨日TechXpore的报道揭示了谷歌DeepMind项目中的一个重要发现:尽管大语言模型在多个领域都展现了惊人的能力,但在编写有趣笑话这一领域,它们的表现却显得“并不太擅长”。
该团队试图在新尝试中,了解大语言模型是否能够创作出笑话甚至完整的单口喜剧。为此,该团队招募了曾在工作中使用过大模型的 20 名专业单口喜剧演员。这些演员需要使用大模型来帮助自己创作完整的单口喜剧,并对结果进行评分。
研究人员发现,大语言模型“相当擅长”编笑话,但其中只有很少一部分真正好笑。他们认为生成的大多数笑话都是“泛泛而谈”,鲜有令人惊喜的结果出现。
不少喜剧演员则认为 AI 生成的笑话缺乏“尖锐性”,而这是需要让笑话变得有趣的因素之一,在他们之中,也有许多人认为结果“平淡无奇”。但另外有一部分喜剧演员认为,大语言模型在生成“套路”方面很有用,自己则可以围绕这些“套路”再创作笑话。
研究团队认为,考虑到大语言模型的制作者会使用过滤器来防止可能令人觉得反感或受到冒犯的输出,因此 AI“讲”的笑话不够好笑并不让人惊讶。