99科技给大家分享各类生活学习资讯!
您现在的位置是: 首页 > 人工智能 > 563支AI团队挑战姜萍数学试卷:最高分竟仅得34分

563支AI团队挑战姜萍数学试卷:最高分竟仅得34分

6月16日,阿里巴巴全球数学竞赛传来令人振奋的消息。在这场汇聚全球数学精英的盛宴中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,更以全球排名12的卓越成绩,成为了赛事历史上首个进入决赛的中专生,这一成就无疑为她的学校和家乡赢得了极大的荣誉。

阿里数赛还首次开放了AI大模型挑战赛,这一创新举措吸引了全球范围内的广泛关注。来自全球知名高校院所和企业的563支AI队伍,与姜萍等人类选手一同解答了同一份试卷。

最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。

AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行“自问自答自验证”的方法,以寻求问题的最优解。

而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。

尽管AI在数学竞赛中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。

AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。

563支AI团队挑战姜萍数学试卷:最高分竟仅得34分

热搜首位:南方医科大学回应教师因救人迟到遭处分

2024/6/16 13:40:05

姜萍姐姐高考后暑假兼职,连打三份工展现毅力

2024/6/16 13:50:05