篮球 足球 综合
当前位置:首页 > 体育 > 电竞

AI玩《超级马力欧兄弟》:Claude模型操作最溜,推理模型表现不佳

时间:2025-03-04 16:22:18 来源:24直播网
加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室(Hao AI Lab)上周五开展了一项独特的研究,将人工智能(AI)引入经典游戏《超级马力欧兄弟》中,以测试其性能表现。研究结果显示,在参与测试的 AI 模型中,Anthropic 的 Claude 3.7 表现最为出色,紧随其后的是 Claude 3.5。相比之下,谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 则表现不佳。

需要明确的是,此次实验所使用的并非 1985 年最初发布的《超级马力欧兄弟》版本。游戏运行在一个模拟器中,并通过一个名为 GamingAgent 的框架与 AI 进行连接,从而让 AI 能够控制马力欧。GamingAgent 由 Hao 人工智能实验室自主研发,其向 AI 提供基本指令,例如“如果附近有障碍物或敌人,向左移动或跳跃以躲避”,同时还提供游戏内的截图。随后,AI 通过生成 Python 代码的形式来操控马力欧。

据实验室介绍,该游戏环境迫使每个 AI 模型“学习”如何规划复杂的操作并制定游戏策略。有趣的是,实验发现像 OpenAI 的 o1 这样的推理模型(它们通过逐步思考问题来得出解决方案)表现不如“非推理”模型,尽管它们在大多数基准测试中通常表现更强。研究人员指出,推理模型在实时游戏中表现不佳的主要原因之一是它们通常需要花费数秒时间来决定行动。而在《超级马力欧兄弟》中,时机至关重要,一秒钟的差别可能意味着安全跳过和坠落死亡的不同结果。

数十年来,游戏一直是衡量 AI 性能的重要工具。然而,一些专家对将 AI 在游戏中的表现与技术进步直接挂钩的做法提出了质疑。与现实世界相比,游戏往往是抽象且相对简单的,并且能够为 AI 训练提供理论上无限的数据。

IT之家注意到,最近一些引人注目的游戏基准测试结果引发了 OpenAI 研究科学家、创始成员安德烈・卡帕西(Andrej Karpathy)所说的“评估危机”。他在 X 平台上发表的一篇帖子中写道:“我目前真的不知道该关注哪些 AI 指标。”他总结道:“我的反应是,我目前真的不知道这些模型到底有多好。”

上一篇: 新华社采访多位国内游戏制作人:国产单机游戏未来拥有无限的可能!

下一篇: mayumi更博晒照:一周内就抵达中国

热门数据

更多

相关信息

相关集锦

热门TAG

停刊 奥尔格里特 科特布斯U19 宇宙联合 扎亚米尼 里奥布兰克ES 世预赛欧洲区小组赛J组第2轮 纳什维尔SC 埃及电信 千里达警察FC 耶夫勒 占领 请客 莫斯塔FC 梅雷克尼亚拉 说教 小队 繁忙 白热化 格鲁吉亚 引起 陶格夫匹尔斯 加纳女足U20 求生 科特迪瓦 nba视频集锦 龙珠体育直播无插件360 欧洲杯2023赛程时间表 斯诺克中国赛直播 足协杯直播 意大利甲级联赛比分 中央五套CCTV5直播在线观看 乐球体育 勒沃库森vs奥格斯堡 今日nba篮球直播 今晚比分预测推荐 低调看nba直播官网高清 女足世界杯时间 奥运会历史总奖牌榜 nba总决赛第七战录像 即时比分500网 足球比赛直播857 斯诺克世锦赛2021直播 热火vs尼克斯全场录像 西汉姆联 cctv5nba季后赛 湖人季前赛首发 公牛vs热火录像 雄鹿VS老鹰 篮球直播

24直播网24小时为广大球迷提供全面及时的赛事直播和资讯 完全绿色安全无插件,稳定安全的直播网,每天收集最新的体育直播资讯,原创大数据足球篮球赛果预测,历史战绩,情报分析,24直播网所有直播信号均由用户收集或从搜索引擎搜索整理获得,所有内容均来自互联网,我们自身不提供任何直播信号和视频内容 如有侵犯您的权益请通知我们,我们会第一时间处理。

Copyright © 2021-2024 24直播网. All Rights Reserved. 辽ICP备15005339号-4