

腾讯研究团队近期发布了一项引人注目的研究成果,他们利用热门游戏《王者荣耀》训练AI,并成功构建了全新的“ThinkinGames”(TiG)框架,旨在重新定义
传统AI在游戏领域往往面临着“会玩不会说”的困境。 它们虽然能够熟练操作游戏角色,却难以解释其决策逻辑。 与此同时,语言模型虽然擅长战术分析,却无法实时应对复杂的游戏局面。腾讯的TiG框架旨在弥合这一鸿沟,打造一个兼具战略理解与解释能力的AI系统。 研发团队选取了《王者荣耀》的匿名对局录像作为训练数据集,涵盖了胜负各半的真实比赛数据。AI学习了包括“推上路”、“控龙”、“防守基地”在内的40种宏观动作,并通过监督学习和强化学习两阶段训练,不断优化判断与策略。
令人惊讶的是,在实验中,小模型的表现反而更出色。 腾讯使用的Qwen3-14B模型在经过TiG与GroupRelativePolicyOptimization (GRPO)优化后,战略判断准确率达到了 90.91%, 甚至超过了体量更大的DeepSeek-R1(86.67%)。GRPO技术显著提高了模型稳定性和泛化性能, 例如Qwen2.5-32B的准确率从 66.67% 跃升至 86.84%。 这表明,在AI领域,模型的大小并非决定性因素,更重要的是算法的优化和对因果关系的理解。 此外,这些AI不仅能执行指令,还能解释其决策思路,例如分析敌方埋伏、识别薄弱防线,并主动推荐最优行动路径。
这项研究成果不仅仅局限于游戏领域。 腾讯研究团队认为,TiG框架在未来有望被应用到其他需要“战略推理 + 可解释决策”的领域,例如金融交易、工业调度,甚至自动驾驶规划。 这预示着AI发展的新方向: 真正强大的智能体, 应该具备更强的因果理解能力和逻辑解释能力。 腾讯的这一成果表明,在AI的下一阶段,比拼的已不再是算力堆叠,而是“策略思维”的深度融合。 这也引发了我们对未来AI发展的思考,这类融合AI能力的智能体,是否会成为未来各行业的技术标配? 随着AI技术的不断进步,我们期待更多创新成果的出现,推动AI技术在更多领域的应用,为我们的生活带来更多便利。 更多AI资讯,请关注相关科技媒体的报道。