

在当今游戏行业,AI的应用正逐步改变我们对游戏智能的认知。腾讯研究团队正在用《王者荣耀》重新定义“AI游戏智能”,推出了全新的“ThinkinGames”(TiG)框架。这一框架不仅让AI能够在游戏中操作角色,更重要的是,它能清晰地解释自己为何这么打,极大地提升了游戏AI的智能水平。
传统的游戏AI往往只能执行简单的操作,像是“攻击”或“防守”,却无法提供决策的逻辑与原因。这就好比一位优秀的棋手,能够走出精彩的棋步,却无法向观众解释每一步背后的深意。而语言模型虽然能讲解战术,却无法实时应对复杂的游戏局面。TiG框架的推出,正是为了弥合这两者之间的鸿沟,让AI具备战略理解与解释能力的统一。
在实际的训练过程中,腾讯研究团队选取了《王者荣耀》真实对局的匿名录像,构建了一个包含胜负各半的数据集。AI通过学习40种宏观动作,如“推上路”、“控龙”、“防守基地”等,进行两阶段的训练:监督学习和强化学习。在强化学习阶段,AI通过“奖励积分”机制进行优化,正确的决策会得分,而错误则为零,这样持续强化其决策能力。
令人惊讶的是,经过训练的小模型表现反而更为出色。实验结果显示,腾讯使用的Qwen3-14B模型,在经过TiG与GroupRelativePolicyOptimization(GRPO)优化后,战略判断准确率达到了90.91%,超越了体量更大的DeepSeek-R1(86.67%)。与此同时,GRPO技术显著提高了模型的稳定性与泛化性能,Qwen2.5-32B的准确率从66.67%跃升至86.84%。
更值得注意的是,这些AI不仅能下指令,还能“讲思路”。在测试中,它能够分析敌方埋伏、识别薄弱防线,并主动推荐最优行动路径。这一机制在未来有望被应用到其他需要“战略推理 + 可解释决策”的领域,如金融交易、工业调度或自动驾驶规划。
腾讯的这一研究成果揭示了AI发展的新方向:真正强大的智能体,不仅仅是“更大”,而是“更懂因果、会讲逻辑”。在未来的AI竞争中,比拼的已不再是算力的堆叠,而是“策略思维”的深度融合。通过《王者荣耀》,腾讯不仅在游戏领域开创了新的AI智能标准,更为整个科技行业提供了重要的思路与启示。
这项研究的成功,不仅让人期待未来更多智能游戏的出现,同时也引发了我们对AI在生活中应用的思考:在未来的生活中,能否有更多的AI像今天的游戏助手一样,能够理解我们的需求,给出清晰的逻辑和建议?
讨论话题:你认为AI在游戏中的智能表现如何?你希望看到哪些AI在未来的游戏中实现?返回搜狐,查看更多