• 主页 > 体育问答
  • AI是怎么学会踢足球的?科学期刊ScienceRobotics上

    足球是一项全球流行的球类运动,强调身体对抗和团队合作。

    现实生活中,不管人们踢不踢足球,踢得好不好,只要看到(听到)“足球”这个词,就会隐约聊起。

    确实,足球界出现如此多的新闻并不罕见。

    然而,如果人工智能学会踢足球,而且踢得很好,这会是一件比较罕见的事情吗?毕竟,目前的人工智能有时甚至无法回答“500年前林肯是美国总统吗?”这样的问题。

    9月1日,英国人工智能公司DeepMind研究团队首次推出了一位“AI足球运动员”,可以完成盘带、身体对抗,进而精准射门等多种动作。

    图 | “AI 玩家”正在进行 2V2 游戏(GIF 来源:Science Robotics)

    尽管偶尔会出现不遵守规则的情况,比如比赛中没有角球、点球、任意球等定位球,但研究团队认为,这项研究推动了人工智能系统向人类水平的运动智能迈进。

    相关研究论文《从运动控制到模拟人形足球的团队合作》已发表在科学期刊《科学机器人》上。

    人工智能是如何学会踢足球的?

    众所周知,一场标准的足球比赛是由两队各11名球员,包括10名球员和1名守门员,在球场上进行比赛和进攻。

    禁区传球足球规则内容是什么_足球场禁区内传球规则_禁区传球足球规则内容

    除守门员可以在本方禁区内用手触球外,其他队员只能用手以外的身体部位触球(界外球除外),比赛的最终目标是尽可能将球踢进对方球门。

    因此,无论是现实比赛还是网络游戏,足球都是一项考验个人技术、需要队员默契配合的运动,完成一次精彩的传球、一次精准的射门都绝非易事,“需要解决很多人类和动物都会面临的问题”。

    论文称,尽管DeepMind团队在这项研究中简化了比赛规则,将双方球员人数限制为2-3人,但结果显示,AI玩家可以在不事先了解足球规则的情况下,学习踢球、带球和射门等技能,并在模拟比赛中完成2V2、3V3的足球比赛。

    论文共同第一作者兼共同通讯作者刘思齐及其团队写道:“它们在运动技能和高级目标导向行为紧密结合的环境中实现了综合控制。”

    图 | “AI球员”完成盘带、抢断、传球等一系列动作(图片制作来源:Science Robotics)

    如上图,在一场2V2的比赛中,红队队员完成了跑动、逼抢、传球等一系列动作,整个动作非常自然流畅,压迫感十足。

    那么,一名“足球菜鸟”是如何蜕变成“优秀足球运动员”的呢?

    原因就在于研究团队提出的3步机器学习框架。

    首先,AI玩家需要通过观看人类运动的视频来学习走路,因为最初的AI玩家根本不知道在足球场上该做什么。

    足球场禁区内传球规则_禁区传球足球规则内容是什么_禁区传球足球规则内容

    图 | 训练前(GIF 来源:Science Robotics)

    然后,在知道自己在做什么之后,AI球员可以借助强化学习算法来学习踢足球。

    图 | 经过 3 天的训练(GIF 来源:Science Robotics)

    最后,AI玩家更进一步,基于另一种强化学习算法,学会了如何团队合作,并进行更困难的动作控制。

    图 | 经过 50 天的训练(GIF 来源:Science Robotics)

    可以看出,当训练中的AI球员不断获得环境奖励并给予正确的反馈时,其踢球水平就会提高。

    从“足球菜鸟”到“足球优秀运动员”,AI再度亮眼。

    但这还不够

    图灵奖获得者艾伦·纽厄尔在其描述认知科学和人工智能基础的经典言论中指出,人类行为跨越多个组织层面,从毫秒的肌肉抽搐到数百毫秒的认知决策,再到长期目标导向行为。

    禁区传球足球规则内容_足球场禁区内传球规则_禁区传球足球规则内容是什么

    更高层次的行为往往与与外界环境以及其他实体更为复杂的交互相关,如何在多个空间和时间尺度上表现出智能行为是物理实体人工智能面临的长期挑战之一。

    DeepMind团队的这项研究,通过强化学习算法等AI技术,赋予了AI选手灵活的动作控制和多智能体协作能力,是多智能体环境下如何学习多尺度综合决策的绝佳范例。

    足球场禁区内传球规则_禁区传球足球规则内容_禁区传球足球规则内容是什么

    图 | 对抗与推搡(GIF 来源:Science Robotics)

    当然,本研究也存在一定的局限性。

    例如由于参与比赛的AI球员数量相对较少,与现实世界相比还存在一定的复杂性不足,并不代表AI可以进行更为复杂的足球比赛。如果在未来的工作中增加AI球员的数量,或许可以产生更加有趣的球队策略。

    此外,由于时间较短、节奏较快,AI 玩家无法调整节奏、保持体力、决定阵型或替换更多防守或进攻球员。

    此外研究团队还表示,他们的方法并不适合直接在机器人硬件上学习,研究成果也无法快速从模拟世界转移到现实世界。

    然而,研究结果确实证明了基于学习的方法生成复杂运动策略的潜力,并且解决了模拟训练中出现的模拟到现实转移的主要挑战之一。

    研究团队在论文的最后写道,“如何在敏捷机器人硬件上实现类似复杂程度的多尺度运动智能,将是令人兴奋的研究方向之一。”

    未来,AI的强大程度超乎你的想象,你觉得呢?

    参考:

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:https://mdxbjj.com/html/tiyuwenda/6412.html

    加载中~

    相关推荐

    加载中~