IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

中国科学院自动化研究所蒲志强研究员团队:面向真实比赛的足球博弈决策

已有 886 次阅读 2024-3-11 15:55 |系统分类:博客资讯

研究背景

足球可以称作是世界上最受欢迎也最具挑战的运动。近些年来,针对足球比赛的自动化分析、评估和决策辅助不仅在专业的体育分析领域备受重视,同时也引起人工智能领域的广泛关注。当前已有越来越多样的数据采集设备应用在足球比赛的训练和转播中,例如视频采集系统、光学追踪系统,以及可穿戴式设备。与此同时,人工智能领域也不断取得重要的研究进展。计算机视觉和自然语言处理的一些成功应用代表了感知智能的研究逐渐成熟,特别是最近颇具热度的大模型。与此同时,深度强化学习对于决策智能的发展也做出巨大的贡献,例如DeepMind的Alpha-x以及OpenAI推出的系列算法。这些理论自然地应用在足球分析领域并带来突破性的变革。

人工智能为足球分析领域带来的突破分为三个方面。首先,人工智能能够提高足球分析与评估模型的表现能力,例如近些年所熟知的期望进球值(Expected Goal,xG),期望控球价值(Expected Possession Value, EPV)等模型,以帮助教练获得更多的关键信息,从而提高球员的技战术水平、优化球队战术决策。其次,人工智能技术的快速发展为足球领域提供了日趋多样的数据采集,由此累计的大量数据由此为人工智能的应用提供了坚实的基础。第三,人工智能能够为足球分析师们提供更具洞察力的建议与参考,相比于其他领域对于模型的精确性与绝对准确性有更宽泛的容忍度。

与此同时,足球为人工智能的研究提供了代表性的基准。从多智能体决策的角度,足球带来了三项巨大的挑战。一是建模需要考虑22名球员、大尺寸场地、长时程比赛的全部特性,同时还要考虑到比赛过程具有高度的动态性和复杂的不确定性等因素;二是一场足球比赛的进球数量屈指可数甚至为零,这对于深度强化学习来说是典型的稀疏奖励问题,同时也带来了信誉分配问题;三是可解释性的挑战,相比于星际争霸等游戏,足球教练、球员更需要模型分析结果有依据可理解。因此,足球将作为人工智能领域下一个里程碑式的挑战性场景。

成果介绍

中国科学院自动化研究所复杂系统认知与决策实验室蒲志强研究员团队首次以OODA循环的范式(observation-orientation-decision-action)来描述足球比赛分析、评估和决策支持的过程,通过OODA循环和足球真实与虚拟世界的交叉,全面回顾了现实世界和虚拟环境足球比赛的可用足球数据、各种态势与决策模型,指出这一交叉领域更具前景的发展方向。本综述发表在IEEE/CAA Journal of Automatica Sinica 2024年第十一卷第一期:Z. Pu, Y. Pan, S. Wang, B. Liu, M. Chen, H. Ma, and Y. Cui, “Orientation and decision-making for soccer based on sports analytics and AI: A systematic review,” IEEE/CAA J. Autom. Sinica, vol. 11, no. 1, pp. 37–57, Jan. 2024. doi: 10.1109/JAS.2023.123807 

图片1.png

图1  OODA循环与真实-虚拟世界交叉的总体概况图

本文将足球比赛的数据采集、评估、决策支撑、决策执行对应于OODA的四个阶段。首先对于现实和虚拟世界所能够采集利用的足球数据进行了详细的介绍,并给出相关的数据商列表以及开源数据资源。真实世界中可采集利用的数据分为事件数据(event data)、追踪数据(tracking data)以及其他类型的数据。事件数据是指按照比赛的进程所记录赛场上所发生的每一件重要事件,例如传球、截断、射门等,以及每个事件发生的位置、时刻、相关球员等更详细的信息。事件数据通常需要通过人工标注进行记录,每场比赛所记录的数据量会根据数据不同的精细程度甚至记录员的专业能力有所不同。当前规模较大的事件数据供应商有Opta, WyScout,以及StatsBomb等公司。追踪数据通常以10Hz或25Hz的频率记录了正常比赛每时每刻全场球员以及球在球场上的位置。追踪数据的获取可通过光学追踪和可穿戴式设备两种方式。光学追踪是通过计算机视觉技术从转播视频、比赛录像等视频中提取,可穿戴式设备则是通过给球员佩戴装有GPS或UWB的设备,同时将球内部装上可定位的芯片进行数据采集。主要的追踪数据供应商有SkillCorner,Second Spectrum,Stats Perform,Metrica等公司。为让更多爱好者加入到足球分析的研究中,这些公司已开放一些脱敏的事件与追踪数据供研究使用。其他类型的数据主要包括一些体能数据,例如通过可穿戴式设备采集的心率、耗氧量等;社交媒体数据,例如球评、新闻、博客等。随着多模态大模型的快速发展,文本、音频、图像等越来越多类型的数据将用于足球分析的研究中。虚拟世界的数据通常利用足球仿真平台获取,例如SoccER,Google Research Football(GRF),Robocup等大型虚拟引擎。虚拟数据与真实数据具有较大的差距,如何将两者结合使用,实现在虚拟环境中训练的足球战术以帮助现实比赛的策略部署仍是有亟待研究的一大挑战。

本文将足球领域的态势模型(Orientation)定义为分析与评估单个球员或整支队伍的技战术表现,以及预测比赛的趋势。随着足球数据可大量获取以及人工智能技术的广泛应用,足球态势模型从最简单的统计传球、进球数量,逐渐发展到利用大数据进行深度的比赛信息挖掘,主要分为知识驱动、数据驱动、知识与数据协同驱动三种类型。其中知识驱动的模型大多基于球员与球的动力学模型,同时结合足球领域的专家知识,对比赛过程中双方球员的优势分布、传接球能力及成功概率进行分析。这类模型分析结果具有较好的可解释性,然而由于无法对比赛中更为复杂的影响因素进行建模,基于知识的模型在准确性以及适用范围上仍存在较大的局限性。数据驱动的足球态势模型则能够从大量数据中挖掘更多潜在特征信息。利用大量的事件与追踪数据,数据驱动的态势模型主要应用在如期望进球值(Expected Goals, xG)、期望威胁值(Expected Threats, xT)等特定指标评估比赛,球员个人的技战术评价,以及球队整体的战术效率、风格的分析等方面。其中以事件数据为基础的模型大多旨在对于球员以及球队行为表现的评价,利用追踪数据的模型多数应用在对于战术风格的挖掘以及比赛整体的态势分析。利用如心率、高强度跑动等体能数据的模型多对运动员个人体能和能力进行分析,进行运动成绩评价。尽管数据驱动的模型比知识驱动模型获得了更详细和细粒度的分析结果,但机器学习方法往往削弱了模型结果的可解释性,从而在一定程度阻碍了其应用。知识与数据协同驱动的模型从数据中学习知识,同时通过引入专家知识来保持模型的可解释性,从而为足球专业人员提供可靠的分析结果,因此是当前足球态势模型研究的热点方向。

决策智能是人工智能研究中的一个新兴话题,特别是在强化学习领域。在D(decision)阶段,足球领域所存在的挑战使得其成为决策智能研究的代表性基准。挑战之一是多智能体协作问题,足球环境的智能体(球员)数量(22个)远多于Go、StarCraft、斗地主等虚拟游戏,这些智能体是异构的,并且之间既有合作又有对抗,这些不同层次的协作给当前多智能体强化学习算法带来了独特的挑战,需要使用更具创新的方法来有效地训练和控制智能体之间的配合。其次是足球比赛的任务场景具有高度的复杂性。GRF的状态空间是连续的,在整个场地中分布着大量智能体的潜在位置,导致状态空间的复杂度远远高于Go、StarCraft、斗地主等游戏。第三,足球是源自于现实世界的运动,然而由于虚拟环境与真实世界的固有差异,使得真实世界中的比赛策略难以在虚拟环境中完全复现。同时,在虚拟环境中训练的策略不仅要赢得比赛,还要使智能体的行为更像真实球员。基于上述足球运动中的典型决策挑战,文章从现实世界和虚拟环境两方面对相关研究进行了详尽的分类总结与介绍。在现实场景中,决策模型的结果通常是为了辅助决策或决策评估,而不是在实时情况下直接指挥球场上的球员进行决策,因此与态势模型有一定程度的交集,相关研究主要分为对于单个球员的决策辅助以及整队策略的决策评估。在虚拟场景中,根据针对足球场景的特有挑战,文章将相关文章分为基于通信、稀疏奖励、基于角色这三类进行详细的介绍。

态势模型提供了对足球比赛深入全面的评估。然而,现有的模型通常用于赛后分析,没有与实时决策过程相结合。深度强化学习的应用为态势模型在实时决策中的应用提供了可能。现有应用于足球领域的强化学习算法通常从数据驱动的角度考虑问题,忽略了足球场景的领域特征。文章用本团队发表的论文为例,详细介绍态势与决策模型相结合,以领域知识嵌入的策略框架能够提供更有效的足球决策支持。

图片2.png

图2  知识嵌入的策略框架结构

文章最后列举了专业足球分析与人工智能相结合的颇具前景的几个重要研究方向。首先,足球场景涵盖了完整的OODA循环,涉及大量状态和动作空间、复杂团队合作、动态战术演变等具有代表性的多智能体决策问题,因此可以将足球作为里程碑式基准。其次,在虚拟环境中学习策略为现实世界的足球分析提供了无线的可能。因此,虚实迁移的技术应用在足球领域将是潜力无限的研究方向。第三,足球以人为本的特性给体育分析和人工智能研究带来了一些额外的挑战,例如模型需要具备足够的可解释性,虚拟环境所训练的智能体要像真实的球员一样行动,同时模型应该考虑到足球比赛中的各种主观的和不确定的因素。第四,决策型的人工智能技术和足球领域知识相结合,未来一定能够解锁更多有待发掘的场景,为球员的个人决策以及球队的战术布防提供更可靠的决策支撑。

当前研究成果已服务于部分职业联赛和青训代表队的比赛分析、推演、复盘等实际应用,如应用在全国首届“联盟杯”中国数智化校园足球联盟邀请赛的赛后赛事总结与复盘,帮助“2023首届京津冀大学生校际足球联赛”多支参赛队伍、北京灵动星空俱乐部、法国欧塞尔俱乐部等以更科学、可量化的方式提升球员技战术水平,辅助教练完善比赛战术布防。同时,与简极科技等业内顶尖上下游企业开展战略合作,形成数据采集-智能分析整体解决方案,已服务于全国百余所中小学的体育课堂,并助力其研发全球首款新一代智能芯片球。下一步,团队将以开放姿态,与合作伙伴一道,以青少年足球与职业联赛为切入点,通过人工智能技术的不断创新赋能,共同打造以足球为代表的体育科技新生态。

作者及团队

1-蒲.png

蒲志强,本科毕业于2009年武汉大学自动化专业,2014年获中国科学院北京自动化研究所控制理论与控制工程博士学位,目前是中国科学院自动化研究所研究员、博士生导师主要研究领域包括决策智能,群体智能,人工智能在体育科学的前沿应用,以及群体智能在无人系统中的应用

2-潘.png

潘一,2021年毕业于中国科学院大学运筹学与控制论专业,获博士学位,目前是中国科学院自动化研究所的助理研究员,主要研究方向为网络优化与大数据分析,多智能体强化学习与足球智能决策。

3-王.png

王诗杰,2020年毕业于山东大学控制科学与工程专业,获得工学学士学位,目前在北京中国科学院自动化研究所攻读控制科学与工程博士学位。目前研究方向包括多智能体强化学习、对手建模和因果推理。

4-刘.png

刘博寅,2019年毕业于中国南京东南大学电气工程及其自动化专业,获工学学士学位,目前在中国科学院大学人工智能学院攻读计算机应用技术博士学位。目前研究方向包括多智能体强化学习和图神经网络。

5-陈.png

陈敏,2020年本科毕业于中国科学院大学物理学专业,2023年毕业于中国科学院自动化研究所控制理论与控制工程专业,获得硕士学位。现任中国科学院自动化研究所助理工程师。目前研究方向为足球比赛状态评估和群体系统决策智能。

6-马.png

马昊,2021年获得北京航空航天大学飞机控制与信息工程学士学位,目前在中国科学院自动化研究所攻读控制科学与工程博士学位,主要研究方向为多智能体强化学习、时间序列预测和因果推理。

7-崔.png

崔一雄,博士毕业于西班牙马德里技术大学体育科学专业,现为北京体育大学体育工程学院副教授。他的主要研究方向为运动成绩分析、运动大数据和智能运动应用,其研究团队与中国多支国家队和专业体育俱乐部均有科研合作。

感谢本文作者提供以上简介



https://wap.sciencenet.cn/blog-3291369-1424907.html

上一篇:有向图中网络Euler-Lagrange系统无需相对速度信息的群一致性
下一篇:基于变换函数与填充函数的模糊粒子群优化算法
收藏 IP: 159.226.177.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 12:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部