こんにちは、ア式蹴球部新4年上野です。今回は、ア式のテクニカルスタッフの行っているデータを用いたサッカーの分析の取り組みについて紹介したいと思います。
Contents
現代サッカーにおけるデータ分析の立ち位置
近年、”データサイエンティスト”という単語を耳にすることが非常に多くなりました。これは機械学習の理論及び技術の台頭によってこの職業が特に注目を浴びるようになったと言って良いですが、ある意味社会が数学的、統計的に裏付けられた意思決定をより尊重するようになっている傾向とも取れるでしょう
これはサッカー業界においても例外ではありません。
量子力学の学者がサッカーを変える!リバプールの頭脳“ラップトップガイズ”。
マンチェスターシティ、リバプールと言った世界トップクラスのチームにおいてはもちろん、Jリーグのチームにおいてもウェアラブル端末を用いたトラッキングデータの収集等が盛んに行われています。上の記事にもあるように、トップクラスのチームではデータアナリストとしてアカデミア出身、特に数理を専攻にしていた人を雇うことが自然なようです(ある種当然といえば当然ですが)。
OptaやHudlといった”スポーツテック”と呼ばれるような業界の中でもデータを取り扱うような企業が今後伸びていくのは間違い無いと個人的には思っています。
今季から、弊部が属する東京都大学リーグにおいても規約が改定され、従来禁止であった通信端末のベンチへの持ち込みが解禁されることによりリアルタイムでの外部からの動画を用いたフィードバック等が(理論的には)可能になります。ただ”理論上可能”という状態と”実行している”という状態に大きなギャップが有るのは事実であり、このギャップを埋めるためにア式のテクニカルチームは基礎技術の開発と、それを実際の練習、試合で試すといった社会実装を複数の研究室、グループと共同で試みています。
ア式でのデータ収集
データを分析するには当たり前ですがまずデータを集める必要があります。ア式では今年度は以下のようにデータを収集しています。
Hudlを用いた試合のタグ付
https://www.hudl.com/
ア式は今年度Hudlというタグを付けるソフトと、タグ付を行ってくれるサービスであるHudl Assistを契約しています。以下のように、ポゼッション、パス、シュートなどのタグを付けることが出来ます。
こうしたタグは試合後Hudl Assistに試合の動画を送ることによって、数時間後にタグがついた状態で返ってきます。これによりパス成功、失敗、シュートの位置、ポゼッション支配率、etcといったら各種スタッツを得ることができます。
以前は試合直後にデータを出すことが難しかったためフィードバックするのに時間がかかりましたが、今年度は迅速に監督、OBコーチにデータを提供することができるようになりました。UI/UXも使いやすく、とてもおすすめできます。サービスに使われている技術が近代的な点も素晴らしいなと思います。
CatapultによるGPSトラッキングデータ、心拍
これは昨年度から始めた試みで弊部でもウェアラブル端末を使用し、試合、練習での座標や心拍を計測しています。座標と加速度の絶対値、心拍数を毎秒5回ずつ計測したものが時系列として得ることが出来ます
これらをすることにより1試合につき、映像に加えGPSデータだけで約30MBほどのデータが手に入るわけです。このデータ量は多いとも少ないとも見ることが出来ます。つまりこれは人間が手で理解するにはあまりに多すぎるデータであり、何らかの情報処理を介する必要性があります。
一方Opta、データスタジアムといった企業に比べると、持っているデータは微量です。何をするにしてもデータは多いほうがよく、例えばシュートの成功失敗だけ考えても僕らは100本程度しか現状サンプル数がないのに対して、そういった企業では数十万のオーダーでサンプルを持っています。そうした少ないデータ量の中で有益なフィードバックを考える必要があるのが難しいところです。
ア式でのデータ可視化、分析
さてHudl, Catapultから得られるデータを整理すると大きく分けてタグ、座標、心拍の3つが得られるわけです。まずア式のテクニカルチームではこれらのデータを選手、コーチ陣にも触れてもらうためにまずは簡単なグラフを作るということをしています。これが第1段階です。
グラフ
色々なグラフを作りますが、例えばこれは横軸が日付で練習ごとに縦軸がそれぞれ走行距離と高強度の運動時間をとったものです。心拍はノイズも多くなってしまうため綺麗には読み取れませんが、走行距離に関しては各週毎に一定のパターンがあることが見えます。
またHudlから得られたスタッツをプロットするだけでも面白かったりします。
上のようなデータだとだとJリーグのパブリックにされているデータなどと比較することもできます。
次に生データを加工することによって特徴を抽出していきます。いくつか現在算出可能なものについて紹介します。
xG
今年度から各シュートごとに”xG”(ゴール期待値)というものを算出しています。これはつまりそのシュートがゴールに入る確率であり、それを累積していくことで1貯まると(本来なら)1点入ってもおかしくないというゲームの状態を表します。本来離散的な数値である点という概念を砕くことによってより細かい粒度で試合の流れを特徴づけることをしています。以下はある練習試合45×3のxGの推移です。
例えばこれにより、
- この時間帯で本来ならn点決めていなければならない
- 劇的に試合の流れが変わった時間帯の算出
などを強調することが出来ます。上の例ですと75-90の間に大きく失点しておりxGの値においても逆転されています。
現在では局面に対してもゴールの期待値を考えるような研究も盛んになされており、将来的にはア式でもそのようなことを目指していきたいです。
ヒートマップ
最近では一般的な可視化のやり方ですが、弊部でもこれは算出可能です。Cataplutから得られる座標情報を置くだけですが、試合全体のヒートマップだけではなくHudlのタグ情報も用いることによって、条件を絞った上でマップを作ることが出来ます(タグの開始時間と終了時間を手でメモる必要があってちょっと疲れますが笑)。
これは以前行った練習試合でのRSBの自チームポゼッション時のヒートマップです。RSBが中に入っていく、偽SBを行なった際の特徴がヒートマップによって明確に表されています。このようなヒートマップを可変フォーメーションを採用した場合にその達成度を視覚的に測るといったように使っていく予定です。
ボロノイ図
よく見る図でこの点から一番近い選手は誰か?という領域を図示したものです。これを使うと守備を評価する時に役立ちます。つまりその領域に相手が入った時、最も早く対応できるのはその人であるということです。例えばこれは練習試合で決定機を作られた局面です。右WBからアンカーに落とされ、左に変えられクロスからゴール前でフリーで打たれています。
上はWBからアンカーに落とされた23秒~の局面です。オレンジの点で区切られた範囲がその選手が最も近い領域です。これを見ると右ボランチのGoto(後藤)の領域が非常に大きくなってしまっていることが分かります。同時にアンカーは東大の4人くらいの選手からちょうど等しいポジションを取られてしまいました。Goto(後藤)は相手の左のIHも気にする必要があり強く出ることが出来ず、逆に大きく展開されてしまいました。この局面だとFWがCBへのパスコースを切りつつアンカーに入った段階で狙える位置で守備をするべきでした。
分析
これらのチャート、図を表示した後にその指標から気づいたことを実際にフィードバックしていきます。現状はフィードバックまで行けないことも多いですが、ここをしっかりやらない限り何も意味がない自己満足に過ぎないことを肝に命じる必要があります。まだオフシーズンは続きそうですが、特にシーズン中はフィードバックの頻度と質を上げてチームにプラスな情報を作ることを目標にしたいです。
実際に行ったフィードバックの例)
今後の課題
長く現在の状況を書きましたが、実用的な運用に向けては積もっている課題も多いです。
現状出来ているのは(かなり)古典的な統計的手法を試すといったことが主ですので、より先進的な技術、理論を用いた分析を中長期的なプランで行っていくことが今後の課題です。各種時系列データをより低次な特徴量に落とし込めると、”局面の検索”とか”局面の評価値”とかも考えられるので嬉しいです。
また出せるようになった図などに関しても、プロトタイピングに用いたコードたちが散乱しており、まとめてドンと出すのが難しくなってしまっているためそれを整頓するといったことが必要です。実際のところ得られるデータにしなければならない前処理が多く、泥臭い作業が必要です(緯度経度からフィールドの座標への変換、交代選手の処理、心拍がとれてなかったりする問題、動画の時間とGPSの時間差…)。もう少しこの辺りを上手くやれるようにしていきたいです。
根本的に相手チームの座標とボールの座標を得ることが難しいという点もあり、出来ない分析も多くなってしまいます。相手の位置とボールが分かると攻める際にどのスペースを使うべきか、といった範囲にまで広げることが出来ます。これを解決するために自チーム、相手チームともに位置を推論する技術の開発を行っているGlaucsという企業と協力しています。
終わりに
さて、ア式蹴球部では今まで触れてきたような側面からサッカーを知りたい、分析したいといった人も募集しています。言うまでもなく(前回の記事:CL シティ×マドリー レビュー)のようにサッカーの観方を養うことも出来るので、サッカーを見るのが好きな人にとってテクニカルスタッフは最適な場でだと思います!
また、様々な関わり方ができるので部員という形ではなくてもサッカーのデータを研究したい人、データが欲しい人などは提供できますので連絡していただけると幸いです。
サッカーが好きでデータに触れたい人はぜひ一度話を聞きにきてください!
筆者の部員ページはこちら