連動する不確実性
「展開」の正体

競艇の統計的モデリング2024

ボートレースの「展開」とはスタートから最初のターンマークを回り切るまでの約10秒間の攻防をいう。展開は、トップ選手が読み切り、ベテランが自在に対応し、新人が恵まれるものでこそあれ、誰も支配することはできない。しかし、その不確実性には統計的に明瞭な構造がある。

中日スポーツでは、毎日全レースの舟券の確率を統計的モデリングを使って推計し、公開している。

現在使っているモデルでは、順位を決める「強さ」が以下の要素の合計で決まると想定している。

順に、各選手の実力、内側の進入コースが持つ優位性、各選手の進入コースの得手不得手、モーターの性能差(機力)、フライング2回かどうかを意味する。これらの要素だけでは説明しきれない部分を運(勝負ムラと呼んでもいい)とみなし、正規分布の乱数として推定する。要素の大きさを表す数値には単位も原点もないが、ゼロ周辺にまとまるように緩い制約をつけている。

直近24000レース(2023年9月6日から24年4月1日まで)のデータから推定した各要素は以下のようになっている。(5月1日開幕の蒲郡・竹島弁天杯関連分)

選手の力 出場選手の中では愛知支部の新エース・磯部誠(以下、敬称略)の力が飛び抜けている。推定平均は100ポイントを超え、川村了ら他のA1選手を寄せ付けないほどだ。ただし、同じ愛知支部所属の平本真之の推定値がゼロ付近であることには注意が必要だ。一般レースにあっせんされることが非常に少ないG1常連にはB級選手との対戦データが不足しているのだ。

モーターの力 蒲郡の現行モーターは23年7月から使用されているため、データは十分に蓄積されている。最強モーターは29号機で、勝率で勝る62、38、68、69号機に比べて頭一つ抜けている。低い勝率は単に乗り手に恵まれなかっただけだと、統計モデルは見ていることになる。

コースの力 1コースは2コースより150ポイント程度も有利で、実力トップの磯部ですら2コースになると平均的には1コースの選手より不利になる。全選手を見渡しても、この差を埋められる選手は女子戦の守屋美穂だけだ。1コースの52%が1着になるボートレースの特徴が明瞭に表れている。

統計モデルの上では、F1(フライング1回)の影響はほとんどないが、F2の影響は20-30ポイントもあると推定されている。累進的に重くなるペナルティ(フライング休みや降格)が、スタートを遅れさせたり、進路妨害などの事故を避ける消極的レースを余儀なくさせているようだ。

連動する不確実性

ボートレースには、他の公営ギャンブルのレースと異なり、ひとたび先行を許すと逆転することが難しいという特徴がある。先を進むボートが引く波を越えて追い抜く必要があるからだ。このため「展開」で順位がほぼ決まってしまう。

最初のターンは、スタート直後で艇身差が大きくない状態のまま各艇の進路が激しく交錯する場面だ。他艇の進路を妨害することは反則になるため、最初にターンに到達した選手だけが自由に進路を選ぶことができる。1コースが圧倒的に有利な理由だ。

後続選手は、他艇の動きを予想しつつ先行艇が空けた進路を瞬時に見つけ出さなければならない。この複雑性が統計モデルの運の要素に競艇特有の構造を生み出している。

現在のモデルは、1コースから6コースまでの不確定要素には以下のような相関関係(相関係数行列)があると推計している。

数値は1に近いほど同じ方向に連動し、−1に近いほど逆方向に連動することを表す(0は無相関)。順位を予想するモデルなので、数値の基調はややマイナスに傾いている。

この関係は、具体的には予想にどのような影響をあたえるのか。3月のSGボートレースクラシックの優勝戦(枠なり進入を想定)のシミュレーション結果を可視化してみよう。

グラフの各点は、シミュレーション1回ごとの各艇(コース)の総合的な強さを表している。6コース分、難しい言葉を使えば6次元の数値だが、そのうち3コース分だけを選んで描いている。

1コースと2コースの関係だけに注目すると、シミュレーションの多くのケースで1コースが2コースよりも優位な結果になっている。つまり、1コースのほうが総じて強い。ただ、両者の相関係数は−0.098なので偏りはほとんどない。1コースの順位と2コースの順位には関係がない。

一方、2コースと3コースの関係に注目すると相関係数マイナス0.340の影響がはっきりわかる。分布が右下に傾き、3コースの艇が強いほど2コースが弱い。数値は統計的な「あてはめ」にすぎないが、ボートレースファンには即座に思い浮かぶシーンがあるだろう。3コースの艇がまくり(外側から抜くこと)を決めた時、2コースは抵抗に失敗してターンが膨らんでいる。逆に2コースのスタートがよければ、3コースは行き場を失う。

3コースと5コースにもマイナス0.274の相関がある。5コースのまくりは3コースの進路(2コースも同様)をふさぐ。逆も同様だ。

5コースと6コースの間にはわずかではあるが正の相関(0.041)がある。両者がそろって抜け出すシーンは決して多いわけではないが、ダイナミックな展開はファンの脳裏に焼き付いているのではないか。なお、総じて外側のコースが不利であることは、点の分布が全体として左下に偏っていることに表れている。

連動する不確実性は、連対舟券に無視できない影響を与える。どの艇が勝つシナリオでも2着以降は有利な内側コースほど確率が高くなりそうなものだが、現実のデータもシミュレーション結果もそうではない。例えば3コースの艇が勝つ時、2コースが舟券に絡む確率は他の場合と比較すると低くなる。

ライバルはオッズ

計算された舟券の確率はどの程度正確なのか。直近のデータを使って検証してみよう。

舟券を推定確率の水準でグループ分けし、実際に当った比率(的中率)と比較すると以下のようなグラフになる。比較のため、オッズから逆算される確率(オッズ確率。オッズを0.75で割り、逆数をとったもの)も表示している。

日本中のファンの最終評価が集約されているオッズ確率は驚くほど正確だ。1%以上の舟券(オッズが75以下)はほぼ完璧。ただし、0.75%以下の万舟券は一貫して過大評価している。

一方、シミュレーション予想は万舟券に関しては正確だが、1−2%の舟券をやや過大評価、5%以上の舟券を過小評価している。改善の余地は残るが、おおむね正確に予想しているとみていいだろう。

最後は直感

確率が分かったとしても、ギャンブルに勝てるわけではない。いかさまのないサイコロの各目が出る確率は正確に6分の1だが、だからといって次の目は分からない。

中日スポーツのボートレースサイトでは、確率予想がオッズよりも正確だといういささか自信過剰な前提の下、人気が過熱している舟券を避け、オッズが相対的に高い割安舟券を推薦している。

ギャンブルで具体的な戦果を報告するのはチェリーピッキングのそしりを免れないが、2024年最初のSGレース、戸田ボートレースクラシック(3月15-20日)では以下のような結果になった。

手堅い予想が求められる担当記者と比べると的中率は低いが、万舟を引き当ててそれを補っている様子がわかる。いうまでもないことだが、今年最初のSGで、記者の顔を立てながら、確率予想の成果をほどほどに示すことができたのは、単なる偶然だ。

読者の武運長久を祈るほかない。

いささか自信過剰な前提 予想した確率がどれほど正しいかを調べることは難しいが、統計モデルの予想する確率がオッズの暗示する確率(オッズ確率)よりも「素性がいい」ところはある。例えば、確率3%の舟券から100枚を無作為抽出して当選率を調べると、統計モデルの方が散らばりが小さい。つまり、オッズ確率の正確性は、さまざまな確率の舟券が都合よく(例えば1%と5%が等量)混ざっているためだと推察される。その場合でも、楽観と悲観を都合よく混ぜることができる競艇ファンの集団的知恵は驚異的である。