2019年NHK杯女子SPの審判団=木戸佑撮影

審判を審判する2020

消えないナショナルバイアス

フィギュアスケートの11段階採点法が導入されて2季目となる2019/20年のシーズンが終わった。主要大会の採点データを分析すると、ジャッジの精度が大幅に向上した反面、自国選手に対する甘い評価(ナショナルバイアス)が依然として続いていることが明らかになった。

2020/4/15 中日新聞電子編集部

国際スケート連盟(ISU)の評価委員会は、演技審判の能力をチェックするため、ジャンプやスピンなどの個別要素の出来栄え点(GOE)と全体を評価する演技構成点(PCS)について、「同じ演技を見た全審判の平均からどれだけ離れているか」を計算し、この数値を逸脱点と呼んでいる。例えば、9人の審判が1、0、−1、0、0、1、0、−1、0(=平均0)と評価した場合、1を出した審判の逸脱点は1ということになる。

2019/20年シーズンの基準では、①GOE逸脱点が2.5以上、②選手ごとの平均GOE逸脱点が1.5を超える、③PCS逸脱点が1.5以上、④選手ごとの平均PCS逸脱点が1.5を超える、のいずれか1項目を誤審とみなすことになっている。自国選手に対する場合は原則2回とカウントする。採点した選手8人あたり1回を超えると警告対象になる。

11段階評価で精度は向上

出来栄え点の評価スケールは、2018年のルール改定で、-3から3までの7段階評価から-5から5までの11段評価に移行した。満点が3から5になったので、1点の大きさは3/5(=0.6)になったことになる。スケールが細分化した結果、逸脱点の分布は広がったが、実質的な評価の散らばり(標準偏差)は、17/18年の0.53から19/20年の0.44(=0.73×0.6)に縮小した=下記グラフ参照。

また、誤審とみなされる異常逸脱点の頻度は、0.77%から0.32%に半減した。

ISUは、GOE評価スケールの細分化と同時に、加点・減点の基準を明確化し、審判のトレーニングにも努めてきた。しかし、スケールを変更していないPCSに目立った改善は見られない。GOEの精度は、11段階評価の導入それ自体によって、格段に向上したと言えるだろう。

消えないバイアス

自国選手と他国選手に対する逸脱点の平均の差をナショナルバイアス(自国選手びいき)とみなすことにしよう。シニア・ジュニア男女個人のすべての審判について計算したナショナルバイアスは、小さいながらもほぼ一貫してプラスに偏っている。

ナショナルバイアスは、判定の精度とは関係がない。例えば、マレーシアのIsmail SURAYU DAKSHINI氏は、逸脱点の散らばりが今季最も大きかった審判だが、自国びいきはほとんどない。逆に、最も精度の高いジャッジをしたスロバキアのAndrea SIMANCIKOVA氏には、平均的なナショナルバイアスがある。

最大のナショナルバイアスを記録したのは、ギリシャのAnna CHATZIATHANASSIOU氏で、ただ一人1.0を超えている。最小はフィンランドのPia ALHONEN氏で、自国選手に非常に厳しかった。いずれも審判を務めたのはジュニアの1大会のみであり、選手の実力のばらつきが影響した可能性がある。

11段階評価では、ナショナルバイアスも0.6倍して比較する必要がある。全審判の分布を見る限り、GOEバイアスは縮小傾向にあると言えるだろう。

演技構成点のナショナルバイアスも、依然としてプラスに偏っている。

ナショナルバイアスは、国別に計算すると、より一層明らかになる。

次の図は、選手数の多い9カ国について、国間バイアスを計算したものだ。横軸に選手の国、縦軸に審判の国を同じ順で配置しているため、対角線上の値がナショナルバイアスになっている。最近4年間、すべての国でプラス(赤系の色)だった。欧州3国は、年によっては露骨な自国びいきを示している。

バイアスは、ライバル国に対しても生じている。例えば、アメリカとロシア、カナダとフランスは相互に一貫してマイナスのバイアスがあった。アジア3国の間にはそういった傾向は見られなかった。

異常なジャッジの頻度

競技会場で選手や観客が感じる不公正は、逸脱点が1.5以上になる過度に高い評価を自国選手に与えたり、-1.5以下になる低評価を他国選手に与える場合だ。

以下の表は、統計的指標の一つである独立性検定のp値という観点で、2018/19年と19/20年に異常なジャッジをした審判のリストだ。いずれも、高い頻度で自国選手に甘い評価を与えている。ただし、この場合もジュニア選手の場合がほとんどで、選手の力のばらつきが影響した可能性がある。他国選手に過度の低評価を与えた審判はいなかった。

今季の焦点は利益相反

ISUは、今季のルール改定で、審判団を司るレフリーと、要素のレベル認定を行う技術審判(テクニカルコントローラーら)に関する倫理規定を厳格化した。

ISUの主要大会では、出場選手の親族や名付け親、友人などの「特別な関係」がある場合、出場選手とライバル関係にある選手のコーチである場合、主要大会参加選手のコーチである場合に、レフリー・技術審判を務めることが禁止された。また、各国のスケート連盟の幹部がレフリー・技術審判を務めることも禁止された。シニア大会では、可能な限り、上位が見込まれる国からの任命を避けることになった。

五輪ではさらに厳しくなり、直前の世界選手権で5位までに入賞した国のレフリー・技術審判は忌避されることになった。他国の国内大会でレフリー・技術審判を務めた場合も同様だ。なお、審判も、他国国内大会で審判、レフリーなどを務めた場合、各国連盟の現役会長である場合は忌避されることになった。

技術審判のレベル認定は、演技審判が出来栄え点を判断する前提となるため、結果を大きく左右する。しかし、同時に9人が採点する演技審判と異なり、データの中にバイアスを見出すことは難しい。

以下の表は、ジャンプの回転不足やエッジ判定などの減点判定の頻度について、技術審判(テクニカルコントローラー)の所属国と選手の所属国の関係をまとめ、偏りを探ったものだ。

自国選手の減点がやや少ない印象があるが、多くは有力選手を輩出している国であることを考慮すると、統計的な偏りはほとんどなかったと言えるだろう。

公平なジャッジとは

ケーキを二人で分けるとき、公平なやり方は一つではない。天秤を使って同じ重さになるように分ける方法は一見科学的だが、デコレーションは切り刻まれてしまう。切った人と別の人が先に選ぶ方法は賢い知恵だが、前提として二人が独立した存在でなければならない。採点基準の細分化は前者、倫理基準の厳格化は後者に当たる。

ルールは、現実に振り回されながら見直される。前半に偏りがちだったジャンプが競技時間の中で均等に配分されるように、後半の点数を1.1倍にするルールが導入されると、当初の意図に反して、ジャンプを後半だけに集中する選手が現れた。くじ引きで審判を割り振る手続きは十分な公平性を担保すると思われていたが、よりによって五輪で有力国の連盟会長が審判に選ばれることが起きてしまった。競技が重視する価値とは何か、公平とは何かは常に問われる。

選手とルールの相克はどのスポーツにもあるが、フィギュアスケートでは審判制度も加わってことさらに複雑だ。審判制度の微調整はこれからも続いていくだろう。

【データについて】分析に用いたデータは、2016年から4年間の国際スケート連盟主催大会(シニア、ジュニア、五輪を含む)の男女個人、ペア、アイスダンスについて採点資料から集計した。逸脱点の集計ではジャンプの転倒などで審判全員が最低点を出した場合を除いた。GOEは720,634件、PCSは444,520件。