Partager sur : Facebook, Twitter

Remise en cause du classement ELO initial aux échecs

Le système ELO permet d'estimer le niveau d'un joueur d'échecs au fur et à mesure qu'il joue. À chaque partie, 20 points sont mis en jeu par chaque joueur. En gagnant contre un faible ou en perdant contre un fort, peu de points sont engagés. À l'inverse, perdre contre un faible ou gagner contre un fort provoque un gros transfert de points. C'est pourquoi une bourde peut ruiner de longs efforts acquis et certains pensent que la prudence des grands maîtres s'explique par cela. Beaucoup de joueurs mettent près de 10 ans avant d'avoir leur classement de croisière, ce qui témoigne d'une stabilisation à long terme de la formule de calcul, mais aussi parce que la mise en jeu des points diminue au-delà des 2400 points.

Le transfert de points ne s'applique pas aux joueurs non classés puisque leur niveau est... inconnu. En participant à une compétition annuelle ou à un tournoi, un tel joueur doit respecter des critères pour obtenir un classement officiel. Il est question du nombre d'adversaires classés rencontrés, de la moyenne de leur niveau et du score final obtenu.

Dans un tournoi bien réparti, le classement initial n'est pas trop déconnant. Imaginons un joueur d'environ 1300 qui réalise ce résultat : 1550 (0), 1420 (0.5), 1350 (0), 1290 (0.5) et 1080 (1). La moyenne des adversaires est Rc=1338 et il marque p=2/5. En application de la formule, il est classé 1266. S'il avait été classé 1251 dès le début et que le joueur n'avait pas gagné exceptionnellement, le transfert de points aurait été nul à la fin. L'estimation est heureusement bonne «la plupart du temps». Toute la nuance est dans ce terme.

La documentation n'est pas très claire au sujet du nombre de parties nécessaires avant d'avoir un classement. Il fut question de 9 parties, ensuite 5 mais en pratique, la FIDE considère 3 parties sur son site. Ceci permet aux clubs d'avoir des joueurs classés dans les compétitions en trois mois au lieu d'un an. Mais en réduisant la taille de l'échantillon, on arrive à des situations ubuesques...

Prenons le joueur A qui perd habituellement toutes ses parties tellement il manque d'expérience face à n'importe quel autre joueur. Mais un jour, il rencontre le joueur X maladroit qui se maintient péniblement au classement. Il a les résultats suivants : 1010 (1), 1330 (0) et 1440 (0). Le taux de victoire est de 1/3 même s'il aurait pu valoir 1/10 sur l'année. L'estimation qui en ressort est de 1135, sachant qu'en étant classé 1112, le niveau du joueur A n'aurait pas évolué.

Prenons le joueur B, un peu meilleur et qui réalise la performance suivante : 1300 (1), 1230 (0) et 1240 (0). Autrement dit, il n'est pas forcément adroit avec des joueurs de son niveau mais il a réalisé un exploit face à un joueur plus fort. Il n'est pas précisé si cet adversaire a bourdé volontairement ou non, mais le joueur A n'aurait jamais réussi un tel coup. Le classement attribué est 1132, proche du classement 1112 qui n'aurait impliqué aucune évolution du classement. On voit déjà que le classement donne le même résultat alors que les joueurs A et B n'ont clairement pas le même profil. De plus, il n'importe nullement que le joueur B ait gagné contre le 1300 ou le 1230 : seule la moyenne des adversaires compte.

Prenons un joueur C, pas plus fort que le joueur A, qui participe à une compétition de haut vol pour combler les tables manquantes en période de vacances. Bizarrement, le joueur C rencontre le maladroit joueur X, lequel perd. Nous avons alors : 2260 (0), 2120 (0) et 1010 (1). La formule nous donne un classement de 1672, alors que le classement 1226 (surévalué aussi) n'aurait donné aucune variation de classement.

Ces écarts sont évidemment inadmissibles, car les disparités d'initialisation nécessitent de nombreuses parties frustrantes avant d'être diluées dans la masse. De la même façon, les joueurs sous-marins qui terminent des tournois avec +125 points devraient être requalifiés immédiatement afin qu'ils n'appliquent pas un fort malus aux joueurs qui auraient perdu contre eux. À l'inverse, les vétérans (GM ou non) mériteraient un contrôle technique périodique, car beaucoup donnent leurs points acquis grâce à la diminution de leurs facultés intellectuelles plutôt qu'à un exploit particulier du jeu adverse. Dans le cas normal, il est évident qu'une partie exceptionnellement gagnée ne doit pas causer un saut énorme dans le classement puisqu'il n'y a pas la preuve évidente de la répétabilité de cette force de jeu. Actuellement, les jeunes bénéficient d'un coefficient de 40 points pour tenir compte de leur rapide apprentissage, mais avec l'essort d'Internet (qui n'existait pas en 1970 à la création du système ELO), ce n'est pas toujours suffisant. Entre les non-classés et les jeunes sous-classés, il est clair que les dysfonctionnements affectent particulièrement les joueurs classés en-dessous de 1400, c'est-à-dire une grande partie des nouveaux joueurs. Plus le niveau augmente, plus le classement est sensiblement fiable, car moins sensible à la faiblesse des joueurs.

On voit donc que l'équilibre du score est indispensable à la justice du jeu, laquelle a le mérite de pouvoir s'appuyer sur une formule incontestable. À ce titre, un petit outil a été développé pour calculer l'ELO initial en tenant compte de contre qui le point a été marqué. L'idée est de trouver par itération l'ELO initial qui ne produit aucune variation de classement à la fin d'un tournoi. L'hypothèse est qu'on ne progresse pas significativement en ELO sur la période d'un tournoi, donc en moyenne, on est censé faire comme performance son ELO. En prenant plusieurs exemples pratiques, le résultat s'est retrouvé applicable et souvent identique à la formule officielle. Mais dans les cas particuliers comme le joueur C, le résultat est plus fidèle à la réalité du terrain. À toutes fins utiles, l'ordre des parties peut être pris en compte si on veut que l'ELO évolue à chaque fin de partie et non de tournoi.

Cette nouvelle formule n'est pas officielle. L'idée est simplement d'expliquer comment deux joueurs bien différents peuvent avoir le même ELO initial, puis tenter d'y remédier. Il faudrait un jeu de données plus étayé pour voir l'effet d'un tel changement à l'échelle de tous les joueurs.

Accessoirement, le code est disponible sur Github.

Posté par admin le 8 août 2019 à 22:50 - Divers
Texte soumis à la licence du site, sauf mention contraire
Rechercher plus d'informations

 

Commentaires

Evaluer l'article : * * * *

Ajouter un commentaire

Pseudo:
Site web: http://...
Message:
Avez-vous trouvé l'information que vous cherchiez ? Votre retour d'expérience sur le site nous intéresse.