Re: Motion om förändringar av ratingsystemet

Eva Jonzon eva.jonzon@….com
Sön. 24 april 2005 09.08.58 +0100


Hej!

Tack Johan för en utmärkt beskrivning. Till och med jag begrep! Och det vill 
inte säga lite... ;-) Ditt teoretiska resonemang var nu solklart för mig, så 
tack för att du tog dig tiden!

Jag tycker att det verkar vara ett mycket vettigt förslag.

Jag är dock böjd att hålla med Gunilla om uttryckssättet 1005,7 är lättare 
att få en känsla för än 10057. (Är det inte därför man devalverar valutor, t 
ex för att det blir så otympligt till slut att hålla på med stora tal?)

/Hälsningar Eva Jonzon



----- Original Message ----- 
From: "Johan Rönnblom" <Information om listan>
To: <Information om listan>
Sent: Tuesday, April 19, 2005 1:58 AM
Subject: Re: Motion om förändringar av ratingsystemet


> Hej!
>
> Här kommer ett väldigt långt svar. Erfarenhetsmässigt vet jag att så här
> långa svar riskerar att döda diskussioner. Men jag måste ändå svara 
> Gustaf,
> så jag hoppas att det ändå är fler som har åsikter i frågan.
>
>
> Gunilla Jarfelt skrev:
>> Jag tycker att det blir knöligt med rejtingttal på 10000,
>> och förslår i stället att vi bestämmer oss för att detaljera dagens
> rejting
>> med att använda en decimal.
>>
>> För mig känns det inte lika klumpigt med 1005,7 som 10057.
>
> Det tycker egentligen jag med, men andra tyckte tvärtom, och jag bryr mig
> inte så mycket om den saken.. men det vore väl bra om fler tyckte till.
>
> Gustaf Bergström wrote:
>> Jag skulle vilja ha ett förtydligande från Johan. Vill du att 
>> förändringen
>> av ratingsystemet ska genomföras retroaktivt?
>
> Ja, det bör den göra. Detta dels för att det är "snyggare" så tycker jag,
> men det är också så att det blir lite lägre ratingförändringstal med det
> nya systemet, och det skulle gynna spelare som ligger högt just när
> ratingförändringen sker på ett otillbörligt vis.
>
>> Ditt "Förslag 3" låter ju intressant, men nackdelen är kanske att de som
>> inte har läst en massa matte inte längre kommer att begripa hur ratingen
>> räknas ut.
>
> Det vet jag väl inte? Den räknas ju ut på exakt samma sätt som innan,
> förutsatt att man känner till de förändringar som sker. Låt gå för att det
> inte är lika lätt att räkna ut dessa förändringar alldeles själv, men att
> kontrollräkna är precis lika enkelt (eller svårt) som tidigare. Jag kan
> inte se någon poäng i att försöka göra den första beräkningen själv, det 
> är
> ju mycket lättare att låta systemet göra det. Finns det något intresse av
> att räkna själv bör det väl vara just att kontrollräkna att systemet
> verkligen gör det som det ska göra.
>
>> Även för mig som har en och annan högskolepoäng i matte är det
>> omöjligt att försöka tänka ut vilket utslag ett sånt system skulle kunna
>> få i ratingtabellen. Jag skulle därför vilja se ett par räkneexempel,
>> gärna med siffror hämtade från riktiga turneringar, där du visar hur
>> ratingförändringarna hade blivit om ditt "Förslag 3" hade tilläpats.
>
> Jag ska göra det. Men jag vet inte om det säger så mycket, man kan aldrig
> utforma ett system efter omdömen som "nu gick Markus ned fem poäng, men 
> jag
> tycker det verkar bättre att han skulle gå ner sju poäng".
>
> Först dock lite teoretiska funderingar kring ratingen (detta gäller såväl
> nuvarande som det nya förslaget, eftersom det i grunden är samma system).
> De som inte är intresserade kan skippa denna bit.
>
> -----BÖRJAN PÅ TEORETISKA FUNDERINGAR-----
> Tanken med det ratingsystem vi har är att ge ett värde på hur bra en viss
> spelare är vid ett visst tillfälle. Man kan tänka sig att vår rating är en
> approximation av en ideal rating. Det är i så fall den rating som en
> spelare skulle få om han eller hon kunde spela oändligt många matcher i
> varje ögonblick. Inte ens den ideala ratingen säger vem av två spelare som
> kommer att vinna en match, dock, eftersom Scrabble är ett turspel. Den
> ideala ratingen säger dock hur stor procent av det oändliga antalet 
> matcher
> som en viss spelare vinner mot en annan spelare.
>
> I verkligheten kan och vill vi inte spela oändligt många matcher, inte ens
> på DBS-tävlingar. Därför är ratingen alltså en approximation. En fråga om
> denna approximation är förstås *när* approximationen ska anses göras. Den
> kan ju inte göras i något enskilt ögonblick, eftersom det tar tid att 
> spela
> Scrabble. Man kunde dock tänka sig att approximationen görs under en
> tidsrymd av en enskild match. Då skulle ratingen alltså förändras efter
> varje match, och inte efter varje turnering som är fallet nu. Men frågan 
> är
> om det vore bra - en spelare som först förlorar tre matcher och sedan
> vinner fyra har förmodligen inte blivit väldigt mycket bättre (även om
> sådant som morgontrötthet kan spela in). Troligare är att spelaren hade
> missflyt i början av dagen. Att ändra ratingen efter varje match skulle
> förmodligen inte vara helt rättvisande, den som fick stryk i fjärde 
> matchen
> i exemplet ovan skulle drabbas orättvist hårt av att motståndaren gått ner
> efter tre raka förluster.
>
> Så i det nuvarande systemet approximeras i stället ratingen under en
> tidsrymd av en hel turnering. Det är något som jag vill behålla, eftersom
> jag tycker att det är vettigt. En turnering är någorlunda väl samlad i
> tiden, men innehåller så pass många matcher att turen jämnar ut sig
> någorlunda väl.
>
> När man räknar ut en ny rating baserar det sig på att man först beräknar 
> hur
> många matcher en spelare rent statistiskt borde vunnit, och därefter 
> jämför
> man detta med hur många matcher spelaren faktiskt vunnit. Skillnaden
> multipliceras med en faktor tio, och så får spelaren sänkt eller höjd
> rating. Så vitt jag vet har faktorn tio ingen egentlig teoretisk bas, utan
> är vald för att få "lagom svängiga förändringar". Om jag har fel hoppas 
> jag
> att någon rättar mig. Det bör gå att räkna ut en "teoretiskt bra" sådan
> konstant om man ställer upp vissa önskemål om förändringstid vid en 
> stegvis
> förändring eller maximalt fel för olika förändringsfrekvensområden eller
> andra inte helt lättgenomträngliga kriterier, men tio är å andra sidan ett
> runt och fint tal och jag betvivlar att man kunde välja det så fasligt
> mycket bättre.
>
> Det som däremot har en teoretisk bas är själva jämförelsen mellan hur 
> många
> matcher man "borde vunnit" och hur många man vann. Där är det något
> märkligt idag: Uppskattningen av hur många man "borde vunnit" görs ju med
> ledning av ratingen för förra turneringen. Dvs, den är egentligen en
> uppskattning av hur många matcher man borde vunnit, förutsatt att man är
> lika bra som man var i förra turneringen. Men det är man ju inte - det är
> ju därför ratingen förändras. Därför anser jag att det helt enkelt är ett
> bättre sätt att räkna att utgå från den rating som faktiskt försöker
> approximera hur bra en spelare är i just den aktuella turneringen.
>
> Nåja - detta teoretiska resonemang är förmodligen betydligt krångligare 
> och
> hårigare än mitt förra konstaterande att "ju fler matcher ratingen grundar
> sig i, desto mer rättvisande är den" vilket väl är ganska lättbegripligt
> hoppas jag.
> -----SLUT PÅ TEORETISKA FUNDERINGAR-----
>
> Tillbaka till siffrorna. Jag har räknat ut ratingen för de tre senaste
> turneringarna med det nuvarande, och med det föreslagna systemet (endast
> förändring 3 här, för att det ska bli mer jämförbart). Att göra funktionen
> för den nya ratingen är egentligen väldigt enkelt, om man har funktionen
> för den gamla ratingen. Därför gjorde jag en sådan funktion, så att jag
> kunde kontrollera den. Då är risken minimal för att jag lyckats göra fel
> med den nya, eftersom den helt bygger på den gamla. En liten skillnad är
> dock värd att beakta: I det gamla systemet gick det bra att använda
> tabellvärden på sannolikhetsfördelningsfunktionen fi(z). Dessutom var den
> avrundad till fyra decimaler. Detta är inte lyckat i det nya systemet,
> eftersom det bygger på att man kontinuerligt ska kunna få mindre och 
> mindre
> förändringar tills man når stabila värden. Med hackiga tabellvärden kan 
> man
> inte lita på att detta fungerar. Det behövs alltså en (mer) kontinuerlig
> fi(z). Detta är dock inget problem att ordna.
>
> Så, här är alltså de tre senaste turneringarna. Jag börjar bakifrån,
> eftersom Örebro Open förmodligen är mest intressant, flest deltagare och
> störst spridning på deltagarnas rating, samt ett antal personer med mycket
> kraftiga ratingförändringar.
> Örebro Open:
> Namn               V R-in  F  F-ny
> Andreas Carlsson   7  998  41  33
> Håkan Andersson    7 1092   8   8
> Niklas Elmefjäll   6 1135  -8  -6
> Fredrik Viberg     5 1000  17  15
> Lisa Blohm         5 1076  -3  -2
> Stefan Furth       5  996  19  16
> Victoria Gejrot    5 1059   4   3
> Patrik Grönvall    5 1030   5   4
> David Brandell     5 1033   6   5
> Claes Gejrot       5 1027   7   6
> Björn Ericson      4 1054  -9  -7
> Henrik Holmström   4 1038  -7  -7
> Joel Bäckelie      4 1011   4   4
> Ida Nord           4 1005   1   1
> Elisabet Claezon   4  962  17  12
> Anders Brandén     4 1000   2   0
> Claes von Hofsten  3  995  -7  -4
> Elisabet Bruzelius 3  970   5   3
> Pyret Karlbom      3 1000 -12  -8
> Pär Båge           3  979  -4  -5
> Jannike Molander   3  969   4   1
> Pia Mattsson       3 1008  -8  -7
> Tine Norling       3  982   1  -1
> Jenny Ringqvist    2 1000 -24 -18
> Daniel Strindberg  2  992 -18 -14
> Frida Wessman      0 1000 -42 -32
>
> Det första man lägger märke till är kanske att förändringarna över lag är
> något mindre. Andreas får inte längre 41 utan "bara" 33. Detta är dock
> ganska ointressant eftersom det gäller alla spelare, +33 med detta system
> är förmodligen ungefär lika bra som +41 i det tidigare. Det beror förstås
> på att en ratingökning blir självhämmande - ökar ratingen så borde man ha
> vunnit fler matcher än vad den gamla ratingen visade, alltså ökar ratingen
> inte lika mycket. Vi ser ju att nästan alla förändringar är mindre.
>
> Mer intressant är det då att se på Håkan A. Han får 8 poäng i det nya
> systemet, precis som i det gamla. Varför då? Jo, vi kan se att alla hans
> motståndare utom Lisa B (dvs 7 av 8) gått upp i rating under turneringen.
> Han har alltså mött svårare motstånd än vad deras rating, som ju härrör
> från förra turneringen, har visat.
>
> Göteborg Open:
> Johan Rönnblom   6 1083  15  12
> Björn Ericson    5 1045  14  12
> Stefan Diös      5 1100  -5  -3
> Niklas Elmefjäll 5 1127 -10  -8
> Joel Bäckelie    4 1015  10   8
> Anders Grönlund  4  988  15  11
> Johanna Oscarson 4 1002  12  10
> Jannike Molander 3  973  13  11
> Patrik Grönvall  3 1035 -10  -8
> Gunilla Jarfelt  3  964   5   3
> Jan Hvarfvenius  3  992  -4  -4
> Erik Granberg    2 1000 -10  -8
> Pia Mattsson     2 1000 -12 -10
> Johan Granberg   0 1000 -33 -26
>
> Inte mycket intressant att kommentera.
>
> Konsonantcupen, Malmö:
> Ola Torstensson      5  990  22  18
> Christoffer Jakobsen 5 1000  19  16
> Daniel Skoglösa      4 1000  10   8
> Annika Lövström      2 1000  -6  -4
> Louise Gripenhov     2 1000  -5  -4
> Ronnie Löfström      2  993  -4  -3
> Helena Ramsing       2 1000  -5  -5
> Kristina Cronqvist   1 1000 -15 -12
> Kicki Stridh         1 1000 -16 -13
>
> Lika lite intressant att kommentera, precis som väntat eftersom detta var 
> en
> turnering där alla hade nästan samma rating.
>
> Ett par ord dock om att förändringarna blir mindre: Detta ska *inte* 
> tolkas
> som att det blir svårare att ta sig ikapp toppen. Det är ju lika för alla.
> Däremot ökar denna förändring på behovet av att glesa ut ratingen lite 
> (med
> en konstant eller en decimal), eftersom den annars blir ännu något tätare.
>
> -- 
>  /Johan Rönnblom
>
>
>
> 





Information om listan