Logic Masters Forum

Normale Version: Croco-Rätsel
Du siehst gerade eine vereinfachte Darstellung unserer Inhalte. Normale Ansicht mit richtiger Formatierung.
(03.06.2011, 08:27)berni schrieb: [ -> ]Aber das erklärt nicht, warum nun bei etlichen Leuten eine Abwärtstendenz vorhanden ist. Wenn der Median (oder auch der Durchschnitt) der Teilnehmer sinkt (das ist ja gleichbedeutend damit, dass der Anteil der schlechten Teilnehmer proportional mehr ansteigt), steigt das Rating.

Da bin ich gleich bei zwei Punkten anderer Meinung:

- "Wenn der Median der Teilnehmer sinkt, steigt das Rating." (Als Kontrolle, ob ich die Formulierung verstehe: "Wenn der Median im Schnitt von einem (schwächeren) 9k statt einem 7k erzielt wird, ..."):
Zunächst bin ich der Meinung, dass der heutigen 9k unter Umständen nicht schwächer ist, als der frühere 7k. Aber selbst wenn das so wäre, müssen dadurch die Ratings nicht ansteigen. Es heißt ja schließlich nur, dass jetzt regelmäßig Teilnehmer der Stärke 9k Punkte über 1500 bekommen, statt früher welche der Stärke 7k. Wie weit über 1500 sagt das ja nicht aus. Wenn sich 90% der Teilnehmer knapp über der 1500-Schwelle tummeln (und bei der Zunahme an starken Teilnehmern und somit der Zunahme von Zeiten, die früher als Ausreißer angesehen wurden, ist das bei logarithmischer Punkteverteilung tendenziell nicht völlig abwegig), werden die Ratings insgesamt im Schnitt trotzdem sinken. Ein Benutzen des Durchschnitts statt Medians könnte da übrigens tatsächlich zu anderen Ergebnissen führen. Bei besagtem Extrembeispiel wäre der Durchschnitt in Relation zum Median zum Beispiel bei einem noch schwächeren Rang. Durch eine logarithmische Punktevergabe sind halt zwangsläufig relativ wenige Spitzenpunkte da und viel mehr mittlere und niedrigere Punkte.

- "Ein geringerer Median bedeutet, dass proportional mehr schwächere Teilnehmer mitmachen.": Das wäre dann richtig, wenn die Leistung eines Teilnehmers ein absoluter Wert wäre, ein 7k von heute also garantiert so stark ist, wie ein 7k von vor 2 Jahren. Dem ist aber nicht zwangsläufig so. Ich persönlich glaube zum Beispiel, in dem Zeitrahmen etwas besser geworden zu sein, und glaube, das ganz ordentlich einschätzen zu können. Auch wenn ich mein Rating länger nicht gesehen habe, bin ich mir sehr sicher, dass es diese Entwicklung seit dem Hinzukommen einiger weiterer Toplöser nicht widerspiegelt. Der Grund dafür liegt im logarithmischen Rating kombiniert mit dem, was euklid in seinem dritten Abschnitt sehr schön erklärt hat.

Was einen möglichen psychologischen Effekt bei der Ratingabnahme angeht: Das sollte doch eigentlich ganz gut empirisch zu kontrollieren sein. (Auch wenn ich euklids Erklärung anschaulicher fand als ich es vorher geschafft hatte.) Nimm doch einfach alle Teilnehmer, die vor dem Starken Nutzeranstieg schon 1 Jahr aktiv waren (bzw. so viele Teilnahmen haben, dass ihr Rating als realistisch angesehen werden kann). Nimm den Durchschnitt ihrer Ratings von vor dem Nutzeranstieg und den Durchschnitt der Ratings von heute.


Schönen Gruß,

Calavera
(03.06.2011, 16:35)Calavera schrieb: [ -> ]- "Wenn der Median der Teilnehmer sinkt, steigt das Rating." (Als Kontrolle, ob ich die Formulierung verstehe: "Wenn der Median im Schnitt von einem (schwächeren) 9k statt einem 7k erzielt wird, ..."):
Zunächst bin ich der Meinung, dass der heutigen 9k unter Umständen nicht schwächer ist, als der frühere 7k.

Das hast du falsch verstanden. Gemeint ist "Wenn der Median im Schnitt von einem *heutigen* 9k statt einem *heutigen* 7k erzielt wird, ..."

Über den Rest muss ich erst noch nachdenken, bevor ich was zu schreiben kann.
Noch ein wenig Statistik:

a) Uvo auf Platz 1: 1.1.2010-31.5.2010: 44mal von 147 Teilnahmen = 29.9%. 1.1.2011-31.5.2011: 23 (26) von 140 Teilnahmen = 16.4% (18.6%); in Klammern Ü2. Also schon eine deutliche Abnahme.

b) Nimmt das Rating ab? Hierfür habe ich das Rating vom 31.5.2010 mit dem vom 31.5.2011 verglichen, wobei nur Leute beachtet wurden, die bereits am 31.5.2010 500 Teilnahmen hatten (149 Leute): Bei 64 (47) Leuten ist das Rating schlechter geworden, bei 85 (60) Leuten ist das Rating besser geworden (in Klammern: um mindestens 50 Punkte). Betrachtet man nur Leute mit einem Rating von über 2000 (vor einem Jahr), so ist dieses bei 20 (15) schlechter geworden und bei 8 (4) besser.

(04.06.2011, 12:22)berni schrieb: [ -> ]Bei 64 (47) Leuten ist das Rating schlechter geworden, bei 85 (60) Leuten ist das Rating besser geworden (in Klammern: um mindestens 50 Punkte). Betrachtet man nur Leute mit einem Rating von über 2000 (vor einem Jahr), so ist dieses bei 20 (15) schlechter geworden und bei 8 (4) besser.

Wirkt stimmig. Herausragende Bestzeiten wirken sich am stärksten auf die Rätsler in der Spitze aus, auf die im Mittelfeld weniger. Wenn man dann davon ausgeht, dass Leute sich prinzipiell verbessern, so überlagert die Verbesserung im Mittelfeld den Effekt durch zunehmende Topzeiten, während es an der Spitze umgekehrt ist.
(04.06.2011, 14:23)Calavera schrieb: [ -> ]Wirkt stimmig. Herausragende Bestzeiten wirken sich am stärksten auf die Rätsler in der Spitze aus, auf die im Mittelfeld weniger. Wenn man dann davon ausgeht, dass Leute sich prinzipiell verbessern, so überlagert die Verbesserung im Mittelfeld den Effekt durch zunehmende Topzeiten, während es an der Spitze umgekehrt ist.

Ja, wobei ich glaube, dass die Verbesserung im Mittelfeld eher durch den Drift des Medians hervorgerufen wird. Dieser mindert auch die Verluste an der Spitze etwas ab.

Alles in allem haben wir derzait also folgendes: Der Median sinkt langsam ab, während der Spitzenwert etwas ansteigt; beides natürlich nur im Mittel. Für Kyu-Rätsler führt das dazu, dass das Rating leicht ansteigt, für Dan-Rätsler, dass das Rating leicht sinkt. Das ist doch schon mal ein handfestes Ergebnis.
da ich ja seit ein paar (wenigen) tagen auch wieder dabei bin, kann ich kaum eigene erfahrung in die diskussion einbringen, gefühlt bin ich ein wenig verkalkt und es sind ne menge neue gute leute dazugekommen Wink

ich werd mir das mit dem rating die nächsten tage (wieder) mal durch den kopf gehen lassen, vor dem schlafengehen nur ein paar kurze gedanken:

- ob die breite in der spitze tatsächlich dichter geworden ist, sollte man einfach überprüfen können, indem man (behauptung: die logarithmen der zeiten sind normalverteilt) sich anschaut, wie viel % der zeiten unter der 2sigma, 3sigma, 4sigma grenze liegen, evtl. sollte man für die berechnung der standardabweichung die unteren und oberen 10% oder so weglassen.

- dass user, die im steigen sind, oft weitersteigen, bis sie ihr wahres niveau erreicht haben, sollte einen wesentlichen teil des überschusses in bernis statistik erklären...

bleibt immer noch die frage, wie man das rating allgemein fair macht^^ und dafür bräuchte man wohl ausführliche analysen der zeitverteilungen Biggrin

Naphthalin
(07.06.2011, 02:28)Naphthalin schrieb: [ -> ]- dass user, die im steigen sind, oft weitersteigen, bis sie ihr wahres niveau erreicht haben, sollte einen wesentlichen teil des überschusses in bernis statistik erklären...

Ne, wenn ich jetzt richtig verstehe, was du meinst, dann habe ich das bereits rausgerechnet.
es gibt zB auch immer mal leute, die ein ganzes weilchen rumdümpeln und dann vom ehrgeiz gepackt werden. wie auch immer Smile ich versuch erstmal in den nächsten tagen nicht noch mehr zu verlieren^^

Naphthalin
Auch wenn es mittlerweile Rätsel mit >400 Lösern gibt, sind es denke ich für jeden einzelnen zuviele sich überlagernde Einflüsse, um da mit Statistiken weiterzukommen.

Nur mal Stichworte, welche mir da so alle vorschweben:

1.) Kurzfristiger rätseltypbedingter Einfluss: einige Rätselarten kann ich nun mal einfach besser als andere. Eine Woche Japanische Summen, Doppelstern, Killersudoku etc., und ich bin wahrscheinlich deutlich im Plus. Eine Woche Tapa, Pyramide, Hitori und mein absoluter Liebling Zeltlager und ich würde vermutlich drei Monate Frustpause einlegen. Analog vermute ich, dass ich bei schweren Rätseln >5 Minuten deutlich besser bin, als bei den 30-Sekunden-Rätseln. Sicher gleicht es sich oft aus, aber es gibt immer mal "Streaks" in denen sich gute oder schlechte Rätselarten häufen.

2.) Kurzfristiger Einfluss: im Lösungsverlauf erkannte Fehler bzw. Fehlversuche vs. glückliche Fallunterscheidung, zufällig mal ein schnelles Auge bzw. manchmal auch Denkfehler, die einen schneller als den Durchschnitt zur richtigen Lösung führen

3.) Kurzfristiger stimmungsbedingter Einfluss: ich hätte nie gedacht, dass die Psychologie so krasse Auswirkungen hat, aber bei mir gehts die letzten Monate beruflich und privat etwas chaotisch zu. Sicher kamen da viele Faktoren zusammen, aber mein Tagesratinggraph spiegelt schon an vielen Stellen recht gut meinen aktuellen Stimmungspegel/Stresspegel wieder, und zwar in beiden Richtungen. Keine Sorge, mir gehts gut, der Graph übertreibt Biggrin (da kamen auch viele Sachen aus 1.) und 2.) mit dazu)

4.) Langfristiger Einfluss: Lerneffekte. Die meisten Rätsler verbessern sich im Laufe der Zeit, lernen neue Strategien, und sehen die richtigen Ansatzpunkte schneller.

5.) Langfristiger Einfluss: im Training bleiben. Im Augenblick mache ich kaum mehr als das Ü-Rätsel, und das wirkt sich über die Monate schon sehr stark aus. Ich merke bei einigen Rätselarten, dass ich die schonmal sehr viel schneller konnte (speziell Killer und Japanische Summen). Jede kleine Teilüberlegung dauert einfach etwas länger als früher, wenn man das Training zurückfährt.

Da läßt sich sicher noch mehr finden.

(Ich stimme aber prinzipiell zu, dass es speziell für die Spitze wünschenswert wäre, wenn einzelne glückliche Ausreißer nicht mehr einen solchen Einfluss auf das Tagesrating hätten.)
Wenn man nicht mitgekriegt hat, dass sich das Applet (Masyu) verändert hat und erst mal denkt, dass irgendwas mit seinem Browser nicht in Ordnung ist, dann darf man sich auch nicht wundern, wenn man eine schlechte Zeit hinbringt. Wann ist das denn an mir vorbeigegangen?