Diese Seite mit anderen teilen ...

Informationen zum Thema:
Forum:
ChessBits-Computerschachforum
Beiträge im Thema:
9
Erster Beitrag:
vor 16 Jahren, 1 Monat
Letzter Beitrag:
vor 16 Jahren, 1 Monat
Beteiligte Autoren:
Rafael B. Andrist, Martin Schubert, Rainer Neuhäusler, Helmut Conrady, marcus kästner

Statistik-Frage zur Partielänge

Startbeitrag von Rafael B. Andrist am 18.06.2001 13:50

Kann man mit den Mitteln der Statistik etwas über die Steigerung der Spielstärke eines Programmes aussagen, wenn die Partielänge der Verlustpartien gegen einen bestimmten Gegner, dessen Spielstärke konstant bleibt, zunimmt? Ich gehe mal davon aus, dass mit zunehmender Partielänge die Anzahl der Fehler abnimmt, wenn man dem stärkeren Programm fehlerfreies Spiel attestiert. Lässt sich die Zunahme der Spielstärke irgendwie ausdrücken, z.B. in ELO-% oder so etwas Ähnlichem, die genaue Spielstärke bleibt ja schliesslich unbekannt, solange das schwächere Programm alle Partien verliert?

Hoffentlich habe ich mich verständlich ausgedrückt, es waren wohl ein bisschen zu lange Sätze...

Rafael B. Andrist

Antworten:

Spielstärke hat nichts mit Partienlänge zu tun. Partienlänge hängt vor allem auch von der Stellung ab. Zum Beispiel gewinnt im Sizilianischen Weiß oft schnell, Schwarz selten. Langfristig gewinnt oft Schwarz.

Gruß, Martin

von Martin Schubert - am 18.06.2001 14:44
Martin Schubert schrieb:
>
> Spielstärke hat nichts mit Partienlänge zu tun.

Eine Begründung dieser These würde mich interessieren. Zumindest hat die Partielänge _etwas_ mit der Spielstärke zu tun.

Ich versuche, meine Idee nun etwas genauer darzulegen. Vielleicht kannst Du mich dann ja auch gleich auf einen Denkfehler oder einen falschen Ansatz hinweisen...

Situation:
Programm A und B spielen gegeneinander Schachpartien.
Programm A spielt fehlerfrei (in der Praxis kann man von diesen Fall ausgehen, wenn A sehr viel stärker als B ist) und gewinnt immer, während Programm B nicht fehlerfrei spielt und immer verliert, da A alle Fehler sofort ausnützt.
In Programm B werden nun aber ständig Verbesserungen vorgenommen, sodass seine Spielstärke zunimmt; aber es erreicht es nie, fehlerfrei zu spielen.

Idee:
Sofern B nicht ein völlig hoffnungsloser Fall ist, ist natürlich nicht jeder Zug ein fehlerhafter Zug. Mit steigender Spielstärke werden die Fehler (v.a. positioneller Art, welche die Stellung schrittweise verschlechtern) immer seltener. Wenn man nun vereinfachend annimmt, dass jeder positionelle Fehler die Stellung um 0.1 Bauerneinheiten verschlechtert, ist wohl nach 15 derartigen Fehlern die Stellung verloren. Damit diese 15 Fehler geschehen, muss aber die Partie länger dauern, wenn die Spielstärke zunimmt, da ja die Fehler dann seltener auftreten.

Mir ist klar, dass es natürlich auch Fehler geben kann, die die Stellung schlagartig verschlechtern, aber ich gehe jetzt mal davon aus, dass diese entweder nur in taktisch komplizierten Stellungen oder in einer bereits schlechter stehenden Position vorkommen und bei genügend Partien nicht eine so grosse Rolle spielen.

> Partienlänge hängt vor allem auch von der Stellung ab. Zum
> Beispiel gewinnt im Sizilianischen Weiß oft schnell, Schwarz
> selten. Langfristig gewinnt oft Schwarz.
>
> Gruß, Martin

Das Problem der Stellungsabhängigkeit lässt sich dadurch lösen, indem man entweder genügend Partien spielt oder immer von einer bestimmten Mittelspielstellung ausgeht.

Rafael B. Andrist

von Rafael B. Andrist - am 18.06.2001 17:20
Um es mal ganz vereinfacht zu sagen: Spielstärke (ELO, DWZ,...) ist darüber definiert, wie viele Punkte man holt. Wie gesagt, die Länge einer Partie hat damit nichts zu tun.
Natürlich kann man statistisch alles mögliche untersuchen. Aber wie soll das hier gehen? Die Länge einer Partie hängt von allem möglichem ab, vor allem von der Stellung. Gut, man könnte natürlich eine bestimmte Menge an Stellungen nehmen, und bei Programmen mit bekannter Spielstärke untersuchen, wie lange die Partien dann dauern. Aber die Partielänge hängt auch noch vom Spielstil ab. Da sind so viele Dinge drinnen, das hat mit der reinen Spielstärke sicher nur entfernt zu tun.
Man könnte natürlich einen riesigen Aufwand treiben, um sich anzusehen, wie sich die Partielänge verändert, und so Sachen wie Spielstil außer acht lassen. Aber was hätte man für Riesenaufwand dann gewonnen?
Ich denke, eine sehr große Gefahr, an solche Dinge mit Statistik heranzugehen, ist, dass man Unterschiede auf etwas zurückführt, wovon sie gar nicht abhängen, sondern von etwass ganz anderem.

Gruß, Martin

von Martin Schubert - am 18.06.2001 18:45
Ich halte es auch für schwierig, da einen Zusammenhang herzustellen. Insbesondere muss man auch beachten, wann ein Programm aufgibt. Wenn sich einer z.B. KLS vs K (gut, ist ne TB-Stellung, nur so als Beispiel) zeigen lässt und der andere nicht, dann sind das eben 30 Züge Unterschied.

Helmut

von Helmut Conrady - am 18.06.2001 19:28
ich denke, ich habe deine frage recht gut verstanden.

ich denke, daß es da einen zusammenhang gibt.

zum beispiel hatte ich beim engine tuning mal festgestellt, daß die verschiedenen getunten versionen gegen den tiger in einer bestimmten stellung zwar nie gewannen, aber doch von version zu version länger überlebten, also zäher waren und weniger fehler machten.

im nachhinein zeigte es sich, daß diese "zäheren" versionen auch im praktischen spiel weniger fehler machten und einen besseren score holten. der war allerdings nur marginal besser.

also: ich denke da gibt es einen zusammenhang, der einfluß ist jedoch SEHR gering.

marcus

von marcus kästner - am 19.06.2001 11:36
marcus kästner schrieb:
>
> ich denke, ich habe deine frage recht gut verstanden.
>
> ich denke, daß es da einen zusammenhang gibt.
>
> zum beispiel hatte ich beim engine tuning mal festgestellt, daß
> die verschiedenen getunten versionen gegen den tiger in einer
> bestimmten stellung zwar nie gewannen, aber doch von version zu
> version länger überlebten, also zäher waren und weniger fehler
> machten.
>
> im nachhinein zeigte es sich, daß diese "zäheren" versionen
> auch im praktischen spiel weniger fehler machten und einen
> besseren score holten. der war allerdings nur marginal besser.
>
> also: ich denke da gibt es einen zusammenhang, der einfluß ist
> jedoch SEHR gering.
>
> marcus

Natürlich hält man bei gleichem Spiel, wenn man weniger Fehler macht, länger durch. Aber bei so viel Faktoren macht das keinen Sinn, das näher zu untersuchen, um dann doch nur Allgemein-Aussagen zu bekommen, ohne das die allgemeinen Aussagen jemals zutreffen.
Ja, vielleicht bekommt man dann einen Durchschnittswert heraus. Aber um das Beispiel von meiner frühen Mathelehrerin zu verwenden: Es nützt wenig, zu wissen, dass man im Schnitt eine 3,5 würfelt, da man nie eine 3,5 würfeln wird.

Gruß, Martin

von Martin Schubert - am 19.06.2001 11:47
Vielleicht, d.h. wenn ich genügend Zeit zur Verfügung habe, werde ich in einem Monat ein paar Tests durchführen, um zu sehen, ob es einen messbaren Zusammenhang gibt (mehr als 10 Partien pro Programmvariante liegen zeitlich wohl kaum drin). Ich hoffe, dass man dann auch etwa abschätzen kann, wie stark der Zusammenhang ist.

Rafael B. Andrist

von Rafael B. Andrist - am 19.06.2001 17:33
Hallo,

die Fragestellung ist prinzipiell praxisrelevant als es darum geht, Indikatoren für die Verbesserungen eines Programmes zu finden, die sich noch nicht in Gewinn oder Verlust ausdrücken. Ein Programmierer will ja z.B. sehen, ob er auf dem richtigen Weg ist und da wäre es sehr hilfreich entsprechend sensible Faktoren der Spielstärke zu haben.

Dein Indikator wäre: Je länger die Partien dauern, desto mehr ist das ein Indiz für Programmverbesserungen, auch wenn es zum Gewinn oder Remisen noch nicht reicht. So habe ich deine Fragestellung verstanden.

Was die Korrelation, also den Zusammenhang vor Partielänge und Spielstärke angeht, so ist sie sicher eine Funktion des Entwicklungsstadiums eines Programmes.

Ist erst erst der Zuggenerator und die Matterkennung implementiert, dann dauern die Partien gegen Deep Fritz wohl nur ein paar Züge :-)). Geht die Materialbewertung ein, dann dauern sie schon länger, da unmittelbarer Figurenverlust vermieden wird. Dann kommt Alpha-Beta, MiniMax, Pruning, Hash etc. Es ist klar worauf das hinausläuft . Je höher die Entwicklungsstufe des Programmes, desto weniger lassen sich seine Verbesserungen in der durchschnittlichen Länge der Partien ablesen. Für Verbesserungen im Bereich der Top-Engines und des Feintunings ist die Variable „Zügezahl“ wohl schon längst überfordert. Da gibt es wohl keine Signifikanzen der Partielänge mehr im Zusammenhang mit der unerschiedlichen Spielstärke von Programmen oder von Programmverbesserungen.

Vielleicht sind die Tablebases noch ein signifikanter Faktor für die Partielänge. Hypothese: Mit Tablebases sind die Partien im Durchschnitt signifikant kürzer als ohne. Warum ist wohl jedem klar, der vor den TB-Zeiten dem endlosen Geschiebe bei Riesenpartien beigewohnt hat. Oder täusche ich mich da ?

Es können bei guten Programmen durchaus noch Signifikanzen in der Partielänge nachzuweisen sein, die mit dem Spielstil (taktisch, positionell, aggressiv, defensiv, mit Tbs ohne Tbs etc.) zu tun haben und nicht mit der Spielstärke.

Vielleicht wäre es eine interessante Untersuchung an Hand von Datenbanken herauszufinden, welche Engines und welche Paarungen von Engines die längsten Partien produzieren und was man daraus ev. für Erkenntnisse gewinnen kann.

Gruß Rainer

von Rainer Neuhäusler - am 19.06.2001 20:26
Zur Information:
MySnip.de hat keinen Einfluss auf die Inhalte der Beiträge. Bitte kontaktieren Sie den Administrator des Forums bei Problemen oder Löschforderungen über die Kontaktseite.
Falls die Kontaktaufnahme mit dem Administrator des Forums fehlschlägt, kontaktieren Sie uns bitte über die in unserem Impressum angegebenen Daten.