Diese Seite mit anderen teilen ...

Informationen zum Thema:
Forum:
ChessBits-Computerschachforum
Beiträge im Thema:
18
Erster Beitrag:
vor 15 Jahren, 11 Monaten
Letzter Beitrag:
vor 15 Jahren, 11 Monaten
Beteiligte Autoren:
Rainer Neuhäusler, Rafael B. Andrist, Martin Schubert, marcus kästner, Michael Scheidl, Christian R.

Schachstatistik mittels Datenbanksystemen ?

Startbeitrag von Rainer Neuhäusler am 23.06.2001 23:47

Ich bin noch ohne Schachdatenbank und würde mich für die statistischen Auswertungsmöglichkeiten von Chessbase bzw. Chess Assistant interessieren.

Was ist (schon) möglich ?

Partielänge nach Eröffnung und Spieler
-die durchschnitlliche Zügezahl
-Varianz, Minimum, Maximum der Zügezahl
- Verteilung der Zügezahl

Figurenparameter nach Spieler und ev. Spielfarbe
-Wie oft werden Bauern, Springer, Könige etc. gezogen
-Wie oft wird das Läuferpaar, das Springerpaar behalten
-Verteilung der Figurenkonfigurationen. Mit welcher Figurenkonfiguration z.B. wird am häufigsten gewonnen, verloren, remisiert.
- Wieviele Züge lang stehen welche Figuren durchschnittlich auf dem Brett

Partieparameter nach Eröffnung und Spieler und Spielerpaarung
- wieviele Partien werden im Mittelspiel, im Endspiel beendet
- wie schnell wird abgetauscht und ins Endspiel gewechselt
- wie oft wird geschlagen
- wir oft wird Schach geboten, Matt ausgespielt, aufgegeben,

Da könnte man noch viele Statistiken nennen, um Schachstrukturen von Schachprogrammen auf den Grund zu kommen.

Ist Statistik auf diesem speziellen Level durch CB oder CA (schon) möglich ?
Wo findet man eine möglichst genaue Beschreibung der Statistikfunktionen (ausser im Handbuch) ?

Gruß Rainer

Antworten:

Hi,

soweit ich weiß, gibt es von ChessBase eine Demoversion. Damit sollten sich alle Deine Fragen beantworten lassen.
Über ChessAssisten stand in der letzten CB ein Bericht (aber vorläufig ein Performance Vergleich).

Gruß
Chris

von Christian R. - am 24.06.2001 11:33
Ohne auf die Einzelheiten einzugehen: das kann heute noch kein Programm.
Statistisch ist von den Programmen Chess Assistant am besten, das heißt aber auch nur, dass man nach Partiedaten Statistiken erstellen kann, dafür aber dann nach allen denkbaren Kombinationen.
Vielleicht kann man mithilfe verschiedener Operationen im Einzelfall so Sachen auch hinbekommen, wenn, dann mit Chess Assistant.
Das einzige interessante im Statistikbereich bei ChessBase, was CA nicht hat, ist die Figurenverteilung nach Feldern.

Gruß, Martin

von Martin Schubert - am 24.06.2001 18:28
Wie gross wäre denn die zu analysierende Datenbank? Ich bin nämlich gerade dabei, sowas Ähnliches in meinem Programm einzubauen, allerdings nur zur Analyse des Eröffnungsbuches, d.h bei mir für weniger als 100'000 Stellungen, maximal vielleicht für eine Mio. Stellungen. Dabei lade ich einfach alles in den Arbeitsspeicher, was für 100'000 Stellungen ca. 8 MB ausmacht. Wenn Du also eine Million Partien mit einer durchschnittlichen Partielänge von 40 Zügen analysieren möchtest, bräuchtest Du mit meinem Programm dann etwa 6 GB RAM. Falls Du trotzdem Interesse hast, kann ich Dir das Programm ja mal geben, wenn alles eingebaut ist. Statistische Infos wie durschnittliche Partielänge usw. werden dabei natürlich nicht unterstützt, weil ich es ja zur Analyse des Eröffnungsbuches einsetze.

Rafael B. Andrist

von Rafael B. Andrist - am 25.06.2001 17:01
Christian R. schrieb:
>
> Hi,
>
> soweit ich weiß, gibt es von ChessBase eine Demoversion. Damit
> sollten sich alle Deine Fragen beantworten lassen.
> Über ChessAssisten stand in der letzten CB ein Bericht (aber
> vorläufig ein Performance Vergleich).
>
> Gruß
> Chris

Danke. Habe mir mitllerweile ChessBase light heruntergeladen.

Ein Bericht über CA 6 ist ja hier angekündigt. Da der Autor selbst statistisch interessiert ist, kommt vielleicht ausführlicheres :-)

Rainer

von Rainer Neuhäusler - am 25.06.2001 22:09
Rainer Neuhäusler schrieb:
>
> Christian R. schrieb:
> >
> > Hi,
> >
> > soweit ich weiß, gibt es von ChessBase eine Demoversion. Damit
> > sollten sich alle Deine Fragen beantworten lassen.
> > Über ChessAssisten stand in der letzten CB ein Bericht (aber
> > vorläufig ein Performance Vergleich).
> >
> > Gruß
> > Chris
>
> Danke. Habe mir mitllerweile ChessBase light heruntergeladen.
>
> Ein Bericht über CA 6 ist ja hier angekündigt. Da der Autor
> selbst statistisch interessiert ist, kommt vielleicht
> ausführlicheres :-)
>
> Rainer


Hi, Rainer!

Werde wohl hauptsächlich auf die Neuheiten eingehen. Und der Statistikmodus ist nicht mehr neu :-(
Also im großen und ganzen kannst Du folgendes machen beim CA: du kannst gucken, welche Kombination von Partiedaten wie oft vorkam bzw. wieviele Punkte geholt wurden.
Zum Beispiel kannst Du nach Spieler und Turnier suchen, dann bekommst Du eine Liste der Art:

Name Name Turnier Anzahl
Karpow Kasparow WM 96
Karpow Kasparow Linares 3
...
Fritz Junior BGN 26

So sieht das aus. Das kann man mit allen Kombinationen von Partiedaten machen, Du könntest also auch nach Jahr und ECO aufschlüsseln.
Beim Chess Assistant ist es aber auch nicht ganz so einfach, zu sagen, dass und das geht und das und das nicht. Weil man nämlich mit den Datenmengenoperationen, mit dem neuen Klassifikationssystem,usw. einiges anstellen kann.
Damit könntest Du Dir dann vielleicht einen Klassifier basteln und darüber eine Statistik drüber laufen lassen...
Direkt kann man so Sachen, wie Du willst jedenfalls nicht machen. Auch Varianz ist ein Fremdwort für die Datenbankprogramme.

Gruß, Martin

von Martin Schubert - am 25.06.2001 23:06
Martin Schubert schrieb:
>
> Ohne auf die Einzelheiten einzugehen: das kann heute noch
> kein Programm.
>
> Gruß, Martin

Erschütternde Nachricht :-( Ich dachte, die wären schon weiter. Datenbankmäßig beherrschte diese Selektionsstatistik schon die dBase-Syntax uner CPM bevor DOS-Microsoft überhaupt aufkreuzte.
In den Computerpartien läge der ganze Schatz der Differentialdiagnostik von Engines (Profildiagnose, repräsentative Stellungstests). Aber ohne die Auswahl und Parameterstatistik der Variablen ....

Hoffentlich gibt es über CA eine detaillierte Beschreibung der Statistikfunktionen oder/und eine Demo-Version :-)
Wer wollte diesen Artikel doch gleich noch schreiben ;-)

Gruß Rainer

von Rainer Neuhäusler - am 25.06.2001 23:14
Rafael B. Andrist schrieb:
>
> Wie gross wäre denn die zu analysierende Datenbank? Ich
> bin nämlich gerade dabei, sowas Ähnliches in meinem Programm
> einzubauen, allerdings nur zur Analyse des Eröffnungsbuches,
> d.h bei mir für weniger als 100'000 Stellungen, maximal
> vielleicht für eine Mio. Stellungen. Dabei lade ich einfach
> alles in den Arbeitsspeicher, was für 100'000 Stellungen ca. 8
> MB ausmacht. Wenn Du also eine Million Partien mit einer
> durchschnittlichen Partielänge von 40 Zügen analysieren
> möchtest, bräuchtest Du mit meinem Programm dann etwa 6 GB RAM.
> Falls Du trotzdem Interesse hast, kann ich Dir das Programm ja
> mal geben, wenn alles eingebaut ist. Statistische Infos wie
> durschnittliche Partielänge usw. werden dabei natürlich nicht
> unterstützt, weil ich es ja zur Analyse des Eröffnungsbuches
> einsetze.
>
> Rafael B. Andrist

Ich habe im Moment keine konkrete Datenbank im Auge. Wenn, dann eine mit den Enginematches der verschiedensten Hersteller: SSDF, ChessBits, @#$%&, User, soweit downloadbar.
Es ginge mir ja noch nicht um eine konkrete Auswertung, sondern darum, die statistischen Auswertungsmöglichkeiten von CB und CA zu sichten

Die Statisitk von Eröffnungen ist ja schon gut integriert in die Programme: Häufigkeit der Varianten, Gewinnwahrscheinlichkeit. Deshalb wäre es interessant zu wissen, was du darüber hinaus erfassen willst.

Wie ist die Oberfläche des Programms, welche Datenbanken werden untersucht, welche Eingabevariablen braucht es, was ist der Output ?

Gruß Rainer

von Rainer Neuhäusler - am 25.06.2001 23:48
Ich verwende CB 7.0, was den ersten Teil, mit Ausgabe der durchschnittlichen Zügezahl etc., ermöglicht. Die Verteilung der Zuglängen wird als Balkengrafik dargestellt (nicht jedoch die Varianz, die ich ehrlich gesagt auch nicht verstehe).

Das kann man für jedes Suchresultat machen, d.h. für einen bestimmten Spieler, Eröffnung, oder eine Kombination davon oder weiterer Suchkriterien.

Die weiteren Daten lassen sich zum Teil indirekt ermitteln, weil Sachen wie bestimmte Materialverteilungen oder Partielänge (Zügezahl) ebenfalls als Suchkriterien dienen können.

Man kann allerdings nicht gezielt z.B. die ganze Palette möglicher Figurenverteilungen auf einmal als Statistik abrufen. Ansatzweise erfüllen bei ChessBase die "Figurenaufenthalte" diese Anforderungen, wo man ein Zugfenster (von-bis) angibt; dann wird die Aufenthaltsdauer für jeden Figurentyp grafisch mit Balken auf einem 3D-Brett angezeigt. Es ist also nicht so, daß hier irgenwelche Zahlenkolonnen zur exakten statistischen Weiterverwertung geliefert werden.

Die Schachdatenbanken sind wohl (sinnvollerweise) mehr für die Bedürfnisse von Schachspielern verschiedenster Art ausgestattet, aber weniger für besonders anspruchsvolle Formen der Statistik. Ich bin auch nicht ganz sicher, ob damit wirklich ein Erkenntnisgewinn verbunden wäre (wenn man z.B. sieht, daß Crafty im Schnitt um 0,74 Züge früher ins Endspiel - wie auch immer das definiert wäre - gelangt als Junior, oder umgekehrt).

mfg.
M.Scheidl

von Michael Scheidl - am 26.06.2001 01:14
Rainer Neuhäusler schrieb:
>
> Martin Schubert schrieb:
> >
> > Ohne auf die Einzelheiten einzugehen: das kann heute noch
> > kein Programm.
> >
> > Gruß, Martin
>
> Erschütternde Nachricht :-( Ich dachte, die wären schon weiter.
> Datenbankmäßig beherrschte diese Selektionsstatistik schon die
> dBase-Syntax uner CPM bevor DOS-Microsoft überhaupt aufkreuzte.
> In den Computerpartien läge der ganze Schatz der
> Differentialdiagnostik von Engines (Profildiagnose,
> repräsentative Stellungstests). Aber ohne die Auswahl und
> Parameterstatistik der Variablen ....
>
> Hoffentlich gibt es über CA eine detaillierte Beschreibung der
> Statistikfunktionen oder/und eine Demo-Version :-)
> Wer wollte diesen Artikel doch gleich noch schreiben ;-)
>
> Gruß Rainer


Der Schreiber würde schon gerne die Statistikfunktionen im Einzelnen behandeln. Nur muss man dann ein Sonderheft "ChessBits Extra- Der neue Chess Assistant" herausgeben.
Jedenfalls denke ich, dass für Deine Zwecke der Chess Assistant am Besten geeignet ist, da er Dich am meisten unterstützen kann. Insbesondere das neue Classifier-Konzept steht auch erst am Anfang, da kann man wohl von Convekta noch einiges erwarten.

Gruß, Martin

von Martin Schubert - am 26.06.2001 07:29
Rainer Neuhäusler schrieb:
>
> Wie ist die Oberfläche des Programms, welche Datenbanken werden
> untersucht, welche Eingabevariablen braucht es, was ist der
> Output ?
>
> Gruß Rainer

Der primäre Zweck ist der, dass ich meine Positionsbewertung je nach Eröffnung etwas anpassen will, um bei einem vorzeitigen Verlassen des Buches entsprechend der gewählten Eröffnung weiterspielen zu können. Dazu analysiere ich das Eröffnungsbuch. Bis jetzt decken sich die so gewonnenen Daten mehr oder weniger mit dem, das ich intuitiv bereits so eingebaut habe.
Erfasste Daten (z.T. noch in Planung): Figurenaufenthaltsstatistik, div. von Dir erwähnte positionelle Merkmale (Läuferpaarlebensdauer), Zughäufigkeit (Start-/Zielfeld), Überlebensdauer bestimmter typischer Strukturen (wie lange steht auf diesem Feld ein Bauer und gleichzeitig auf einem anderen ein Springer und ...)

Input: Text (modifiziertes PGN)
Output: Text

Verarbeitung der Daten in Textform anschliessend mit einem kleinen VB-Programm.

Grüsse

Rafael B. Andrist

von Rafael B. Andrist - am 26.06.2001 12:39
Vielen Dank für die ehrliche Selbsteinschätzung und die informativen Angaben.
Zum Thema wir es noch viel zu sagen geben....

Gruß Rainer

von Rainer Neuhäusler - am 27.06.2001 15:17
Mir sind zwar deine Erhebungsziele immer noch nicht ganz klar, weil du von DEINER Positionsbewertung und nicht der der Programme sprichst, aber die Erhebungsmerkmale klingen gut. Wie du allerdings auf mehrere GB RAM kommen willst ist mir schleierhaft ?
Mit der Variablisierung von Positionsmerkmalen begibt man sich eigentlich schon in die "Geheimküche" der Programmierer bzgl. evaluation functions. Mit dieser Operationalisierung des Schachspiels haben aber die Nichtprogrammierer noch ihre Schwierigkeiten und sehen hierin eher unnütze statistische Spielereien.
Ich glaube, dass das eine falsche Einschätzung ist. Wenn man die Théron-Sprechstunde im Original liest, dann gibt es dafür einen interessanten Hinweis. Der sonst aufgeschlossene Christoph wurde auf einmal schweigsam, als es um das statistische Testsystem ging!
Wenn solche detaillierten Auswertungsmöglichkeiten in die Datenbanken eingebaut werden, dann werden sie m.E. des User liebstes Kind. Sie ermöglichen Einblick in die Struktur eines Programmes, wie es bisher noch nicht möglich war.

Wenn dein Programm einmal so weit ist, dann exemplifiziere das Ganze doch mal ganz konkret an Hand eines Beispieles mit Ergebnissen. Mit dem "was hinten rauskommt" ist der Aha-Effekt immer am größten. So wie es ausschaut kann man ja bald damit rechnen :-)

Gruß Rainer

von Rainer Neuhäusler - am 27.06.2001 16:04
Rainer Neuhäusler schrieb:
>
> Mir sind zwar deine Erhebungsziele immer noch nicht ganz
> klar, weil du von DEINER Positionsbewertung und nicht der der
> Programme sprichst, aber die Erhebungsmerkmale klingen gut. Wie
> du allerdings auf mehrere GB RAM kommen willst ist mir
> schleierhaft ?

Ich benutze es ganz egoistisch :-) zur Verbesserung meiner Positionsbewertung. Andere Zwecke sind für Dich vermutlich interessanter, aber für mich sekundär. Diese Auswertung für die Grössenordnung bis 100'000 Positionen gedacht. Alle Positionen werden zur Auswertung in den Arbeitsspeicher geladen, wobei die Information für eine Position 112 Byte beträgt. Falls Du damit eine Datenbank mit einer Million Partien analysieren möchtest (nur mal eine Annahme meinerseits) und die Partien durchschnittlich 40 Züge lang dauern (für Partien auf GM-Niveau vielleicht etwas zu optimistisch geschätzt, aber die interessanten Merkmale, die damit erfasst werden, sind ja auch nicht auf das Endspiel bezogen), dann bräuchtest Du mit meinem Analysetool 10^6 * 40 * 2 * 112 Byte RAM, was 8.345 GB entspräche.

> Wenn dein Programm einmal so weit ist, dann exemplifiziere das
> Ganze doch mal ganz konkret an Hand eines Beispieles mit
> Ergebnissen. Mit dem "was hinten rauskommt" ist der Aha-Effekt
> immer am größten. So wie es ausschaut kann man ja bald damit
> rechnen :-)

In ein oder zwei Monaten wird es wohl fertig sein - was natürlich nicht heisst, dass ich es dann nicht weiterentwickle.

Rafael B. Andrist

von Rafael B. Andrist - am 27.06.2001 18:52
>>Wie
> > du allerdings auf mehrere GB RAM kommen willst ist mir
> > schleierhaft ?

>... dann bräuchtest Du mit meinem
> Analysetool 10^6 * 40 * 2 * 112 Byte RAM, was 8.345 GB
> entspräche.
>
Ich meinte, wie du hardware- pc- speicherbankmäßig auf 8 GB RAM kommen möchtest ? Bist du Zeitreisender ?

Rainer

von Rainer Neuhäusler - am 27.06.2001 19:38
so schwer ist das nicht. auch heute schon durchaus machbar.

gruß
marcus

von marcus kästner - am 28.06.2001 07:56
marcus kästner schrieb:
>
> so schwer ist das nicht. auch heute schon durchaus machbar.
>
> gruß
> marcus

Sicher, Radioteleskope sehen auch weiter als Ferngläser !
Kommt halt drauf an, was es im Laden und mit Normalbudget zu kaufen gibt ;-)
Mit Asus&Co werden wir wohl auf 8 Gigabyte RAM noch ein Weilchen warten müssen.

Wäre aber trotzdem interessant zu wissen, was Hobbyisten so alles hintereinander- und parallel schalten, was Multiprozessorenanlagen an Speicher rekrutieren und was erst in den Großrechenanlagen und Forschungslabors der Stand des Speichers ist.

Gruß Rainer

von Rainer Neuhäusler - am 28.06.2001 22:51
Rainer Neuhäusler schrieb:
>
> >>Wie
> > > du allerdings auf mehrere GB RAM kommen willst ist mir
> > > schleierhaft ?
>
> >... dann bräuchtest Du mit meinem
> > Analysetool 10^6 * 40 * 2 * 112 Byte RAM, was 8.345 GB
> > entspräche.
> >
> Ich meinte, wie du hardware- pc- speicherbankmäßig auf 8 GB
> RAM kommen möchtest ? Bist du Zeitreisender ?
>

Du hast mich wohl ein bisschen missverstanden. Ich selbst analysiere ja nicht eine Mio Partien sondern 100'000 Positionen. Da braucht es natürlich nicht soviel Speicher. Die 8 GB wären notwendig, wenn Du das machen möchtest. Deshalb habe ich dort auch den Konjunktiv verwendet (siehe meine vorhergehenden Postings).

Rafael B. Andrist

von Rafael B. Andrist - am 29.06.2001 07:47
Zur Information:
MySnip.de hat keinen Einfluss auf die Inhalte der Beiträge. Bitte kontaktieren Sie den Administrator des Forums bei Problemen oder Löschforderungen über die Kontaktseite.
Falls die Kontaktaufnahme mit dem Administrator des Forums fehlschlägt, kontaktieren Sie uns bitte über die in unserem Impressum angegebenen Daten.