Diese Seite mit anderen teilen ...

Informationen zum Thema:
Forum:
ChessBits-Computerschachforum
Beiträge im Thema:
5
Erster Beitrag:
vor 15 Jahren, 9 Monaten
Letzter Beitrag:
vor 15 Jahren, 9 Monaten
Beteiligte Autoren:
Gerhard Sonnabend, Dr. M. Gourevitch, HJS

Shredder 5.32(Dual) im BS-2001-Test

Startbeitrag von Gerhard Sonnabend am 19.08.2001 09:48

Hier das Ergebnis von Shredder 5.32 (CB) als "Deep-Version" im neuen BS-Test.

PC: Dual-P3-800MHz / 256MB HTs / 4Steiner-TBs

1. Gelöst in 200s / 12
2. Gelöst in 81s / 12
3.-6. > 900s.
7. Gelöst in 2s / 9
8. Gelöst in 25s / 14
9. Gelöst in 5s / 13
10. Gelöst in 57s / 12
11.+12. > 900s.
13. Gelöst in 63s / 12
14. Gelöst in 133s / 11
15. Gelöst in 2s / 12
16. Gelöst in 576s / 21
17.-21. > 900s.
22. Gelöst in 66s / 12
23.-27. > 900s.
28. Gelöst in 776s / 22
29.+30. > 900s.

Also 12 Lösungen.

Eine ELO-Auswertung spare ich mir, da dass bei solchen Tests nur
Zahlenroulette ist.

Gruß G.S.
Computerschach Corner

Antworten:

Alles ist relativ

Die ELO-Auswertungen für Stellungstests dienen natürlich lediglich als Vergleichszahlen innerhalb des Tests bzw. der Thematik. Z.B. ist die "BS-Wertungszah/ELO" demnach selbstverständlich nicht identisch mit der SSDF-ELO, die wiederum selbst ihre spezifischen Eigenheiten besitzt und nicht gleichzusetzen ist mit den menschlichen ELO-Zahlen. Dementsprechend ist im Computerschachsektor strenggenommen jede ELO-Auswertung überflüssig. Trotzdem sind ELO-Auswertungen interessant und nützlich, solange man sie nicht überbewertet und nur als Mosaikstein aller verfügbaren Daten betrachtet. Deshalb erscheinen mir die ELO-Auswertungen mit den oben ausgeführten Einschränkungen und Anmerkungen für Stellungstests und auch für einzelne Turniere durchaus für sinnvoll. Ansonsten brauchst Du einen Test eigentlich gar nicht erst durchzuführen, wenn Du die daraus entstehenden Resultate sowieso für sinnlos erachtest. Die Aussagekraft eines Tests oder eines Turniers für den Gesamteindruck zur Spielstärke eines Programms ist immer relativ und alleingenommen aufgrund unendlicher individueller Faktoren wie verwendete Hardware, Bedenkzeit und nicht zuletzt den reinen Zufall, sehr begrenzt. Im Verbund, die Addition aller verfügbaren Daten (Tests, Turniere, Partien) auf allen Plattformen und Disziplinen ermöglicht erst ein objektives Gesamtbild. Demnach, z.B. nach allen mir vorliegender "Mosaiksteinchen" diverser Veranstaltungen auf den unterschiedlichsten Rechnern, komme ich zu dem objektiven Schluss, das der Tiger 14 wohl das derzeit ausgewogenste und spielstärkste erhältliche Programm sein muss, wenngleich mir persönlich Junior 7 wegen des flotten, verwegenen Spielstils besser gefällt. Doch das ist rein subjektiv und entspricht nicht den vorliegenden Datenmaterial.

von HJS - am 20.08.2001 05:32

Falsch verstanden !

...
Ansonstenbrauchst Du einen Test eigentlich gar nicht erst durchzuführen,
> wenn Du die daraus entstehenden Resultate sowieso für sinnlos
> erachtest.
...

S o habe ich dies ja garnicht geschrieben !
Mich interessieren die Vergleich schon, aber in der Art:
Programm X hat 12 Stellungen gelöst, Programm Y deren 14.
Aber daraus und aus den unterschiedlichen Lösungszeiten eine Wertungszahl
abzuleisten - ich weiss nicht ?!

Gruß G.S.
Computerschach Corner


von Gerhard Sonnabend - am 20.08.2001 08:41

Re: Falsch verstanden !

Hallo Gerhard,

ist es nicht interessant, in welchem Fall Deep Fritz mit GLEICHER Lösungszahl (14 aus 30) auf Dual oder bei Single PIII besser aussieht?
Du willst NUR wissen, wie viel Stellungen Programme X und Y lösen.
Aber Du könntest wesentlich mehr Informationen aus einem Test haben: Z.B. wie ändert sich die Analysefähigkeit (Stärke) Deiner Programm, wenn Du meinetwegen statt PIII ein AMD TB 1,4 benutzt. Möglicherweise bleibt die LQ ohne Änderung und AMD ist in einigen Aufgaben sogar langsamer. Willst Du Zeitfaktor ignorieren?

Gruß
Michael

von Dr. M. Gourevitch - am 20.08.2001 11:20

Re: Falsch verstanden !

Hallo !
...
> ist es nicht interessant, in welchem Fall Deep Fritz mit
> GLEICHER Lösungszahl (14 aus 30) auf Dual oder bei Single PIII
> besser aussieht?
...

Selbstverständlich !

...
> Du willst NUR wissen, wie viel Stellungen Programme X und Y lösen.
> Aber Du könntest wesentlich mehr Informationen aus einem Test
> haben: Z.B. wie ändert sich die Analysefähigkeit (Stärke)
> Deiner Programm, wenn Du meinetwegen statt PIII ein AMD TB 1,4
> benutzt. Möglicherweise bleibt die LQ ohne Änderung und AMD ist
> in einigen Aufgaben sogar langsamer. Willst Du Zeitfaktor ignorieren?
...

Ich drücke mich jetzt mal einfach anders aus:
Wenn ein Prog X eine Aufgabe in z.B. 30sec. löst, dann ist es für mich total egal
ob Programm Y nun 20sec. oder 40sec. oder 2min. dafür braucht.
Bis auf 0,00001% Ausnahme würde das Programm Y den "gesuchten" Zug
nämlich ebenfalls in einer "echten" Partie spielen. (Ausser vielleicht im
Superblitz).
Der Test als solcher ist selbstredend interessant, nur muss man nicht mit
irgendwelchen konstruierten Formeln versuchen daraus eine Wertungszahl abzuleiten. (Meine Meinung)
Möglicherweise habt Ihr das ja nur gemacht, weil es das Publikum so haben will ?

Gruß G.S.
Computerschach Corner


von Gerhard Sonnabend - am 20.08.2001 19:14
Zur Information:
MySnip.de hat keinen Einfluss auf die Inhalte der Beiträge. Bitte kontaktieren Sie den Administrator des Forums bei Problemen oder Löschforderungen über die Kontaktseite.
Falls die Kontaktaufnahme mit dem Administrator des Forums fehlschlägt, kontaktieren Sie uns bitte über die in unserem Impressum angegebenen Daten.