Diese Seite mit anderen teilen ...

Informationen zum Thema:
Forum:
ChessBits-Computerschachforum
Beiträge im Thema:
8
Erster Beitrag:
vor 16 Jahren
Letzter Beitrag:
vor 16 Jahren
Beteiligte Autoren:
Eduard Nemeth, Ingo Bauer, Dr. M. Gourevitch, Dieter Bürßner, HJS, Andreas Schwartmann

GS 2930: Frage zu Position 13

Startbeitrag von Andreas Schwartmann am 21.05.2001 16:58

Ich habe heute folgende Email erhalten, die sich mit Position Nr. 13 des GS 2930 Test auseinandersetzt. Offenbar findet Deep Blue Jr. eine bessere Fortsetzung, aber ich kann das nicht abschließend beurteilen. Vielleicht hat ja HJS eine Idee?

Anbei die Mail von Murray Campbell vom IBM TJ Watson Research Center:


Andreas,

I have been using the GS 2930 test suite to estimate the rating for the
Deep Blue system. This is for use in a paper we are preparing. I
downloaded the test suite from your web site. There are three problems
that the system does not solve in 20 minutes. One of them in particular,
#13, is not solved even for very deep searches. The given move is Bxg7,
but Deep Blue Jr. gives a different move that has a somewhat higher score
than Bxg7. The PV follows. Do you have any opinion on this? Thank you.

Regards,

Murray

Rh5 Qc2 Qe7 Qb2 Ne5 Rc1 g4 Rf1 Kf1 Qb1 Kg2 Qe4 Kh3 Qb1 Rf5 Qf1 Kh4 Qg2 h3
Qa8 Rf7 +1.49

Antworten:

Re: DER WM-2930 TEST !

Andreas Schwartmann schrieb:
>
> Ich habe heute folgende Email erhalten, die sich mit
> Position Nr. 13 des GS 2930 Test auseinandersetzt. Offenbar
> findet Deep Blue Jr. eine bessere Fortsetzung, aber ich kann
> das nicht abschließend beurteilen. Vielleicht hat ja HJS eine
> Idee?
>
> Anbei die Mail von Murray Campbell vom IBM TJ Watson Research
> Center:
>
>
> Andreas,
>
> I have been using the GS 2930 test suite to estimate the rating
> for the
> Deep Blue system. This is for use in a paper we are
> preparing. I
> downloaded the test suite from your web site. There are three
> problems
> that the system does not solve in 20 minutes. One of them in
> particular,
> #13, is not solved even for very deep searches. The given move
> is Bxg7,
> but Deep Blue Jr. gives a different move that has a somewhat
> higher score
> than Bxg7. The PV follows. Do you have any opinion on this?
> Thank you.
>
> Regards,
>
> Murray
>
> Rh5 Qc2 Qe7 Qb2 Ne5 Rc1 g4 Rf1 Kf1 Qb1 Kg2 Qe4 Kh3 Qb1 Rf5 Qf1
> Kh4 Qg2 h3
> Qa8 Rf7 +1.49

Hallo!

Ich habe 'mal aus dem GS 2930 Test (also den jeweiligen Partien!) 14 Varianten a la ChessBits-Test erarbeitet (!) und natürlich damit getestet. Den Test benannte ich WM-2930-Test. Da ich schon zuvor einen WM-Test (gleiche Bedingungen) kreiert hatte, so war hier der Titel WM-2930 durchaus zutreffend, da es ja ebenfalls um die 14 (damalige) Weltmeister ging.

von Eduard Nemeth - am 21.05.2001 18:34

DEEP BLUE TESTET SPIELSTÄRKE!

Hallo Andreas und alle anderen.

>Andreas Schwartmann schrieb:
>
> Ich habe heute folgende Email erhalten:>
> Anbei die Mail von Murray Campbell vom IBM TJ Watson Research
> Center:

> Andreas,
>
> I have been using the GS 2930 test suite to estimate the rating
> for the
> Deep Blue system. This is for use in a paper we are
> preparing. ....... (weiter siehe Originalposting)

Da ich keinerlei Schachzeitschrift angehöre oder mit irgendeiner Schachprogramm-Firma verbunden bin darf ich hier munter drauflosspekulieren:

IBM benutzt also den GS 2930 um die Spielstärke festzustellen damit sie es in einem "paper" zu verwenden. Die Übersetzung von "paper" lautet in abnehmender Wahrscheinlichkeit: Papier / Brief / Veröffentlichung (?).
Zuesrt ist interessant das endgegen anderslautenden Veröffentlichungen doch noch ein funktionierender Deep Blue existiert. Wenn ich jetzt nachdenke warum IBM jetzt plötzlich den schon bekannten GS2930 Test benutzt um die Spielstärke ihres Rechners/Programms zu testen kommt mir eigentlich nur ein Gedanke in den Sinn.
IBM ist vor einiger Zeit gefragt worden ob sie nicht gegen Kramnik antreten wollen. Dies wurde angeblich abgelehnt (Habe hier auch nur Infos aus zweiter Hand, habe nie ein Statement von IBM direkt gelesen). Könnte es sein das IBM sich überlegt hat das dies ein publicityträchtiges Unternehmen sein könnte? Also hollen sie mal das olle Ding aus dem "Keller" und wollen mal sehen wie es sich im Vergleich zu heutigen Engines schlägt. Sollte es etwas taugen (darauf lassen die "nur drei Ungelösten" Stellungen) schließen wird man ein Papier veröffentlichen in dem es heist das man im Oktober gerne gegen KRamnik antreten würde. Was wäre dann? Das schöne Match Fritz - Junior wäre erstmal für die Katz gewesen (obwohl ein bischen Werbung gab es ja schon ...). Deep Blue könnte wohl kaum drei Monate vorher Kramnik zur Verfügung gestellt werden deswegen bin ich sicher das dieses Detail dann unter den Tisch fallen würde.

Tja bleibt nur noch zu hoffen das die E-Mail nicht gefakt ist.

BTW: Was das neue Deep Blue Team da bemängelt findet Deep Shredder nach 37 Minuten. Ich mußte leider einmal unterbrechen deswegen die gestückelte Analyse (53 Min + 36Min) DS bleibt bei seinem Zug.

Engine: Deep Shredder
by Stefan Meyer-Kahlen

11.01 2:54 +0.88 1.Nd2 Bd6 2.Ne4 Bxh2+ 3.Kh1 f5 4.Ng5 Qc6 5.Qe6+ Qxe6 6.Nxe6 Rfe8 7.Nxg7 Re2 8.Kxh2 Rxb2 9.Nxf5 (30.742.601) 176.5
12.01 7:22 +0.89 1.Nd2 Rcd8 2.Qg4 f6 3.Qe6+ Rf7 4.Rc1 Bc5 5.Ne4 Rxd5 6.Qxd5 Nb7 7.Rd1 Qf4 8.Qe6 (78.040.210) 176.3
13.01 21:10 +0.73 1.Nd2 Rcd8 2.Qg4 f6 3.Qe6+ Rf7 4.Rc1 Bc5 5.Ne4 Rxd5 6.Qxd5 Qd7 7.Qh5 Nb3 8.Rd1 (221.098.760) 173.9
13.02 37:58 +0.74++ 1.Bxg7 Kxg7 2.Ne5 Rfd8 3.Qg4+ Kf8 4.Nd7+ Rxd7 5.Rxd7 Qc4 6.Qh5 a6 7.Qh8+ (407.172.076) 178.7
best move: Bb2xg7 time: 53:16.567 min n/s: 178.954 CPU 96.4% nodes: 572.037.826

9.01 0:01 +1.09 1.Bxg7 Kxg7 2.Ne5 Rfd8 3.Qh5 Bxa3 4.Nd7 f6 5.Rd4 Bc1 6.Rg4+ Bg5 7.Nxf6 Kxf6 8.Qh6+ Bxh6 (152.690) 142.5
10.01 0:09 +1.08 1.Bxg7 Kxg7 2.Ne5 Rfd8 3.Qh5 Bf6 4.Qg4+ Kf8 5.Nd7+ Rxd7 6.Rxd7 Qc4 7.Qh5 Nc6 8.Rfd1 Kg8 9.Qh6 (1.597.412) 171.1
11.01 0:33 +0.89 1.Bxg7 Kxg7 2.Ne5 Rfd8 3.Qg4+ (5.738.274) 169.0
12.01 2:43 +0.89 1.Bxg7 Kxg7 2.Ne5 Rfd8 3.Qg4+ (27.239.300) 167.1
best move: Bb2xg7 time: 36:18.683 min n/s: 180.398 CPU 95.1% nodes: 393.029.871
Freudig erregt
Ingo die alte Klatschtante

von Ingo Bauer - am 21.05.2001 19:45

Re: DEEP BLUE TESTET SPIELSTÄRKE!

Sehe gerade noch das IBM das ganze Deep Blue Jr. Nennen könnte sich also um abgespeckte Hardware mit einem anderen (verbessertem?) Programm handeln!

Der komplette Absender der E-Mail lautet übrigen:

Murray Campbell
IBM TJ Watson Research Center
Yorktown Heights, NY 10598
914-945-2942, mcam@us.ibm.com

Sieht gut aus. Wäre doch etwas für die Recherche der Redaktion!!!!!!!

Ingo

PS: An ergebnissen wäre ich interessiert. Sowohl im Heft als auch vorher ;-)

von Ingo Bauer - am 21.05.2001 19:50
Nach Th5 steht Weiß sicherlich auch besser, doch ein konkreter Gewinn ist nicht in Sicht. "Die weißen Figuren haben eine ideale Anordnung, aber vordergründig gibt es nichts konkretes." schreibt Kasparow zu der Situation vor Lxg7. Nach Kxg7 2. Se5 "Weiß steht hervorragend!" wieder Kasparow. Im Zweifelsfall sollte das Urteil von Weltmeistern wohl ausschlaggebend sein. Sxg7 scheint mir auch zwingender und direkter zu sein als Th5.
Ich gebe jedoch zu, das die Aufgabe nicht so klar und eindeutig ist, wie wir ursprünglich dachten und wünschten.

von HJS - am 21.05.2001 20:55
> Nach Th5 steht Weiß sicherlich auch besser, doch ein konkreter Gewinn ist nicht in Sicht.

Ist denn ein komkreter Gewinn nach Bxg7 in Sicht? Mit Yace kann ich diesen selbst 5 Züge später und nach 2 Stunden Bedenkzeit nicht sehen.

Ich hatte mir schon vor einiger Zeit wirklich sehr viele Varianten in dieser Stellung angesehen. Der Grund war, dass Yace 0.23 diese Stellung anscheinend löste, während Yace 0.99 den Zug nicht mehr findet.

Nach alle dem, was ich mir angesehen habe, komme ich zu dem Schluss, dass diese Stellung für kein Schachprogramm taktisch lösbar ist. Ich glaube, die Stellung ist denkbar ungeeignet für eine Testsuite mit relativ wenigen Stellungen. Ich kann an ein paar Parametern in meiner engine herumschraben, und die Lösung erscheint, oder sie erscheint auch nicht. Ich glaube, diese Art von Stellung ist durchaus zum Testen von engines geeignet, aber nur dann, wenn wirklich viele solcher Stellungen vorliegen. Ansonsten, ist es meiner Ansicht nach reine Glückssache. Im Endeffekt, wird das bessere Programm, öfters Glück haben. Aber bei genau einer solcher Stellung, sehe ich das kritisch.

Meine aktuelle Version von Yace bevorzugt nach langer Analyse auch Th5.

Übrigens, auch die Stellung 12 finde ich relativ kritisch. Kleine Änderungen, nur bei den Materialwerten können in meinem Programm dazu führen, dass die Stellung sehr schnell gelöst wird (weniger als 10 Sekunden) oder auch gar nicht. Ich habe keinen Zweifel daran, dass die kommerziellen Programme deutlich tiefer sehen, aber auch hir schein mir der Glücksfaktor für eine Testsuite mit relative wenigen Stellungen viel zu gorß. Würde mich aber auch gerne eines besseren belehren lassen - z.B. dur wirklich eindeutige Bewertungen und HVen einiger Programme.

Grüße,
Dieter

von Dieter Bürßner - am 23.05.2001 02:58
Hallo Dieter !

Ich bin nur ein Amateurspieler, aber ich glaube dass Lxg7 objektiv nicht gewinnt.
Ích glaube dass Portisch irgendwo gepatzt hat.

Ich bin gerne bereit (egal gegen wen auf der Welt) diese Position auf Fernschach-
Ebene mit schwaz zu spielen (also nach Lxg7) !

Garry wäre mir am liebsten.:-) :-) ... ich glaube dass ich Remis halte.

:hot:

Gruß,
Eduard

von Eduard Nemeth - am 23.05.2001 14:02
Ich möchte mich Herrn Murray Campbell vom IBM für sein Interesse zum GS-Test bedanken. Die Popularität unseres Testes in der Schachwelt überzeugt uns, ihn mit den neuen, korrekten und schwierigen Stellungen aus der WM-Praxis in der nächsten Zeit zu erweitern!

Ich habe festgestellt, dass beide Gewinnmöglichkeiten in der Aufgabe 13 (1. Lxg7! vom Kasparov und
1. Th5! vom Murray Campbell) Zwillinge sind. Nach 1. Th5! Tfe8 (eine natürliche Antwort!) folgt wieder 2. Lxg7!! Kxg7 3.Se5 u.s.w. (s. Kasparovs Hauptvariante!). D.h., schlägt ein Programm Th5,
sieht es auch den Gewinn mit Lxg7.

Wie schon vor kurzem erwähnt wurde, haben wir unser GS-2930 in GS 99-Test umbenannt und seine Formel korrigiert, damit ELO-Zahl nicht 2800 überschreitet!

Viele Grüße
Dr. Michael Gourevitch Aachen

von Dr. M. Gourevitch - am 23.05.2001 15:16
Zur Information:
MySnip.de hat keinen Einfluss auf die Inhalte der Beiträge. Bitte kontaktieren Sie den Administrator des Forums bei Problemen oder Löschforderungen über die Kontaktseite.
Falls die Kontaktaufnahme mit dem Administrator des Forums fehlschlägt, kontaktieren Sie uns bitte über die in unserem Impressum angegebenen Daten.