INVISIBLE Dojo. ーQUIET & COLORFUL PLACE-

John 8:32 Then you will know the truth, and the truth will set you free."  複数ブログの過去記事を移管し、管理の委託を受けています/※場合により、語る対象の「ネタバレ」も在ります。ご了承ください 

よく分からなくても楽しめる「人間vsコンピュータ」将棋対決の”感想戦”

http://news22.2ch.net/test/read.cgi/newsplus/1174576383/

197 :名無しさん@七周年 :2007/03/23(金) 05:57:29 id:TIyz7Ldv0
ボナンザの評価関数の各パラメーターは学習して最適化してるから人間が恣意的に与えたものじゃないよ。
ただ、評価関数として何を使うかは恣意的に選んでるようだから、そこを自動学習できたら今より強くなるだろうね。
遺伝的アルゴリズムで複数のコンピューターで対戦して勝率のいいコンピューターが生き残るようにしたら自動化できるかな。PS3あたりでやったら面白いだろうね。



224 :名無しさん@七周年 :2007/03/23(金) 09:51:22 id:oDiRrgIJ0
プロの感想
http://shogi-daichan.seesaa.net/article/36598176.html

具体的な説明は無いが、かなりボナンザを評価している。



254 :名無しさん@七周年 :2007/03/23(金) 14:07:19 id:dWxlJzkE0
PCで全部読みきらずに評価関数で局面をより正確に評価できれば良いが「駒割りも陣形も圧倒的に不利でも、細い攻めが続いて40手くらい先で寄せきれる」とかの局面を評価関数で判断きるのは、ブレークスルーが必要だとオモ
もちろん40手以上先まで全手数読めば良いのだけど、長年月掛るから無理っぽい



255 :名無しさん@七周年 :2007/03/23(金) 14:15:50 id:oifCWb4X0
べつに全局面調べ尽くすのが目標じゃないし。
トッププロを倒せばいいんだよ。5番勝負で1局くらい。
その事実だけで、人間様オワタと思わせるのに十分。
そしてそれは現時点でも可能なのだ。
イベントの入場料で、東工大スパコンを2時間借りれば良い



256 :名無しさん@七周年 :2007/03/23(金) 14:30:14 id:dWxlJzkE0
うん、人間はミスあるから5番勝負中で1局は可能だと思う
でも5番勝負を100回やったら100回とも竜王が勝つ
ボナンザが中盤で9手読めれば竜王に5回に1回勝てると思う
PCの完全な9手読みvs竜王の大局感(不完全な読みだが20手先の優劣を直観できる)
ボザンナも含めて最新の将棋プログラムは中盤で7手読みしてるらしい



257 :名無しさん@七周年 :2007/03/23(金) 14:30:35 id:FDpr2agD0
ボナンザの思考を表示させて観察してみたが、そこまで単純じゃ無さそうだよ。
だいたい、そんなに単純な思考しかしていないんだったら、詰め将棋以外できない。

ボナンザは全幅探索をしていると聞いたが、思考内容をみてみると、数秒でも10数手
ぐらい深いところまで読んでいる。つまり、全幅探索をしていると言っても、全ての手を
平等に掘り下げて読んでいるわけじゃなく、評価関数(?)で有力と判断した手を、
集中的に深く読んでいる模様。で、途中でうまく行かない変化が出てきたら、別の手を
探索する、という感じ。それを制限時間の許す限り、しらみつぶしにやっているように見える。

だから、わずかな思考時間でも、筋の良い手をさせるんだろうね。>ボナンザ

CPU性能が上がって、かつ、思考時間をたっぷりもらえたら、読みぬけが減る
ことになるな。あとは、評価関数の能力次第だね、良い手が指せるかどうかは。

> △3九龍の見落としは、読んでなかったわけじゃなく、評価を誤ったんだなぁ・・・
> ということを、ボナンザの思考を見ていて、思った。




358 :名無しさん@七周年 :2007/03/23(金) 23:11:11 id:vhbrwLg30
コンピューターの場合、序盤は膨大な棋譜で有利な方っつう考え方で手を進めて、終盤は詰め将棋の理論で如何に相手を押し切るかっつう方法論なんだろうと思うんだが、、問題の中盤に関してだね、、5手先、10手先を虱潰しに読んだとしても、その読んだ盤面の形を如何に得点化してチョイスするかっつうのが難しいんだろうね。一番ダメダメなのは、単に駒得だけで判断する場合。これだと、全体的な攻めの形が崩れてしまう場合がある。王を追いつめるのが本来の目的なのに、関係のない場所で駒を得ようとしてしまうからね。
だけど、10手先の自分の形について、どういう風になっているのが理想なのかっつうのをコンピューターに理解させるのは非常に難しい




444 :名無しさん@七周年 :2007/03/24(土) 18:30:33 ID:L2+hzaYl0
6x6のオセロの完全解が発見されたのが1993年(ちなみにどうあがいても後手の勝ち)。
その分岐数は、だいたい平均10個の指し手で32手あるから10の32乗。
で、未だに完全解が出ない8x8のオセロの分岐数は10の60乗。
未だにムーアの法則に従って上昇するPCの計算速度をもってしてもこの程度が読み切れない。
将棋は平均50個の指し手で100手あるとして…10の170乗!?

プロが勝てなくなる日は近いかもしれんが、完全解が発見されて将棋というゲームが成り立たなくなる日は来ないな。
つーかゲームとして成立している以上は、コンピュータに勝てなくなったところでプロの存在意義がないとは言えないのでは。
チェス業界もまだあるよな?知らんけどw



525 :名無しさん@七周年 :2007/03/25(日) 11:41:38 id:aWw4+RAF0
資料をあらためて読んだら、また分かったような分からんようなことがあるので覚書。
ボナンザの評価関数は、ものすごくざっくりいうと、以下の要素を見ているらしい。

・駒の損得
・囲いの堅さ
・形の良さ(機能的な駒の配置になっているか)
・駒の働き(駒が捌けているか、睨みを利かせているか)

こうして整理してみると、序盤と中盤を感覚よく指せるように意識している感じか。
しかし、「手番をどちらが握っているか」を重視する項目が無いんだね。
(実際にはあるんだろうけど。メインの要素じゃないんだろう)

これで△3九竜を軽視した理由が、なんとなくつながって見えてきた。

すべて羽生善治の受け売りでいうと、ざっくり、終盤は以下の要素が重要。
1.手番をどちらが握っているか
2.玉はあと何手で詰むか
3.何の駒を渡すと詰まされるか
4.何の駒を手放すと詰まなくなるか

# 2〜4は自分・相手両方の視点。

これらの要素で計算して、一直線のスピード争いで勝てるなら、踏み込むのが良いし、
勝てそうにないなら、曲線的な手を指して「ぼやかす」のが良い。

この辺の計算は人間にもコンピュータにもとても難しいと思う。
たぶん、ボナンザも苦手なんだろう。それで負けたか・・・課題なんだろうね



594 :名無しさん@七周年 :2007/03/25(日) 20:14:14 id:UPmD9OT+0
ゲーム終了までの全局面を網羅できれば無敵だろうが、
全幅探索することとゲーム終了までの全局面を網羅することは違う

むしろ全幅探索するからこそ、読み切れる手数は限られてくる
浅い手数を読みきっただけで深い手数まで読んでる人間には敵わない

もちろん、無限に近い時間をコンピューターに与えてやれば、
いつかは全局面を網羅することに辿り着くだろうけど
少なくとも人間との対局には制限時間がある。
(人間はたった100年すら待ってられない)

全局面が網羅できない状況の中で、暗中模索しながら手を進めていくしかないわけだが手を進める基準になる、対局途中の(終局していない)盤面の評価の仕方は、人間によって予め与えられている



635 :名無しさん@七周年 :2007/03/26(月) 08:52:18 id:bY4D6FjF0
将棋プログラムが難しい理由
局面評価関数の精度が望むべくもない。

1.将棋は大逆転がある(一手バッタリ)
囲碁やチェスと比べると圧倒的に生じる。
途中大差でも1手違いで終わる為、最後にミスした方が負け(とまでは言えないが)。
Q1)終盤に先手が大逆転した場合は、後手のミスがあったからか?
Q2)後手のミスがなく逆転が生じたならば、局面判断で既に先手が有利だった筈。

2.中盤では離れ駒(死に駒)の微妙な位置の違いが、最終局面で効いてきて詰みに繋がる事が良くある。
Q1)このケースで先手が勝つ場合、後手のミスがあった為か?

3.現在の将棋プログラムは最終盤の1手隙争いは数十手を完全に読みきる。
「詰めろ逃れの詰めろ」とかを確実に指してくる。
ポイントは手隙争い以前の局面での局面評価関数。

4.ただ、これは人間側にも言えるわけで、神様レベルと比べると、圧倒的に低レベルで人間とコンピュータが争っている現状か。

5.角落ち将棋は徹底的に研究され尽くして神様レベルに達していると言われている。
Q1)本当は如何か?
人間が想起しない無駄と思われる手が終盤で効いてきて勝ちになる筋が無数に未発見ではないのか?
Q2)人間が敗勢と判断して切捨てた局面が、実はギリギリ繋いでいて逆転勝ちになる筋はないのか?

6.局面評価関数の形勢判断が大きく上下するのは、最善手を刺せていない為か?
互いに最善手を指して局面判断が上下するのは、当初の局面判断が正確でない為。局面評価関数の精度が望むべくもないのが現状。