D*******r 发帖数: 2323 | 1 先说被让子棋,假设在被让四子的时候,它是定位终局要赢40-60目为目标来下呢?还
是以终局就是按人类的被让四子赢棋为目标(终局贴还两子)来下呢?如果是按后者,
那么18狗让13狗四子有很大的水分在里面,因为13狗认为被让四子已经很大优势了,它
就会走很多缓手,那么18狗只要算路比13狗在深一点再广一点,就很容易追上来。
再说让子,让四子的阿法狗是先以保持局面不落后40-60目为目标来做形势判断吗?如
果不是,岂不是上来就发现胜率不足10%就要认输了?或者要发疯胡乱下了?如果是先
保持落后不超过40目,那么在什么阶段开始调整目标?因为让子棋最终要赢还得是按黑
贴两子能赢。它是在固定多少手后调整目标?还是在差距缩小到什么范围的时候调整目
标?比如说先以落后不超过40目为目标,等差距缩小到35目的可能性超过75%时,它再
以差距不超过30目为目标,依此类推。 |
T****g 发帖数: 705 | |
g***n 发帖数: 14250 | |
T****g 发帖数: 705 | 4
这招估计写代码的不一定考虑到,哈哈。
【在 g***n 的大作中提到】 : 死扛不许认输,不就行了
|
D*******r 发帖数: 2323 | 5 在胜率低于多少的时候认输,或者死都不认输,这都很好改。问题是在胜率很低的时候
改怎么调整下棋的策略,这点很难。这次阿李五番棋就让人能看出,阿九段在执黑时不
如执白时下得好。阿九段的棋力不至于说多贴了一目或者两目就会成为巨大负担,而是
因为在它判断胜率低于50%的时候,它的策略有缺陷,导致下出的棋质量下降。
【在 g***n 的大作中提到】 : 死扛不许认输,不就行了
|
s***u 发帖数: 80 | 6 40-60目为目标是不可能的,那样的value network要重训练。
【在 D*******r 的大作中提到】 : 先说被让子棋,假设在被让四子的时候,它是定位终局要赢40-60目为目标来下呢?还 : 是以终局就是按人类的被让四子赢棋为目标(终局贴还两子)来下呢?如果是按后者, : 那么18狗让13狗四子有很大的水分在里面,因为13狗认为被让四子已经很大优势了,它 : 就会走很多缓手,那么18狗只要算路比13狗在深一点再广一点,就很容易追上来。 : 再说让子,让四子的阿法狗是先以保持局面不落后40-60目为目标来做形势判断吗?如 : 果不是,岂不是上来就发现胜率不足10%就要认输了?或者要发疯胡乱下了?如果是先 : 保持落后不超过40目,那么在什么阶段开始调整目标?因为让子棋最终要赢还得是按黑 : 贴两子能赢。它是在固定多少手后调整目标?还是在差距缩小到什么范围的时候调整目 : 标?比如说先以落后不超过40目为目标,等差距缩小到35目的可能性超过75%时,它再 : 以差距不超过30目为目标,依此类推。
|
D*******r 发帖数: 2323 | 7 不需要重新训练啊。假设让四子同样棋力的阿法狗对弈几千万局,黑最后领先40目以上
的机率是50%就相当于,让四子贴还40目是合理的贴目数。所以,只是最终的目标值变
了,而value network还是按照以前training的来,才能下出和不让子时一样棋力的棋。
当然,作为下让子棋,这个目标值随着棋局的变化要动态调整,就是说某目标值的胜率
达到某个比例后,就要调整目标。比如说,作为让子方,75%的几率不会落后40目的时
候,就把目标调为不落后35目,等到75%的几率不落后35目时,就把目标调为不落后30
目。
作为被让子方时,开始就当对方和自己棋力一样来下,所以目标是要赢40目,当对方追
赶上来以后,赢40目的机率只有35%的时候,就把目标下调为赢35目,赢35目机率不到
35%时,就再下调为赢30目。
【在 s***u 的大作中提到】 : 40-60目为目标是不可能的,那样的value network要重训练。
|
c****e 发帖数: 60 | |
a******s 发帖数: 4052 | |
D****y 发帖数: 2207 | 10 这招在写代码的这里有个专用名词叫作边界测试
【在 T****g 的大作中提到】 : : 这招估计写代码的不一定考虑到,哈哈。
|
|
|
b*******8 发帖数: 37364 | 11 不公测,就是故意制造阴谋论,怪不得别人认为18K疯狗很容易被复制,只要多下几盘
。 |
h*h 发帖数: 27852 | |
D*******r 发帖数: 2323 | 13 人类啥算法?
【在 h*h 的大作中提到】 : 让子棋当然是按人类的算法
|
h*h 发帖数: 27852 | 14 人类让4子棋是怎么算的?黑必须赢30-40目吗?
【在 D*******r 的大作中提到】 : 人类啥算法?
|
D*******r 发帖数: 2323 | 15 但是人下让子棋不会上来就觉得这里亏点没事儿,那里亏点没事儿,反正还有40目优势
呢。
【在 h*h 的大作中提到】 : 人类让4子棋是怎么算的?黑必须赢30-40目吗?
|