w***u 发帖数: 17713 | 1 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固
定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱
数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产
品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些
比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储
备,到时候可以放出绝招? |
h*********g 发帖数: 1812 | 2 调整各种经验值的权重
【在 w***u 的大作中提到】 : 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固 : 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱 : 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产 : 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些 : 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储 : 备,到时候可以放出绝招?
|
C**********e 发帖数: 23303 | 3 方法还有一些
比如可以分析对手的棋路采取对应方式
有的对手长于开局 有的中盘搏杀 有的收官 有的打劫 等等
都可以有相应的应对
说实话
计算机在无概率的棋类玩胜人类只是时间上的问题 |
c****t 发帖数: 5452 | |
w***u 发帖数: 17713 | 5 你说的是搜现有的谱。但是我们可以花时间搜可能性啊,这是超越现有知识和人脑能力
的可能性尝试。
【在 c****t 的大作中提到】 : 最基本的还是搜索,所以学习肯定得依靠于学谱
|
c****t 发帖数: 5452 | 6 肯定都可以搜啊,但是当然现有的谱信息量更大效率更高啊
【在 w***u 的大作中提到】 : 你说的是搜现有的谱。但是我们可以花时间搜可能性啊,这是超越现有知识和人脑能力 : 的可能性尝试。
|
b*******8 发帖数: 37364 | 7 让两台机器配上不同的参数对战,互相学习,类似遗传算法。 |
w***u 发帖数: 17713 | 8 这么搞,就得到个参数优化的系统。算是当前高手中的集大成者,还不算不落窠臼,发
明新招式的绝顶高手。这机器们能不能闭关几个月,跳出三界外呢?
【在 b*******8 的大作中提到】 : 让两台机器配上不同的参数对战,互相学习,类似遗传算法。
|
c*******5 发帖数: 216 | 9 什么时候计算机Texas holdem可以胜过人我就承认它聪明
【在 w***u 的大作中提到】 : 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固 : 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱 : 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产 : 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些 : 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储 : 备,到时候可以放出绝招?
|
n*l 发帖数: 1126 | 10 答案是有些可以提高有些不能,你得对AI/ML的概念有些基本了解才能理解
棋类游戏本质上是在可能解法空间里的搜索算法,但是围棋的牛X之处在于他的搜索空
间太大,而且权值的计算也很微妙,现有计算机的能力不可能遍历所有的分支来找到最
优解,只能搜一部分分支和有限的步数
新的算法具体怎么做的还不知道,从媒体报道上我理解在于使用deep network让这个搜
索过程更有效率,这就有点往人类下棋的方式靠的感觉。人下棋是靠大量训练之后的感
觉,看棋形的势决定怎么下,不会去穷举每一个可能下的点哪个最优。使用训练好的
deep network也可以快速搜索方向。
棋谱可以理解为经过人类总结的好训练样本,但是不是说只有棋谱可以用于优化参数,
一般对局也可以,计算机自己跟自己下也可以(这个样本数是无限的)。所以即使没有
棋谱,继续提高也是可能的,但不是无限的,取决于当前计算能力能够支持多复杂的模
型而不至于overfit。
【在 w***u 的大作中提到】 : 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固 : 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱 : 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产 : 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些 : 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储 : 备,到时候可以放出绝招?
|
w***u 发帖数: 17713 | 11 现在poker没有大投入的情况下,小程序和人类最高手谁强谁弱,在两可之间.要投钱下
去,搞死人是分分的事情,概率就别说了,不在一个层次上。现在你们人类不就拿那个
bluff来说你们人类多有个性,机器不善解人意。其实这玩意真不是那么牛B的东西。这
玩意人也就靠个运气,你们人类敢让概率run,拼上三百回合?
【在 c*******5 的大作中提到】 : 什么时候计算机Texas holdem可以胜过人我就承认它聪明
|
b*******8 发帖数: 37364 | 12 机器互搏,要小概率出错,类似人类滑鼠,好比DNA突变。然后双方继续下去,可能发
现更好的套路。 |
b*******8 发帖数: 37364 | 13 目的不光是为了参数优化,不同风格对战,可能融合交流发展出全新套路招数,相同参
数不可能研究到的。
【在 w***u 的大作中提到】 : 这么搞,就得到个参数优化的系统。算是当前高手中的集大成者,还不算不落窠臼,发 : 明新招式的绝顶高手。这机器们能不能闭关几个月,跳出三界外呢?
|