由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 请教一下搞机器学习的
相关主题
说白了,狗狗alpha就是剽窃了东亚人的知识和智慧高考由于强烈的竞技性
我有一招,可能战胜阿法狗如果唐骏的名片能加个真博士的话,多少古人要从坟墓中爬出来改简历啊
围棋体现了中华文明的高度,我们的崛起是必然的王岐山为避嫌家中做饭待老友
排行榜第一的手机象棋游戏,喜欢的不要错过奇书《变局策》横空出世 (转载)
弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能《变局策》:乱世奇书,革命良谋
理论上什么样的棋类是人类思维dominate AI的呢?王岐山自言对习心服口服 愿做保皇党
棋类压根就不是什么真正的智力活动年轻的金正恩同志担任一个社会主义国家的最高领...
难怪google的围棋软件能击败樊麾近来习皇上修仙,引发热议
相关话题的讨论汇总
话题: 机器话题: 学习话题: 人类话题: 棋谱话题: 能力
进入Military版参与讨论
1 (共1页)
w***u
发帖数: 17713
1
现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固
定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱
数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产
品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些
比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储
备,到时候可以放出绝招?
h*********g
发帖数: 1812
2
调整各种经验值的权重

【在 w***u 的大作中提到】
: 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固
: 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱
: 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产
: 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些
: 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储
: 备,到时候可以放出绝招?

C**********e
发帖数: 23303
3
方法还有一些
比如可以分析对手的棋路采取对应方式
有的对手长于开局 有的中盘搏杀 有的收官 有的打劫 等等
都可以有相应的应对
说实话
计算机在无概率的棋类玩胜人类只是时间上的问题
c****t
发帖数: 5452
4
最基本的还是搜索,所以学习肯定得依靠于学谱
w***u
发帖数: 17713
5
你说的是搜现有的谱。但是我们可以花时间搜可能性啊,这是超越现有知识和人脑能力
的可能性尝试。

【在 c****t 的大作中提到】
: 最基本的还是搜索,所以学习肯定得依靠于学谱
c****t
发帖数: 5452
6
肯定都可以搜啊,但是当然现有的谱信息量更大效率更高啊

【在 w***u 的大作中提到】
: 你说的是搜现有的谱。但是我们可以花时间搜可能性啊,这是超越现有知识和人脑能力
: 的可能性尝试。

b*******8
发帖数: 37364
7
让两台机器配上不同的参数对战,互相学习,类似遗传算法。
w***u
发帖数: 17713
8
这么搞,就得到个参数优化的系统。算是当前高手中的集大成者,还不算不落窠臼,发
明新招式的绝顶高手。这机器们能不能闭关几个月,跳出三界外呢?

【在 b*******8 的大作中提到】
: 让两台机器配上不同的参数对战,互相学习,类似遗传算法。
c*******5
发帖数: 216
9
什么时候计算机Texas holdem可以胜过人我就承认它聪明

【在 w***u 的大作中提到】
: 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固
: 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱
: 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产
: 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些
: 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储
: 备,到时候可以放出绝招?

n*l
发帖数: 1126
10
答案是有些可以提高有些不能,你得对AI/ML的概念有些基本了解才能理解
棋类游戏本质上是在可能解法空间里的搜索算法,但是围棋的牛X之处在于他的搜索空
间太大,而且权值的计算也很微妙,现有计算机的能力不可能遍历所有的分支来找到最
优解,只能搜一部分分支和有限的步数
新的算法具体怎么做的还不知道,从媒体报道上我理解在于使用deep network让这个搜
索过程更有效率,这就有点往人类下棋的方式靠的感觉。人下棋是靠大量训练之后的感
觉,看棋形的势决定怎么下,不会去穷举每一个可能下的点哪个最优。使用训练好的
deep network也可以快速搜索方向。
棋谱可以理解为经过人类总结的好训练样本,但是不是说只有棋谱可以用于优化参数,
一般对局也可以,计算机自己跟自己下也可以(这个样本数是无限的)。所以即使没有
棋谱,继续提高也是可能的,但不是无限的,取决于当前计算能力能够支持多复杂的模
型而不至于overfit。

【在 w***u 的大作中提到】
: 现在那两台围棋机器,自我提高的能力还有多少?他们的能力上限,在机器硬件能力固
: 定的情况下,是不是局限于对旧有棋谱的学习上?我们知道,新谱产生的速率对于旧谱
: 数量来说基本可以为零,那他们可不可以互相对弈学习(考虑到这是两台不同公司的产
: 品)?还是他们的水平基本被困住在当前水平上了,只有等新算法加入?现在可否跑些
: 比赛没时间进行的高深度搜索,积攒些这世界上从没达到过知识,然后存起来做知识储
: 备,到时候可以放出绝招?

w***u
发帖数: 17713
11
现在poker没有大投入的情况下,小程序和人类最高手谁强谁弱,在两可之间.要投钱下
去,搞死人是分分的事情,概率就别说了,不在一个层次上。现在你们人类不就拿那个
bluff来说你们人类多有个性,机器不善解人意。其实这玩意真不是那么牛B的东西。这
玩意人也就靠个运气,你们人类敢让概率run,拼上三百回合?

【在 c*******5 的大作中提到】
: 什么时候计算机Texas holdem可以胜过人我就承认它聪明
b*******8
发帖数: 37364
12
机器互搏,要小概率出错,类似人类滑鼠,好比DNA突变。然后双方继续下去,可能发
现更好的套路。
b*******8
发帖数: 37364
13
目的不光是为了参数优化,不同风格对战,可能融合交流发展出全新套路招数,相同参
数不可能研究到的。

【在 w***u 的大作中提到】
: 这么搞,就得到个参数优化的系统。算是当前高手中的集大成者,还不算不落窠臼,发
: 明新招式的绝顶高手。这机器们能不能闭关几个月,跳出三界外呢?

1 (共1页)
进入Military版参与讨论
相关主题
近来习皇上修仙,引发热议弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能
google推出,dell打算撤退理论上什么样的棋类是人类思维dominate AI的呢?
中國造雙模多點觸控屏電腦問世棋类压根就不是什么真正的智力活动
春节不能和家人一起过年,难怪google的围棋软件能击败樊麾
说白了,狗狗alpha就是剽窃了东亚人的知识和智慧高考由于强烈的竞技性
我有一招,可能战胜阿法狗如果唐骏的名片能加个真博士的话,多少古人要从坟墓中爬出来改简历啊
围棋体现了中华文明的高度,我们的崛起是必然的王岐山为避嫌家中做饭待老友
排行榜第一的手机象棋游戏,喜欢的不要错过奇书《变局策》横空出世 (转载)
相关话题的讨论汇总
话题: 机器话题: 学习话题: 人类话题: 棋谱话题: 能力