如果真的上战场，怎么训练模型？ - Programming版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 如果真的上战场，怎么训练模型？

相关主题
● 计算和学习根本就是两回事	● 怎样在cygwin里安装老的gcc版本？
● 围棋人工智能Deep Learning就是在玩数学	● 让你们看看国内学计算机的师弟都在想什么 (转载)
● Deep Learning/Machine Learning 对传统优化问题，可能做的更好吗？	● 因为不会单词悲剧了!
● Reinforcement Learning的思想精髓是什么？	● 哪位大侠用过bootstrap wysiwyg editor
● Question about learning C#	● 什么库能做这个功能？
● Re: 这里有人做p2p的么?	● 大家有什么比较推荐外行用的front end framework 比如bootstrap？
● 问一个随机排列的问题.	● 有没有好的 bootstrap 工具推荐
● 正看一本叫code complete的书，有一句话关于c不明白	● angular是否淘汰jquery了

相关话题的讨论汇总
话题: biubiubiu话题: ai话题: 训练话题: 战场

进入Programming版参与讨论

(共1页)

w***g
发帖数: 5958

所谓出奇制胜。怕是没有操星际那么容易。
让AI学孙子兵法，然后transfer learning?

h**c
发帖数: 1979

If(target.isEnemy) then biubiubiu

C*****l
发帖数: 1

其实有些大国之间都是预设战场，比如法德之间，不知道纸上演习了多少次，德国一战
用施里芬计划，二战换了曼施坦因计划，AI做纸上预演完全有可能，指挥全面战争还早
，变量太多。Ai直接使用，用在局部比如空战海战更有可能。这些场景都有充足的数据。

【在 w***g 的大作中提到】

: 所谓出奇制胜。怕是没有操星际那么容易。
: 让AI学孙子兵法，然后transfer learning?

w*****r
发帖数: 197

reinforcement learning直接对胜进行优化，奇或不奇都尽在掌握。在无限算力面前，
rl对人施行的是残暴的降维打击

f******2
发帖数: 2455

是的，所有策略型，board game型游戏现在人类基本就是被Google搞出来的这个方案全
面碾压。
一些类似五子棋一样的board game好像deep net都不需要，就是mdp和q function就够了

: reinforcement learning直接对胜进行优化，奇或不奇都尽在掌握。在无限算力
面前，

: rl对人施行的是残暴的降维打击

【在 w*****r 的大作中提到】

: reinforcement learning直接对胜进行优化，奇或不奇都尽在掌握。在无限算力面前，
: rl对人施行的是残暴的降维打击

x****u
发帖数: 44466

rf是用回放数据训练的

【在 w*****r 的大作中提到】

: reinforcement learning直接对胜进行优化，奇或不奇都尽在掌握。在无限算力面前，
: rl对人施行的是残暴的降维打击

x****u
发帖数: 44466

用历史数据学习

【在 w***g 的大作中提到】

: 所谓出奇制胜。怕是没有操星际那么容易。
: 让AI学孙子兵法，然后transfer learning?

w*****r
发帖数: 197

你说的那叫bootstrapping

【在 x****u 的大作中提到】

: rf是用回放数据训练的

r****t
发帖数: 10904

bootstrapping 是说的 random sample with replacement 那种 bootstrapping 吗？

【在 w*****r 的大作中提到】

: 你说的那叫bootstrapping

x****u
发帖数: 44466

bootstraping指的是人类参与，就算电脑自己瞎折腾也一样需要回放

【在 w*****r 的大作中提到】

: 你说的那叫bootstrapping

相关主题
● 问一个随机排列的问题.	● 让你们看看国内学计算机的师弟都在想什么 (转载)
● 正看一本叫code complete的书，有一句话关于c不明白	● 因为不会单词悲剧了!
● 怎样在cygwin里安装老的gcc版本？	● 哪位大侠用过bootstrap wysiwyg editor
进入Programming版参与讨论

w*****r
发帖数: 197

统计我不太懂，也许高人会认为它们抽象的是一个东西。
我说的是RL里面的booststrapping

【在 r****t 的大作中提到】

: bootstrapping 是说的 random sample with replacement 那种 bootstrapping 吗？

g****t
发帖数: 31659

从一些原则出发进行训练机器人。例如勇敢，忠诚

C*****l
发帖数: 1

experience replay，deepmind的早期的DQN就要用这个了，以为的经验会进一个pool，
然后随机sample一些出来做训练

【在 w*****r 的大作中提到】

: 统计我不太懂，也许高人会认为它们抽象的是一个东西。
: 我说的是RL里面的booststrapping

C*****l
发帖数: 1

DM星级2联赛里面就保留了各种风格的AI，有的就是微操好，有的注重发展经济。

【在 g****t 的大作中提到】

: 从一些原则出发进行训练机器人。例如勇敢，忠诚

L****8
发帖数: 3938

仿真训练不可能用真实数据没有那么多

【在 w***g 的大作中提到】

: 所谓出奇制胜。怕是没有操星际那么容易。
: 让AI学孙子兵法，然后transfer learning?

(共1页)

进入Programming版参与讨论

相关主题
● 哪位大牛简单说说compiler里的bootstrap是干啥用的？	● Question about learning C#
● Yaml css	● Re: 这里有人做p2p的么?
● Linus Torvalds: Java A Horrible Language - YouTube	● 问一个随机排列的问题.
● replace document body,but js does not run	● 正看一本叫code complete的书，有一句话关于c不明白
● 计算和学习根本就是两回事	● 怎样在cygwin里安装老的gcc版本？
● 围棋人工智能Deep Learning就是在玩数学	● 让你们看看国内学计算机的师弟都在想什么 (转载)
● Deep Learning/Machine Learning 对传统优化问题，可能做的更好吗？	● 因为不会单词悲剧了!
● Reinforcement Learning的思想精髓是什么？	● 哪位大侠用过bootstrap wysiwyg editor

相关话题的讨论汇总
话题: biubiubiu话题: ai话题: 训练话题: 战场

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天