|
M*******p 发帖数: 5626 | 2 新浪上面有一个香港大学教授写的辩解文章,可以稍微看一下,如果属实,百度这次干
的有点操之过急。
汤晓鸥:百度并没有“作弊” 吴韧工作令人钦佩
本文原载于2015年6月18日,科学网刘志峰博客
ImageNet国际计算机视觉挑战赛(ILSVRC)主办方近日发表公开信宣布百度在
ImageNet测试过程中,违反了测试服务器的使用规则,超过了每周2次的提交。 国外技
术媒体纷纷借机报道,ZDNet报道百度在超算比赛中作弊,MIT Technology Review 则
评论百度制造了人工智能首例作弊丑闻。国内舆论一片哗然,关于百度的讨论甚嚣尘上
。随后,百度解除了深度学习研究院杰出科学家吴韧的职务。
ImageNet国际计算机视觉挑战赛(ILSVRC) 是什么? 百度做了什么?
吴韧博士吴韧博士
Imagenet ILSVRC 全称是ImageNet Large Scale Visual Recognition Challenge
(大规模视觉识别挑战赛),包括“图像分类和物体检测”这两项不同的比赛,从2010
年开始每年举办一次。从2012年开始,深度学习被应用到大规模视觉识别挑战赛中。比... 阅读全帖 |
|
h***e 发帖数: 2823 | 3 能确定不是copy非死不可或者狗狗的吗?
一看到标榜自主知识产权的,下意识的感觉是偷的。都让欢喜一场空给搞出来习惯了 |
|
|
|
p***e 发帖数: 183 | 6 吴韧博士,不就是那个因imagenet竞赛违背规则,被百度解雇的科学家吗? |
|
l*****i 发帖数: 20533 | 7 根据内容,这不是跟风,而是基本同时起步的研究。相关开发者之前就是做这方面的。
希望这不假。
人工智能必然是下一阶段产业革命的重点,中国不能再次落后。 |
|
|
c******n 发帖数: 16403 | 9 扯淡, 都承认是nature文章出来之后, 他们才开始做的。 |
|
l*****i 发帖数: 20533 | 10 看了一下,说违背规则,其实就是百度在竞赛中用了比别人更多次的学习,于是虽然最
后实际成绩的确更好,但是被判无效。这简直就是中国人死读书的一贯逻辑在人工智能
上的延续嘛:我不求自己学习方式(这里等同于计算机深度学习算法,也就是学习方法
了)比你更合理更有效,只要我花更多时间,最后把你赢过就行了。而老外要求的是大
家花同样时间学习,最后比比学习结果,但目的是分出谁的学习方式更好。这种中外思
路上的差异,我看比这个比赛判违规本身更让人难受。何况还有诚信的问题。 |
|
c******n 发帖数: 16403 | 11 我老估计是这样: 随便copy了一个最简单的模型, 买通了个所谓的职业棋手背书下超
快棋。 第一盘故意输一下企图吸引注意力, 然后让子胜挽回面子和留下台阶 |
|
e********9 发帖数: 444 | 12 David Silver大概10年前读博期间开始围棋相关研究。
不过,现在开始也有后发优势。对相关技术也是推进。看有没有几个人静下下来做了。
百度是基本照抄的,不是也不错嘛。 |
|
p***e 发帖数: 183 | 13 其实主要被罚的原因不是比别人更多次的学习,而是利用不停测试testing set来作
parameter sweep(调参数),这样做说得重一点就是一种作弊。关键是百度的研究团
队其实知道这一点,所以他们注册了很多账号来做这件事。当然啦,最后解雇吴韧可能
就是找个人背锅,所以也不能说就是他一个人的错。但是我看到正好提到他,又在这种
时刻,不免想着出来做个注脚。 |
|
|
|
c****t 发帖数: 5452 | 16 你是说overfitting吗, 现在结合大数据所谓深度学习根本不在乎,或者说简直就是在故
意overfitting |
|
x********e 发帖数: 35261 | 17 这就是不要脸的炒作
棋渣明确表示没答应任何人机比赛 |
|
|
|
w*******d 发帖数: 59 | 20 不是overfitting,模型都是放在训练集上训练好后再放在测试集上测试。百度这么做
,相当于把测试数据也拿来训练模型,然后又放到测试集上测试。等于是作弊 |
|
n******r 发帖数: 4455 | 21 各种ML study的一个主要目的就是如何尽量避免overfit
故意overfit简直不知道如何说好 |
|
n******r 发帖数: 4455 | 22 我以为做题库这个比方恰当
run test set相当于考试,公平情况下每人考一次比分数
百度的情况是考了几次取个最高分,是违规但是不到偷看考试答案那个地步
如果是把test set data偷回去研究才叫偷看答案 |
|
m**m 发帖数: 5500 | 23 吴现在在湾区搞个startup是吧?好像和iot有关。 |
|
b******r 发帖数: 1137 | 24 就是in sample, out sample |
|
|
|
|
w*******d 发帖数: 59 | 28 要按他那个实验次数,早把正确答案试出来了……就算是傻子,让他答无限次也能答对
……对于稍微聪明的人和偷看答案没区别…… |
|
r******n 发帖数: 4522 | 29 相当于先进去考的人抄题目出来帮后面的人build题库。国内考那些资格认证早就这么
干了。严格意义上说新东方也是同类。 |
|
d*******o 发帖数: 107 | 30 做题的比方不对,应该是这样:
考试试卷固定,100到4选1选择题,每人可以提交3份答案,取得分最高的。
结果百度先提交一份都选a的,看一下得多少分,然后再改几个答案提交一份,一直刷
刷刷提交答案,等着试出一个得分最高的。。。
这。。。 |
|
m****u 发帖数: 3915 | 31 看上面的说法百度相当于自己搞了GRE的题库
通过注册多个账号去考试,对测试题库猜出来个大概,然后下次考试同样的题目肯定领
先啊 |
|
|
|
|
c*****t 发帖数: 10738 | 35 什么玩意儿,恐怕还需要现招程序员来抄google paper吧。 |
|
w**a 发帖数: 3510 | 36 碰瓷的。
[在 longtian (有人的地方,就有江湖) 的大作中提到:]
:不知道是什么情况,呵呵 |
|
|
|
V****n 发帖数: 651 | 39 拾人牙慧,全无创建。难怪连HP女CEO和拜登这种烂人都看不起中国人。 |
|
|
|
|
k*******r 发帖数: 355 | 43 脸书不会再在黑暗森林上增加投入了。谷歌算法都已公开,再照别人的路子走下去,就
沦为异构神机,百度之流了,脸书还是要保持高大上的形象的。现在是谷歌得了一分,
脸书要扳回来,还是在虚拟现实上搞出一个逆天的东西才行 |
|
s*****V 发帖数: 21731 | 44 阿发狗不一定最牛,异构神机,百度狗什么的就快出来了,中国就擅长于干这个。 |
|
|
|
|
|
D*******r 发帖数: 2323 | 49 三月到十月,又是半年时间,阿九再涨四子的棋力的话。。。
古力微博:三天的工作愉快而艰辛,感慨最深的是人工智能令人咋舌的进步速度(冷汗
)。我一直担忧,是当它们有足够的自我意识时,人类会被统治,灭亡。莫非只有到了
濒临绝境的时候,人性的光辉才能得到体现!愿一切都是杞人忧天,珍惜当下。
古力的微博颇有深意(在见识过人机大战以后,还能让古力再次咋舌并冒冷汗?),难
道古力花了三天时间去做“人奸”去了,陪AI练了三天棋?是陪的异构神机?还是陪的
阿九? |
|
M*******p 发帖数: 5626 | 50 应该就是那个异构神机,几个月前不让子已经能打败不“好好”下的职业棋手了,这段
时间再长个几段估计没问题。 |
|