s*******u 发帖数: 1855 | 1 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps.
N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep
cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为
什么花钱搞这个东东?如果没有kinect,谁知道ps?
很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便
一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出
来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic
paper,我给你我全部伪币.
这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中
一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
快detect,好像还没有任何solution.也许有>linear的算法,但是没有任何nb至极的算法
,公推nb大了.
类似,给定depth cam,告诉你里面有人,是你,知道你的一切数据(身高,臂长,etc),虽然
也比较难(walmart多半没戏),但是一个nb点的tech公司,都应该搞得定(老任肯定搞得定
).
但是,support所以可能的人,大人,孩子,男人,女人,胖,瘦,高,矮,怀孕,等等,这个难度
高多了.kinect也许有缺陷(孕妇支持不晓得如何),但是论支持受众的广度,绝对不是竞
争者搞得定的.说kinect的简单的,看看sony的对手产品吧,不值一晒.sony是比walmart
还差吗?
还有,tracking要花多少时间?xbox不能不干别的,只做tracking.skeleton tracking要
做到相比较电影的frame rate,同时花尽量少的xbox资源,这个难度比单纯一个research
problem难多了.
一句话,如果kinect是100mile,dep cam最多10-20mile,后面80-90mile都是ms的.ms虽然
很多比较烂,这个credit还是不能剥夺的.
当然,还没上市,谁也不知道如何,说成功太早.但是,说walmart也搞得出来,笑死懂行的
人.
业界这么多公司,如果apple跟google铁心砸钱搞,也许投上50-100人+1-2年(后起自然容
易,如果他们第一个做,没有2-3年没戏),有戏.还只是tracking一块,他们没有console,
有了skeleton tracking也是白搭.有console的Nintendo,sony,看看他们能搞出什么竞
争产品吧,我不觉得他们3年内赶得上. | t*******s 发帖数: 8 | 2 re
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| Q*K 发帖数: 3464 | 3 well said
people with engineering sense know how hard to convert something to real
product
kinect should be a great product
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| d********u 发帖数: 5383 | 4 我觉得你的技术文章比拟在篮球版的垃圾文章靠铺的多...比好虫强的不是一点半点...
不管是技术还是篮球.
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| t*********l 发帖数: 566 | 5 说的有点过了。
vision界的牛人是有数的,说别家要做那么久才能做出来,有点夸张。。。
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| P***P 发帖数: 1387 | 6 你应该了解一下intel research那里的工作 | s*******k 发帖数: 57 | 7 for non-technical people, check out Times "The 50 Best Inventions of 2009"
Kinect is ranked 5th, slightly ahead of "Teleportation". This sayas
something about the technology.
http://www.time.com/time/specials/packages/completelist/0,29569,1934027,00.html | v*****r 发帖数: 1119 | 8 君子一言,驷马难追, 你说的给全部的伪币
99年IEEE的一篇paper:
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=819585
Video motion capture using feature tracking and skeleton reconstruction
This paper appears in: Image Processing, 1999. ICIP 99. Proceedings. 1999
International Conference on
Issue Date: 1999
On page(s): 232 - 236 vol.4
Meeting Date: 24 Oct 1999 - 28 Oct 1999
Location: Kobe , Japan
Print ISBN: 0-7803-5467-2
References Cited: 11
INSPEC Accession Number: 6514320
Digital Object Identifier: 10.1109/ICIP.1999.819585
Date of Current Version: 06 August 2002
Abstract
In the domain of computer vision, there exists a very wide application for
the research of human motion capture. This paper proposes a new approach to
do motion capture in video. It is composed of image sequence based tracking
of human feature points and the reconstruction of three dimension (3D)
motion skeleton. First, we track every part of human body from top to bottom
on the basis of a human model. The Kalman filter and a morph-block
similarity algorithm based on subpixel are used. Then we do camera
calibration using the line correspondences between the 3D model and the
image. Finally the 3D motion skeleton is established by using the model
knowledge. This approach does not aim at a given mode of human motion.
Rather, it analyzes large motion from frame to frame in complex, variational
background, and sets up a 3D motion skeleton under the perspective
projection. We also present the experimental result at the end of the paper
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| t*****s 发帖数: 2933 | 9 睁啥争,有本事的,自己弄出个类似的东东,paper都是gp, 拿出真东西来才硬道理.
【在 v*****r 的大作中提到】 : 君子一言,驷马难追, 你说的给全部的伪币 : 99年IEEE的一篇paper: : http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=819585 : Video motion capture using feature tracking and skeleton reconstruction : This paper appears in: Image Processing, 1999. ICIP 99. Proceedings. 1999 : International Conference on : Issue Date: 1999 : On page(s): 232 - 236 vol.4 : Meeting Date: 24 Oct 1999 - 28 Oct 1999 : Location: Kobe , Japan
| W***i 发帖数: 9134 | | | | A*********l 发帖数: 2005 | 11 I think LZ means using depth sensing camera to achieve the goal.
Just from the abstract, it doesn't look it is using depth sensing camera.
Beside, the effort difference for a research paper vs. real product are huge
. I have seen so called excellent professor doing shit in engineering stuff.
【在 v*****r 的大作中提到】 : 君子一言,驷马难追, 你说的给全部的伪币 : 99年IEEE的一篇paper: : http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=819585 : Video motion capture using feature tracking and skeleton reconstruction : This paper appears in: Image Processing, 1999. ICIP 99. Proceedings. 1999 : International Conference on : Issue Date: 1999 : On page(s): 232 - 236 vol.4 : Meeting Date: 24 Oct 1999 - 28 Oct 1999 : Location: Kobe , Japan
| v*****r 发帖数: 1119 | 12 depth sensing camera 不就是3D camera的更fancy的名称,新马甲而已。
LZ 可说的明明白白,找到09以前的academic paper, 给全部的伪币,我找的这篇99年
的应该match吧。
LZ 如果信守诺言的话,50个包子我一个不留,全发。 大家帮忙起起哄,前50个都有包
子,呵呵,当然要等LZ给我转账以后
huge
stuff.
【在 A*********l 的大作中提到】 : I think LZ means using depth sensing camera to achieve the goal. : Just from the abstract, it doesn't look it is using depth sensing camera. : Beside, the effort difference for a research paper vs. real product are huge : . I have seen so called excellent professor doing shit in engineering stuff.
| s*******u 发帖数: 1855 | 13 你要是能找到一个09年前的关于dep cam做skeleton tracking的academic | s*******u 发帖数: 1855 | 14 i do not think 3D camera = depth camera.
If you can provide strong evidence that 3D camera = depth camera, and most
ids here agree with you, I won't
mind to send you all my baozi.
【在 v*****r 的大作中提到】 : depth sensing camera 不就是3D camera的更fancy的名称,新马甲而已。 : LZ 可说的明明白白,找到09以前的academic paper, 给全部的伪币,我找的这篇99年 : 的应该match吧。 : LZ 如果信守诺言的话,50个包子我一个不留,全发。 大家帮忙起起哄,前50个都有包 : 子,呵呵,当然要等LZ给我转账以后 : : huge : stuff.
| v*****r 发帖数: 1119 | 15 呵呵,就是觉得你那句话说的太大,包子免了。
我不是搞 CV 的,有没有搞这个专业的同学来给 clarify 一下。
【在 s*******u 的大作中提到】 : i do not think 3D camera = depth camera. : If you can provide strong evidence that 3D camera = depth camera, and most : ids here agree with you, I won't : mind to send you all my baozi.
| l****t 发帖数: 36289 | | z**u 发帖数: 118 | 17 http://scholar.google.com/scholar?
hl=en&q=%22depth+camera%22+skeleton+tracking&btnG=Search&as_sdt=
100000000000000&as_ylo=&as_vis=
0
随便找找,就有好多
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| k*********t 发帖数: 2999 | 18 depth cam used here is not based on 3D stereo, but some kind of IR light
pattern, similar to the "Time of flight" sensors that use IR directly
without the pattern.
There are a number of papers in recent years using Time of flight sensors
for motion capture/human body tracking.
【在 v*****r 的大作中提到】 : 呵呵,就是觉得你那句话说的太大,包子免了。 : 我不是搞 CV 的,有没有搞这个专业的同学来给 clarify 一下。
| z***e 发帖数: 5393 | 19 我7年前搞过一点CV. 那时候印象中并没有depth camera的说法,但是存在3D camera,
当时比较有趣的是用两个以上camera的图像来计算3D信息,我认为这和现在专门提出来
的depth camera应该不同。
【在 v*****r 的大作中提到】 : 呵呵,就是觉得你那句话说的太大,包子免了。 : 我不是搞 CV 的,有没有搞这个专业的同学来给 clarify 一下。
| o*******p 发帖数: 722 | 20 如果6B中任何一个,还要你尽
快detect,好像还没有任何solution.也许有>linear的算法,但是没有任何nb至极的算法
,公推nb大了.
I think this is completely impossible solely based on skeleton tracking. But
why is this needed on Kinect? You have 6B people in your family?
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| | | j*****e 发帖数: 11116 | 21 替ms默哀 将来会不会变成一个纯游戏或者以游戏娱乐为主的公司……
mobile搞不过别人,search,online也搞不过别人…… | w****a 发帖数: 186 | 22 从首页看见这篇文章,来参加技术讨论。
首先,要得到3D depth有好几种方式:
(1) stereo camera:用两个平行放置的摄像头来采集一对图像,计算图像中沿着水平线
的视差
(disparity),然后来计算3d depth。这种方法计算量很大(速度慢),精度也不太稳定
,所以离
家庭中的实用还很远;
(2) structured lighting:这种方法是用一个光源投出各种预先设计好的图案到物体上
,根据
投射后看到的图案来估计物体的三维结构。PrimeSense的camera应该是属于这种,它用
左边的一
个红外投影仪每秒投出几十个structured pattern,再用右边的红外摄像机来采集、分
析图像,
计算出3维深度图。这种方法很适合封闭环境下的短距离的成像,比如说家庭里;速度
也很快,每秒
30帧,精度也不错。
(3) 3d scanning: 这种方法用一束红外激光在三维空间中扫描,根据反射光的相位变
化来计算到
点的三维距离,这种方式也可以叫做Time-of-Flight。这种方法分辨率低,速度慢,不
适合实时的
应用。
Kinect选择PrimeSense是有道理的,这种成像方式最适合家庭里的动作识别。这三种方
式的技术
都有一段历史了,说CV界没有相关的研究就武断了。当然能够进入家庭实用的产品,比
如Prime
Sense的出现是5年内,但它的竞争对手之一3DV(也是以色列的一家startup)出现的更早
。3DV被
微软买下来了,然后就被干掉了,这也是防止竞争的一种方式。PrimeSense给MS的
licensing不
是独占的,也就是说其他公司可以用同样的技术来做不同的应用,比如遥控电视什么的。
PrimeSense的camera生成的是每秒30帧的depth map,从中需要识别出人的三维运动、
进而控制
游戏。这里面最重要的算法应该是blob detection and tracking,然后才是human
skeleton tracking。blob是说深度比较类似的一小块区域,每个人被分割成多个blob
,根据
blob的三维位置和方向,可以进一步拟合人的三维位置和运动。跟踪人的运动常见的
model是joint
model,把人的运动简化成关节的运动,关节来驱动骨架。算法流程是depth map
generation -
> blob detection and tracking -> human segmentation -> human motion
tracking -> game control,还是比较复杂的一个过程。
PrimeSense也提供一个SDK,我没有看过SDK里面到底有什么(因为要钱,好像是9千刀一
份),但
我听说里面有blob detection and tracking。我估计微软做得应该是human
segmentation and motion tracking。这只是猜测了。不知道有谁在MS的Applied
Science组,肯定知道更多的信息。传说中的Johnny Lee就在这个组了。
ps.
dep
【在 s*******u 的大作中提到】 : 见到无数人把功劳归给prime sense,而不给ms,笑掉大牙.depth cam也不是只有一家ps. : N个月前就至少3家了,现在估计M家都有了.而且depth cam的原理并不复杂,搞出一个dep : cam,绝对不是什么别人干不了的事.为什么开始只有ps做了?因为没有什么应用,别人为 : 什么花钱搞这个东东?如果没有kinect,谁知道ps? : 很多人啥都没看,也不是学cv跟ml的,就觉得从depth cam到kinect是举手之劳,好像随便 : 一个大学生都做得到.事实上,cv界根本没有这方面的相关research,因为dep cam刚刚出 : 来而已.你要是能找到一个09年前的关于dep cam做skeleton tracking的academic : paper,我给你我全部伪币. : 这个做过cv跟ml的都知道,最难的就是未定集合的大小.一幅人物画,告诉你是两个人中 : 一个,随便谁都搞得定.告诉你1000人中一个,就比较难了.如果6B中任何一个,还要你尽
| n**p 发帖数: 1150 | 23 admire..
【在 w****a 的大作中提到】 : 从首页看见这篇文章,来参加技术讨论。 : 首先,要得到3D depth有好几种方式: : (1) stereo camera:用两个平行放置的摄像头来采集一对图像,计算图像中沿着水平线 : 的视差 : (disparity),然后来计算3d depth。这种方法计算量很大(速度慢),精度也不太稳定 : ,所以离 : 家庭中的实用还很远; : (2) structured lighting:这种方法是用一个光源投出各种预先设计好的图案到物体上 : ,根据 : 投射后看到的图案来估计物体的三维结构。PrimeSense的camera应该是属于这种,它用
| t******a 发帖数: 1200 | 24 补充一点,根据小道消息,kinect 里的3d tracking 除了来自 PrimeSense 的
一部分外,基本上买自 GestureTek, 欢迎知情人士否定。kinect 里的纯 MSR 自产
技术就是 speech recognition 和 face recognition 了.
还看到有人把 Nintendo 不买 PrimeSense 和雅虎当年不买 Google 相比,认为
这一决定只能说明 MSFT 的精明和 Nintendo 的二。但这两件事的性质是截然不同
的。Yahoo 当年如果买了 Google 的话别的公司就不能买了,MSFT license (非独占性
license) PrimeSense 后,PrimeSense 还可以随时把相关技术卖给任何竞争对手。
严格的说,MSFT 现在的做法和 Yahoo 当年对 Google 的做法同出一辙,都是图省
钱搞个非独占 license 而不是买断某项技术或买下整个公司.
另外 PrimeSense 的 reference design 里应该是有 skeleton tracking 这一块
的,参见下面链接的最后一张截图。
http://www.primesense.com/?p=487
http://www.primesense.com/?p=515
【在 w****a 的大作中提到】 : 从首页看见这篇文章,来参加技术讨论。 : 首先,要得到3D depth有好几种方式: : (1) stereo camera:用两个平行放置的摄像头来采集一对图像,计算图像中沿着水平线 : 的视差 : (disparity),然后来计算3d depth。这种方法计算量很大(速度慢),精度也不太稳定 : ,所以离 : 家庭中的实用还很远; : (2) structured lighting:这种方法是用一个光源投出各种预先设计好的图案到物体上 : ,根据 : 投射后看到的图案来估计物体的三维结构。PrimeSense的camera应该是属于这种,它用
| t******a 发帖数: 1200 | 25 Also look at this -
http://www.gesturetek.com/pdfs/printer_friendly/3D_depth_tracker_pf.pdf
So I think if the kinect market is BiG, Nintendo/Wal-Mart can build
something similar quickly by licensing technologies from PrimeSense
and GestureTek.
【在 t******a 的大作中提到】 : 补充一点,根据小道消息,kinect 里的3d tracking 除了来自 PrimeSense 的 : 一部分外,基本上买自 GestureTek, 欢迎知情人士否定。kinect 里的纯 MSR 自产 : 技术就是 speech recognition 和 face recognition 了. : 还看到有人把 Nintendo 不买 PrimeSense 和雅虎当年不买 Google 相比,认为 : 这一决定只能说明 MSFT 的精明和 Nintendo 的二。但这两件事的性质是截然不同 : 的。Yahoo 当年如果买了 Google 的话别的公司就不能买了,MSFT license (非独占性 : license) PrimeSense 后,PrimeSense 还可以随时把相关技术卖给任何竞争对手。 : 严格的说,MSFT 现在的做法和 Yahoo 当年对 Google 的做法同出一辙,都是图省 : 钱搞个非独占 license 而不是买断某项技术或买下整个公司. : 另外 PrimeSense 的 reference design 里应该是有 skeleton tracking 这一块
| m****c 发帖数: 252 | 26 还少了几种,
比如SFM( structure from motion).
只需要一个calibrate的camera即可。
calibration也可以用self calibration。
简单的家庭摄像机即可。
但是这种技术对重建大的场景上比较有优点。
应用在游戏里没有得到很大的挖掘。
在CV这个领域里,只要做CV calibration就要引 张正友的文章。
你说那个stereo那个,只要做stereo,就要引孙健的文章。
MSR和MSRA在这方面的技术积累还是很强的。
另外关于Stereo现在也非常有用的, avatar 的拍摄就是stereo加skeleton做的。
为此James还搞了一个computer Farm(上千台计算机)作优化。
随着Avatar和Kinet的出现,很清楚的说明了3D时代即将到来了。
其实想想真快啊。2003年前后,搞视觉的除了到MSR这种地方,还有就是研究所外,其
他的毕业的基本上都得转行。
【在 w****a 的大作中提到】 : 从首页看见这篇文章,来参加技术讨论。 : 首先,要得到3D depth有好几种方式: : (1) stereo camera:用两个平行放置的摄像头来采集一对图像,计算图像中沿着水平线 : 的视差 : (disparity),然后来计算3d depth。这种方法计算量很大(速度慢),精度也不太稳定 : ,所以离 : 家庭中的实用还很远; : (2) structured lighting:这种方法是用一个光源投出各种预先设计好的图案到物体上 : ,根据 : 投射后看到的图案来估计物体的三维结构。PrimeSense的camera应该是属于这种,它用
| w****a 发帖数: 186 | 27 Structure from Motion只能得到稀疏的点阵,对于估算人的运动还不够;想要密集的
点,那么
还是要用dense stereo. MSR Redmond,MSR Asia, MSR Cambridge都做了很多很好的相关
研究,但对于gaming这个application来说,他们的技术还不够实用。
Avatar是另外一个应用,拍摄中用了stereo camera,但那是为了接下来的
stereoscopic
display,主要目的不是为了估算深度。motion capture是computer animation这个方
向用
的最多的方法,在人身上粘上反红外的小球,然后用红外摄像机捕捉三维运动。这是得
到人的三维运
动的最准确的方式,可惜在家里不适用。
【在 m****c 的大作中提到】 : 还少了几种, : 比如SFM( structure from motion). : 只需要一个calibrate的camera即可。 : calibration也可以用self calibration。 : 简单的家庭摄像机即可。 : 但是这种技术对重建大的场景上比较有优点。 : 应用在游戏里没有得到很大的挖掘。 : 在CV这个领域里,只要做CV calibration就要引 张正友的文章。 : 你说那个stereo那个,只要做stereo,就要引孙健的文章。 : MSR和MSRA在这方面的技术积累还是很强的。
| m****c 发帖数: 252 | 28 稀疏的点阵其实问题不大,中间的很多点可以estimate出来。只要先出来几个matching
的point,然后在alignment,然后再拿stereo的算法去estimate,出来的结果还是过得
去的。
当然对于人体棱棱角角不是很多的这种确实不够实用。当然游戏不仅仅限于人体啦。
很多游戏的场景,完全可以让用户自己创建然后倒入。这种大场景其实拿SFM还是挺靠
谱的。
当然传感器这种东西,做成人游戏大大地好。应该在日本大大的推广。
其实MSR这种地方,往往把发论文当成目的,技术转化成产品的能力比较弱,也比较慢
。好多好多非常有意思,有前途的技术,停在论文和demo的程度。CV方面唯一一个变成
真正产品的那个panorama camera视频会议系统,还卖给了polycomm。这个产品是基于
Sing bingkang等人2002年左右的几篇论文搞出来的。但是最后实现的时候,搞得超贵
。后来MS又卖掉了。其实当初4个DSP搞得东西,现在一个DSP就能搞定,如果再和XBOX
整合一下。把XBOX变成家庭视频通信设备的一部分。前途无量啊。
另外还有人脸识别这些东西,一个researcher搞得SDK真是难用,如果这种东西用到手
机上,也是windows phone的一大卖点。
希望Kinet为MSR的技术转化开条新路。我们UI没有Apple的fancy,但是我们可以用技术
创新去拍死竞争对手去。 | k*******n 发帖数: 8891 | | s*******u 发帖数: 1855 | 30 这个,
"kinect 里的3d tracking 除了来自 PrimeSense 的
"
i know this is not true
I cannot provide more details, but this statement is definitely not true
Kinect tech is not very innovative research-wise. But it requires huge
engineering effort. | | | z*n 发帖数: 2893 | 31 开始用道听途说来支持自己的观点了? 下一步一般就是直接造谣生事了.
Nintendo不二, wii上跑不起来. 下一代主机不知道要等到什么时候.
【在 t******a 的大作中提到】 : 补充一点,根据小道消息,kinect 里的3d tracking 除了来自 PrimeSense 的 : 一部分外,基本上买自 GestureTek, 欢迎知情人士否定。kinect 里的纯 MSR 自产 : 技术就是 speech recognition 和 face recognition 了. : 还看到有人把 Nintendo 不买 PrimeSense 和雅虎当年不买 Google 相比,认为 : 这一决定只能说明 MSFT 的精明和 Nintendo 的二。但这两件事的性质是截然不同 : 的。Yahoo 当年如果买了 Google 的话别的公司就不能买了,MSFT license (非独占性 : license) PrimeSense 后,PrimeSense 还可以随时把相关技术卖给任何竞争对手。 : 严格的说,MSFT 现在的做法和 Yahoo 当年对 Google 的做法同出一辙,都是图省 : 钱搞个非独占 license 而不是买断某项技术或买下整个公司. : 另外 PrimeSense 的 reference design 里应该是有 skeleton tracking 这一块
| t******a 发帖数: 1200 | 32 请不要人身攻击,我不确定的是 "major portion" 这一块, 对于 primesense
本身支持 skeleton tracking, 以及 MSFT 买了 GestureTek 的代码用于
kinect body tracking 我 100% 确定。
http://www.gesturetek.com/pdfs/printer_friendly/3D_depth_tracker_pf.pdf
当然你可以 argue 说 MSFT 拿来 PrimeSense 和 GestureTek 的代码后又大改
了一通,这也就是我说不确定的原因。
建议你把嘴巴放干净点。不懂装懂 + 人身攻击只能暴漏一个人的素质
【在 z*n 的大作中提到】 : 开始用道听途说来支持自己的观点了? 下一步一般就是直接造谣生事了. : Nintendo不二, wii上跑不起来. 下一代主机不知道要等到什么时候.
| z*n 发帖数: 2893 | 33 你的观点前几天讨论得很清楚了, 你根本对于kinect的内部实现一知半解. 别老再这里
阴魂不散的. 你需要对于kinect的实现有足够的了解再做这个"不难, 谁都可以做出来的"结论. 你连里面有什么都没搞清楚, 就象你那经典的对AEC的评论, 有什么好谈的?
如果你真人为阿猫阿狗就能做出来, 咱们等等两三年内有没有小任之类的
非阿猫阿狗搞出来.
你如果真对做产品有任何基础的了解, 在一个大东西里面license别人的技术是十分正常的事情. XBOX里面没IBM的CPU什么都跑不起来, 不license JPEG/H264照片视频放不了, 也没见walmart真做出个wbox出来.
【在 t******a 的大作中提到】 : 请不要人身攻击,我不确定的是 "major portion" 这一块, 对于 primesense : 本身支持 skeleton tracking, 以及 MSFT 买了 GestureTek 的代码用于 : kinect body tracking 我 100% 确定。 : http://www.gesturetek.com/pdfs/printer_friendly/3D_depth_tracker_pf.pdf : 当然你可以 argue 说 MSFT 拿来 PrimeSense 和 GestureTek 的代码后又大改 : 了一通,这也就是我说不确定的原因。 : 建议你把嘴巴放干净点。不懂装懂 + 人身攻击只能暴漏一个人的素质
| s********n 发帖数: 943 | 34 it looks like simmilar.
Kinect use two or more camera , I think
【在 z***e 的大作中提到】 : 我7年前搞过一点CV. 那时候印象中并没有depth camera的说法,但是存在3D camera, : 当时比较有趣的是用两个以上camera的图像来计算3D信息,我认为这和现在专门提出来 : 的depth camera应该不同。
|
|