s********1 发帖数: 581 | 1 computer vision哪个学校最好?
有朋友要报考Ph.D, 请问北美的学校哪个最好?
有什么好导师可以推荐?
有什么热门方向?
谢谢! |
b***a 发帖数: 6422 | 2 MIT最好,STANFORD还可以,BERKERLEY一般般,CMU及其他学校很烂。
【在 s********1 的大作中提到】 : computer vision哪个学校最好? : 有朋友要报考Ph.D, 请问北美的学校哪个最好? : 有什么好导师可以推荐? : 有什么热门方向? : 谢谢!
|
w***g 发帖数: 5958 | 3 Berkeley的Jitendra Malik可是CV的开山级人物. 要是再榜上Jordan那就无敌了. 还有
Caltech也很牛.
【在 b***a 的大作中提到】 : MIT最好,STANFORD还可以,BERKERLEY一般般,CMU及其他学校很烂。
|
b***a 发帖数: 6422 | 4 你从加拿大回来了?闯关回来的?给说说。
【在 w***g 的大作中提到】 : Berkeley的Jitendra Malik可是CV的开山级人物. 要是再榜上Jordan那就无敌了. 还有 : Caltech也很牛.
|
w***g 发帖数: 5958 | 5 哪有那么快. 正滞留着呢.
【在 b***a 的大作中提到】 : 你从加拿大回来了?闯关回来的?给说说。
|
f*****x 发帖数: 2748 | 6 在美国CV有几大学派。
1) berkeley的Malik学派。传人有caltech的perona, upenn的jianbo shi, cmu的efros, ucsd的belongie等。
2) mit的ADELSON。传人为B. Freeman。
3) 布朗大学的mumford (菲尔兹奖获得者)以及Grenander。传人为ucla的songcun zhu
等。
4) CMU的一帮人。
此外ubc的david lowe也很牛。
【在 b***a 的大作中提到】 : MIT最好,STANFORD还可以,BERKERLEY一般般,CMU及其他学校很烂。
|
w***g 发帖数: 5958 | 7 这传人是怎么定的? 是说这些人得到了他们的真传吗?
efros, ucsd的belongie等。
zhu
【在 f*****x 的大作中提到】 : 在美国CV有几大学派。 : 1) berkeley的Malik学派。传人有caltech的perona, upenn的jianbo shi, cmu的efros, ucsd的belongie等。 : 2) mit的ADELSON。传人为B. Freeman。 : 3) 布朗大学的mumford (菲尔兹奖获得者)以及Grenander。传人为ucla的songcun zhu : 等。 : 4) CMU的一帮人。 : 此外ubc的david lowe也很牛。
|
f*****x 发帖数: 2748 | 8 学生而已。
【在 w***g 的大作中提到】 : 这传人是怎么定的? 是说这些人得到了他们的真传吗? : : efros, ucsd的belongie等。 : zhu
|
b******x 发帖数: 826 | |
M**u 发帖数: 10158 | 10 我觉得这个方向就游戏开发还可以
【在 s********1 的大作中提到】 : computer vision哪个学校最好? : 有朋友要报考Ph.D, 请问北美的学校哪个最好? : 有什么好导师可以推荐? : 有什么热门方向? : 谢谢!
|
|
|
s**********l 发帖数: 8966 | 11 PDE filter算法最基本的就是perona-malik,图像segmentation里面的mumford-shah算
法,
registration里面Anuj Srivastava and Washington Mio是shape registration里面的
专家,其他
的知道的不多。
【在 w***g 的大作中提到】 : 这传人是怎么定的? 是说这些人得到了他们的真传吗? : : efros, ucsd的belongie等。 : zhu
|
w***n 发帖数: 1084 | 12 你确定?
stanford的vision和berkeley比那差的可不是一点半点。
要搁早几年,stanford的cs连个vision的教授都没有,也就是ee的一帮人搞搞,以至于开课都是外面请来的人教的。现在的几个都是年轻教授,近些年才来的。
至于CMU很烂?。。。无语了。
【在 b***a 的大作中提到】 : MIT最好,STANFORD还可以,BERKERLEY一般般,CMU及其他学校很烂。
|
w***n 发帖数: 1084 | 13 vision拿来游戏开发?这我还是头一回听说。
【在 M**u 的大作中提到】 : 我觉得这个方向就游戏开发还可以
|
d******e 发帖数: 7844 | 14 kinect就是典型的Vision啊
【在 w***n 的大作中提到】 : vision拿来游戏开发?这我还是头一回听说。
|
i*********8 发帖数: 3229 | 15 你多读点书也不会死人啊,没文化还出来丢人现眼。
【在 d******e 的大作中提到】 : kinect就是典型的Vision啊
|
d******e 发帖数: 7844 | 16 ??
t has now been revealed that the key software was developed by Microsoft
Research Cambridge's vision research group. The old way of approaching the
problem is to construct an avatar and attempt to find a match in the data
provided by the camera. Tracking is a matter of updating the match by
moving the avatar as the data changes.This was the basis of the first Kinect
software and it didn't work well enough for a commercial product. After
about a minute or so it tended to lose the track and then not be able to
recover it. It also had the problem that it only worked for people whe were
the same size and shape as the system's developer - because that was the
size and shape of the avatar used for matching.
The new approach developed by the vision research team makes use of machine
learning. They trained a learning system to recognise body parts. This can
then be used to identify body parts in the incoming data stream using the
GPU on a per pixel basis. The classifications are then pooled across pixels
to produce hypothetical 3D body joint positions used by a skeletal tracking
algorithm.
Explaining this recently one of the researchers said:
"We train the system with a vast and highly varied training set of synthetic
images to ensure the system works for all ages, body shapes & sizes,
clothing and hair styles. Secondly, the recognition does not rely on any
temporal information, and this ensures that the system can initialize from
arbitrary poses and prevents catastrophic loss of track, enabling extended
gameplay for the first time."
Who says that AI never delivers on its promises! It is also clear that this
sort of approach has many more applications than just a game input device.
【在 i*********8 的大作中提到】 : 你多读点书也不会死人啊,没文化还出来丢人现眼。
|
d******e 发帖数: 7844 | 17 ??
t has now been revealed that the key software was developed by Microsoft
Research Cambridge's vision research group. The old way of approaching the
problem is to construct an avatar and attempt to find a match in the data
provided by the camera. Tracking is a matter of updating the match by
moving the avatar as the data changes.This was the basis of the first Kinect
software and it didn't work well enough for a commercial product. After
about a minute or so it tended to lose the track and then not be able to
recover it. It also had the problem that it only worked for people whe were
the same size and shape as the system's developer - because that was the
size and shape of the avatar used for matching.
The new approach developed by the vision research team makes use of machine
learning. They trained a learning system to recognise body parts. This can
then be used to identify body parts in the incoming data stream using the
GPU on a per pixel basis. The classifications are then pooled across pixels
to produce hypothetical 3D body joint positions used by a skeletal tracking
algorithm.
Explaining this recently one of the researchers said:
"We train the system with a vast and highly varied training set of synthetic
images to ensure the system works for all ages, body shapes & sizes,
clothing and hair styles. Secondly, the recognition does not rely on any
temporal information, and this ensures that the system can initialize from
arbitrary poses and prevents catastrophic loss of track, enabling extended
gameplay for the first time."
Who says that AI never delivers on its promises! It is also clear that this
sort of approach has many more applications than just a game input device.
【在 i*********8 的大作中提到】 : 你多读点书也不会死人啊,没文化还出来丢人现眼。
|
i*********8 发帖数: 3229 | 18 你真是个文盲啊
The depth sensor consists of an infrared laser projector combined with a mo
nochrome CMOS sensor, which captures video data in 3D under any ambient ligh
t conditions.
跟什么糊弄人的computer vision 屁关系没有。
Kinect
were
【在 d******e 的大作中提到】 : ?? : t has now been revealed that the key software was developed by Microsoft : Research Cambridge's vision research group. The old way of approaching the : problem is to construct an avatar and attempt to find a match in the data : provided by the camera. Tracking is a matter of updating the match by : moving the avatar as the data changes.This was the basis of the first Kinect : software and it didn't work well enough for a commercial product. After : about a minute or so it tended to lose the track and then not be able to : recover it. It also had the problem that it only worked for people whe were : the same size and shape as the system's developer - because that was the
|
d******e 发帖数: 7844 | 19 明显是你落伍了,Vision可不仅仅是拿点2D的图片和视频做做分割和检测,3D Vision
已经
有很多人在搞了。尤其是这种可以直接获得深度信息的Censor,就CMU,我就知道至少
有几
个组都在用Kinect在搞跟踪和检测。
btw: Kinect本身就是MSR搞Vision的一群人搞出来的。
借用你自己的一句话送给你,“You know so little about 3D Vision, but you are
so
confident.”
mo
ligh
【在 i*********8 的大作中提到】 : 你真是个文盲啊 : The depth sensor consists of an infrared laser projector combined with a mo : nochrome CMOS sensor, which captures video data in 3D under any ambient ligh : t conditions. : 跟什么糊弄人的computer vision 屁关系没有。 : : Kinect : were
|
w***g 发帖数: 5958 | 20 显然有关系啊. 红外线人眼看不到就不算vision了? 你真幽默.
mo
ligh
【在 i*********8 的大作中提到】 : 你真是个文盲啊 : The depth sensor consists of an infrared laser projector combined with a mo : nochrome CMOS sensor, which captures video data in 3D under any ambient ligh : t conditions. : 跟什么糊弄人的computer vision 屁关系没有。 : : Kinect : were
|
|
|
i*********8 发帖数: 3229 | 21 小屁孩,这是laser scanner, 不是你们说的computer vision
要是computer vision搞出来的搞这行的那帮人早就high上天了,你看看一个个悄无声息
的,别丢人了,连哪行对哪行都搞不清楚的傻波依。
【在 w***g 的大作中提到】 : 显然有关系啊. 红外线人眼看不到就不算vision了? 你真幽默. : : mo : ligh
|
i*********8 发帖数: 3229 | 22 小屁孩,我再义务教育你一次,你以前在这儿版出丑已经不是第一次了。
http://en.wikipedia.org/wiki/Kinect
好好读读吧,跟msr的vision有屁关系。
Vision
are
【在 d******e 的大作中提到】 : 明显是你落伍了,Vision可不仅仅是拿点2D的图片和视频做做分割和检测,3D Vision : 已经 : 有很多人在搞了。尤其是这种可以直接获得深度信息的Censor,就CMU,我就知道至少 : 有几 : 个组都在用Kinect在搞跟踪和检测。 : btw: Kinect本身就是MSR搞Vision的一群人搞出来的。 : 借用你自己的一句话送给你,“You know so little about 3D Vision, but you are : so : confident.” :
|
d******e 发帖数: 7844 | 23 "老人家",是你的脑子该换换了。
【在 i*********8 的大作中提到】 : 小屁孩,我再义务教育你一次,你以前在这儿版出丑已经不是第一次了。 : http://en.wikipedia.org/wiki/Kinect : 好好读读吧,跟msr的vision有屁关系。 : : Vision : are
|
j*****n 发帖数: 1545 | 24 FT.. Kinect 不是vision那是毛啊
做vision我觉最强的就是Microsoft了, Redmond 一帮人和 Cambridge 一帮人相当猛.
很多学校看着牛,发一堆CVPR,其实都是垃圾.
声息
【在 i*********8 的大作中提到】 : 小屁孩,这是laser scanner, 不是你们说的computer vision : 要是computer vision搞出来的搞这行的那帮人早就high上天了,你看看一个个悄无声息 : 的,别丢人了,连哪行对哪行都搞不清楚的傻波依。
|
S*******w 发帖数: 24236 | 25 msra是不是也很牛
.
【在 j*****n 的大作中提到】 : FT.. Kinect 不是vision那是毛啊 : 做vision我觉最强的就是Microsoft了, Redmond 一帮人和 Cambridge 一帮人相当猛. : 很多学校看着牛,发一堆CVPR,其实都是垃圾. : : 声息
|
b*****t 发帖数: 1700 | 26 水很多
【在 S*******w 的大作中提到】 : msra是不是也很牛 : : .
|
j*****n 发帖数: 1545 | 27 msra paper 很多, 有些文章很不错,但是灌的太多了,质量就控制的不好. Redmond
和 Cambridge的人基本不会灌水.
【在 S*******w 的大作中提到】 : msra是不是也很牛 : : .
|
j*****n 发帖数: 1545 | 28 ce liu 在msr - new england 搞,也很强. Adobe还有一帮人(Sylvain Paris)也在
boston附近. 我反正觉得做vision的工业界的几个top lab比top 的 university (
CMU, UCB, UCLA) 做的好
Redmond
【在 j*****n 的大作中提到】 : msra paper 很多, 有些文章很不错,但是灌的太多了,质量就控制的不好. Redmond : 和 Cambridge的人基本不会灌水.
|
r**t 发帖数: 937 | 29 这个要刨根问底就涉及到什么是CV什么不是CV.....看你怎么定义了。不过kinect的关键
技术来源于MSR Cambridge,这点是公认的。
声息
【在 i*********8 的大作中提到】 : 小屁孩,这是laser scanner, 不是你们说的computer vision : 要是computer vision搞出来的搞这行的那帮人早就high上天了,你看看一个个悄无声息 : 的,别丢人了,连哪行对哪行都搞不清楚的傻波依。
|
C*********e 发帖数: 587 | 30 CV的录取学生的竞争很激烈,下面列的学校都很好
Berkeley/MIT/CMU/UIUC/Caltech/USC/UMD/Stanford/UCLA/UW/Gatech/UPenn
【在 s********1 的大作中提到】 : computer vision哪个学校最好? : 有朋友要报考Ph.D, 请问北美的学校哪个最好? : 有什么好导师可以推荐? : 有什么热门方向? : 谢谢!
|
|
|
C*********e 发帖数: 587 | 31 ...
游戏相关开发固然是好方向,其他的好方向多了去了。。。。
【在 M**u 的大作中提到】 : 我觉得这个方向就游戏开发还可以
|
C*********e 发帖数: 587 | 32 这些都很牛
另外,从传统的vision角度来说,2D和3D之间的关系是最重要的一块,说到这个,这些
大牛是top,Takeo Kanade,Andrew Zisserman, Richard Hartley,etc
【在 s**********l 的大作中提到】 : PDE filter算法最基本的就是perona-malik,图像segmentation里面的mumford-shah算 : 法, : registration里面Anuj Srivastava and Washington Mio是shape registration里面的 : 专家,其他 : 的知道的不多。
|
n******y 发帖数: 7 | 33 CMU有最大的vision group,没有之一
Berkley, UIUC 从规模上可以说是第二梯队,质量也很不错
MIT, Standford 相对小些,但是质量很高。 (但注意stanford发fellowship可能会不
保证老
板)
Caltech, NYU圈子更小,但是如果能去也是非常好
Columbia, UBC,UCLA,Brown....这些地方都有很好的researcher, 但是具体情况要具
体分析
【在 s********1 的大作中提到】 : computer vision哪个学校最好? : 有朋友要报考Ph.D, 请问北美的学校哪个最好? : 有什么好导师可以推荐? : 有什么热门方向? : 谢谢!
|
e***g 发帖数: 1696 | 34 FeiFei声称她是湾区大学中唯一的搞computer vision的教授.
【在 n******y 的大作中提到】 : CMU有最大的vision group,没有之一 : Berkley, UIUC 从规模上可以说是第二梯队,质量也很不错 : MIT, Standford 相对小些,但是质量很高。 (但注意stanford发fellowship可能会不 : 保证老 : 板) : Caltech, NYU圈子更小,但是如果能去也是非常好 : Columbia, UBC,UCLA,Brown....这些地方都有很好的researcher, 但是具体情况要具 : 体分析
|
G*****7 发帖数: 1759 | 35 唯一只做vision的吧。
andrew ng
daphne koller
还有他老师,老老师
【在 e***g 的大作中提到】 : FeiFei声称她是湾区大学中唯一的搞computer vision的教授.
|
G*****7 发帖数: 1759 | 36
典型的machine vision,epipolar geom/range scanner之类的深度测算而已。
典型的computer vision追求的是从2D intensity bitmap infer世界。
【在 d******e 的大作中提到】 : kinect就是典型的Vision啊
|
G*****7 发帖数: 1759 | 37 cmu玩kinect的都是在hci, robotics, mechanical engr而已
3D vision的人比如efros不觉得kinet是什么cv的东西
Vision
are
【在 d******e 的大作中提到】 : 明显是你落伍了,Vision可不仅仅是拿点2D的图片和视频做做分割和检测,3D Vision : 已经 : 有很多人在搞了。尤其是这种可以直接获得深度信息的Censor,就CMU,我就知道至少 : 有几 : 个组都在用Kinect在搞跟踪和检测。 : btw: Kinect本身就是MSR搞Vision的一群人搞出来的。 : 借用你自己的一句话送给你,“You know so little about 3D Vision, but you are : so : confident.” :
|
G*****7 发帖数: 1759 | 38 computer vision的目标是是实现
只用一只眼睛看照片,识别出照片里的世界
.
【在 j*****n 的大作中提到】 : FT.. Kinect 不是vision那是毛啊 : 做vision我觉最强的就是Microsoft了, Redmond 一帮人和 Cambridge 一帮人相当猛. : 很多学校看着牛,发一堆CVPR,其实都是垃圾. : : 声息
|
a***y 发帖数: 852 | 39 一看就是外行,喷啥呢
mo
ligh
【在 i*********8 的大作中提到】 : 你真是个文盲啊 : The depth sensor consists of an infrared laser projector combined with a mo : nochrome CMOS sensor, which captures video data in 3D under any ambient ligh : t conditions. : 跟什么糊弄人的computer vision 屁关系没有。 : : Kinect : were
|
O*****a 发帖数: 427 | 40 汗,两个都不是很懂的人吵谁更懂Vision吵得这么凶
Kinect用的是编码结构光。不是Laser Scanner,后者还有其它可以直接获得深度的摄
像机都不是家用游戏机可承受的成本范围的,所以MS这个项目开始了很久都没搞出能商
业化的产品。后来是吃下了以色列公司才搞定的这事,所以也不能说功劳全在MSR吧。
另外编码结构光这玩意儿图形学的人研究的更多一些,视觉的人的三维重建法一般是基
于Multi view的Stereo。所以很难说Kinect有多少视觉成份在里面。
另外视觉的分支很多,楼上很多人提到的那些个牛人大部分贡献和研究重点在模式分类
吧,算是视觉最核心的问题之一,但和Stereo基本是两件事。
我也是凭印象,不是专家,说错请指证。 |
|
|
w***g 发帖数: 5958 | 41 尔曹身与名俱裂, 不废微软财源滚滚. 有这功夫搞分类学还不如入个kinect玩一玩,
哈哈哈哈.
【在 O*****a 的大作中提到】 : 汗,两个都不是很懂的人吵谁更懂Vision吵得这么凶 : Kinect用的是编码结构光。不是Laser Scanner,后者还有其它可以直接获得深度的摄 : 像机都不是家用游戏机可承受的成本范围的,所以MS这个项目开始了很久都没搞出能商 : 业化的产品。后来是吃下了以色列公司才搞定的这事,所以也不能说功劳全在MSR吧。 : 另外编码结构光这玩意儿图形学的人研究的更多一些,视觉的人的三维重建法一般是基 : 于Multi view的Stereo。所以很难说Kinect有多少视觉成份在里面。 : 另外视觉的分支很多,楼上很多人提到的那些个牛人大部分贡献和研究重点在模式分类 : 吧,算是视觉最核心的问题之一,但和Stereo基本是两件事。 : 我也是凭印象,不是专家,说错请指证。
|
b***a 发帖数: 6422 | 42 你啥时候能CLEAR啊?感觉我比你着急啊!
【在 w***g 的大作中提到】 : 尔曹身与名俱裂, 不废微软财源滚滚. 有这功夫搞分类学还不如入个kinect玩一玩, : 哈哈哈哈.
|
w***g 发帖数: 5958 | 43 这也急不来啊. http://www.checkee.info/main.php?dispdate=2011-02
2月份check的还一个都没出来呢. 昨天好几个1月底的clear了. 估计再一个星期吧.
这版上不还有别的去WWW的吗? 我都不一定去得了了.
我已经miss了FAST, travel grant也没拿到.
【在 b***a 的大作中提到】 : 你啥时候能CLEAR啊?感觉我比你着急啊!
|
C*********e 发帖数: 587 | 44 re,good post,呵呵
stereo,geometry相关的牛人我在我前面帖子里面指出来了,一般来说,推崇这些人的
都是对vision比较了解的
而上面那些只是看重模式识别/ML的人,都不是vision圈的,对vision的key idea不太
清楚
【在 O*****a 的大作中提到】 : 汗,两个都不是很懂的人吵谁更懂Vision吵得这么凶 : Kinect用的是编码结构光。不是Laser Scanner,后者还有其它可以直接获得深度的摄 : 像机都不是家用游戏机可承受的成本范围的,所以MS这个项目开始了很久都没搞出能商 : 业化的产品。后来是吃下了以色列公司才搞定的这事,所以也不能说功劳全在MSR吧。 : 另外编码结构光这玩意儿图形学的人研究的更多一些,视觉的人的三维重建法一般是基 : 于Multi view的Stereo。所以很难说Kinect有多少视觉成份在里面。 : 另外视觉的分支很多,楼上很多人提到的那些个牛人大部分贡献和研究重点在模式分类 : 吧,算是视觉最核心的问题之一,但和Stereo基本是两件事。 : 我也是凭印象,不是专家,说错请指证。
|
d*****u 发帖数: 17243 | 45 现在做vision的多如牛毛啊,不知道就业怎么样?
我认识几个人好像都去做医疗方面的去了。
【在 C*********e 的大作中提到】 : re,good post,呵呵 : stereo,geometry相关的牛人我在我前面帖子里面指出来了,一般来说,推崇这些人的 : 都是对vision比较了解的 : 而上面那些只是看重模式识别/ML的人,都不是vision圈的,对vision的key idea不太 : 清楚
|
i*********8 发帖数: 3229 | 46 难的遇到这么有耐心的,我是看到那些个乱喷的都懒的理了
MSR里面那么多做vision的大牛,但是个个都有自知之明没敢跳出来乱喷自己的vision
算法在kinect里面有用到。
Kinect算是给做vision的人留条后路吧,那个API里面可以抓到图像,但是目前系统绝对
没有用任何vision的东西。
【在 O*****a 的大作中提到】 : 汗,两个都不是很懂的人吵谁更懂Vision吵得这么凶 : Kinect用的是编码结构光。不是Laser Scanner,后者还有其它可以直接获得深度的摄 : 像机都不是家用游戏机可承受的成本范围的,所以MS这个项目开始了很久都没搞出能商 : 业化的产品。后来是吃下了以色列公司才搞定的这事,所以也不能说功劳全在MSR吧。 : 另外编码结构光这玩意儿图形学的人研究的更多一些,视觉的人的三维重建法一般是基 : 于Multi view的Stereo。所以很难说Kinect有多少视觉成份在里面。 : 另外视觉的分支很多,楼上很多人提到的那些个牛人大部分贡献和研究重点在模式分类 : 吧,算是视觉最核心的问题之一,但和Stereo基本是两件事。 : 我也是凭印象,不是专家,说错请指证。
|
a***y 发帖数: 852 | 47 google下Jamie Shotton
vision
绝对
【在 i*********8 的大作中提到】 : 难的遇到这么有耐心的,我是看到那些个乱喷的都懒的理了 : MSR里面那么多做vision的大牛,但是个个都有自知之明没敢跳出来乱喷自己的vision : 算法在kinect里面有用到。 : Kinect算是给做vision的人留条后路吧,那个API里面可以抓到图像,但是目前系统绝对 : 没有用任何vision的东西。
|
e***g 发帖数: 1696 | 48 她认为她老师老老师所在地不属于湾区
【在 G*****7 的大作中提到】 : 唯一只做vision的吧。 : andrew ng : daphne koller : 还有他老师,老老师
|
m**********n 发帖数: 285 | 49 stereo,geometry仅是vision的一部分。pattern recognition and machine leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么learn。
Jamie Shotton, Andrew Fitzgibbon, Mat Cook, and Andrew Blake, Real-Time Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to appear), IEEE, 2011
We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes.
The system runs at 200 frames per second on consumer hardware. Our
evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.
【在 C*********e 的大作中提到】 : re,good post,呵呵 : stereo,geometry相关的牛人我在我前面帖子里面指出来了,一般来说,推崇这些人的 : 都是对vision比较了解的 : 而上面那些只是看重模式识别/ML的人,都不是vision圈的,对vision的key idea不太 : 清楚
|
D***r 发帖数: 7511 | 50 还有什么texture synthesis, impainting之类的吧
呵呵,我以前的课程project就是做的synthesis
leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可
能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么
learn。
Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to
appear), IEEE, 2011
body joints from a single depth image, using no temporal information. We
take an object recognition approach, designing an intermediate body parts
representation that maps the
investigates the effect of several training parameters. We achieve state of
the art accuracy in our comparison with related work and demonstrate
improved generalization over exa
【在 m**********n 的大作中提到】 : stereo,geometry仅是vision的一部分。pattern recognition and machine leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么learn。 : Jamie Shotton, Andrew Fitzgibbon, Mat Cook, and Andrew Blake, Real-Time Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to appear), IEEE, 2011 : We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes. : The system runs at 200 frames per second on consumer hardware. Our : evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.
|
|
|
a***y 发帖数: 852 | 51 strong re~
leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可
能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么
learn。
Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to
appear), IEEE, 2011
body joints from a single depth image, using no temporal information. We
take an object recognition approach, designing an intermediate body parts
representation that maps the
investigates the effect of several training parameters. We achieve state of
the art accuracy in our comparison with related work and demonstrate
improved generalization over exa
【在 m**********n 的大作中提到】 : stereo,geometry仅是vision的一部分。pattern recognition and machine leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么learn。 : Jamie Shotton, Andrew Fitzgibbon, Mat Cook, and Andrew Blake, Real-Time Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to appear), IEEE, 2011 : We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes. : The system runs at 200 frames per second on consumer hardware. Our : evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.
|
a***y 发帖数: 852 | 52 意思好像是只使用3d-depth图像?但是Kinect有一个RGB的camera啊
leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可
能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么
learn。
Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to
appear), IEEE, 2011
body joints from a single depth image, using no temporal information. We
take an object recognition approach, designing an intermediate body parts
representation that maps the
investigates the effect of several training parameters. We achieve state of
the art accuracy in our comparison with related work and demonstrate
improved generalization over exa
【在 m**********n 的大作中提到】 : stereo,geometry仅是vision的一部分。pattern recognition and machine leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么learn。 : Jamie Shotton, Andrew Fitzgibbon, Mat Cook, and Andrew Blake, Real-Time Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to appear), IEEE, 2011 : We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes. : The system runs at 200 frames per second on consumer hardware. Our : evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.
|
m**********n 发帖数: 285 | 53 是的,human pose recognition部分应该仅使用depth image。Human pose
recognition和RGB关系不大,depth要比RGB靠谱很多。但是如果你用Kinect做其他方面的研究,例如object recognition,RGB也是很有用的(depth image不能提供object的纹理信息)。
of
【在 a***y 的大作中提到】 : 意思好像是只使用3d-depth图像?但是Kinect有一个RGB的camera啊 : : leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可 : 能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么 : learn。 : Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to : appear), IEEE, 2011 : body joints from a single depth image, using no temporal information. We : take an object recognition approach, designing an intermediate body parts : representation that maps the
|
a***y 发帖数: 852 | 54 那RGB camera是用来做什么的呢
面的研究,例如object recognition,RGB也是很有用的(depth image不能提供object
的纹理信息)。
【在 m**********n 的大作中提到】 : 是的,human pose recognition部分应该仅使用depth image。Human pose : recognition和RGB关系不大,depth要比RGB靠谱很多。但是如果你用Kinect做其他方面的研究,例如object recognition,RGB也是很有用的(depth image不能提供object的纹理信息)。 : : of
|
i*********8 发帖数: 3229 | 55 给做vision的人留条灌水的路而已
object
【在 a***y 的大作中提到】 : 那RGB camera是用来做什么的呢 : : 面的研究,例如object recognition,RGB也是很有用的(depth image不能提供object : 的纹理信息)。
|
m**********n 发帖数: 285 | 56 我不知道,或许用在其它地方吧。
object
【在 a***y 的大作中提到】 : 那RGB camera是用来做什么的呢 : : 面的研究,例如object recognition,RGB也是很有用的(depth image不能提供object : 的纹理信息)。
|
C*********e 发帖数: 587 | 57 做的人多都正好说明了hot,目前业界应用上还是属于有待发展阶段,医疗方面的应用
倒是挺多的。不过,in general,做vision的人去google(youtube,street map),
facebook,microsoft的很多,不一定是exact的vision对应的工作,比如video
information retrieval等
【在 d*****u 的大作中提到】 : 现在做vision的多如牛毛啊,不知道就业怎么样? : 我认识几个人好像都去做医疗方面的去了。
|
C*********e 发帖数: 587 | 58 论文摘要我看了下,single image based human pose estimation,框架是建一个大规
模的labeled数据库,然后来做pixel级别的分类,最后再综合生成3D的model
不过这和你的观点有什么联系?
第一,stereo/geometry是vision中最重要的一个部分
第二,PR&ML在vision中的地位你没有搞清楚。PR&ML在vision中的应用,在大多数时候
(超过90%),都只是应用的工具,方法本身并不是vision的人提出来的;只有10%的时
候,是做vision的人自己提出的ML的方法,比如graph-cut,Robust PCA等。(btw,10
%只是个估算)
你所说的,ML能够work,关键是怎么用,这个对任何领域都是一样的,所有应用ML的领
域,从vision,到speech,到NLP,到web data,全都有这个问题。在绝大多数情况下
,怎么用好ML,需要的关键是domain的knowledge,而不是ML的知识。、
举个简单的例子,CVPR/ICCV的会议上,用到ML的paper估计有50%,但是会议的所有
track里面,真正叫做learning的track里面paper,大约10%。包括你列绝的这篇CVPR11
,肯定就不在learning的track里面,因为对ML本身没有什么贡献。再类比下,用到统
计的vision paper估计超过70%,但是说paper和统计研究联系紧密的估计1%都不到
leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可
能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么
learn。
Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to
appear), IEEE, 2011
body joints from a single depth image, using no temporal information. We
take an object recognition approach, designing an intermediate body parts
representation that maps the difficult pose estimation problem into a
simpler per-pixel classification problem. Our large and highly varied
training dataset allows the classifier to estimate body parts invariant to
pose, body shape, clothing, etc. Finally we generate confidence: -scored 3D
proposals of several body joints by reprojecting the classification result
and finding local modes.
investigates the effect of several training parameters. We achieve state of
the art accuracy in our comparison with related work and demonstrate
improved generalization over exact whole-skeleton nearest neighbor matching.
【在 m**********n 的大作中提到】 : stereo,geometry仅是vision的一部分。pattern recognition and machine leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么learn。 : Jamie Shotton, Andrew Fitzgibbon, Mat Cook, and Andrew Blake, Real-Time Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to appear), IEEE, 2011 : We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes. : The system runs at 200 frames per second on consumer hardware. Our : evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.
|
m**********n 发帖数: 285 | 59 你的理解太过狭隘,我没有必要也没有时间和你做口舌之争。我不care百分之多少的papers做什么,什么在什么track里,stereo/geometry重要还是ML重要,这些在我看来没有太多意义。用最合适的工具solve问题就行了。我care的是怎么样理解/定义问题,怎样solve问题。贴这个论文摘要的唯一目的是让更多的人了解Kinect怎么样work和Kinect解决问题的方式。至于ML在Kinect中是否重要,可以和论文作者talk。
10
【在 C*********e 的大作中提到】 : 论文摘要我看了下,single image based human pose estimation,框架是建一个大规 : 模的labeled数据库,然后来做pixel级别的分类,最后再综合生成3D的model : 不过这和你的观点有什么联系? : 第一,stereo/geometry是vision中最重要的一个部分 : 第二,PR&ML在vision中的地位你没有搞清楚。PR&ML在vision中的应用,在大多数时候 : (超过90%),都只是应用的工具,方法本身并不是vision的人提出来的;只有10%的时 : 候,是做vision的人自己提出的ML的方法,比如graph-cut,Robust PCA等。(btw,10 : %只是个估算) : 你所说的,ML能够work,关键是怎么用,这个对任何领域都是一样的,所有应用ML的领 : 域,从vision,到speech,到NLP,到web data,全都有这个问题。在绝大多数情况下
|
s********1 发帖数: 581 | 60 texture synthesis, inpainting应该是computer graphics里的内容。除非您的vision和
graphics的project一起做。
parts
【在 D***r 的大作中提到】 : 还有什么texture synthesis, impainting之类的吧 : 呵呵,我以前的课程project就是做的synthesis : : leaning是Kinect软件的核心部分。建议看看这篇下面的论文摘要。这个论文非常有可 : 能是介绍Kinect怎样work。Machine learning还是能work的。关键是learn什么,怎么 : learn。 : Human Pose Recognition in Parts from a Single Depth Image, in CVPR (to : appear), IEEE, 2011 : body joints from a single depth image, using no temporal information. We : take an object recognition approach, designing an intermediate body parts
|
|
|
C*********e 发帖数: 587 | 61 我希望对事发帖,不对人,不过你的言辞还是让人觉得你逻辑思维很无语
我最前面re这个帖子的意义是说因为,这个帖子的前面有些人谈vision就说那些ML/PR
的部分,我觉得这是没有理解vision问题的体现,由此我发了那个帖子
然后你re的帖子呢?贴出了一个Kinect的paper的摘要,然后呢,你认为ML在kinect起
了很多作用,但这个我前面的帖子有什么具体关系?
你要注意,
第一,我前面的帖子的是针对ML和CV的关系发的,并不是说kinect
第二,ML和Vision是两个领域,你通过说kinect用了ML说明不了任何kinect和vision的
关系,事实上,你理解问题很混乱(而你确claim你care理解问题)。那篇paper之所以
投CVPR,而不是ICML,是因为paper要解决的是一个典型vision问题,human pose
estimation,而用的depth camera也是vision领域的人所接受的一种input。至于用了
ML,是不会让这篇paper就投去ICML的。
亦或者,你认为这么一个vision问题用了ML,说明ML是vision中很重要的一部分?这个
我前面很明确说了,ML是工具,正如Stat一样,并不是vision的研究领域
anyway,如果按你所说,你并不care ML和CV的关系,不care那个领域重要,等等,那
你就没有对vision和ML有很深图的理解,只是针对具体的问题有认识罢了,何必针对这
个讨论来发帖
papers做什么,什么在什么track里,stereo/geometry重要还是ML重要,这些在我看来
没有太多意义。用最合适的工具solve问题就行了。我care的是怎么样理解/定义问题,
怎样solve问题。贴这个论文摘要的唯一目的是让更多的人了解Kinect怎么样work和
Kinect解决问题的方式。至于ML在Kinect中是否重要,可以和论文作者talk。
【在 m**********n 的大作中提到】 : 你的理解太过狭隘,我没有必要也没有时间和你做口舌之争。我不care百分之多少的papers做什么,什么在什么track里,stereo/geometry重要还是ML重要,这些在我看来没有太多意义。用最合适的工具solve问题就行了。我care的是怎么样理解/定义问题,怎样solve问题。贴这个论文摘要的唯一目的是让更多的人了解Kinect怎么样work和Kinect解决问题的方式。至于ML在Kinect中是否重要,可以和论文作者talk。 : : 10
|
R*******V 发帖数: 57 | 62
PR
看了你这段话,确实觉得你对Vision的理解太狭隘。
计算机的视觉的基本问题就是那个understanding
怎么解决大家可以各自给不同的办法。你用3D,他用appearance learning都没关系,关
键看你做的
效果怎么样。坦白的说,kinect没出来之前,3D的东西在understanding这块没啥真正
可以用的。
倒是ada-boost based 人脸检测救了Vision一把。现在从apple到cannon都在用。
【在 C*********e 的大作中提到】 : 我希望对事发帖,不对人,不过你的言辞还是让人觉得你逻辑思维很无语 : 我最前面re这个帖子的意义是说因为,这个帖子的前面有些人谈vision就说那些ML/PR : 的部分,我觉得这是没有理解vision问题的体现,由此我发了那个帖子 : 然后你re的帖子呢?贴出了一个Kinect的paper的摘要,然后呢,你认为ML在kinect起 : 了很多作用,但这个我前面的帖子有什么具体关系? : 你要注意, : 第一,我前面的帖子的是针对ML和CV的关系发的,并不是说kinect : 第二,ML和Vision是两个领域,你通过说kinect用了ML说明不了任何kinect和vision的 : 关系,事实上,你理解问题很混乱(而你确claim你care理解问题)。那篇paper之所以 : 投CVPR,而不是ICML,是因为paper要解决的是一个典型vision问题,human pose
|
R*******V 发帖数: 57 | 63
搞计算机视觉最牛的人(whoever you name)也不敢说这话。
现在的人都怎么回事?你要不是Viola,Kanade, 和Lowe这样的人物, 说这话不觉得丢人么?
【在 b***a 的大作中提到】 : MIT最好,STANFORD还可以,BERKERLEY一般般,CMU及其他学校很烂。
|
C*********e 发帖数: 587 | 64 You are wrong,不是说大IT公司推出了才叫可以用,商业上的实用和推广是很多因素的结合,不光是技术问题本身。我虽然不专做3D,但至少知道3D understanding上,比如3D face recognition就是可行的。
而且,我并没有质疑kinect,也不质疑kinect用了ML的技术,我的观点是这个是属于用ML技术解决CV问题,但不是ML的研究,so?
你对vision的认识也有问题,CV没有一个明确的定义(至少没有任何大牛敢说,你倒是敢自己给定义。。。。),牵涉的范围很广,并且还在继续演化中。understanding只是从偏AI的角度出发的,而很多认识相关的问题,都牵涉到AI的核心问题,不只是CV独有的。另一方面,stereo,multi-view geometry,motion analysis,tracking中的很多问题确和high level的认知没有关系。
至于说Adaboost的人脸检测,这个是人脸检测中的popular技术,so what?做这个的人绝大部分是属于用ML的技术来做CV的问题,这不属于ML的研究,都只是CV的研究,paper也都是ICCV/CVPR上,not NIPS/ICML
【在 R*******V 的大作中提到】 : : 搞计算机视觉最牛的人(whoever you name)也不敢说这话。 : 现在的人都怎么回事?你要不是Viola,Kanade, 和Lowe这样的人物, 说这话不觉得丢人么?
|
R*******V 发帖数: 57 | 65 你对CV的认识还不够,不要轻易说别人Wrong.
另外,我并没有给CV下定义,我说CV的核心问题是understanding的问题,你最好去问
问你身边的
资深研究人员,看看是不是这样。
小年轻,你的悟性需要提高,否则CV会让你很失望的。
记住这句话,希望你2年后回头看看你说的话。
素的结合,
不光是技术问题本身。我虽然不专做3D,但至少知道3D understanding上,比如3D
face
recognition就是可行的。
用ML技术
解决CV问题,但不是ML的研究,so?
是敢自己给
定义。。。。),牵涉的范围很广,并且还在继续演化中。understanding只是从偏AI
的角度出发
的,而很多认识相关的问题,都牵涉到AI的核心问题,不只是CV独有的。另一方面,
stereo,
multi-view geometry,motion analysis,tracking中的很多问题确和high level的认
知没有关系。
人绝大
部分是属于用ML的技术来做CV的问题,这不属于ML的研究,都只是CV的研究,paper也
都是
ICCV/CVPR上,not NIPS/ICML
【在 C*********e 的大作中提到】 : You are wrong,不是说大IT公司推出了才叫可以用,商业上的实用和推广是很多因素的结合,不光是技术问题本身。我虽然不专做3D,但至少知道3D understanding上,比如3D face recognition就是可行的。 : 而且,我并没有质疑kinect,也不质疑kinect用了ML的技术,我的观点是这个是属于用ML技术解决CV问题,但不是ML的研究,so? : 你对vision的认识也有问题,CV没有一个明确的定义(至少没有任何大牛敢说,你倒是敢自己给定义。。。。),牵涉的范围很广,并且还在继续演化中。understanding只是从偏AI的角度出发的,而很多认识相关的问题,都牵涉到AI的核心问题,不只是CV独有的。另一方面,stereo,multi-view geometry,motion analysis,tracking中的很多问题确和high level的认知没有关系。 : 至于说Adaboost的人脸检测,这个是人脸检测中的popular技术,so what?做这个的人绝大部分是属于用ML的技术来做CV的问题,这不属于ML的研究,都只是CV的研究,paper也都是ICCV/CVPR上,not NIPS/ICML
|
C*********e 发帖数: 587 | 66 我对CV的认识自然还需要加深,不过还是足够看出you are wrong
你上个帖子说是CV的基本问题,现在又说是核心问题?这就是你的汉语问题,我没兴趣
再多说,我只关注技术层面的讨论
另外,看起来你年纪不小了,so?从你的帖子没看出来你的深入讨论问题的能力,表层
且肤浅
【在 R*******V 的大作中提到】 : 你对CV的认识还不够,不要轻易说别人Wrong. : 另外,我并没有给CV下定义,我说CV的核心问题是understanding的问题,你最好去问 : 问你身边的 : 资深研究人员,看看是不是这样。 : 小年轻,你的悟性需要提高,否则CV会让你很失望的。 : 记住这句话,希望你2年后回头看看你说的话。 : : 素的结合, : 不光是技术问题本身。我虽然不专做3D,但至少知道3D understanding上,比如3D : face
|