O***b 发帖数: 104 | |
C*****5 发帖数: 8812 | 2 cnn提取feature再喂进rnn,这个搞个简单的模型估计不难
【在 O***b 的大作中提到】 : 比如说识别一段视频当中的手势,这个应该怎么做?
|
k*****u 发帖数: 1688 | 3 LSTM啊
一般搞个几层layer 效果就会不错了 |
s********k 发帖数: 6180 | 4 RNN, LSTM
【在 O***b 的大作中提到】 : 比如说识别一段视频当中的手势,这个应该怎么做?
|
i******t 发帖数: 22541 | 5 假设我在做图片的 分类问题
假设识别猫
我的训练样本 只知道 此图是1 还是 -1
我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的
位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像,
也可能比较小 , 也可能多个猫
这样的 训练样本 如何搞特征呢?
谢谢讨论 |
C*****5 发帖数: 8812 | 6 可以先用dlib之类的把手的图像crop出来,resize成同样大小的图片,再用CNN->RNN(
LSTM/GRU)
难点在于怎样从video中准确的extract手势而不是手势之间的过渡状态
【在 i******t 的大作中提到】 : 假设我在做图片的 分类问题 : 假设识别猫 : 我的训练样本 只知道 此图是1 还是 -1 : 我不知道 猫具体在那里? 具体多大? 也就是说我的训练样本 没有猫 的具体的 : 位置和大小信息。 猫可能是 在边也可能是在中间 , 可以比较大 整个图像, : 也可能比较小 , 也可能多个猫 : 这样的 训练样本 如何搞特征呢? : 谢谢讨论
|
i******t 发帖数: 22541 | 7 。。。。。。。。。
这是我的问题吗?
【在 C*****5 的大作中提到】 : 可以先用dlib之类的把手的图像crop出来,resize成同样大小的图片,再用CNN->RNN( : LSTM/GRU) : 难点在于怎样从video中准确的extract手势而不是手势之间的过渡状态
|