由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 关于多维结构性数据的分类技术问题
相关主题
Supervised和Unsupervised Learning有什么区别欢迎加入“机器学习实践” 俱乐部
做蛋白质折叠的预测,整篇NIPS难度大不大?数据科学之江湖兵器谱 (转载)
请教 EE phd 自学 CS谁给一点思路,关于找最小值的问题
如何对100维的数据进行unsupervised clustering?多维空间角概念
在machine learning 里, clustering 和 classification 有什么区别?求助一个函数模型,急,在线等! (转载)
Kalman Filter, Neural Network, HMM 有什么区别呢[合集] 有没有分布函数的分布 这个概念? (转载)
SVM可以是Unsupervised的?问一个信号采样的问题
这里有人研究神经网络的吗?问一个算法题 (转载)
相关话题的讨论汇总
话题: 数据话题: 属性话题: 分类话题: hypergraph话题: 每个
进入CS版参与讨论
1 (共1页)
g******i
发帖数: 32
1
有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性
C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这
些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术,
能否请各位指点一二?多谢了。
d*******g
发帖数: 36
2




个人意见:
你的问题比较泛,我觉得应该做进一步规范化的描述。
比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某些
数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法;
可能的问题描述,比如:
有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些属
性将数据分类: 具体的分类准则为....;
然后分析可行的算法,复杂度,效果等等;

【在 g******i 的大作中提到】
: 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性
: C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这
: 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术,
: 能否请各位指点一二?多谢了。

h****t
发帖数: 93
3
我觉得主要是模型的表达能力和复杂度之间的冲突.
比较复杂的数据结构一般都用树来描述.比较成熟的例子是xml. 但是树的表达能力有限,
如果sub structure有overlap, 用xml就不是很好描述了. 在这种情况下,可以考虑用
图来描述.不过图的数据结构就复杂的多. 你的这个例子, 一般的图都难以表达.
可能需要用到hypergraph. 普通的图一条边连接2个结点,hypergraph一条边连接3个
或者更多个节点. 不过针对hypergraph的算法就比较少见了.





【在 g******i 的大作中提到】
: 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性
: C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这
: 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术,
: 能否请各位指点一二?多谢了。

c****r
发帖数: 185
4
你是想做分类(classification)还是做clustering?
看看数据挖掘和机器学习方面的书。





【在 g******i 的大作中提到】
: 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性
: C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这
: 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术,
: 能否请各位指点一二?多谢了。

p*******s
发帖数: 7
5
两者有区别吗?似乎讲的一个东东。

【在 c****r 的大作中提到】
: 你是想做分类(classification)还是做clustering?
: 看看数据挖掘和机器学习方面的书。
:
: 性
: 这
: ,

g******i
发帖数: 32
6
多谢各位回复。因为我的专业不是数据挖掘,目前只是用到,所以希望能知道和问题相关
的可能使用的具体算法名称,然后我可以做针对性的修改。我感觉根据属性将数据分类应
该是很成熟的,是不是涉及到有交叉组(即一个数据可能被分给多个组)(相应的英文专业
术语是什么?)和层次型属性(hierarchical feature?)的问题就困难了呢?能否请提示一
些有关这方面的概念,算法等等,我好顺藤摸瓜。多谢了。
> 发信人: DamonPeng (达盟), 信区: CS
> 个人意见:
> 你的问题比较泛,我觉得应该做进一步规范化的描述。
> 比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某

> 数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法;
> 可能的问题描述,比如:
> 有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些

> 性将数据分类: 具体的分类准则为....;
> 然后分析可行的算法,复杂度,效果等等;
你说的是对的。目前主要的问题是可使用的具体分类算法有哪些?然后我才可以考虑属性
的处理,复杂度等。
> 发信人
g******i
发帖数: 32
7
> 因为每一次分类可能都是基于某个或某些数据的加权
能否请再具体一点?比如什么算法?




【在 d*******g 的大作中提到】
:
: 性
: 这
: ,
: 个人意见:
: 你的问题比较泛,我觉得应该做进一步规范化的描述。
: 比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某些
: 数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法;
: 可能的问题描述,比如:
: 有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些属

g******i
发帖数: 32
8
我感觉是两者的思想出发点以及随之使用的具体方法有所不同,虽然最后结果可能是一样
的。

【在 p*******s 的大作中提到】
: 两者有区别吗?似乎讲的一个东东。
c***a
发帖数: 655
9
supervised vs unsupervised

【在 p*******s 的大作中提到】
: 两者有区别吗?似乎讲的一个东东。
1 (共1页)
进入CS版参与讨论
相关主题
问一个算法题 (转载)在machine learning 里, clustering 和 classification 有什么区别?
两会讨论谷歌事件,喊话:“回头的马是聪明马” (转载)Kalman Filter, Neural Network, HMM 有什么区别呢
问一个概率表述问题SVM可以是Unsupervised的?
请教一个多维遍历问题这里有人研究神经网络的吗?
Supervised和Unsupervised Learning有什么区别欢迎加入“机器学习实践” 俱乐部
做蛋白质折叠的预测,整篇NIPS难度大不大?数据科学之江湖兵器谱 (转载)
请教 EE phd 自学 CS谁给一点思路,关于找最小值的问题
如何对100维的数据进行unsupervised clustering?多维空间角概念
相关话题的讨论汇总
话题: 数据话题: 属性话题: 分类话题: hypergraph话题: 每个