g******i 发帖数: 32 | 1 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性
C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这
些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术,
能否请各位指点一二?多谢了。 |
d*******g 发帖数: 36 | 2
性
这
,
个人意见:
你的问题比较泛,我觉得应该做进一步规范化的描述。
比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某些
数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法;
可能的问题描述,比如:
有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些属
性将数据分类: 具体的分类准则为....;
然后分析可行的算法,复杂度,效果等等;
【在 g******i 的大作中提到】 : 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性 : C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这 : 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术, : 能否请各位指点一二?多谢了。
|
h****t 发帖数: 93 | 3 我觉得主要是模型的表达能力和复杂度之间的冲突.
比较复杂的数据结构一般都用树来描述.比较成熟的例子是xml. 但是树的表达能力有限,
如果sub structure有overlap, 用xml就不是很好描述了. 在这种情况下,可以考虑用
图来描述.不过图的数据结构就复杂的多. 你的这个例子, 一般的图都难以表达.
可能需要用到hypergraph. 普通的图一条边连接2个结点,hypergraph一条边连接3个
或者更多个节点. 不过针对hypergraph的算法就比较少见了.
性
这
,
【在 g******i 的大作中提到】 : 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性 : C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这 : 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术, : 能否请各位指点一二?多谢了。
|
c****r 发帖数: 185 | 4 你是想做分类(classification)还是做clustering?
看看数据挖掘和机器学习方面的书。
性
这
,
【在 g******i 的大作中提到】 : 有一组数据,每个数据都具有属性一或若干个,如数据d1有属性C1, C2,数据d2有属性 : C2-1,C3,如此等等。每个属性可能具有不同程度的属性值。如何能最有效的依此划分这 : 些数据呢,注:每个数据可能隶属于多个类。感觉在这方面应该有较成熟的算法和技术, : 能否请各位指点一二?多谢了。
|
p*******s 发帖数: 7 | 5 两者有区别吗?似乎讲的一个东东。
【在 c****r 的大作中提到】 : 你是想做分类(classification)还是做clustering? : 看看数据挖掘和机器学习方面的书。 : : 性 : 这 : ,
|
g******i 发帖数: 32 | 6 多谢各位回复。因为我的专业不是数据挖掘,目前只是用到,所以希望能知道和问题相关
的可能使用的具体算法名称,然后我可以做针对性的修改。我感觉根据属性将数据分类应
该是很成熟的,是不是涉及到有交叉组(即一个数据可能被分给多个组)(相应的英文专业
术语是什么?)和层次型属性(hierarchical feature?)的问题就困难了呢?能否请提示一
些有关这方面的概念,算法等等,我好顺藤摸瓜。多谢了。
> 发信人: DamonPeng (达盟), 信区: CS
> 个人意见:
> 你的问题比较泛,我觉得应该做进一步规范化的描述。
> 比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某
些
> 数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法;
> 可能的问题描述,比如:
> 有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些
属
> 性将数据分类: 具体的分类准则为....;
> 然后分析可行的算法,复杂度,效果等等;
你说的是对的。目前主要的问题是可使用的具体分类算法有哪些?然后我才可以考虑属性
的处理,复杂度等。
> 发信人 |
g******i 发帖数: 32 | 7 > 因为每一次分类可能都是基于某个或某些数据的加权
能否请再具体一点?比如什么算法?
些
属
【在 d*******g 的大作中提到】 : : 性 : 这 : , : 个人意见: : 你的问题比较泛,我觉得应该做进一步规范化的描述。 : 比如,每个数据的属性个数不一样,需要补充,因为每一次分类可能都是基于某个或某些 : 数据的加权;如果某个数据不具备某个属性,需要有相应的处理方法; : 可能的问题描述,比如: : 有一组数据,每个数据具有k个属性,每个属性有一定的取值范围;现在需要依据这些属
|
g******i 发帖数: 32 | 8 我感觉是两者的思想出发点以及随之使用的具体方法有所不同,虽然最后结果可能是一样
的。
【在 p*******s 的大作中提到】 : 两者有区别吗?似乎讲的一个东东。
|
c***a 发帖数: 655 | 9 supervised vs unsupervised
【在 p*******s 的大作中提到】 : 两者有区别吗?似乎讲的一个东东。
|