由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 如何evaluate an unsupervised learning method?
相关主题
求问一道关于NLP的面试题欢迎加入“机器学习实践” 俱乐部
[Data Science Project Case] Generate Categories for Product说说浅学ML的感受
[经验帖] 我是如何当上DS的Bioinformatics Position in a Genomics Center in a University in the Southern California
[Data Science Project Case] Topic LearningBioinformatics Position in a Genomics Center in a University in the Southern California
问问面试如何出题Bioinformatics Position in a Genomics Center in a University in the Southern California
为什么要知道DETAILS OF A MACHINE LEARNING ALGORITHMSE/Data scientist找工作总结[F/G/L/T/D/P/U…] (转载)
谁面过亚麻的应用科学家?机器学习日报
[Road map] From ClickStream to ConsumerInsight若问entropy和gini的选择
相关话题的讨论汇总
话题: learning话题: index话题: evaluate话题: used
进入DataSciences版参与讨论
1 (共1页)
d******4
发帖数: 132
1
一次电面,一个amazon manager问我这个问题。一时不知所措不知道如何回答。我说最
终我们还是需要 class label 的信息吧?她说这是unsupervised learning, no class
label.
E*********g
发帖数: 185
2
网上找了一下
External Index: Used to measure the extent to which cluster
labels match externally supplied class labels.
- Entropy
Internal Index: Used to measure the goodness of a clustering
structure without respect to external information.
- Sum of Squared Error (SSE)
Relative Index: Used to compare two different clusterings or
clusters.
- Often an external or internal index is used for this function, e.g., SSE
or
entropy

class

【在 d******4 的大作中提到】
: 一次电面,一个amazon manager问我这个问题。一时不知所措不知道如何回答。我说最
: 终我们还是需要 class label 的信息吧?她说这是unsupervised learning, no class
: label.

s****h
发帖数: 3979
3
楼上找得挺好,这两个方法应该都有效:
基于cluster的metrics,和entropy
看过有人这样弄:
方法A,和方法B,分别搞出一个vector
然后基于vector跑SVM, 方法A结果更好,所以号称方法A生成的vector更有代表性。
上次有人问LDA如何evaluate,不是有人回答么?当时没继续看如何做的,是不是也算?
h*****a
发帖数: 1
T*****u
发帖数: 7103
5
如果有外部信息就用外部信息。如果没有外部信息就用cluster出来的结果去train相应
的supervised learning method,loo,看看是不是coherent。或者把data随机打开一
半一半,看看是不是给出相似的结果,一个方法收敛至少要能“自圆其说”。
d******4
发帖数: 132
6
thanks!
1 (共1页)
进入DataSciences版参与讨论
相关主题
若问entropy和gini的选择问问面试如何出题
机器学习日报 2015-01-29 LDA入门与Java实现为什么要知道DETAILS OF A MACHINE LEARNING ALGORITHM
机器学习日报2015年2月楼谁面过亚麻的应用科学家?
新手学python, 有个简单数据结构问题,在线急等[Road map] From ClickStream to ConsumerInsight
求问一道关于NLP的面试题欢迎加入“机器学习实践” 俱乐部
[Data Science Project Case] Generate Categories for Product说说浅学ML的感受
[经验帖] 我是如何当上DS的Bioinformatics Position in a Genomics Center in a University in the Southern California
[Data Science Project Case] Topic LearningBioinformatics Position in a Genomics Center in a University in the Southern California
相关话题的讨论汇总
话题: learning话题: index话题: evaluate话题: used