由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 用R做review 的summary
相关主题
基于DS的startup究竟都申请些什么专利?大家对于有很多value的categorical feature都怎么处理?
这样的数据怎么处理讲座: SQL Server 2016 new features in SSAS
random forest 有没有可能保证某几个变量一直被选上急,xgboost prediction的问题
data science 面试求教问题:用VIF做feature selection
如何证明某个feature 没用, 分组的分布和 总体分布相同Kaggle入门问题
怎么计算距离比较好?random forest/xgbclassifier的feature importance
问一个 feature 相关性问题评估feature的预测能力
几个星期前看到一个3000 feature 的选重要variable的面试帖子,text mining中的relation extraction
相关话题的讨论汇总
话题: review话题: summary话题: liu话题: hu话题: 工作量
进入DataSciences版参与讨论
1 (共1页)
p****r
发帖数: 46
1
想用R做online review的summary, 比如对一个review, 能找出它说的product
features, 并且对每一个feature的评价是正面还是负面。也就是Hu and Liu (2004)
做的。
有这方面现成的R package或code吗?大概搜了一下,没有找到。自己写看起来工作量
不小
p****r
发帖数: 46
2
想用R做online review的summary, 比如对一个review, 能找出它说的product
features, 并且对每一个feature的评价是正面还是负面。也就是Hu and Liu (2004)
做的。
有这方面现成的R package或code吗?大概搜了一下,没有找到。自己写看起来工作量
不小
b******g
发帖数: 88
3
NER 应该就可以,python 的nltk可以基本实现。如果做的复杂也许要用topic
modeling方面的东西,看看lda/llda.

【在 p****r 的大作中提到】
: 想用R做online review的summary, 比如对一个review, 能找出它说的product
: features, 并且对每一个feature的评价是正面还是负面。也就是Hu and Liu (2004)
: 做的。
: 有这方面现成的R package或code吗?大概搜了一下,没有找到。自己写看起来工作量
: 不小

1 (共1页)
进入DataSciences版参与讨论
相关主题
text mining中的relation extraction如何证明某个feature 没用, 分组的分布和 总体分布相同
假如想实现 entity recognition, relation extraction这些功能的话,除了GATE, 还有 哪些其它的open source library。怎么计算距离比较好?
我想建立一个自动选股票系统问一个 feature 相关性问题
Life time value 推荐资料几个星期前看到一个3000 feature 的选重要variable的面试帖子,
基于DS的startup究竟都申请些什么专利?大家对于有很多value的categorical feature都怎么处理?
这样的数据怎么处理讲座: SQL Server 2016 new features in SSAS
random forest 有没有可能保证某几个变量一直被选上急,xgboost prediction的问题
data science 面试求教问题:用VIF做feature selection
相关话题的讨论汇总
话题: review话题: summary话题: liu话题: hu话题: 工作量