由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 如何implement model with categorical variable?
相关主题
SAS coding help needed如何证明某个feature 没用, 分组的分布和 总体分布相同
请教proc transpose 问题 (转载)问一个 feature 相关性问题
像 kappa-test 这种,什么书上会讲? (转载)PCA 可以用在mixture of continuous 和categorical variables (转载)
Re: 攒人品,发Google Statistician/Data Scientist电面面经有没有大牛来classifiy一下 PCA用法吗?
请问这样的数据应该用什么样的模型适合。大家对于有很多value的categorical feature都怎么处理?
我现在有一个15个variable的回归模型。 有什么系统性的方法去怎么处理categorical variable有很多个level的
问个R的问题紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!
data science 面试求教data challenge ... 现在公司都咋tmd想的
相关话题的讨论汇总
话题: var1话题: value话题: implement话题: variable
进入DataSciences版参与讨论
1 (共1页)
w******d
发帖数: 120
1
比如var1
Range Value
1-5 --- 3
6-7 --- 8
8-11 --- 20
...
Var2
Chicago --- 10
New york --- 15
如果数据很大, 变量多, 用if- else 很慢
if var1 >= 1 and var1 <5:
value = 3
elif var >=6 and var1 < 7:
value = 8
....
if var2 = 'chicago':
value = 10
Python 有没有好的函数做这个?
最好能handle所有情况, 而不是每个var都不一样
Z**0
发帖数: 1119
2
慢不是因为这些ifelse,是数据多了,自然花费时间多。需要并行数据处理。
用spark。
1 (共1页)
进入DataSciences版参与讨论
相关主题
data challenge ... 现在公司都咋tmd想的请问这样的数据应该用什么样的模型适合。
Data Engineer @ Seattle Amazon我现在有一个15个variable的回归模型。 有什么系统性的方法去
寻找一起做kaggle competition的小伙伴问个R的问题
python/excel suggestion/replacementdata science 面试求教
SAS coding help needed如何证明某个feature 没用, 分组的分布和 总体分布相同
请教proc transpose 问题 (转载)问一个 feature 相关性问题
像 kappa-test 这种,什么书上会讲? (转载)PCA 可以用在mixture of continuous 和categorical variables (转载)
Re: 攒人品,发Google Statistician/Data Scientist电面面经有没有大牛来classifiy一下 PCA用法吗?
相关话题的讨论汇总
话题: var1话题: value话题: implement话题: variable