T*****u 发帖数: 7103 | 1 扔了一大团快1G的内部的原始data过来。没有任何文档,任何data model, data log。
单看名字完全不知道是什么玩意, 连是categorical data还是numerical data都分不
出来,还让人作model,现在这些公司都是这么玩别人的吗? |
b*********n 发帖数: 2975 | 2 use tableau, a quick way to learn data, ;-)
扔了一大团快1G的内部的原始data过来。没有任何文档,任何data model, data log。
单看名字完全不知道是什么玩意, 连是categorical data还是numerical data都分不
出来,还让人作model,现在这些公司都是这么玩别人的吗?
【在 T*****u 的大作中提到】 : 扔了一大团快1G的内部的原始data过来。没有任何文档,任何data model, data log。 : 单看名字完全不知道是什么玩意, 连是categorical data还是numerical data都分不 : 出来,还让人作model,现在这些公司都是这么玩别人的吗?
|
s****i 发帖数: 197 | |
w*****t 发帖数: 190 | |
f*******6 发帖数: 56 | 5 文他们要类似data dictionary,如果不能拿到,即使做出model,纯粹只是数字,不能解
释任何商业上的东西。 如果有missing value,不同的feature要依据不同的规则来填补
。 尤其是parametric predicting, 有些算法是不接受null 值。 |
T*****u 发帖数: 7103 | 6 草,这个咋办,我这网速下载10g都要下小半天。
【在 w*****t 的大作中提到】 : 我面过最大的给了10G
|
m******r 发帖数: 1033 | 7 没什么呀 挺正常啊。 我们有时还故意把变量名屏蔽掉,叫var_001, var_002....机器
学习么,得让机器学。 不能引入人的偏见。
我说的只是一个步骤。 |
n***b 发帖数: 14 | 8 文本还是图像?
【在 w*****t 的大作中提到】 : 我面过最大的给了10G
|
r**********d 发帖数: 510 | |
f*******6 发帖数: 56 | 10 那如何处理missing value?
【在 m******r 的大作中提到】 : 没什么呀 挺正常啊。 我们有时还故意把变量名屏蔽掉,叫var_001, var_002....机器 : 学习么,得让机器学。 不能引入人的偏见。 : 我说的只是一个步骤。
|
w*****t 发帖数: 190 | 11 文本
老邢这验证码搞的,憋了好久才上电脑给回复了
【在 n***b 的大作中提到】 : 文本还是图像?
|
T*****u 发帖数: 7103 | 12 你们啥公司阿
【在 m******r 的大作中提到】 : 没什么呀 挺正常啊。 我们有时还故意把变量名屏蔽掉,叫var_001, var_002....机器 : 学习么,得让机器学。 不能引入人的偏见。 : 我说的只是一个步骤。
|
T*****u 发帖数: 7103 | 13 做了。貌似结果还可以。后来和一个工作2年的中东统计女硕士follow up了一轮给废掉
了。
面的有些怕这些20多岁刚工作一两年的小朋友了。貌似他们问的问题都有一个很细的标
准答案,如果回答超出这个答案范围就是个死字了。 |