m*********x 发帖数: 127 | 1 下周就要面试了,是个大学医学院的研究组,要做large dataset longitudinal data
analysis。 我没搞过大的dataset, 课堂上用的dataset都很小,都是存成.txt文件,
想知道到底large dataset是怎么存的?是不是存在数据库里,比如SQL Server or
Oracle?
还有hierarchical linear models,repeated measures,我都不记得哪门课学过,应
该怎么准备呢?
请多多指教,多谢多谢! |
D******n 发帖数: 2836 | 2 我覺得excel裝不下的都可以算比較大的了。
data
【在 m*********x 的大作中提到】 : 下周就要面试了,是个大学医学院的研究组,要做large dataset longitudinal data : analysis。 我没搞过大的dataset, 课堂上用的dataset都很小,都是存成.txt文件, : 想知道到底large dataset是怎么存的?是不是存在数据库里,比如SQL Server or : Oracle? : 还有hierarchical linear models,repeated measures,我都不记得哪门课学过,应 : 该怎么准备呢? : 请多多指教,多谢多谢!
|
g*********n 发帖数: 441 | 3 不都是在SAS 的LIBERARY DATASET 的文档下么…… 其他的好像就没有严格的要求了吧
。 |
z**********i 发帖数: 12276 | 4 我记得上次做比较大的数据也是txt文件。
data
【在 m*********x 的大作中提到】 : 下周就要面试了,是个大学医学院的研究组,要做large dataset longitudinal data : analysis。 我没搞过大的dataset, 课堂上用的dataset都很小,都是存成.txt文件, : 想知道到底large dataset是怎么存的?是不是存在数据库里,比如SQL Server or : Oracle? : 还有hierarchical linear models,repeated measures,我都不记得哪门课学过,应 : 该怎么准备呢? : 请多多指教,多谢多谢!
|
m*********x 发帖数: 127 | 5 喔,谢谢!
是存成 .txt文本文件吗?
【在 g*********n 的大作中提到】 : 不都是在SAS 的LIBERARY DATASET 的文档下么…… 其他的好像就没有严格的要求了吧 : 。
|
g*********n 发帖数: 441 | |
f****r 发帖数: 1140 | |
m*********x 发帖数: 127 | 8 比如说医院的claim data,据说是billions of records
【在 f****r 的大作中提到】 : 多大算大啊?
|
p********a 发帖数: 5352 | 9 >1 million records ---Large datasets |
h**m 发帖数: 57 | |
c****y 发帖数: 373 | 11 一般大量数据都存在数据库里吧,SAS也有SQL PROC去读取数据库的 |
s*****z 发帖数: 202 | 12 insurance claim data一般都存在oracle,db2等server上,大学医院的data应该不是
claim data, 而是health outcome, or billing, 应该也是存
在server
repeated measures, test variability in different hierarchical data应该就是
longitudinal data analysis Or so called mixed effect model
data
【在 m*********x 的大作中提到】 : 下周就要面试了,是个大学医学院的研究组,要做large dataset longitudinal data : analysis。 我没搞过大的dataset, 课堂上用的dataset都很小,都是存成.txt文件, : 想知道到底large dataset是怎么存的?是不是存在数据库里,比如SQL Server or : Oracle? : 还有hierarchical linear models,repeated measures,我都不记得哪门课学过,应 : 该怎么准备呢? : 请多多指教,多谢多谢!
|
m*********x 发帖数: 127 | 13 Thanks for the detailed explanation! I got it. You are so nice.
【在 s*****z 的大作中提到】 : insurance claim data一般都存在oracle,db2等server上,大学医院的data应该不是 : claim data, 而是health outcome, or billing, 应该也是存 : 在server : repeated measures, test variability in different hierarchical data应该就是 : longitudinal data analysis Or so called mixed effect model : : data
|
p****o 发帖数: 1340 | 14 一般就在一个SAS数据集里了。再大,就放在数据库里。。。
data
【在 m*********x 的大作中提到】 : 下周就要面试了,是个大学医学院的研究组,要做large dataset longitudinal data : analysis。 我没搞过大的dataset, 课堂上用的dataset都很小,都是存成.txt文件, : 想知道到底large dataset是怎么存的?是不是存在数据库里,比如SQL Server or : Oracle? : 还有hierarchical linear models,repeated measures,我都不记得哪门课学过,应 : 该怎么准备呢? : 请多多指教,多谢多谢!
|