由买买提看人间百态

topics

全部话题 - 话题: variate
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
f**********t
发帖数: 32
1
来自主题: Accounting版 - 求教~~becker AUD 的一个习题~~
In evaluating the resonableness of an entity's accounting estimates, an
auditor normally would be concerned about assumptions that are
1) susceptible to bias
2) consistent with prior periods
3) insensitive to variation
4) similar to industry guidelines
In evaluating the resonableness of an accounting estimates, an auditor most
likely would concentrated on key factors and assumptions that are
1) consistent with those of prior periods
2) similar to industry guidelines
3) objective and not suscepti... 阅读全帖
b******l
发帖数: 1632
2
high-throughput 的一个作用就是可以借助海量数据来解决 bio 领域最让人头大的
variation 的问题,通过 statistics 来获得对某种行为的 reliable 的描述。
比如说,我过去研究的一个简单的细胞行为,variation 大到让人绝望。最后我用了一
种特殊的 metric 来建立 billion-level database,再用 bayasian model 来重新描
述同一个的细胞行为,那个清晰,漂亮和稳定啊。但这种方法就需要海量数据采集,必
须用 high-throughput 的方法。

quanti
结果
决定
不同
呢?
个生
也许
p*****m
发帖数: 7030
3
来自主题: Biology版 - 我就抛砖引玉了吧
我先说说我的理解 生物样本的问题就是大多数情况下你不知道分布是什么 因为数
据偏差一般都不主要来自仪器误差 而是生物对象本身的variation和处理的variat
ion 比如说吧 你给老鼠打药看某个变化 老鼠自己情况的变化就未必是正态的(可
能有笼间区别 是吃喝bedding或者打架引起的) 打的东西能够引起的变化也不一定
是正态的 甚至都不一定是连续的或者单峰值的(比如说只有超过某个阈值才有反应
step-wise的) 等等等等 因此尤其是在样本少的条件下想满足正态性是很难的
我个人认为比较实用的就是散点图看看分布 能看出中心集中就差不多了 否则的话
就不光是统计的问题 你得看看引起异常分布的原因是什么了 说不定很有趣呢还
s*****0
发帖数: 357
4
Essay写累了上来灌灌水,没想到脸红脖子粗的争了一场,多少有些意气了。忙了一天
,现在闲下心来好好说说这个话题。既然有网友抛砖引玉了,缄口不言也实在不够尊重
。另外版主塞了不少包子,也不能吃白食.
先说说常用的描述数据的几个概念.
1. random variation -- variability有两大类,一类是知道来源的,还有一类是
unexplained. 比如一部分variability是由treatment effect引起的,而剩下的大部分
variability却不知道缘故. 后者经常被归入random variation.
2. Mean -- 最常见的当然是arithmetic mean, 特殊情况下也会用geometric及
harmonic mean. 任何数据组都能计算mean, 但不是所有时候用mean都合适. 当碰到
extreme data values的时候(经常因为技术条件所限边缘值不太容易被精确测量),
median就会有很大的优越性, 因为median可以大幅降低个别extreme value的影响.
3. Median -- 概念不多提了, 优
s*****0
发帖数: 357
5
Essay写累了上来灌灌水,没想到脸红脖子粗的争了一场,多少有些意气了。忙了一天
,现在闲下心来好好说说这个话题。既然有网友抛砖引玉了,缄口不言也实在不够尊重
。另外版主塞了不少包子,也不能吃白食.
先说说常用的描述数据的几个概念.
1. random variation -- variability有两大类,一类是知道来源的,还有一类是
unexplained. 比如一部分variability是由treatment effect引起的,而剩下的大部分
variability却不知道缘故. 后者经常被归入random variation.
2. Mean -- 最常见的当然是arithmetic mean, 特殊情况下也会用geometric及
harmonic mean. 任何数据组都能计算mean, 但不是所有时候用mean都合适. 当碰到
extreme data values的时候(经常因为技术条件所限边缘值不太容易被精确测量),
median就会有很大的优越性, 因为median可以大幅降低个别extreme value的影响.
3. Median -- 概念不多提了, 优... 阅读全帖
s*****0
发帖数: 357
6
说正题以前,先胡扯几句,算是给已经转了统计或者正在转统计的朋友们提个醒。我这
是杂谈贴,不是劝退。偶尔隔壁统计版逛逛,如今正在向生物版靠拢,成为劝退的大本
营。以前是SAS大本营,原本已经很悲哀了,现在有赶超我版的苗头。归根到底就一个
问题,就是现在的行情统计好不好找工作。我要去隔壁说统计很多availability,估计
立刻会被砖头拍死,为什么?因为大部分在版的job seeker都是fresh,又没有经验又
要身份支持,哪怕有一千个机会, 这么一stratify,也剩不了几个,而且广大的老印兄
弟还虎视眈眈。
其时学统计的时候必须要弄清楚一个问题,应用统计的关键在于应用,大部分转统计的
人都不会去搞methodology念PhD,而是期望靠统计找份工作。但当你工作后就会明白,
统计只是一个工具,工作的经验有一部分讲究的是你对统计工具的娴熟,但更看重的是
你在行业里累积的经验。比如在药厂里搞生统,当你写SAP的时候会去理解一个
therapeutic area,在银行里建模,你会去理解各种各样的风险模型信用模型。你以后
改resume跳槽,真正值得突出的是这些经验,而会什么mult... 阅读全帖
a***a
发帖数: 40617
7
一个150kd,一个还大于500kd
不用UV都行,只要你柱子合适(s200)且上样量足够
组分手工收集的细一点(analytical的柱子,bed vol约28ml),那就0.5ml一个组分
prep柱子,bed vol约120ml,1ml一个组分
然后每个fraction取一点做bradford就可以判定峰的位置了(可以肉眼直接看)
如果你上样量不够,你没有连续动态监测UV的装置(如FPLC上自带的)
光靠取样用比色皿去自己测,那误差和variation都够你喝一壶的,你根本无法判断
峰的位置
结论就是
上样量必须够。如果上样量不够,还是得FPLC,虽然也是用UV的,但是那个很稳定
variation小,所以灵敏度和复现性都远远好于你用比色皿
这个讨论我看了半天,跟以前好多次一样,感觉学生物的大部分还是停留在书本
b****r
发帖数: 17995
8
全基因组测序和GWAS可不是一回事
GWAS基于的是common disease common variants 的hypothesis,而且华丽丽滴忽略了
copy number variation这个比SNP更大的variation
而全基因组测序直接就是hypothesis free的,直接把所有的东西都搞了出来。和
function assay也没有直接的关系,只是在最后确证阶段有可能用上一点
d*********n
发帖数: 10
9
Natural variation in Ghd7 is an important regulator of heading ...
by W Xue - 2008 - Cited by 112 - Related articles
May 4, 2008 ... Natural variation in Ghd7 is an important regulator of
heading date and yield potential in rice. Weiya Xue1,2, Yongzhong Xing1,2, .
..
www.nature.com/ng/journal/vaop/ncurrent/abs/ng.143.html
2008 Nature Genetics, cited by 112 times. This is a remarkable achievement!
A*******e
发帖数: 284
10
对于一个job而言,或许bioinfo现在有一个好的market, 比做实验的有高的salary。
但对于一个行业而言,我并不认为这是一个还在扩展的行业,相反应该它的前途应该是
萎缩,因为我认为会有越来越多的人对bioinfo的认识会越来越真实,越来越实际,越来
越理性。现在好的job market和整个行业前途的收缩并不矛盾。 bioinfo就是提供一些
平台,工具,以供处理实验数据,并不能解决实际的biology问题,因而决定了其用处
的有限性。即使现在流行的全基因组snp测序,它实际是一个genetics问题。其基本原
理就是做genotype和phenotype的连锁分析。做genetics的都知道,这是一个最基本的
道理,只是现在可以大规模测序,可以发掘很多的genome marker,甚至可以直接在一
个species里面分析不同个体基因的natural variation,再去他们的phenotype
variation做连锁分析,这是一个遗传学问题。很早前作qtl的就这么做了,只是那时候
marker难找。所以归结起来这是一个用bioinfo来辅助分析genetics ... 阅读全帖
l****u
发帖数: 46
11
来自主题: Biology版 - NCBI 的 SRA 停了?
http://www.ncbi.nlm.nih.gov/sra
Sequence Read Archive (SRA) and Trace Archive repositories have been
discontinued
Due to budget constraints, NCBI will be discontinuing its Sequence Read
Archive (SRA) and Trace Archive repositories for high-throughput sequence
data. Closure of the databases will occur in phases. SRA and Trace will stop
accepting some types of submissions in the coming weeks, and all
submissions within the next 12 months. Over the next several months, NCBI
will be working with sta... 阅读全帖
s********r
发帖数: 312
12
来自主题: Biology版 - 对分子进化的思考
The standard neutral model and a selective sweep:
higher vertebrates do not have a high enough reproductive rate to support
rapid rates of beneficial evolution. It takes too many deaths to select for
new mutations.Kimura reasoned the majority of new mutations must be ‘
neutral’ The rate of neutral evolution could be much faster than positive
evolution, and would be limited only by the rate of DNA copying errors.
Since natural selection will not act on neutral traits, which do not affect
survival... 阅读全帖
l***d
发帖数: 1828
13
来自主题: Biology版 - Cells may stray from 'central dogma'
any comments?
http://www.nature.com/news/2011/110519/full/news.2011.304.html#
All science students learn the 'central dogma' of molecular biology: that
the sequence of bases encoded in DNA determines the sequence of amino acids
that makes up the corresponding proteins. But now researchers suggest that
human cells may complicate this tidy picture by making many proteins that do
not match their underlying DNA sequences.
In work published today in Science1, Vivian Cheung at the University of
Pennsy... 阅读全帖
a***y
发帖数: 19743
14
在英国的Xiangchao Gan牛啊。
Genetic differences between Arabidopsis thaliana accessions underlie the
plant’s extensive phenotypic variation, and until now these have been
interpreted largely in the context of the annotated reference accession Col-
0. Here we report the sequencing, assembly and annotation of the genomes of
18 natural A. thaliana accessions, and their transcriptomes. When assessed
on the basis of the reference annotation, one-third of protein-coding genes
are predicted to be disrupted i... 阅读全帖
a*******a
发帖数: 4233
15
来自主题: Biology版 - 关于ips 和es stem cells问题请教
同一strain的老鼠也有variation啊
我当时的想法是建一个es系、挑单克隆出来一半存了,
另一半诱导分化成终末分化细胞然后再ips
不过中间还有好几个技术问题
而且epigenome variation必然很大。。
T****i
发帖数: 15191
16
新技术作为技术储备到花钱不多,但只要用起来,就收不住了,铺开来,有多少钱也能
花光。
另外,不是所有的技术都有必要实现。技术不成熟的时候,完全可以等待未来更成熟的
技术再大规模铺开应用。而现实是,往往一个新技术出来,大规模应用就开始了。比如
,做酵母的同学都知道yeast knockout collections (YKO)。当时做的时候,就没引
入loxP sites,就大规模做了。用YKO strains 做double KO 就不方便。现在用zinc
finger nuclease技术做knockout mice,其实也有很多问题,但也开始大规模铺开了。
希望Sigma没从NIH拿钱做这个。
发生这种有技术马上就大规模上马的原因,主要是个人和小集团利益。有新技术,就有
忽悠钱的机会。而且,大规模做,自己5年的funding就有保障了。而且肯定能产生结果
。至于有没有用,那也肯定有的,作为工具。
还有,对技术应用能解决多少问题,事先的评估是很不够的。基本就听申请人瞎吹。讲
个例子,无论是传统的SNP/haplotype mapping,还是新一些的arrays,还是最新的
Next... 阅读全帖
T****i
发帖数: 15191
17
新技术作为技术储备到花钱不多,但只要用起来,就收不住了,铺开来,有多少钱也能
花光。
另外,不是所有的技术都有必要实现。技术不成熟的时候,完全可以等待未来更成熟的
技术再大规模铺开应用。而现实是,往往一个新技术出来,大规模应用就开始了。比如
,做酵母的同学都知道yeast knockout collections (YKO)。当时做的时候,就没引
入loxP sites,就大规模做了。用YKO strains 做double KO 就不方便。现在用zinc
finger nuclease技术做knockout mice,其实也有很多问题,但也开始大规模铺开了。
希望Sigma没从NIH拿钱做这个。
发生这种有技术马上就大规模上马的原因,主要是个人和小集团利益。有新技术,就有
忽悠钱的机会。而且,大规模做,自己5年的funding就有保障了。而且肯定能产生结果
。至于有没有用,那也肯定有的,作为工具。
还有,对技术应用能解决多少问题,事先的评估是很不够的。基本就听申请人瞎吹。讲
个例子,无论是传统的SNP/haplotype mapping,还是新一些的arrays,还是最新的
Next... 阅读全帖
l**********1
发帖数: 5204
18
来自主题: Biology版 - 【求教】关于做人类细胞
看英语没有问题的 人类基因组的新手的话
hg18 hg 19的区别
Why are some variants mapped to hg18 but not hg19?
When the variation data was mapped to hg19, we did our best to come up with
a process that would result in a low error rate, while maximizing the number
of variants kept in hg19. Due to changes in the underlying assembly, some
regions are re-arranged while others contain novel sequence, thus changing
the structure of the region. In most cases the assembly hasn't changed
enough to cause difficultly in remapping,... 阅读全帖
s******a
发帖数: 252
19
来自主题: Biology版 - 土博找到faculty来写点心得
So it's Barkai's student.
1 Science, 1 Nat Genetics.
That's outstanding but not surprising.

Publications:
Tsui K, Dubuis S, Gebbia M, Morse RH, Barkai N, Tirosh I, Nislow C (2011).
Evolution of nucleosome occupancy: conservation of global properties and
divergence of gene-specific patterns. Mol Cell Biol. 31:4348-55.
Dori-Bachash M, Shema E, Tirosh I (2011). Coupled evolution of transcription
and mRNA degradation. PLoS Biol. 9(7):e1001106.
Tirosh I, Barkai N (2011). Inferring regulatory mechani... 阅读全帖
s******y
发帖数: 220
20
来自主题: Biology版 - 问个关于老鼠遗传背景的问题
我管的line很多,老板也没经验,(我们lab以前做大型动物model的)我phd做生化的
,老鼠对我来说也是新的,我一开始genotyping都是自己做的,我们triple mutant做
起来也很tedious的。而且还有别的line等着我。估计有些一直做老鼠的lab都有专门的
technician来干这些吧,而且人家更有经验知道这些隐患。
后来反正也发现了现象,就一直拖着:(,因为我要做很多别的实验来characterize啊
,一忙又忘了。
再说吧,我要back cross回去,就算5代,一代三个月,那也要15个月后开始
characterize了,觉得耗时太久了。
什么叫每代跟每代老鼠不一样? 我的确发现有variation,我平行设了几个breeder,
来自于各个breeder的老鼠,on average 没有明显不同,但是 littermate的确有
variation, 有的发病快,有的发病慢。
e*******e
发帖数: 1837
21
来自主题: Biology版 - 问个基因组的问题
人类基因组测序是完成了。但是每个人的基因序列是不一样的,每个种族也有差别。那
么这个基因组测序得到的信息是某个人还是某个人种的?
The reference genome is what it is: a reference. It's actually a chimeric of
multiple individuals from different populations, and it is not meant to be
used to study human variation.
Study of the differences among individuals/populations are in the field of
population genetics.
Projects such as the HapMap project and the 1000 Genome project are aimed at
identifying the difference (i.e., genetic variation) among human
individuals/po... 阅读全帖
s******9
发帖数: 283
22
来自主题: Biology版 - science的编辑抢稿
The peer review process at Science
http://www.publications.parliament.uk/pa/cm201011/cmselect/cmsc
1.Peer-reviewed scientific publications represent the primary useful archive
of scientific progress. Scientific publications have served other main
functions as well: They are a primary means of evaluating scientists and
institutions, and they have become a main pathway for informing the general
public about science, through coverage in the media and press releases (new
results are news). Peer-revi... 阅读全帖
l**********1
发帖数: 5204
23
就是虫子
还有这个呢: cryptic development
pls refer:
Duveau F et al. (2012)
Role of pleiotropy in the evolution of a cryptic developmental variation in
Caenorhabditis elegans.
PLoS Biol. 10: e1001230.
link:
//www.ncbi.nlm.nih.gov/pubmed/22235190
and
Chandler CH (2010)
Cryptic intraspecific variation in sex determination in Caenorhabditis
elegans revealed by mutations.
Heredity 105: 473-82.
link:
//www.ncbi.nlm.nih.gov/pubmed/20502478
NB: LZ 没有透露任何 模式生物 或非模式生物其名称 也没有透露那两alleles 是否
有关性分化 或 进化 所以如果这两线虫的文章 ... 阅读全帖
d**********2
发帖数: 831
24
Rate of de novo mutations and the importance of father’s age to disease
risk
Nature 488, 471–475 (23 August 2012)
Mutations generate sequence diversity and provide a substrate for selection.
The rate of de novo mutations is therefore of major importance to evolution
. Here we conduct a study of genome-wide mutation rates by sequencing the
entire genomes of 78 Icelandic parent–offspring trios at high coverage. We
show that in our samples, with an average father’s age of 29.7, the average
de novo ... 阅读全帖
x******m
发帖数: 736
25
我想起来有一次一个生物学教授在一个conference上讽刺statistician,说他找到一个
统计学教授,在他的实验中,问多大sample size能达到signficant results。统计学
教授告诉他大概200,他很得意的说,他只用了150就行了,statistician只会夸大效果。
我马上反问他,知不知道你的sample大概variation,sample size估计的偏差不是
statistics的错,而是你给他错误的estimation of variation。那老头估计也没听懂
u*********1
发帖数: 2518
26
作为一个曾经0基础的菜鸟,我还是蛮有体会的。
想想一年前我连linux里的grep都不晓得是啥。老板说“grep”,我说gre。。啥?greb
吗?老板摇摇头说you really have a lot to learn...不过老板超好,想办法给我把
各种基础的东西讲清楚。。。包括RAM是啥。。汗。。。
做NGS/bioinformatics的,我觉得核心思想还是:如何利用计算机手段解决生物问题。
说起来简单但未必每个人都深刻体会的到。什么python/bash/perl啥啥的,要入门很快
,但也绝对不是什么两个星期就搞定。我现在和python打交道也一年了,但也完全就是
个皮毛,主要是你自己的project决定的。。如果你永远只需要简单的process下你的
text,而且text如果不大比如100MB,你可以永远for line in text。。或者readlines
(),但如果碰到很大的text,就不能readlines()了因为cluster可能没有那么大的
memory to load the whole text.
所以我觉得就是现学现用,除非你是CS系科班搞计算出身... 阅读全帖
u*********1
发帖数: 2518
27
来自主题: Biology版 - Sequencing 还能热多久呢?
不晓得大家有没有看这个文章:
http://www.cell.com/abstract/S0092-8674%2812%2900166-3
Personal Omics Profiling Reveals Dynamic Molecular and Medical Phenotypes
Michael Synder在14个月内各种genomics,transcriptome,proteomics,
metabolomics的数据叠加起来,最后准确的预测了他要得糖尿病
我觉得只要:
1.DNA测序技术本身质量足够高(比如更加准确,read更加长),价格足够低;那么需
求量会越来越大。你看几年前exome sequencing还是不多;而现在成百上千的exome
sequencing都满天飞了。DNA测序可以解决genomics和transcriptome这两样最重要的
omics
2.搞清楚这些sequences到底干啥的。coding protein到底什么作用;noncoding区域
regulatory function(比如ENCODE project),以及这些regulato... 阅读全帖
l********n
发帖数: 260
28
来自主题: Biology版 - paper wanted.Thanks
paper wanted
Phenotypic Heterogeneity of Genomic Disorders and Rare Copy-Number Variants
S. Girirajan and Others
Most chromosomal deletions and duplications (copy-number variants) that are
associated with neurodevelopmental disorders are known to result in a wide
variation of clinical phenotypes. This study describes a genetic mechanism
for such variation.
please send paper to my email: a*************[email protected]. Thanks a lot!
Jiatian
n*********4
发帖数: 99
29
CGH microarray is used to check copy number variation.
Since it is DNA array, it should be relatively reliable.
It can be used for whole genome structure variation scan.
h******s
发帖数: 3420
30
来自主题: Biology版 - 求教一个生物统计学得问题
try mixed model for both within group variation and between group variation.
m******p
发帖数: 67
31
I have genomic DNA samples of about 1000 diabetic patients. We are
interested in examining the sequence variations of a gene in these samples.
But we are not good at this and have 2 questions.
1) Can we do that by traditional Sanger sequencing? This is very doable.
We first PCR the fragment of interest, and then do sequencing. But the
problem is that Sanger sequencing cannot distinguish paternal and maternal
alleles, that is, we cannot tell whether a variation is homozygous or
heterozygous, u... 阅读全帖
g***n
发帖数: 14
32
来自主题: Biology版 - 求教生物信息学问题
谢谢你详细的回复
我的mutant实际上还有很多noise,原因是我的线虫体外回交成功率极低,这也是为什么
而且,我研究的线虫基因组还没有发表,所以也没有common variants数据库了,我这
个搞非模式生物的也只能流口水
所谓的wildtype A和B,是同一个isolate里发现的,理论上来说genome的variation很
小,测序数据也证明了这点
其中一个问题是,两个wildtype的差异基因很可能是控制上游表达的,而mutant中的
candidates基本都靠近下游。这是通过研究c elegans的ortholog 得出的结论。但不是
很肯定,因为线虫间的差异很大。
另外,我手上还有两个wildtype在stage L2的transcriptome,这个stage是所谓
phenotype的决定期。通过分析发现不到30个基因差异表达。有没有什么方法可以把
genome和transcriptome放在一起做个cross analysis的?
你上一个回复中提到的structure variation,是指rna的还是蛋白的?是怎么做呢?如
果有已经发表的文章,能不能给... 阅读全帖
l**********1
发帖数: 5204
33
来自主题: Biology版 - 才发现deseq除了2,好太多
so what? if your found can solve solid wet or hard bio can’t solve non-
linear trend between
count level and variance by Deseq or other softs ?
pls refer,
01-16-2013, 12:40 AM #1
JesperGrud
Junior Member
Location: Odense
Join Date: Aug 2012
Posts: 5
DESeq and independent filtering
Hi everyone
I know this topic has been up a few times, but yet there is a question. So
the basic idea about filtering is that it is done unsupervised to remove
genes that are too lowly expressed to become signif... 阅读全帖
m******g
发帖数: 467
34
PNAS 14.05.06
稍微了解一下:
1. Hypermutable DNA chronicles the evolution of human colon cancer
A simple PCR-based assay
Interrogating somatic variation in hypermutable polyguanine (poly-G) repeats
2. Exploration of sequence space as the basis of viral RNA genome
segmentation
小知识:
1. Patterns of coding variation in the complete exomes of three Neandertals
2. Horizontal transfer of an adaptive chimeric photoreceptor from bryophytes
to ferns
l******u
发帖数: 936
35
http://investor.illumina.com/phoenix.zhtml?c=121127&p=irol-news
Illumina’s MiSeqDxTM Receives FDA Premarket Clearance with Two Cystic
Fibrosis Assays and Universal Kit for Open Use
Premarket Clearance is an Industry First for a Next-Generation Sequencing
System
SAN DIEGO--(BUSINESS WIRE)--Nov. 19, 2013-- Illumina, Inc. (NASDAQ:ILMN)
today announced that it received premarket clearance from the U.S. Food and
Drug Administration (FDA) for the MiSeqDx system, the first high-throughput
DNA sequencin... 阅读全帖
l**********1
发帖数: 5204
36
来自主题: Biology版 - NGS数据分析的流程
Plus
To LZ:
just check,
>http://bcbio.wordpress.com/tag/ngs/
cited:
>Access VCF variant information
>In addition to extending the GATK through walkers and annotations you can
also utilize the extensive API directly, taking advantage of parsers and
data structures to handle common file formats. Using Clojure’s Java
interoperability, the variantcontext module provides a high level API to
parse and extract information from VCF files. To loop through a VCF file and
print the location, reference alle... 阅读全帖
w*******e
发帖数: 63
37
经常在这个版上潜水,很少发言,心理承受力较差,如果哪些话说得不合适,还请诸位
轻拍。这个帖子主要是自己要招实验室工作人员。另一个帖子(http://www.mitbbs.com/article_t/Biology/31869207.html)涉及遗传发育所分子系统生物学中心PI的招聘信息。
首先这不是一个典型意义上的招聘广告,因为从海外直接招聘实验室工作人员,仅仅电
话或者skype,对应聘者对我都更像是赌博,双方风险都不小。所以我想象中的招聘对
象是由于家庭等原因已经决定回国,又还没有找到合适的工作,对于科研仍然感兴趣,
又不一定要自己开实验室的人。
我(钱文峰)2002年到2006年北大生命科学学院读本科,毕业论文在王文实验室完成(
对,就是你知道的那个,他在学术上对我有非常大的帮助)。2006年到2012年在U of
Michigan的EEB(生态与进化系)张建之实验室读博士,2012年12月加入中科院遗传发
育所建立实验室。在博士期间我的研究方向从比较基因组学,进化基因组学,慢慢转向
功能基因组学。现在我最感兴趣的问题是variation of gene expression,... 阅读全帖
y***k
发帖数: 40
38
终于有人忍不住下手了,可是到哪里找业务去喂饱这个巨兽呢
=================================================
SAN DIEGO & SHANGHAI--(BUSINESS WIRE)--Mar. 10, 2014-- Illumina, Inc. (
NASDAQ:ILMN) and WuXi PharmaTech (Cayman) Inc. (NYSE:WX), a leading
pharmaceutical, biotechnology, and medical device R&D outsourcing company
with operations in China and the United States, today announced that the
WuXi Genome Center has purchased an Illumina HiSeq X Ten sequencing system.
This new investment will enable WuXi’s clinical genomic ser... 阅读全帖
s****l
发帖数: 10462
39
有人愿意讨论这里面提及的测序技术吗?优缺点,可行性,第一手经验等等
这里面谁现在是赢家很清楚,但是可见的将来和更远的将来谁会赢?
http://cen.acs.org/articles/92/i33/Next-Gen-Sequencing-Numbers-
全文拷贝如下
试试看图能不能贴上
/1407973177171.jpg
/1408028636124.jpg
OVER STORY
Next-Gen Sequencing Is A Numbers Game
As technical and cost barriers fall, instrument firms move their systems
into research and clinical markets
By Ann M. Thayer
Department: Business
Keywords: instrumentation, gene sequencing, diagnostics, genomics, cancer
[+]Enlarge
09233-cover-Openercxd_17647969-690
A... 阅读全帖
d******1
发帖数: 709
40
【 以下文字转载自 Boston 讨论区 】
发信人: santa2009 (santa), 信区: Boston
标 题: 羊穿microarray 发现8号染色体多了一点点怎么办?
发信站: BBS 未名空间站 (Wed Dec 10 19:34:30 2014, 美东)
高龄产妇, 二胎,等明年生产时已经39了.先做了maternity T21 plus正常。觉得不放
心,在18周时做了一个羊穿,自己掏腰包加选了microarray (这个查得更细,不加选
这个就是普通的羊穿)。 普通的羊穿结果没问题,但是microarray 发现了8号染色体
上多了一小块(8p23.1), 大小大约0.73Mb。
下面是报告的原文, 觉得写的有点模糊:
No diagnostic copy number were observed, however, one variant of uncertain
significance was identified: a heterozygous copy number gain of 0.73 Mb on
8p23.1 (10,875, 772-11... 阅读全帖
s*****5
发帖数: 52
41
前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
一般会被排除。
但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
品里,那么这个population的precision可以用coefficient of variation from
median来表示,accuracy用deviation of median from true ratio来表示的话, 这些
低质量的PSM肯定会导致整体数据q... 阅读全帖
s*****5
发帖数: 52
42
前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
一般会被排除。
但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
品里,那么这个population的precision可以用coefficient of variation from
median来表示,accuracy用deviation of median from true ratio来表示的话, 这些
低质量的PSM肯定会导致整体数据q... 阅读全帖
v**********m
发帖数: 5516
43
来自主题: Biology版 - 联邦劳工统计局的报告
http://www.bls.gov/opub/mlr/2015/article/stem-crisis-or-stem-su
US Department of Labor
A to Z Index|FAQs|About BLS|
Contact Us
U.S. Bureau of Labor Statistics
Follow Us|What's New|Release Calendar|Site
Map
HomeSubjectsData ToolsPublicationsEconomic ReleasesStudentsBeta
HOMEARCHIVESFOR AUTHORSABOUT
ARTICLE
MAY 2015
STEM crisis or STEM surplus? Yes and yes
The last decade has seen considerable concern regarding a shortage of
science, technology, engineering, and mathematics (STEM) workers to meet ... 阅读全帖
m******e
发帖数: 1932
44
来自主题: Biology版 - Biorad cfx96 vs Roche lc96
求问:这两个机器哪个好?主要跑taqman和sybr,也有可能会用到hrm。这两天demo,
感觉Roche的在小amplicon上的well to well variation比biorad小,但amplicon大一
些, roche的well to well variation就大得多,而biorad不论Amplicon size,表现都
挺稳定。有经验的同学们请多多指教!谢谢!
r**********e
发帖数: 587
45
来自主题: Biology版 - 转行 bioinformatics
未来long read普及,成本继续降低,对于在计算机层面认识noncoding sequence,以
及structural variation,以及repetitive sequence,甚至telomere centromere肯定
有革命性帮助,从这点说,NGS远远不会衰落。
毕竟一个生物和疾病层面很重要的东西---noncoding sequence,98%的human genome我
们都不清楚功能。我们可以更好更精确的identify complex structural variation,
甚至运用到prenatal的产检上去,这是industry的机遇 。
但是一个根本性问题是,哪怕你做再多的evolution层面的比对,请你告诉我:
noncoding sequence的biology function是什么?什么promoter,enhancer,intron这
些都是已经研究相对清楚的(但哪怕如此研究起来还是很困难),有更多的gene
desert的东西,必须要通过实验实验实验实验实验实验来证实。。。。。但一提到实验
,尤其是subtle effect的,就各... 阅读全帖
r**********e
发帖数: 587
46
来自主题: Biology版 - 转行 bioinformatics
未来long read普及,成本继续降低,对于在计算机层面认识noncoding sequence,以
及structural variation,以及repetitive sequence,甚至telomere centromere肯定
有革命性帮助,从这点说,NGS远远不会衰落。
毕竟一个生物和疾病层面很重要的东西---noncoding sequence,98%的human genome我
们都不清楚功能。我们可以更好更精确的identify complex structural variation,
甚至运用到prenatal的产检上去,这是industry的机遇 。
但是一个根本性问题是,哪怕你做再多的evolution层面的比对,请你告诉我:
noncoding sequence的biology function是什么?什么promoter,enhancer,intron这
些都是已经研究相对清楚的(但哪怕如此研究起来还是很困难),有更多的gene
desert的东西,必须要通过实验实验实验实验实验实验来证实。。。。。但一提到实验
,尤其是subtle effect的,就各... 阅读全帖
r**********e
发帖数: 587
47
从来就只用现成的package (alignment, GATK, haplotype, WGS, exome, RNA-seq,
structural variation)
会一些python perl R,但都是皮毛
完全没做过统计分析
我的工作主要就是寻找 genetic variation....
这也是为什么我觉得自己bioinformatics其实很弱。。
r**********e
发帖数: 587
48
PhD临近毕业。老板MD,主要做disease genetics,PhD前半部分是纯bioinformatics,
寻找疾病mutation或者risk lock;后半部分就是研究这些位点的功能,做了很多实验
分子细胞RNA等等基础研究(已后悔)。好处是啥都懂一些,坏处是不精通。
技能方面,不会自己写package,从来就只用现成的package (alignment, GATK,
haplotype, WGS, exome, RNA-seq,
structural variation),会一些python perl R,但都是皮毛,完全没做过统计分析
bioinformatics方面我的工作主要就是寻找 genetic variation....这也是为什么我觉
得自己bioinformatics其实很弱。。
未来的事业方向我非常非常清楚和坚定,就是clinical genetics,只想做临床or疾病
的基因组分析,坚决不做基础生物研究。但有个选择问题是继续一半实验+一半生物信
息的模式,还是下定决心彻底做生物信息
1. 一半实验+一半生物信息:还是对有实际应用价值的医学基因组学很... 阅读全帖
r**********e
发帖数: 587
49
从来就只用现成的package (alignment, GATK, haplotype, WGS, exome, RNA-seq,
structural variation)
会一些python perl R,但都是皮毛
完全没做过统计分析
我的工作主要就是寻找 genetic variation....
这也是为什么我觉得自己bioinformatics其实很弱。。
r**********e
发帖数: 587
50
来自主题: Biology版 - 请教染色体易位
说下我的comments吧
DELLY其实是比较新的软件,综合了paired-end discordant和split-read两种signal来
make calls,自然是不错的,而且也是1000genome使用的软件之一,而且最后结果提供
vcf format
SV领域最早最原始的三个软件,我个人认为的,read-depth的CNVnator;discordant的
breakdancer;以及split-read的Pindel;后续陆陆续续出来了很多类似软件,其实大
同小异,很多都是为了发文章而发文章的trash paper。上面说的三个软件,虽然都是
基于一种signal,但都算元老,1000genome使用的软件,而且关键是有四五年历史,很
多人使用,所以一直在update,debug,maintain,使用起来比较上手。但CNVnator是
不可能计算translocation的,Pindel可以找到translocation但Pindel是针对比较小的
structural variation,因为big SV的computational cost太高
还有一个超级好的... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)