l******o 发帖数: 3764 | 1 有一个paper里面提到了几个SNPs有funtional change,
没有给rs#,只给了相对位置
其中有两个SNP在dbSNP里面根本找不到
分别是 UGT1A4 -36G>A, UGT1A4 -217T>G
dbSNP里面UGT1A4 5' near gene region倒数4个分别是
rs3732219 -219C>T
rs45454101 -204G>A
rs3732218 -163G>A
rs199517966 -39C>T
请问为什么会这样?我有什么地方理解错了吗?
dbSNP link:
http://www.ncbi.nlm.nih.gov/projects/SNP/snp_ref.cgi?chooseRs=a |
|
l******o 发帖数: 3764 | 2 没有,跟本就没有supplementary material
说留一手也不成立啊,位置和突变都给了,没有什么可保密的了
我们是做群体遗传的,我本来是想看看这两个snp的frequency, 结果dbsnp里竟然没有
所以怀疑是否自己有什么地方理解有误 |
|
j*p 发帖数: 411 | 3 攒人品,顺便回答一下 iiiir 的问题。
我们尝试过好几种不同的SNP calling的方法,包括GATK, Samtools, Varscan,
SeqGenes, 等,并且做了SNP array 作为gold standard比较各种方法的prediction
power。
从我们的经验,BWA + GATK 最好,sensitivity 和 specificity 都在95%以上。
以下是GATK 的pipeline
假设你有一个control 样品C 和一个样本样品A的pair-end sequencing,共4个文件,C
_R1.fastq, C_R2.fastq, A_R1.fastq and A_R2.fastq如何通过BWA/GATK去找样品A中
的SNPs (相对于C)
假设assembly 用的是hg19,你的BWA index 在这里:/bwa/indexes/hg19
Check this website if you have any questions:
http://seqanswers.com/wiki/How-to/exome_analysis
#s... 阅读全帖 |
|
i***r 发帖数: 1035 | 4 谢谢,祝你一切顺利!
我这种情况怎么搞(目前还是没有弄明白)
有2个原始文件,一个是发飙了的SNPs数据,大概70个不同human poupulations,是一
个bed文件,结构是这样(右边省略了若干column)
chr1 41217 41218 snp 2 + T A dbsnp.108:
rs3863625 NN
chr1 41255 41256 snp 3 + C T dbsnp.111:
rs4543737 NN
chr1 41980 41981 snp 4 + A G dbsnp.86:
rs806721
姑且叫A.bed
另一个是个bam文件,别的地方下载的,是另一个human population数据,转成sam文件
之后(为了好看把SEQ和QUAL拿掉了):
all-hg18_1 0 chr1 39 10... 阅读全帖 |
|
j*p 发帖数: 411 | 5 攒人品,顺便回答一下 iiiir 的问题。
我们尝试过好几种不同的SNP calling的方法,包括GATK, Samtools, Varscan,
SeqGenes, 等,并且做了SNP array 作为gold standard比较各种方法的prediction
power。
从我们的经验,BWA + GATK 最好,sensitivity 和 specificity 都在95%以上。
以下是GATK 的pipeline
假设你有一个control 样品C 和一个样本样品A的pair-end sequencing,共4个文件,C
_R1.fastq, C_R2.fastq, A_R1.fastq and A_R2.fastq如何通过BWA/GATK去找样品A中
的SNPs (相对于C)
假设assembly 用的是hg19,你的BWA index 在这里:/bwa/indexes/hg19
Check this website if you have any questions:
http://seqanswers.com/wiki/How-to/exome_analysis
#s... 阅读全帖 |
|
i***r 发帖数: 1035 | 6 谢谢,祝你一切顺利!
我这种情况怎么搞(目前还是没有弄明白)
有2个原始文件,一个是发飙了的SNPs数据,大概70个不同human poupulations,是一
个bed文件,结构是这样(右边省略了若干column)
chr1 41217 41218 snp 2 + T A dbsnp.108:
rs3863625 NN
chr1 41255 41256 snp 3 + C T dbsnp.111:
rs4543737 NN
chr1 41980 41981 snp 4 + A G dbsnp.86:
rs806721
姑且叫A.bed
另一个是个bam文件,别的地方下载的,是另一个human population数据,转成sam文件
之后(为了好看把SEQ和QUAL拿掉了):
all-hg18_1 0 chr1 39 10... 阅读全帖 |
|
t**x 发帖数: 20965 | 7 请你仔细看看,
良性的三个报告。其中一个是这个德国医生自己的,他承认自己从来没有看过。第一个
genedx,是我们出院(04/13)后一个月报的(05/13), 这个极有可能就是我们宝宝的结
果,被报呈良性。
https://www.ncbi.nlm.nih.gov/clinvar/variation/92429/
这个变异发现10多年,欧洲基因库收录为恶性。只有美国报称良性,在我们宝宝刚刚出
院。你真得仔细看看时间和事情了。
你没有看到跨国界作假反而。。。你看看荷兰医生的回信。我真怀疑你到底是干什么的
?
这个变异发现了10多年了, 这个德国医生的链接的文献没有说是良性的, 你自己看看
下面德国医生附上的文献。我不是医生,我看不出来说这个变异是良性的。你如果愿意
看看我家宝宝cpt2的两个结果, 一个1.5%酶活性,一个15%酶活性,跟下面的温度相关
吻合得多好。
我家宝宝的下降更多,大概是因为他的变异更多。这个特征的变异很多年了,但是
cchmc和Baylor都没有查出来。你说说他们不知道?!
Here the excerpt von OMIM regarding this mut... 阅读全帖 |
|
t**x 发帖数: 20965 | 8 yangyi和aning我没有跟她/他斗, 我劝你们好好看看德国医生给的参考资料, 这个资
料你怎么得出是benign的结论的:
0018 ENCEPHALOPATHY, ACUTE, INFECTION-INDUCED, SUSCEPTIBILITY TO, 4
CPT2, PHE352CYS AND VAL368ILE [dbSNP:rs2229291] [dbSNP:rs1799821] [ClinVar]
Chen et al. (2005) found an association between 2 thermolabile polymorphisms
in the CPT1 gene and susceptibility to infection-induced acute
encephalopathy-4 (IIAE4; 614212) in Japanese children. The variants were a
1055T-G transversion, resulting in a phe352-to-cys (F352C) substitution (
rs... 阅读全帖 |
|
t**x 发帖数: 20965 | 9 我可以跟你说这个写这个文章的医生是一个十恶不赦的王八蛋!因为这个德国医生就是
跟西雅图儿童医院勾结的个婊子养的畜生。
这是我的信:
Von: Andrew Xie [mailto:[email protected]/* */]
Gesendet: Montag, 19. September 2016 13:24
An: Wieser, Dr. Thomas, Chefarzt
Betreff: RE: Question on a benign mutation / NM_000098.2(CPT2):c.1102G>A (p.
Val368Ile) Simple - Variation Report - ClinVar – NCBI
Dear Dr. Wieser,
Thanks for your reply.
In the link it says 3 sources reporting ‘benign’ :
1. GeneDX on May 29, 2013
2. Emory Genetics Laboratory on Apr 16, 2014... 阅读全帖 |
|
s******9 发帖数: 283 | 10 NCBI protein database一般都有标注吧。
FEATURES Location/Qualifiers
source 1..503
/organism="Homo sapiens"
/db_xref="taxon:9606"
gene 1..503
/gene="TGFBR1"
/gene_synonym="ALK5"
/gene_synonym="SKR4"
Protein 1..503
/gene="TGFBR1"
/gene_synonym="ALK5"
/gene_synonym="SKR4"
... 阅读全帖 |
|
e******6 发帖数: 6 | 11 Job Description
Cooperation Introduction
GenScript is a contract research organization (CRO) specialized in
biological research and drug discovery services. Ever since its inception in
2002, GenScript has experienced rapid, constant, and organic growth. Now
GenScript has become a leading biology contract research organization (CRO)
in the world, with a global operating team of over 900 dedicated scientists,
staffs.
Headquartered in Piscataway, New Jersey, GenScript has become a leading
Biology C... 阅读全帖 |
|
q******o 发帖数: 17 | 12 赛福解码(北京)基因科技有限公司(简称“赛福基因”)坐落于中关村核心区域,是
微软创投加速器孵化的唯一一家针对医疗健康基因大数据深度挖掘与精准分析的初创团
队,并已于近期完成天使轮融资。赛福基因由顶级美国生物信息学和转化医学的海归博
士组成,公司高级顾问团包括美国唯一生物医学信息科学院院士、美国精准医疗联盟技
术负责人以及美国遗传咨询师等。
赛福基因专注于中国人基因大数据在健康管理与疾病诊疗领域的产业化应用,致力于推
进中国的精准医疗事业,让每个中国人都拥有一本基因使用说明书。
我们为医院、科研单位和三方检测机构提供数据分析解读服务及各类疾病基因检测产
品的研发服务,同时我们也正在开发自动化基因数据分析平台,并着手建立专属于中国
人的疾病数据库。
在赛福基因,等待你的除了有增长空间的报酬,更有一帮有才、有趣、敢想、敢拼的同
事,会用心向你传授经验,期待与你共同成长!
如果你热爱生命,期望去影响甚至改变数亿中国人的健康事业,请联系我们,期待你的
加入!
具体招聘职位及招聘要求如下:
1. 生物信息分析师
工作地点: 北京
数量:2名
岗位职责:
· 肿瘤及遗传疾病相关的NGS数... 阅读全帖 |
|
y****1 发帖数: 671 | 13 发信人: dbSNP (SNP), 信区: PKUER
标 题: 北大77届后部分优秀校友一览(修订版)
发信站: 北大未名站 (2003年05月28日14:09:58 星期三) , 站内信件
( 招生网按:北大作为我国的最高学府,承担着为国家和民族培养杰出人才的重任。
百年
北大不辱最高学府的使命,一直默默地为国家做着杰出的贡献。北大人是低调的,北大人
更
是务实的,他们在各条战线上默默地耕耘着,我们为有着这样的校友而感到自豪和骄傲!
且不
说百年来北大始终站在时代的前沿,为国家输送了一代代的各领风骚的人才,单就北大19
77
年以后毕业的学子就足以让这所百年名校欣慰。
以下所列的是北大1977届以后的部分杰出校友,大家可以发现他们分布在各行各业,
这
也许是对北大综合性大学注重个性培养的特点的一个最好诠释。 )
北大近20多年来的毕业生在学术界的出色表现有目共睹,国内外学术界的精英人物都
有
一大批。在哈佛大学执教的校友不完全统计就有8人(1人为原北医毕业生)之多。
北美学术界代表有:
哈佛大学统计系正教授、2002统计学考普斯总统 |
|
y****1 发帖数: 671 | 14 大家共勉!
发信人: dbSNP (SNP), 信区: PKUER
标 题: 北美学术界中的北大优秀学子2.2版
发信站: 北大未名站 (2003年05月17日01:50:10 星期六) , 站内信件
已统计到336人,其中北大校本部毕业生321,医学部毕业生15人,在美国大学任教的310
人(
295
+15),在加拿大大学任教的21人,在著名研究所中研究工作突出的5人。其中正教授57+1
人,
副教授99+4人。
==========================================================================
顶尖名校(top 19)中执教的北大学子 (75+6人)
哈佛大学 Harvard University (7+1)
斯坦佛大学 Stanford University (2)
加州大学柏克利分校 UC Berkeley (5)
麻省理工学院 MIT (1)
加州理工学院 Caltech (1)
普林斯顿大学 Princeton University (2)
芝加哥大学 University of Chicago (3+1 |
|
y****1 发帖数: 671 | 15 发信人: dbSNP (SNP), 信区: PKUER
标 题: 任教北美大学的北大博士毕业生(整理补充版)
发信站: 北大未名站 (2003年11月14日03:58:10 星期五) , 站内信件
约翰霍普金斯大学 John Hopkins University
CHEN, Shi-Yi (MS 1984, PhD 1987), Prof. and Chair of Mechanical Engineering
B.S., Zhejing Univ., 1981
M.S., PKU, 1984
Ph.D., PKU, 1987
http://www.me.jhu.edu/~cfd/file/people/ShiyiChen.html
宾西法尼亚州立大学 Penn State University
XI, Xiao-Xing (BS1982, PhD 1986), Associate Prof. of Physics
B. Sc. in Physics, Peking University, Beijing, China Jan. 1982
Ph. D. in Physics, P |
|
y****1 发帖数: 671 | 16 If anyone has new information to update,
please tell us.
发信人: dbSNP (SNP), 信区: PKUER
标 题: 北美学术界中的北大优秀学子2.3版
发信站: 北大未名站 (2003年11月14日04:05:12 星期五) , 站内信件
已统计到355人,其中北大校本部毕业生339,医学部毕业生16人,在美国大学任教的326
人(310+16),在加拿大大学任教的23人,在著名研究所中研究工作突出的6人。其中正教
授71+1人,副教授105+5人。
==========================================================================
顶尖名校(top 19)中执教的北大学子 (80+7人)
哈佛大学 Harvard University (7+1)
斯坦佛大学 Stanford University (2)
加州大学柏克利分校 UC Berkeley (5)
麻省理工学院 MIT (1)
加州理工学院 Caltech (1)
普林斯顿大学 Princeto |
|
i***r 发帖数: 1035 | 17 input 文件的某1行,共22million
chr1 46669 46670 snp 11 + A G dbsnp.100:rs2548905
00 00 00 00 01 01 11 NN NN 11 01 NN 00
NN NN NN 00 00 00 00 00 11 NN 11 01
11 01 NN 00 00 00 11 NN 00 01 NN NN 00
00 00 NN 00 00 NN 01 00 11 NN 00 NN 01
01 NN 11 00 NN 11 NN 00 00 NN 00 01
01 NN NN 11 ... 阅读全帖 |
|
|
l****u 发帖数: 46 | 19 http://www.ncbi.nlm.nih.gov/sra
Sequence Read Archive (SRA) and Trace Archive repositories have been
discontinued
Due to budget constraints, NCBI will be discontinuing its Sequence Read
Archive (SRA) and Trace Archive repositories for high-throughput sequence
data. Closure of the databases will occur in phases. SRA and Trace will stop
accepting some types of submissions in the coming weeks, and all
submissions within the next 12 months. Over the next several months, NCBI
will be working with sta... 阅读全帖 |
|
u*********1 发帖数: 2518 | 20 作为一个曾经0基础的菜鸟,我还是蛮有体会的。
想想一年前我连linux里的grep都不晓得是啥。老板说“grep”,我说gre。。啥?greb
吗?老板摇摇头说you really have a lot to learn...不过老板超好,想办法给我把
各种基础的东西讲清楚。。。包括RAM是啥。。汗。。。
做NGS/bioinformatics的,我觉得核心思想还是:如何利用计算机手段解决生物问题。
说起来简单但未必每个人都深刻体会的到。什么python/bash/perl啥啥的,要入门很快
,但也绝对不是什么两个星期就搞定。我现在和python打交道也一年了,但也完全就是
个皮毛,主要是你自己的project决定的。。如果你永远只需要简单的process下你的
text,而且text如果不大比如100MB,你可以永远for line in text。。或者readlines
(),但如果碰到很大的text,就不能readlines()了因为cluster可能没有那么大的
memory to load the whole text.
所以我觉得就是现学现用,除非你是CS系科班搞计算出身... 阅读全帖 |
|
x*****d 发帖数: 704 | 21 有可能是他们故意留了一手。supplment里面有吗? |
|
|
m*****7 发帖数: 366 | 23 找找1000 genomes或ESP browser,搜gene,把所有gene内variants都list出来,再找
position,看有没有,有的可能太rare还没rsID 但可能在这二个database里有了,要是
还没有可能就是极其rare了 也不用看population frequency了 肯定是小于0.5%甚至0.
1%的 |
|
G******n 发帖数: 289 | 24 OMIM
dbSNP
and many many |
|
x*****d 发帖数: 704 | 25 "这里的问题就在于snp位于什么位
置,如果在编码区就直接做点突变检测蛋白表达量和功能就好;如果在启动子内就看是
否影响转录活性,做个luciferase就可以,"
对的。可以先这么做。对于在coding region的snp,可以看是不是missense。如果是
missense,可以做SIFT, Polyphen2看看对protein function有没有影响。
“但是如果在intron或者在启动子还上
游呢怎么做呢?要看是否影响转录调控?”
这就比较麻烦一点。intronic snp可以首先看有没有影响splicing,其次看mirna。还
有可以用A Catalog of Published Genome-Wide Association Studies看看有没有和以
前的GWAS有关
“还有一个根本问题就是,有什么网站可以直接
确定snp的位置的吗?”
NCBI dbSNP |
|
q******o 发帖数: 17 | 26 我们是一家坐落于北京中关村核心区域的基因科技公司,致力于把重大癌症转化为慢性
病,推进精准医疗,提高国人健康水平。我们现已经完成了天使轮融资。
我们现诚招聘全职生物信息分析师,参与打造基因数据智能分析平台。如果你热爱生命
,也想通过基因数据与临床的结合去影响和改变数亿中国人的生命,这是你发光发热的
地方!
生物信息分析师2-3名,职位需求如下:
•生物信息、统计或相关领域硕士以上学历
•精通next-generation sequencing数据分析,DNA-seq/RNA-seq至少一类
•精通python/perl/ruby/R中至少一门
•熟练使用基因组常用数据库及平台:dbSNP,1000 Genomes 等等
•熟练使用 statistical learning方法
•熟练英文阅读文档
•较强的口头和书面沟通技巧
•待遇面议
加分项:
•精通Django开发
•精通Hi-C/ChIA-PET等数据分析
•精通GWAS、家系/群体遗传学分析
... 阅读全帖 |
|
q******o 发帖数: 17 | 27 赛福解码(北京)基因科技有限公司(简称“赛福基因”)坐落于中关村核心区域,是
微软创投加速器孵化的唯一一家针对医疗健康基因大数据深度挖掘与精准分析的初创团
队,并已于近期完成天使轮融资。赛福基因由顶级美国生物信息学和转化医学的海归博
士组成,公司高级顾问团包括美国唯一生物医学信息科学院院士、美国精准医疗联盟技
术负责人以及美国遗传咨询师等。
赛福基因专注于中国人基因大数据在健康管理与疾病诊疗领域的产业化应用,致力于推
进中国的精准医疗事业,让每个中国人都拥有一本基因使用说明书。
我们为医院、科研单位和三方检测机构提供数据分析解读服务及各类疾病基因检测产
品的研发服务,同时我们也正在开发自动化基因数据分析平台,并着手建立专属于中国
人的疾病数据库。
在赛福基因,等待你的除了有增长空间的报酬,更有一帮有才、有趣、敢想、敢拼的同
事,会用心向你传授经验,期待与你共同成长!
如果你热爱生命,期望去影响甚至改变数亿中国人的健康事业,请联系我们,期待你的
加入!
具体招聘职位及招聘要求如下:
1. 生物信息分析师
工作地点: 北京
数量:2名
岗位职责:
· 肿瘤及遗传疾病相关的NGS数... 阅读全帖 |
|