i*S 发帖数: 175 | 1 我最近做了质谱,在某个小鼠样品里鉴定出了将近一千个蛋白。质谱不是我自己做的,
而是花钱去research facility做的,质谱的结果后来用Scaffold文件的格式返回给我。
我的Scaffold文件里面的蛋白是用NCBI的gi number来代表的。 我发现好多蛋白对应有
多个
NCBI的gi number。比如说蛋白XYZ,里面对应的是gi|123456, gi|24680, gi|13579,
gi|9876543, 如果在scaffold里面选择用excel导出:就变成了
Identified Portein Accession Number
XYZ gi|123456(+3)
而不是gi bunumber四个都显示。
我想请教一下大家,有没有什么办法够批量的导出所有的gi numbers?
我是希望做一下Gene Ontology的分析,不过用了Panther以后发现有的gi number有对
应的蛋白ontology信息,有的没有,所以想全部看一下!
包子重谢! | M***7 发帖数: 2420 | 2 发几行数据上来看看,我写个简单的脚本帮你提出来。
我。
【在 i*S 的大作中提到】 : 我最近做了质谱,在某个小鼠样品里鉴定出了将近一千个蛋白。质谱不是我自己做的, : 而是花钱去research facility做的,质谱的结果后来用Scaffold文件的格式返回给我。 : 我的Scaffold文件里面的蛋白是用NCBI的gi number来代表的。 我发现好多蛋白对应有 : 多个 : NCBI的gi number。比如说蛋白XYZ,里面对应的是gi|123456, gi|24680, gi|13579, : gi|9876543, 如果在scaffold里面选择用excel导出:就变成了 : Identified Portein Accession Number : XYZ gi|123456(+3) : 而不是gi bunumber四个都显示。 : 我想请教一下大家,有没有什么办法够批量的导出所有的gi numbers?
| t*****z 发帖数: 1598 | 3 楼主,顺便说下你用的什么操作系统,有没有装什么语言环境(如果你知道的话)。
【在 M***7 的大作中提到】 : 发几行数据上来看看,我写个简单的脚本帮你提出来。 : : 我。
|
|