0%

Predicted protein interactome for T.reesei

好的,现在稍作休息。 实在是拖得不能再拖了,手里的PRIN项目不赶快结束掉,不但今后自己的研究之路会被毁掉,在实验室也会没有立足之地。 逐渐觉得自己的注意力在不断的下降后,对自己坚持做一件事情越来越没有信心,将工作效率的下降简单归咎于外界干扰,实际上是懦夫的行为。 但是我真的很难在用心隔绝一切外借骚扰。

先来整理一下PRIN的流程吧。

首先是获取模式生物和目标物种的蛋白序列。统计序列长度。 接着利用InParanoid软件构建目标物种和模式生物的同源映射。 通过从公共数据库找到的模式生物的蛋白互作信息,依据同源映射预测目标物种的蛋白互作。 构建模型,得到准确的预测结果。

好的,就这么几步,为什么我会拖上大半年?任务的难度在哪里? 首先,我没有相应的素质。 然后,样本数据过少。 再次,不同公共数据库的数据标识差别太大,整合难度大。

好的,假设我可以一路畅通无阻地解决以上难题,那么认真做需要花多久呢。开始计算吧

开始时间:201602271200 重新开始。

根据统计已经得到相关序列信息、蛋白互作信息,涉及物种十种,统计如下表:

org | fname | source | sequence | InParanoid | interaction reviewed | unreviewed |
------ | ------ | ------ | ---- | ------ | ------ | ------ |
T. reesei | proteins.FilteredModelsV2.0.fasta | JGI | 9129 | | | |
A. nidulans | A_nidulans_FGSC_A4_current_orf_trans_all.fasta | aspgd | 28996 | | 1 | 1 |
Neurospora crassa | Neucr_trp3_1_GeneCatalog_proteins_20140324.aa.fasta | JGI | 11978 | | 1 | 1 |
D.melanogaster | Drosophila_melanogaster.BDGP6.pep.all.fa | ensembl | 30362 | | 1 | 1 |
Arabidopsis thaliana | Arabidopsis_thaliana.TAIR10.30.pep.all.fa | ensembl | 35386 | | 1 | 1 |
Homo sapiens | Homo_sapiens.GRCh38.pep.all.fa | ensembl | 101933 | | 1 | |
S.cerevisiae | orf_trans_all.fasta | sgd | 6726 | | 1 | 1 |
Fusarium oxsysporum | Fusox1_GeneCatalog_proteins_20110522.aa.fasta | JGI | 17708 | | 1 | 1 |
Pyrenophora tritici-repentis | pyrenophora_tritici-repentis_1_proteins.fasta | JGI | 12169 | | 1 | 1 |
E.coli | E.coli_K12.fasta | JGI | 4305 | | 1 | 1 |

好的,接下来是利用InParanoid构建同源映射 InParanoid软件4.1版本来自InParanoid , 只要填写邮箱就能获得下载链接。 InParanoid命令是perl inparanoid.pl fasta1 fasta2 目录的权限有要求,上次试了几次终于成功,这次忘记了,重新配置一下。 其中目录权限是750,inparanoid.pl blast_parser.pl seqstat是750,其他好像只要640即可。

欢迎关注我的其它发布渠道