Predicted protein interactome for T.reesei

好的,现在稍作休息。
实在是拖得不能再拖了,手里的PRIN项目不赶快结束掉,不但今后自己的研究之路会被毁掉,在实验室也会没有立足之地。
逐渐觉得自己的注意力在不断的下降后,对自己坚持做一件事情越来越没有信心,将工作效率的下降简单归咎于外界干扰,实际上是懦夫的行为。
但是我真的很难在用心隔绝一切外借骚扰。

先来整理一下PRIN的流程吧。

首先是获取模式生物和目标物种的蛋白序列。统计序列长度。
接着利用InParanoid软件构建目标物种和模式生物的同源映射。
通过从公共数据库找到的模式生物的蛋白互作信息,依据同源映射预测目标物种的蛋白互作。
构建模型,得到准确的预测结果。

好的,就这么几步,为什么我会拖上大半年?任务的难度在哪里?
首先,我没有相应的素质。
然后,样本数据过少。
再次,不同公共数据库的数据标识差别太大,整合难度大。

好的,假设我可以一路畅通无阻地解决以上难题,那么认真做需要花多久呢。开始计算吧

开始时间:201602271200
重新开始。

根据统计已经得到相关序列信息、蛋白互作信息,涉及物种十种,统计如下表:

| org | fname | source | sequence | InParanoid | interaction reviewed | unreviewed |
| ——— | ——— | ——— | —— | ——— | ——— | ——— |
| T. reesei | proteins.FilteredModelsV2.0.fasta | JGI | 9129 | | | |
| A. nidulans | A_nidulans_FGSC_A4_current_orf_trans_all.fasta | aspgd | 28996 | | 1 | 1 |
| Neurospora crassa | Neucr_trp3_1_GeneCatalog_proteins_20140324.aa.fasta | JGI | 11978 | | 1 | 1 |
| D.melanogaster | Drosophila_melanogaster.BDGP6.pep.all.fa | ensembl | 30362 | | 1 | 1 |
| Arabidopsis thaliana | Arabidopsis_thaliana.TAIR10.30.pep.all.fa | ensembl | 35386 | | 1 | 1 |
| Homo sapiens | Homo_sapiens.GRCh38.pep.all.fa | ensembl | 101933 | | 1 | |
| S.cerevisiae | orf_trans_all.fasta | sgd | 6726 | | 1 | 1 |
| Fusarium oxsysporum | Fusox1_GeneCatalog_proteins_20110522.aa.fasta | JGI | 17708 | | 1 | 1 |
| Pyrenophora tritici-repentis | pyrenophora_tritici-repentis_1_proteins.fasta | JGI | 12169 | | 1 | 1 |
| E.coli | E.coli_K12.fasta | JGI | 4305 | | 1 | 1 |

好的,接下来是利用InParanoid构建同源映射
InParanoid软件4.1版本来自InParanoid , 只要填写邮箱就能获得下载链接。
InParanoid命令是perl inparanoid.pl fasta1 fasta2
目录的权限有要求,上次试了几次终于成功,这次忘记了,重新配置一下。
其中目录权限是750,inparanoid.pl blast_parser.pl seqstat是750,其他好像只要640即可。