Cytoscape 基础(文字初版)

此文内容为未发布的教材章节,含原创部分,请勿转载。

从来没正经写过教材的章节,语言难免不通顺,而且限于篇幅,并不能涵盖太多信息,写得比较像说明书。如果对此领域已有了解或有十分学习热情的朋友,建议参考 Wikipedia: CytoscapeUser Manual

Cytoscape 概要

Cytoscape 是由美国西雅图系统生物学研究所开发并于2002年发布的开源软件,主要用于分子互作网络可视化和复杂网络分析。目前软件的最新版本是3.5.1。 Cytoscape 可以运行在各种操作系统平台上。官方网址: http://cytoscape.org/

Cytoscape 安装

Cytoscape 需要在 Java 运行环境的支持下使用,因此在安装 Cytoscape 之前,用户的计算机应具备 Java (官方网址: https://java.com)。 Cytoscape 提供了不同操作系统平台的安装包下载,你可以按照自己操作系统的配置选择对应版本下载安装。

Cytoscape 和其他软件的比较

相比于其他网络可视化软件, Cytoscape 的优势体现在:操作丰富,包含大量插件,支持多种格式的导入与导出,并且能良好支持生物数据专用的文件格式(如 SBML)。Cytoscape 在系统生物学领域的应用尤为突出,并且可以应用于生物学之外的领域,它还提供了官方 JavaScript 库用于网页开发。而同样有类似特性的软件包括 R 和 Gelphi. 但是它们相对于 Cytoscape 的不足在于: R 主要面向统计计算,要进行网络分析和可视化,需要安装一些第三方的软件包,并且它完全由命令行输入代码操作,需要使用者有一定编程基础;而 Gelphi 并非针对生物学网络开发的软件,相对于 Cytoscape 功能较少,开发成熟程度也较差。

相比之下, R 同样具有丰富的软件包和精细的图像导出预设,熟练使用后可以实现更加复杂的互作网络生成和分析,在学术研究领域也是比较好的选择; Gelphi 更加轻便、简化,适合生物学互作关系网络研究的初学者,此外它具备更加美观的预设和内建的统计分析模块。

由于 Cytoscape 是开源软件,由核心开发团队和众多开发者共同开发维护,随着软件版本的更新,相信 Cytoscape 的功能会越来越丰富与强劲。

Cytoscape 基本操作

一、认识界面

Figure 1. Cytoscape 主界面

Cytoscape 在2013年发布3.0版本后,发生了较大的变化。以3.5.1为例,目前 Cytoscape 软件的界面更加模块化。界面顶端是菜单和工具栏,用于执行各种对网络和文件的操作。占据界面左侧的是控制台,可以管理、调整并筛选网络中的节点和连线。界面最突出的区域是可视化区域,用于展示和移动网络可视化。可视化区域的下方是数据栏,以列表的形式展现网络中节点与连线的具体信息。

二、基本网络操作
节点和连线的操作

在可视化区域右键点击唤出快捷菜单,实现节点和连线的创建 Add,在可视化区域中实现节点的移动(左键拖动),节点和连线的删除或剪切(Delete 键或 Ctrl + X)视图的放大缩小(鼠标滚轮)。

Figure 2. 添加节点和连线的操作

节点和连线的样式改变

在可视化区域右键点击唤出快捷菜单,对选中节点和连线的样式进行单独设置。在控制面板的 Style 栏中实现网络全局、映射调整和对选中节点和连线的样式进行单独设置。

Figure 3. 设置选中节点样式的操作

网络分析

在菜单栏中选择 NetworkAnalyzer,运行网络分析,在数据栏生成新的列展示网络节点和连线的具体属性,计算节点的度与连线的加权。

Figure 4. 运行网络分析

子网络的构建

选择感兴趣的节点,使用菜单栏或工具栏的选项构建子网络,选择相应层级的邻接节点构建多层子网络。

Figure 5. 构建子网络的操作

三、文件操作
导入网络文件

通过菜单栏或工具栏导入文件,选择文件位置,选择数据格式和属性,导入网络视图。在导入网络的过程中,你可以通过对话框与 Cytoscape 交互,调整输入数据的分隔格式。 Cytoscape 对不同文件的格式有良好的适应性,可以到入用各种符号分隔的数据表。

Figure 6. 导入网络文件

导入表格

通过菜单栏或工具栏导入表格文件,这些表格文件多为网络节点或者连线的属性注释。选择文件位置,选择数据格式和属性,导入数据栏,用于后续操作。同样,你也可以用与导入网络过程中类似的对话框与 Cytoscape 交互,调整输入数据的分隔格式。

Figure 7. 导入表格

导出网络图像

将所需导出的网络视图调整为适当大小,确保不超出可视化区域边缘。利用菜单栏或工具栏导出图像,选择文件导出位置和图像格式(支持 JPEG、 PDF、 PNG 等格式)。

Figure 8. 将网络导出为图像

Cytoscape 实现互作网络可视化

我们使用 Cytoscape 安装目录中的示例数据构建一个简单的蛋白质互作网络。在 sampleData/ 目录中找到 galFiltered.sif,在 Cytoscape 中使用“导入网络”操作。点击顺序为:File → Import → Network → File. 观察数据栏可知该文件表示酵母蛋白的两两互作。

Figure 9. 导入示例数据 galFiltered.sif

在可视化界面即可查看导入的网络,使用菜单栏的 “Layouts” 菜单调整网络布局。使用控制面板 “Style” 页面对网络的节点、连线及整体进行手动调整。

也可以使用“导入表格”操作加入附加表格文件,作为网络的属性,映射到对应的节点或连线上。在弹出的对话框中完成正确的映射后,观察 Cytoscape 下方数据栏,即可找到增加的节点或连线属性,可以根据此在控制面板的 “Style” 页面对网络的节点、连线及整体进行批量调整。

如果没有附加表格,也可以直接通过网络分析工具创建网络的基本统计属性。点击顺序为: Tools → Network Analyzer → Network Analysis → Analyze Network. 增加基本统计属性后也可以此为参数设置网络的 Style.

Figure 10. 对 galFiltered 进行网络分析

完成上述工作后,再手动对网络的节点位置进行微调,移开重叠的节点。

也可以参照视频教程,结合 此处打码 中的数据进行较大规模网络的构建。

Cytoscape 插件

Cytoscape 具备丰富的插件支持,例如,用于 GO 富集分析的 BiNGO,用于文献挖掘的 Agilent Literature Search.

可以在菜单中打开插件管理器,搜索所需的插件进行下载安装,也可以通过来自网络或其他位置的 jar 文件安装,安装后即可在菜单栏插件列表中点击运行。Cytoscape 在丰富的插件支持下,功能变得更加强大,也更受多个领域的研究人员的青睐。

Figure 11. 插件管理器