临床研究必备!TCGA的兄弟数据库,一站式出图,
基于TCGA的蛋白芯片分析神器
对于TCGA(The Cancer Genome Atlas)这个在生信研究中大佬级别的存在,想必大家伙儿都已经耳熟能详了吧?前不久我们一本八道老师对TCGA家族的好兄弟TCIA(The Cancer Immunome Atlas)做了详细介绍,大快朵颐之后,不少小伙伴不禁感慨意犹未尽。那么在今天,弘毅就来说说TCGA的另外一个好兄弟——TCPA数据库(The Cancer Proteome Atlas),大家伙儿都备好瓜子饮料小板凳,不要走开哦~!
TCPA数据库简介
1
Patient Cohorts
着眼于肿瘤患者的RPPA数据,包含肿瘤基因组图谱中32种肿瘤类型共8167个肿瘤组织样本,目前设置Summary、My Protein、Visualization和Analysis四大功能模块。对于每个数据集,TCPA还提供level3和level4数据,level3数据代表来自独立批次的归一化数据,level4数据代表多个批次的合并数据。目前更新到2019年10月3.2版本。
2
Cancer Cell Lines
侧重于肿瘤细胞系的RPPA数据,包含19个谱系的超过665个独立细胞系,同样设置Data Sets、My Protein、Visualization和Analysis四大功能模块,目前更新至2020年7月2.02版本。
下面我就来为大家进行TCPA数据库功能板块与操作演示:
一、Patient Cohorts功能板块
点击Patient Cohorts进入功能界面:左侧边栏主要是,Home(首页),Overview(数据库介绍),About(版本信息),News(历史发布消息),FAQ(常见问题),Resources(数据来源),Credits(发表论文时引用信息),Forum(论坛),Contact(联系方式)和Download(下载注意事项);右边栏分别是,Summary、My Protein、Visualization和Analysis四个功能模块。
下面是FAQ两个比较重要的问题
(1)关于什么是RPPA芯片数据?
(2)关于TCPA数据Level1~4数据类型?
点击FAQ进去可查看详情。
以下是数据来源,包括Oncomine、TCGA等数据库,并提供各个数据库访问链接。
以下是四个功能模块介绍:
1
Summary
点击Summary进入详细界面,可以看到以不同肿瘤为导向的数据集来源,样本数目和相关蛋白数目,点击Show可查看详细信息,包括数据集编号、数据来源、平台信息、种属、样本数和标准化信息等。
2
My Protein
点击My Protein进入详细界面,显示蛋白详细信息,包括对应基因、验证状态、种属和抗体来源等信息,点击Gene Info栏链接(G:GeneCard或O:OncoMX)可以查看基因信息。选择感兴趣的蛋白,单击View“+”按钮得到该蛋白在不同肿瘤组织中表达丰度柱状图,鼠标悬停在图上可查看具体统计信息。
3
Visualization
点击Visualization进入详细界面,可以看到Network Visualization网络菜单和Heatmap Visualization热图菜单。
(1)点击Network Visualization进入功能界面,选择感兴趣的肿瘤数据集,点击Dataset Description可以查看该数据集详细信息。
点击Show可以得到基于HPRD数据库的蛋白互作网络图,线条的颜色和宽度取决于两个互作蛋白之间的相关性,红色表示正相关,绿色表示负相关,右侧边栏可设置显著性条件,可隐藏非显著相关的互作关系。
点击NDEx可进入在线工具进行网络图个性化设置,左下检索框可输入感兴趣蛋白查看互作关系,可以选择感兴趣的可视化形式,右下位置可下载Cytoscape格式文件,点击Type处叹号,有多种网络图类型供大家选择。
(2)点击Heatmap Visualization进入功能界面,选择感兴趣的肿瘤数据集,可以得到三张热图,K=3,4,5分别代表分3,4,5个cluster。
选择其中一个点击进入,点击左上角Dialogs可进行个性化设置,鼠标悬停某个样本可显示其详细信息,点击左上角Misc-PDF可下载PDF格式图片。
4
Analysis
点击Analysis进入详细界面,可以看到Individual Cancer Analysis和Pan-cancer Analysis两个功能菜单。
(1)点击Individual Cancer Analysis进入功能界面,有三个菜单:Correlation Analysis相关性分析,可以在不同肿瘤甚至不同组学数据间进行;Differential Analysis差异分析,可以在两种不同类型肿瘤或者两种亚型肿瘤之间进行;Survival Analysis生存分析,提供Cox proportional hazards model, log rank–test P values和Kaplan-Meier plot三种方法。