IPA新功能解密

2018-04-24 11:12:05 来源:源资科技市场部

新闻摘要:IPA是一个进行分子网络挖掘的有力工具。近年IPA不停的添加新的功能,为数据的挖掘和解读提供更全面更便捷的新工具。本文描述了近年IPA的更新的新功能,包括磷酸化研究,转录组学研究和大数据比对等工具。

  前言:IPA是一个进行分子网络挖掘的有力工具。近年IPA不停的添加新的功能,为数据的挖掘和解读提供更全面更便捷的新工具。本文描述了近年IPA的更新的新功能,包括磷酸化研究,转录组学研究和大数据比对等工具。


新功能一:Phosphorylation分析功能
      在哺乳动物细胞中,蛋白质磷酸化状态的改变起着重要的调控作用。IPA能够针对磷酸化蛋白质组数据集做一个新的磷酸化的核心分析。获得更过的磷酸化信息。在Upstream Analysis中能够获得磷酸化蛋白质组学数据中驱动蛋白质磷酸化水平的变化因子。这些结果通过数据集中的磷酸化数据,能发掘潜在的上游调控因子,提供了可检验的假设。

 

图一:IPA磷酸化核心分析的上游分析结果。 

 

图二:磷酸化分析上游调节分析结果示意图。能够看到当上调Insulin时对靶基因的磷酸化影响。


新功能二:Isoprofile的GTEx组织特异性分析功能
      本次更新使Isoprofiler能够访问GTEx组织表达数据,使您能够在从51个不同的人体组织RNA序列表达数据中无缝地探索表达谱数据。可以探讨以下问题:
      从实验数据集得到的差异表达的转录本是否只在一个几个特定组织中表达?例如,它会不会可能是在一个特定的组织中的药物作用靶标?
      该基因在同一个组织中会不会有其他的转录本表达?
      在实验数据及中有哪些转录本在肝脏中或是其他组织中中是特异表达的?
      在实验数据集中,转录本的组织富集结果如何?是否仅富集在一种或几种组织内?
      对于在实验数据集中一个给定的基因,在特定组织中,哪些转录本是高表达的,哪些是低表达的?

  GTEx内部的数据是采用OmicSoft(QIAGEN子公司)对原始FASTQ文件进行处理后,再由IPA团队采用Ensembl 88和RefSeq 80基因模型进行进一步处理,得到每个转录在各组织中的FPKM中位值。这些数据随后被导入到IsoProfiler,计算组织富集评分。因此,根据这个数据,Isoprofiler可以过滤你的RNA-Seq数据集并且获得转录本的组织富集度。

图三:GTEx人体组织的基因表达数据FGL1。在IsoProfiler的FGL1基因线图表明,fgl1-204亚型在肝脏中的表达比其他任何51个组织的表达高多了。X轴上列出的每个组织每个转录本在样本集的平均FPKM。


新功能三:Analysis Match
      在2017秋季更新中,进行Core Analysis核心分析时,会自动启用Analysis Match模块。Analysis Match*自动挖掘IPA中其他相似或相反的核心分析的生物学结果进行对比,助力对结果的解释,或从已有的其他生物学机制中挖掘意想不到的潜在信息。Analysis Match将本次分析与之前存在Project Manager中其他的分析,以及公共资源中其他人类和小鼠的表达分析一同进行比对。从Canonical Pathways, Upstream Regulators, Causal Networks和Diseases and Functions四个方向进行比对。


新模块的功能特点:
      通过不同的疾病、组织、治疗方法和其他的生物生物特征建立分析的可信性
      深入了解上游调节,下游表型和生物通路探讨结果在疾病和其他功能的潜在作用
      通过广泛收集的公共数据库轻松获取和评估关键假设

  从IPA的Analysis Match分析结果是从SRA,GEO,Array Express,TCGA以及其他数据库中高度优化和质量控制而收集整理的超过6000个人类和小鼠的疾病及肿瘤的数据集。这些数据是由QIAGEN收购的新公司OmicSoft收集整理的,这些由DiseaseLand和Oncoland产生的对比信息包含了疾病和正常、治疗和非治疗等条件分组的对比信息。

  Analysis Match分析是根据Canonical Pathways, Upstream Regulators, Causal Networks和Diseases and Functions四个方面创建一次分析的,将本次分析和其他所有分析在以上四个方面一一进行比对,并且计算总平均值。

 

图四:Analysis Match分析选项卡。默认情况下,分析是根据整体相似性评分(上面显示的最右栏)从最相似的到最不相似的进行排序。Analysis Match分析是根据Canonical Pathways, Upstream Regulators, Causal Networks和Diseases and Functions四个方面创建一次分析的,将本次分析和其他所有分析在以上四个方面一一进行比对。在上面的图片中,右边的前四个彩色列中的每一个代表了每一个方向与本次分析的百分比相似性。紫红色的颜色表明相似(如图所示)和青色的颜色表明不同(不显示)。第一个得分列(“CP”)是Canonical Pathways,第二个(“UR”)是Upstream Regulators,第三个(CN)是Causal Networks,最后一个(de)用于下游效应(即Diseases and Functions)。上面显示的最后一列是这四个方面匹配的平均值。注意,图中隐藏了默认情况下Analysis Match选项卡中的一些列。

 

图五:揭示四个分析方向相似和差异分析的“热图”。“4 hr lung”分析(首行中粉色高亮)与其他样本的对比结果从四个方面(最左列)进行Z-Score打分。其他参考的分析数据可能并不能获得显著性的Z-Score,行和列是按照Euclidean distance和 average linkage (UPGMA linkage)进行聚类。

  可以直接从热图上选择过滤感兴趣的结果。图六显示了在热图上对上游调控的转录因子的筛选。聚类的行揭示了具有相似的模式的转录因子,而聚类的列揭示了基于转录调节模式的下最密切相关的分析。

 

图六:Analysis Match的热图过滤结果只显示转录因子的上游调控结果。热图提供过滤条件进行深层次的分析。单击列明即可在新窗口中显示分析的原始数据。

  使用OmicSoft库另一个有价值的方法利用IPA的数据集和分析进行如疾病名称或组织关键词搜索。下面的图七显示了一个不涉及沙丁胺醇albuterol的人类哮喘分析结果。从这些搜索结果中,可以双击打开分析,或选择最多20个结果进行可视化的Comparison Analysis。

 

图七:利用数据集和分析搜索发现感兴趣的结果。使用条件“不涉及沙丁胺醇albuterol的人类哮喘”发现136分析结果在。双击打开一个或创建一个最多20个结果的比较分析。选定的分析(或分析)的元数据显示在搜索屏幕的右侧。

  用于分析的OmicSoft数据集存在IPA-Project Manager-Libraries中,如图八所示。注意,这些数据是只读的,不能从IPA导出。

 

图八:IPA中,OmicSoft库超过8000个数据和相应的数据分析。该资源是只读的,不能从IPA导出。

【责任编辑:(Top) 返回页面顶端
Copyright © 2008 - 2018 Tri-ibiotech.com All Right Reserved. | 备案许可证: 沪ICP备11020704.