IPA 2017冬季更新

2017-12-10 00:00:00 来源:源资科技市场部

新闻摘要:圣诞前夕,IPA进行了2017年最后一次更新,本次更新加强了Analysis Match功能以及做图中Build功能。使得IPA更易懂易用。

  圣诞前夕,IPA进行了2017年最后一次更新,本次更新加强了Analysis Match功能以及做图中Build功能。使得IPA更易懂易用。


增强Analysis Match功能

  秋季新更新的Analysis Match*可以自动在IPA做核心分析时,能够寻找其他与上传数据相似(或相反)的生物学结果,以帮助确认数据分析结果的解释,或在各种实验条件下提出与众不同的共同生物学机制新观点。IPA将研究者上传的数据与公共资源中成千上万的人类和小鼠的数据以及该研究者以往上传的研究数据放在一起比较。从Canonical Pathways, Upstream Regulators, Causal Networks, 和Diseases and Functions四个方面比较以上所有的数据分析。
       本次更新中,Analysis Match可以选择使用哪类数据(DiseaseLand,OncoLand或其他Land数据)进行匹配对比。在得到的热图中的详细结果能更容易理解和进行后续分析。如今使用Project Search,可以手动向自己的数据集添加实验元数据,以便在Analysis Match分析结果中清楚的体现他们。


Analysis Match更新摘要

  从OmicSoft新正的“Land”数据使IPA获得更多的Match结果。本次更新,IPA从OmicSoft增加了约700个分析包括在OncoLand中新的Land数据MetastaticCancer。

  在Analysis Match页面的下拉菜单中能够自主选择使用哪一个Land数据集用于比较分析(图1)。

  Analysis Match热图更新了:

  •   可以设定一个阈值,直观的在热图的单个单元中显示出显著的,最重要的z-score和p-value(图2)。
  •   为热图中的每个单元都提供一个开放的、可视的网络或通路图,能够更好的跟踪和理解研究人员上传的数据集或从OmicSoft数据中的分子在Canonical Pathways, Upstream Regulators, Causal Networks, 和Diseases and Functions四个方面的表现。(图3)。
  •   能够直接利用热图上的分支深入研究聚类或某一特征。比如。可以直接选择全部Upstream Regulators和Diseases and Functions在热图上的聚类分枝,加入到一个通路或列表中进行后续分析(图4),或使用列树状分支选择最多20个分析进行全面的比较分析分析(图5)。

Analysis更新细节:

 

图1. 从源头(Land)过滤Analysis Match结果。使用“Analysis Match”选项卡中的“Project”菜单可以选择采用哪一个Land来源的数据用于Matching分析。单击一个或多个存储库名可以选择它们。研究者还能够从My Projects中选择自己上传的数据。或使用数据名或Land名称搜索需要的数据。本次更新中加入了一组新的Land数据MetastaticCancer。

 

图2. 在Analysis Match得出的热图中能够显示出不具备显著性的分析项。在Analysis Match的热图中,能够看到所有感兴趣的分析项(Canonical Pathways, Upstream Regulators, Causal Networks, 和Diseases and Functions)的结果,并且能够用颜色代表每个样本的分析项的z-score值。然而,尽管在样本中用了橙色或蓝色表示了样本的分析特征,但是很可能其实际的z-score可能太小却被误认为是重要的。如今,可以将无关紧要的特征特别标记出来。本例中,设定“2”为阈值,如果比阈值小的特征量则被标记一个点,这可以在查看结果是,帮助研究者忽略没有统计意义的z-scores。

 

图3. 通过点击热图中的方块能够直接查看四大分析项的具体网络。通过点击Analysis Match中的热图方块,能够打开其网络和通路。如上图A,点击第一列中的ACKR2方块,能够在右边直接显示其分子网路。而数据集中份分子则会在Molecular Tab中详细列出(上图B), 点击元数据标签,则会显示出该分析的元数据(上图C)。下面的图6将会讲解如何在自己的数据集中加入元数据。

 

图4. 能够在热图的行或列的聚类选择某一组或几组分析项进行后续分析。通过选择一组或几组分析项的聚类分支,进一步对其进行分析。比如,选择最显著的一组分析项(行),可以将聚类在一起的相关的内容都选择进来。所选的组可以保存到新的Pathway或list中。可以通过 Ctrl+单击(Windows)或 command+单机(Mac)优化选择结果。

 

图5. 选择一组数据进行新一步的比较分析。可以从热图中聚类列的分支选择聚类在一起的一组相关分析。如上图所示,一组分析(列)是通过单击热图上方的部分选择。进而通过比较分析进行进一步的全面分析。最多可以选择20组数据进行比较分析。也可以通过Ctrl+单击(Windows)或 command+单机(Mac)优化选择结果。

  用IPA新的元数据编辑器可以对研究者上传的数据集进行注释和标记。如今,研究者可以给上传数据进行详细的注释,以帮助研究者快速用project search搜索到这些数据,或者能帮助研究者记忆实验分析结果的细节。这样,就能在Analysis Match选项卡中直接显示元数据的详细内容,这一点在理解Analysis Match分析内容时尤其有用。

  上传数据集时,可以在IPA用户界面中输入有关元数据的背景资料。例如,可以利用现有的OmicSoft注释方法在“case.disease”或“case.tissue”的值中输入“哮喘”或“肺”,或创建个性化的的自定义字段注释。例如,你可以创建一个新的“eNotebook record”的注释值,并输入一个可点击的超链接,指向有网络在线的关与实验数据的记录,或创建一个“Collaborators”的注释值,输入与数据集相关的同事名。向数据集中添加的元数据将自动上传到该数据集的任意一个核心分析中。注意,输入的元数据仅用于自己的研究目的,而不会影响IPA的分析结果。图6显示了如何为数据集输入元数据。

 

图6. 为数据集输入元数据。可以使用OmicSoft现有的注释,也可以创建一个自定义注释字段,如上图所示。在这种情况下,一个新的注释字段“Hyperlink to paper”被创建,并且粘贴了一个超链接值(Ctrl+v)。还添加了其他元数据,如组织类型、疾病状态等。元数据将上传到从该数据集创建的任意一个核心分析中。

 

图7. 使用为数据集输入的元数据搜索数据集和分析。在上图例子中,使用关键字“GSE11352”能找到需要份分析,这一关键字即是OmicSoft的注释“projectname”值。本例中,注释“oncoGEO”分析的注释值也是同一个GSE号码。

  元数据可以在保存数据集文件之前或之后添加或编辑。在上传之前,还可以在数据集文本或Excel文件内的顶部插入元数据(详见帮助)。这一点在如果希望输入大量元数据或者有许多具有相同的元数据的相似派生的数据集时非常有用。在本次更新中,可以在元数据选项卡(在上传期间)或保存并重新打开后,编辑上传的元数据。


*Analysis Match需要购买单独License。


IPA的其他更新

      选择或高亮网络和通路节点的新标准

  IPA现在可以更灵活地利用研究者的创造力来建立和修改网络和通路。可以通过本次更新的新标准通路上全局选择节点用于进一步的操作。具体来说,可以通过overlay和其连接来选择或高亮节点。例如,如果有对节点overlay了表达值,则可以首先选择上调的基因,并将它们立即移动到Pathway作图的不同位置,并对下调的节点执行相同的操作。或者您可以选择所有未没有相关关系的节点并删除它们。或者可以高亮显示网络中连接最多的节点。

 

图8. 通过Overlay来高亮或选择节点。Overlay工具中的高亮菜单已改名为“高亮或选择”,现在可以选择是高亮显示还是选中满足标准的节点。“高亮”是将节点边框变为紫色,或将其填充为深蓝色。“选择”是将节点边框变为蓝色并可以对其进行挪动或进一步分析。例如,可以一起删除或移动他们。上图示例中,没有overlay表达值的节点被选为一组。

 

图9. 通过节点的连接数来高亮或选择节点。新的节点连接过滤器用于通过连接网络或通路中的节点连接情况来选择节点。如上图所示,选择了连接数>6个的节点。如此选择了三个连接数最多的节点。

 

图10. 通过连接数来Trim节点。节点连接过滤器也可在Build菜单的Trim和Keep中使用。上图示例中,在Trim中使用节点连接过滤器来删除所有没有连接的节点。


核心分析中设立有独立的上下调的阈值

  可以为FC或Log ratio设定独立的上下调的阈值(而不是一个单一的绝对值阈值)。能够更有效地控制IPA数据集中的数据结构,而不是使用一个绝对值阈值。如图11显示。

 

图11. 为核心分析设置独立的上下调阈值。如今,当建立一个核心分析时,可以对有正值和负值的FC或log ratio分别设定上下调的阈值。如上图所示,在本例中,-1.5和3用于表达倍数变化为上下调阈值。这意味着的基因FC值>- 1.5和< 3不在分析中使用。注意,用于分析“下调基因”和“上调基因”的个数需按recalculate键重新计算(如上图红色箭头指示的位置)。



【责任编辑:(Top) 返回页面顶端
Copyright © 2008 - 2014 Tri-ibiotech.com All Right Reserved. | 备案许可证: 沪ICP备11020704.