为了支持公共使用和散布基因表达数据,NCBI开始了基因表达汇编(GEO)计划。GEO是努力建立一个基因表达数据仓库和在线资源,用于从任何物种或人造的来源检索基因表达数据。来自microarray,高密度寡核苷酸array(HAD),杂交膜(filter)和SAGE的许多类型的基因表达数据都被接受,登记,和存档,作为一个公共数据集合。一系列预先计算的数据的定义和描述,以及用于交互检索和分析这些表达数据的在线工具即将放入。 数据仓库图解。 一个GEO仓库概念图解的顶层视图显示四个基本实体:提交者,平台,系列和样本。 同许多平台,许多样本和许多系列有关系。 同一个提交者,许多样本有关。 系列:样本收集,样本是如何相关的,如何排序的,分析是如何进行的,和聚类数据是如何获得的信息。 FAQ: 我如何提交我的数据? GEO是否提供“一定日期前保留”服务? GEO将接受什么样的数据? GEO是否存档未加工的数据图? 有没有任何GEO 要求的QA(质检)测量? 我如何加入QA测量到GEO中去? 我如何提交重复实验到GEO? 我如何能过提交更正? |
提交者是如何被认证的? GEO有那些可能的查询和检索? 马上要有的:我们还要决定被GEO网络界面支持的全范围查询。有些查询可能包括:表达水平的变化;基因,由UniGene聚类,ORF或LocusLink定义的;MeSH术语;分类术语;被选的提交者字段;被选的平台字段;被选的系列字段;被选的样本字段;对于网络界面不支持的查询,我们将在NCBI FTP站点以XML形式提供整个的GEO数据集合(和可能子集)。这样,不同的基因表达数据库实现(允许更复杂的查询)可能移植GEO的数据。 什么是MeSH? “taxon”这个词指的是什么? |
→如果您认为本词条还有待完善,请 编辑词条
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0