广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    如何下载geo原始数据

    来源:网络收集  点击:  时间:2024-07-19
    【导读】:
    首先我们需要了解高通量数据上传数据库GEO(gene expression omnibus,基因表达综合数据库),其是由NCBI建立的公共数据库。该数据库具有很强的灵活性和开放性,用户可提交、存储和检索多种形式的数据:包括基于单通道和多通道的微阵列技术实验测量得到的基因表达谱数据、基因组DNA和蛋白质分子数据、以及基于非阵列技术的基因表达序列分析(serialanalysis of gene expression,SAGE)得到的数据。我们以查询转录组数据为例,为您提供两种从GEO数据库中下载数据的途径。 第一种是仅知道研究物种和大概方向,但是没有相关数据的任何信息,需要在数据库中查找获得相关数据,具体方法为:首先,打开NCBI数据库链接http://www.ncbi.nlm.nih.gov,在搜索栏的左侧选择GEO Datasets,在搜索框中填入需要搜索的内容,例如搜索与水稻抗病相关的数据,输入rice disease,点击search, 搜索结果包含所有相关信息列表,其中大部分是利用表达谱芯片完成实验的数据, 方法/步骤1/6分步阅读

    如果只搜索利用转录组测序完成实验的数据,也可在搜索词后面加上RNA-seq字样(rice disease RNA-seq)。如果搜索结果只有一条记录,会直接显示该条记录信息,若有很多条记录,会显示相应列表,每条记录都会直接显示文章的相应信息:1)Expression profilingby high throughput sequencing,2)9 samples。

    2/6

    例如我们下载上面所列文章的数据,点击标题连接即可看到提交数据的具体信息介绍,可查看实验的具体设计思路与实验细节,例如所用实验平台、如何分组等信息

    3/6

    点击(htp),获得文件夹,继续点击,直到看到如下页面,即可下载数据(转录组测序原始数据扩展名为.sra),

    下载数据后,请牢记每个样本编号对应的文章中样本名字以及分组信息(例如GSM1229035对应的原始数据SRR976336,分组为EC1组),便于后期分析。

    4/6

    第二种方法是通过查看相关文章后,发现与自己研究相关,想要下载文章中涉及的转录组数据,具体方法如下:1)文章中一般给出数据相关链接,直接点击链接即可,可直接进入以下页面,搜索自己需要信息即可。

    5/6

    如果文章没有给数据链接,那么会给出数据提交的accession ID,例如本文的GSE50777,在GEO Datasets栏中搜索即可,会出现以下信息,

    6/6

    其中第一条记录就是前面我们搜索到的数据,从第三条记录开始就是我们文章每个样本的具体信息,可以直接点击下载。

    请注意:由于测序方法不同,后期对数据提取(二进制提取碱基序列)所用程序有一定差异,所以需对相应文章进行查询(点击最早搜索记录中的pubmed即可),获取转录组测序的方式(是单端SE测序还是双端PE测序)。

    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_973003.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-05 16:32:29  耗时:0.026
    0.0259s