chen7qi的个人博客分享 http://blog.sciencenet.cn/u/chen7qi

博文

为什么GEO2R/GEOquery的结果可能是错的?

已有 2781 次阅读 2020-4-20 11:01 |个人分类:生物信息|系统分类:科研笔记

前言

NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集)等内容。

在准备GEO/TCGA培训时,因为部分数据来自NCBI GEO数据库,就系统梳理了GEO数据库的结构和存储方式,顺便也看了GEO2R的使用。然后就发现了一个问题,可能直接使用GEO2R的分析结果是错误的。

原因见下图 (官网介绍截图)



而GEO2R的R代码使用的是GEOquery获取GSEMatrix,所以如果我们自己写代码这样获取非原始数据时,也有可能得到的数据是不可比的。



所以,还是建议使用工具或命令之前,好好读一下帮助文档,做到心中有数,知其所以然。如果能基于原始数据进行分析,可以做更多的质控和更深入的比较。如果不能,分析之前看下数据的分布是否均一 (median-centered)

所以生信宝典的原理类文章,值得好好阅读。

从课件中截取GEO简介部分分享如下 :





https://wap.sciencenet.cn/blog-118204-1229236.html

上一篇:RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)
下一篇:NBT:单细胞转录组新降维可视化方法PHATE
收藏 IP: 114.250.115.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 21:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部