科学网

 找回密码
  注册
置顶 · 我和我的《现代科研指北》
热度 5 2022-9-6 11:50
《现代科研指北》终于正式 出版 了,这是一本写给想做科研、正在做科研或假装正在做科研的朋友们的书。虽然人口在不远的将来可能面临负增长,但研究生群体还在高速增长,研究生所需的科研技能训练,当前高等教育还没有广泛覆盖到,很多科研趋势也难以及时反映到教材里。这本书是我对当前科研现状及研究方法的经验总结,希 ...
个人分类: 生活点滴|7608 次阅读|7 个评论 热度 5
回归、安慰剂与流行
热度 4 于淼 2017-3-13 06:05
回归 在科研数据分析中,回归分析的使用频率可能仅次于假设检验。我们现在提回归分析更多是说数据回归到我们预设的自变量因变量模型的分析,例如线性回归就是说假设了自变量与因变量之间的关系是线性的,那么通过拟合这个模型得到一堆自变量系数,然后通过一堆关于系数(t检验)或模型本身(F检验)的假设检验来说明模型对 ...
个人分类: 科搜研手册|6075 次阅读|4 个评论 热度 4
鸢尾花数据集背后的故事
热度 3 于淼 2017-1-16 09:05
如果说对机器学习或统计学习里最常见的示例数据集进行排序,那么鸢尾花数据集一定排的上号,而且不同于事后诸葛的泰坦尼克生还者数据,这个数据集理论上是可以拿来做预测的。设想某个清晨,你漫步花园并驻足于一朵鸢尾花前,然后你掏出尺子,测量了花萼长度、花萼宽度、花瓣长度跟花瓣宽度后静默片刻,淡淡的说到:“果然 ...
个人分类: 科搜研手册|10818 次阅读|3 个评论 热度 3
高通量数据的多重检验问题
热度 2 于淼 2017-1-9 12:44
各种组学分析技术的进展导致了我们在收集数据时更侧重数据信息的保存,然而我们收集的数据最终也会根据我们的想探索的问题来寻找答案,甚至有时候我们在实验设计分组时就打算考察某一个变量而为了获取更多的相关信息而采用了组学技术。这点是尤其要强调的,科研人员一定是面向科学问题解决科学问题,而不要为了应用新技术 ...
个人分类: 科搜研手册|11099 次阅读|4 个评论 热度 2
慕课以来
热度 1 于淼 2016-7-29 00:11
1 最初参加慕课是11年因为研究中有篇文献提到了支持向量机(SVM)算法,我查了很多资料都没看明白,然后发现网上有人提到吴恩达的机器学习课讲的比较透彻就去网易公开课看了视频,看完后发现很多中文资料写不清楚不是因为SVM难,而是其根本就没搞清楚原理在照猫画虎。这时我开始真正意识到国内外研究的差距,既然这些 ...
个人分类: 科搜研手册|5778 次阅读|1 个评论 热度 1
给师弟师妹们的留言
热度 8 于淼 2016-7-16 00:53
我已经博士毕业离开了RCEES,当然还会回来,不过那时候就是外来户了。我知道你们会来这边看这个博客,所以有些东西还是要说一下的,有没有用看你们自己,只是我的一家之言。 - 不管你们是否乐意,PI级的老师都是希望你们以后做科研。按我们组里规定,到毕业时你们要具备独立设计实验、独立发表文章、进行学术会议报告 ...
个人分类: 科搜研手册|10851 次阅读|9 个评论 热度 8
如何做球探?——经验贝叶斯分析方法的案例分析
热度 1 于淼 2016-6-17 13:55
最近看到一系列以棒球为主题的关于贝叶斯分析的 (http://varianceexplained.org/posts/),赶忙总结了一下,省的忘了。我非常喜欢这类通过实际案例来进行分析的讲解方法,很容易举一反三。 什么是贝塔分布? 贝塔分布的本质是概率分布的分布。我们来看一个棒球击球率的估计问题,一共打了300个球,81个击中,219个击 ...
个人分类: 科搜研手册|11618 次阅读|1 个评论 热度 1
理解基因组数据分析之结果注释与通路分析篇
热度 1 于淼 2015-8-31 22:09
上面三篇费了半天口舌的最终目的就是找出靠谱的差异基因,但到这里只算是研究的开始,下一步我们要为这些差异基因寻找意义。 分子生物学的研究方法一般就是围着中心法则转圈并找出同一层次的上下游变化。举例而言,如果我们实际发现一个突变性状想找到调控基因,那么你最好能纯化出这个蛋白或者根据相似性原理找一组同 ...
个人分类: 科搜研手册|9890 次阅读|2 个评论 热度 1
理解基因组数据分析之建模与可视化篇
热度 1 于淼 2015-8-30 13:58
原始数据导入时我们所遇到的背景问题说到底是测定的系统误差,期望可以看作0。但有些影响是我们不希望看到但依旧存在的,例如你测定了100多份基于地区分布的人体样本中的感兴趣基因组,但由于采样原因不可能同时采集,而时间的差异会直接导致诸如温度等影响了样本的均质性,这种情况下进行统计推断就需要平衡掉这些因素的 ...
个人分类: 科搜研手册|8158 次阅读|6 个评论 热度 1
理解基因组数据分析之差异比较篇
于淼 2015-8-29 11:14
先从最简单的例子来,假设我们比较两组人的平均身高该如何做?我们要对两组人采样,采样数最好一样,然后测量每个样本的身高,记录后分组计算均值与方差。如果目的是比较均值,那么首先要考虑使用的方法,如果是t检验,那么先对均值的方差进行F检验来确定是否需要等方差t检验,然后就是双样本t检验,结果显著(p0.05) ...
个人分类: 科搜研手册|12096 次阅读|没有评论
理解基因组数据分析之数据读取与数据结构篇
于淼 2015-8-28 09:43
这一系列的文章源于edx上PH525这一系列 (https://www.edx.org/course/statistics-r-life-sciences-harvardx-ph525-1x),从实用角度出发分为四部分: - 原始数据读取与数据结构 - 高维数据的分组差异比较 - 基因组数据建模与可视化 - 结果注释与通路分析 其实就是按工作流程走的,首先设计实验,跑芯片,然后拿到机器 ...
个人分类: 科搜研手册|5265 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 17:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部