科学网

 找回密码
  注册
计算生物学/生物信息学的未来是什么?
热度 9 彭友松 2011-10-17 21:57
做为一名快要毕业的生物信息学博士生,对于这个问题一直在思考。以我对于现在这个学科的粗浅的认识,我认为现在的生物信息学和计算生物学大部分都只是停留在辅助实验和解释生物学现象上,有一些工作发现了一些生物学规律,很少的工作提出了指导本领域或者整个生物学的发展。难道我们做生物信息学的就只能够当帮手吗? 当年 ...
个人分类: 生物信息学与计算生物学|20016 次阅读|10 个评论 热度 9
计算生物学和生物信息学中有意义的5类工作
热度 2 彭友松 2011-10-17 13:30
我个人觉得做计算的只有做下面的这些工作才会有意义。否则,文章发了一大堆,其实都是一些垃圾。 1 辅助实验生物学,为之减少实验量,提供一些建议和参考。比如通过计算分析发现一些重要的位点,供实验生物学家进行验证。 2 为计算同行和实验生物学家提供资源或者工具,比如建立一个数据库, ...
个人分类: 生物信息学与计算生物学|6493 次阅读|2 个评论 热度 2
非常快速而且能够处理成千上万条序列的建进化树软件FastTree
热度 7 彭友松 2011-9-16 22:01
之前推荐过但是当时自己没有用过,现在尝试了一下,发现确定非常快。拿我的问题来说,总共3000多条序列,序列长度为1700nt,我用Phylip中最快的的Neighbor-joining计算花了一个小时以上,而且是在我的主机,而用我装的虚拟机(内存500M,计算能力肯定不能主机)FastTree计算,只花了不到20分钟,而且更强悍的是它还给出了 ...
个人分类: 生物信息学与计算生物学|17974 次阅读|12 个评论 热度 7
随笔
彭友松 2011-8-26 16:05
好的统计学专家不是那种拿到数据直接用某个工具运行一遍得到结果的人,而是应该先分析数据,对于数据有一个大致的了解,然后再去决定用哪种工具和哪种方法。同样,好的机器学习专家不是一拿到问题就用某种学习方法学习一遍,而是应该仔细分析问题,选择最合理的方法。虽然做了两三年的机器学习和统计,发现自己还是没有入门 ...
3203 次阅读|没有评论
R语言中坐标轴刻度值的灵活处理
彭友松 2011-8-19 17:40
在R中处理坐标轴的函数为axis(),我现在关心的是如何改变坐标轴的刻度位置,以及刻度标记。axis()中的参数at和labels可以解决这个问题。at表示坐标轴刻度的位置,可以自己指定,比如at=c(1,2,3,4,5,5.5,5.6,6,7),labels表示与坐标轴刻度相对应的坐标轴标记,如labels=c(1,2,3,4,5,5.5,5.6,6,7)。如果要改变坐标轴,首先在画 ...
个人分类: 统计学与R语言学习|60320 次阅读|没有评论
R中评估层次聚类可信度的包Pvclust
彭友松 2011-8-15 16:16
就像进化树中分支需要给出bootstrap值一样,层次聚类后得到的类别划分也需要给出其可信度。R中提供了这样一个包Pvclust,它采用bootstrap重新采样的思路,对于给定的数据进行重新采样,然后会给出每个节点的可信度(AU值和BP值)。需要指出的是,它要求提供原始数据,而不能是已经计算好的距离矩阵,比如说microarray的数据 ...
个人分类: 统计学与R语言学习|8571 次阅读|没有评论
强烈推荐--R的集成环境RStudio
彭友松 2011-8-12 10:07
推荐一下该东东,虽然我刚知道还没有开始用,但是它看起来很方便。现在我还是比较习惯在命令行里面操作,等以后再用吧。 RStudio有Windows和Linux环境下的版本,见 http://rstudio.org/
个人分类: 统计学与R语言学习|4400 次阅读|没有评论
相关矩阵的图形表示
彭友松 2011-7-23 16:44
刚看到一个R包corrplot可以很漂亮和形象的展示相关矩阵,而且可以进行聚类。该包的参数特别多,我只关心下面两个:一个是输入数据为相关矩阵,可以是全矩阵,下三角或者上三角;另外一个矩阵展示中元素的顺序,可以是原来的顺序,也可以用聚类的方法,这可以使用参数order来指定。 corrplot(corr,order = c("original", ...
个人分类: 统计学与R语言学习|6181 次阅读|没有评论
去除冗余序列的超快超好用工具cd-hit
热度 6 彭友松 2011-7-21 16:03
这个软件(也有在线服务器,见其官网 http://www.bioinformatics.org/cd-hit/ )是中国人( Weizhong Li )写的,很好用,最大的特点就是快。基本思路是首先对所有序列按照其长度进行排序,然后从最长的序列开始,形成第一个序列类,然后依次对序列进行处理,如果新的序列与已有的序列类的代表序列的相似性在cutoff以 ...
个人分类: 生物信息学与计算生物学|34145 次阅读|10 个评论 热度 6

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 07:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部