科学网

 找回密码
  注册
R语言中的颜色问题
彭友松 2011-7-15 16:02
1 R中有多少种颜色?怎么看? 命令:colors()显示出下面的657种颜色 "white" "aliceblue" "antiquewhite" "antiquewhite1" "an ...
个人分类: 统计学与R语言学习|25786 次阅读|没有评论
非常快速的建树软件FastTree
热度 2 彭友松 2011-6-21 11:30
FastTree http://www.microbesonline.org/fasttree/ Also see Fast Tree-Comparison Tools FastTree infers approximately-maximum-likelihood phylogenetic trees from alignments of nucleotide or protein sequences. FastTree can handle alignments with up to a million ...
个人分类: 生物信息学与计算生物学|20052 次阅读|4 个评论 热度 2
Perl语言中的splice()函数的用法及其用于对数组的随机扰动
彭友松 2011-6-17 10:11
splice函数有四种用法: 1 在数组中用其他元素代替数组部分元素,用法为splice(@list,offset,length,@new),即把@new中的元素替换数组@list中从offset位置开始且长度为length的元素。 2 从数组中删除元素,用法为splice(@list,offset,length),即把数组@list中从offset开始长度为length的元素去掉。 3 清空数组,用法为spl ...
个人分类: 统计学与R语言学习|17559 次阅读|没有评论
分子生物学中常用数据库
彭友松 2011-6-9 10:40
转自生物统计家园 http://www.biostatistic.net/thread-2498-1-1.html 下面的数据库很有用,所以先保存下来了。非常感谢生物统计家园的总结! 综合数据库: 最权威的生物信息学网址链接: http://www.bioinformatics.vg 生物信息学网址链接: http://www.bioinformatics.ca/links_directory/ Nuclei ...
个人分类: 生物信息学与计算生物学|12158 次阅读|没有评论
R中的遗传算法
彭友松 2011-6-8 15:27
在R中我发现了四个软件包使用遗传算法进行参数选择和目标函数优化,如下所示: 1GALGO 2genalg rbga(stringMin=c(), stringMax=c(), suggestions=NULL, popSize=200, iters=100, mutationChance=NA, elitism=NA, monitorFunc=NULL, evalFunc=NULL, showSettings=FALSE, verbose=FALSE) 3 mcga ...
个人分类: 统计学与R语言学习|10793 次阅读|没有评论
《Linear models with R 》学习笔记之一
彭友松 2011-6-2 21:44
一本好的参考书不应该只告诉读者技术性或者知识性的东西,还应该把作者的思想和经验与读者交流。刚看了这本书第一章的前面几页就觉得这本书不错,因为作者告诉我们怎样成为一位合格的统计学家,而不是仅仅会用统计学作为工具。第一章的第一句话是这么说的: Statistics starts with a problem, pr ...
个人分类: 统计学与R语言学习|5902 次阅读|没有评论
R中的排列组合,阶乘的计算
彭友松 2011-6-2 10:04
参考了网上的一些资料,得到了下面的一些函数可以做这些事。 组合数的计算:从N中选择K个用函数 choose(N,K) 阶乘的计算有三种方法: 1)factorial(N),最快的方法 2) prod(1:N),最慢的方法 3) gamma(N+1),也是非常快的算法 可以看下面的一个测试: system.time(replicate(10000000,gamma(101))) ...
个人分类: 统计学与R语言学习|33238 次阅读|没有评论
对于bootstrap的一些粗浅认识-2
彭友松 2011-5-31 20:25
bootstrap percentile confidenceinterval和bootstrap t confidence interval的比较 先说bootstrap percentile confidence interval的概念,它是指某统计量的bootstrap分布的2.5%和97.5%的间距。两种可信度区间的应用条件不一样,当bootstrap distribution近似符合正态分布,而且bias很小的时候,一般用t可信度区间 ...
个人分类: 统计学与R语言学习|12490 次阅读|没有评论
对于bootstrap的一些粗浅认识
彭友松 2011-5-30 22:11
什么是bootstrap? bootstrap就是从一个原始样本中进行有放回的重复采样,采样大小和原始样本大小相同,采样次数根据计算量而定。从每个重新样的样本中可以计算某个统计量的bootstrap 分布,比如说均值,多个重采样样本的均值构成了原始样本均值的bootstrap分布。在采样完后需要检查待研究统计量的bootstrap分布是不是符合 ...
个人分类: 统计学与R语言学习|23528 次阅读|没有评论
R语言中的机器学习-分类树和回归树
热度 1 彭友松 2011-5-18 16:31
在R中包tree专门用于分类树和回归树的构建,其中的函数tree()和线性回归的函数lm()类似,只需要指定函数形式和数据。如: data - read.table("test") model - tree(V1~.-1,data) 这里需要注意的是,如果公式中的Y是数值变量,那么tree()默认为回归树,否则是分类树。 包中的函数prune.tree()用于修建树,predic ...
个人分类: 统计学与R语言学习|19010 次阅读|1 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 18:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部