NJUYJX的个人博客分享 http://blog.sciencenet.cn/u/NJUYJX

博文

R语言数据清洗

已有 2958 次阅读 2018-1-10 18:56 |个人分类:R语言|系统分类:科研笔记

1. 创建新变量

mydata <- transform(mydata,

                   sumx = x1 + x2,

                   meanx = (x1 + x2)/2)

2. 变量重编码

(1)within函数

leadership <- within(leadership, {

                                 agecat < NA                                                                       -----新建一个变量

 agecat[ age > 75 ]                              <- "Elder"

 agecat[ age > = 55 & age <= 75 ]      <- "Middle Aged"     -----根据Age的值判断

 agecat[ age < 55 ]                              <- "Young" })

(2)reshape函数


3. Mac笔记本读取含有中文字符的文件

read.csv("filename", fileEncoding = "GBK")可以避免编码错误


4. factor类型转成numeric类型之前,一定要先转成character类型,即as.numeric(as.character()),不然数会变




https://wap.sciencenet.cn/blog-3376545-1094174.html


下一篇:R语言sp包学习笔记
收藏 IP: 114.230.57.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 08:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部