杭州外文__詹宏伟分享 http://blog.sciencenet.cn/u/hwzhan

博文

R语言在语言学中的应用

已有 3256 次阅读 2020-5-29 14:53 |系统分类:科研笔记

杭州师范大学外国语言学及应用语言学研究生课程


第一讲 R Starter Tutorial


行首标有##号的,表示输出的结果;不带标记的,表示输入的代码

rm(list = ls(all=TRUE))# Arithmetic operators# +  -  * /9+3   #type in this after the prompt ">"
## [1] 12
#assign a value to a variable# <-  =num1 <- 9     #num1 is assigned without output(num2 <- 3)   #num2 is displayed while assigned

(未完)


第二讲 StringR+Regular Expression用正则表达式处理文字


data("words")str(words)
##  chr [1:980] "a" "able" "about" "absolute" "accept" "account" "achieve" ...
head(words)
## [1] "a"        "able"     "about"    "absolute" "accept"   "account"
str_subset(words,"^y")
## [1] "year"      "yes"       "yesterday" "yet"       "you"       "young"



第三讲 Frequency Spectrum词频分析


library(zipfR)##Case 1 #data("BrownImag.spc")summary(BrownImag.spc)
## zipfR object for frequency spectrum
## Sample size:     N  = 258196 
## Vocabulary size: V  = 19494 
## Class sizes:     Vm = 9334 3024 1553 993 724 476 389 303 ...
print(BrownImag.spc)
##     m   Vm
## 1   1 9334
## 2   2 3024
## 3   3 1553
## 4   4  993
## 5   5  724
## 6   6  476
## 7   7  389
## 8   8  303
## 9   9  266
## 10 10  189
## 	...
## 
##       N     V
##  258196 19494
Vm(BrownImag.spc,1:15)
##  [1] 9334 3024 1553  993  724  476  389  303  266  189  167  157  130  128  105




https://wap.sciencenet.cn/blog-3391152-1235507.html

上一篇:[转载]推荐统计学视频课程
下一篇:xyplorer提高文件管理效率
收藏 IP: 218.109.201.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 11:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部