气象.水.熵.复杂性分享 http://blog.sciencenet.cn/u/zhangxw 张学文的文章,涉及气象、水分、熵、统计、复杂性、一般科学等

博文

欢迎统计英文词汇中类似汉字的笔画熵与笔画(字母数量)分布图

已有 5776 次阅读 2013-11-14 12:40 |个人分类:统计、概率、熵、信息、复杂性.2.|系统分类:科研笔记| 统计, 字母, 分布图, 汉字笔画, 英文词汇

欢迎统计英文词汇中类似汉字的笔画熵与笔画(字母数量)分布图

张学文,2013.11.14

前几天我在博客中提到汉字的笔画熵与不同笔画的汉字数量分布图http://blog.sciencenet.cn/blog-2024-741111.html ,这里我提出对于英文词汇,应当作与此差不多的一种分析。即以一本英文字典为准,针对其中的每个词汇,统计字母数量为n1n2,n3…的英文词汇数量m1,m2,m3…各为多少。并且由此计算英文词汇的字母数量熵,以及n,m的关系图。

也就是说,把面对中文的字的笔画数的统计,改为面对英文的词汇的字母数的统计。开展类似的信息熵与统计分布函数分析。

我早就想到此问题,但是人懒,没有作这个辛苦的统计分析。欢迎有人统计它。并且获得结果。我猜测其结果与我关于汉字笔画的结果很类似。字母数量为3,6,10,15…n的英文词汇各有多少m,我预言n,m的关系也符合对数正态分布!

欢迎有志者实验、统计之。




https://wap.sciencenet.cn/blog-2024-741663.html

上一篇:中国每天降水资源总量与笼罩面积报告-2013.11月13日
下一篇:2013.11.15新疆降水/温度/湿度笼罩面积报告
收藏 IP: 124.117.70.*| 热度|

2 蒋迅 徐晓

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-10 09:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部