康建
Python小例:统计文本中单词出现的频次
2019-6-11 09:58
阅读:1507
标签:Python

import re

zen='''

The Zen of Python, by Tim Peters

Beautiful is better than ugly.

Explicit is better than implicit.

Simple is better than complex.

此处略去15行...

Namespaces are one honking great idea -- let's do more of those!

'''

s=re.findall('[a-zA-Z]+',zen)

counts={}

for w in s:

    counts[w]=counts.get(w,0)+1

items=list(counts.items())

items.sort(key=lambda x:x[1],reverse=True)

for i in range(20):

    word,count=items[i]

    print("{0:<15}{1:>5}".format(word,count))


此题综合利用正则式、字典、列表、lambda等,很典型很实用,我出试卷的必考题

转载本文请联系原作者获取授权,同时请注明本文来自康建科学网博客。

链接地址:http://wap.sciencenet.cn/blog-797552-1184289.html?mobile=1

收藏

分享到:

当前推荐数:2
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?