导读:今天首席CTO笔记来给各位分享关于python统计文本有多少个单词的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
如何用python统计一个txt文件中各个单词出现的次数
1、首先,定义一个变量,保存要统计的英文文章。
2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。
3、从文章中分割出所有的单词,保存在数组中。
4、然后,计算文章中单词的总数,保存在变量中。
5、用for循环,统计文章中各单词的词频。
6、最后,输出文章中各单词的词频。
7、运行程序,电脑会自动统计输入文章中各单词的词频。
python统计个单词数目
楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等。
请问楼主要区分大小写吗?如果区分的话,就按照下面的来:
import re
def get_word_frequencies(file_name):
dic = {}
txt = open(filename, 'r').read().splitlines()
#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中。
txt = re.sub(r'[^\u4e00-\u94a5\w\d\-]', ' ', txt)
#替换单独的'-'
txt = re.sub(r' - ', ' ', txt)
for line in :
for word in line.split():
#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(), 0)
dic.setdefault(word, 0)
dic[word] += 1
print dic
if __name__ = '__main__':
get_word_frequencies('test.txt')
有问题继续追问吧
用python统计一段文本中单词出现的次数
python有个特别简单的方法就可以实现,直接用str的count方法就可以了,如下
python统计字符串中单词数量
使用比较基本的方法写的参考代码:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#python 2.7
import re
print u'请输入字符串:'
wz = raw_input()
s = wz.lower()
#小写单词的正则表达式
r='[a-z]+'
#找到所有单词
ws = re.findall(r,s)
#定义一个字典来存储单词和次数
dt = {}
for w in ws:
dt[w] = dt.setdefault(w,0)+1
#wd来存储单词集合,可能有几个,比如2个单词,都出现30次
wd = []
#max用来存储单词出现的最多的次数
max = 0
for word,times in dt.items():
if timesmax:
wd = []
wd.append(word)
max = times
elif times == max:
wd.append(word)
print u'有%s个单词,出现频率最高:'%len(wd)
for x in wd:
print "%s\t%s"%(x,max)
测试
请输入字符串:
A good beginning makes a good ending!!!
有2个单词,出现频率最高:
a 2
good 2
python,字符串怎么统计单词个数
如果你是指一串单词,空格隔开的,统计词频,就用列表和字典来。
比如输入的是这样:this one ok this one two three go end at end
dic1={}
n=input().split()
for i in n:
缩进if i in dic1:dic1[i]+=1
缩进else:dic1[i]=1
print(dic1)
python中怎么样统计一篇文章中的单词个数
你好,楼主,可以使用字符串的统计函数来完成。
详细代码如下:
w = 'python,我爱python,hello python。'
print("python出现了%s次"%w.count('python'))
结语:以上就是首席CTO笔记为大家整理的关于python统计文本有多少个单词的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于python统计文本有多少个单词的相关内容别忘了在本站进行查找喔。