博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(mac上python、c++读取txt文件时的问题)python 统计txt文档里面的每个单词出现的个数
阅读量:3930 次
发布时间:2019-05-23

本文共 666 字,大约阅读时间需要 2 分钟。

编码方式不是UTF-8会造成txt读取失败

放入Office 中选择保存txt方式,会跳出文件转换,选择其他编码 Unicode(UTF-8)即可。

以下为单词个数统计python 代码

 

f=open("aa.txt",'r')ll=f.read()'''将空格都取代为逗号,方便后面的split()'''ll=ll.replace(" ",',') '''防止由于文档编辑不规范出现双逗号的情况'''ll=ll.replace(",,",',')l=ll.split("\n")rows=[]dic={}for i in l:    row=i.split(",")    rows.append(row)for ii in rows:    for each in ii:        if each in dic:            dic[each]=dic[each]+1        else:            dic[each]=1#输出所有的排序:print(sorted(dic.items(),key=lambda x:x[1],reverse=True))'''只输出最大的值'''HighValue=0HighKey=Nonefor each in dic:    if dic[each]>HighValue:        HighValue=dic[each]        HighKey=eachprint(HighKey,HighValue)

在jupyter中样例的运行结果如下:

转载地址:http://iltgn.baihongyu.com/

你可能感兴趣的文章
测试方针和测试策略的区别
查看>>
JAVA代码—算法基础:最大数问题
查看>>
JAVA代码—算法基础:二叉树基础(基本性质)
查看>>
JAVA代码—算法基础:蚂蚁爬行问题
查看>>
JAVA代码—算法基础:水房接水问题
查看>>
JAVA代码—算法基础:学生出勤记录问题
查看>>
JAVA代码—算法基础:水壶分水的问题
查看>>
JAVA代码—算法基础:矩阵元素置零
查看>>
JAVA代码—算法基础:反转整数问题
查看>>
JAVA代码—算法基础:四平方定理问题
查看>>
JAVA代码—算法基础:字谜分组
查看>>
JAVA代码—算法基础:素数环问题
查看>>
JAVA代码—算法基础:重建行程
查看>>
JAVA代码—算法基础:DFS搜索算法伪代码
查看>>
JAVA代码—算法基础:最大连续邮资问题求解
查看>>
JAVA算法:三角形最短路径问题(动态规划求解)
查看>>
算法刷题:LeetCode中常见的动态规划题目
查看>>
JAVA代码—算法基础:切割钢锯条售卖的问题
查看>>
JAVA代码—算法基础:整数拆分求最大乘积问题
查看>>
JAVA代码—算法基础:求最大子矩阵的和
查看>>