tanyxkxw的个人博客分享 http://blog.sciencenet.cn/u/tanyxkxw

博文

[R语言] 统计文件词频

已有 8961 次阅读 2014-6-20 13:20 |系统分类:科研笔记

# 在Windows系统下,打开所选的多个文件并统计词频    

fileNames <- choose.files()

for(i in fileNames) { data <- c(data, scan(i, what="")) }

data <- gsub("[^\w-]", "", data, perl=TRUE)

wordFreq <- sort(table(tolower(data)))

wordFreq[wordFreq>length(fileNames)]



https://blog.sciencenet.cn/blog-747197-805037.html

上一篇:读取WAV文件头信息
下一篇:如何设置路由器,实现共用同一个帐户上网
收藏 IP: 166.111.156.*| 热度|

1 王云才

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 18:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部