On the Road 吧分享 http://blog.sciencenet.cn/u/zhjzh1016 科研在路上

博文

齐普夫定律-科技文献词频分布规律

已有 6953 次阅读 2011-11-30 08:08 |个人分类:文献计量学|系统分类:科研笔记| Law, 齐普夫定律

齐普夫定律(Zipf's Law) 是1948年由美国哈佛大学语言学教授G.K.齐普夫(George K. Zipf )对英语文献中单词出现的频次进行大量统计以检验前人的定量化公式而提出的。

定义:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。


https://blog.sciencenet.cn/blog-443101-513159.html

上一篇:布拉德福定律-科技文献分布规律
下一篇:洛特卡定律-科技文献作者分布规律
收藏 IP: 159.226.100.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 20:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部