科学网

 找回密码
  注册
分享与交流
潘现伟 2011-11-11 11:15
今天抄读会,一个学姐讲的是多种方法计算文本相似性的比较,文章特别新,比较的方法个人感觉也很新颖,分别对特大样本集中Mesh词、标题和摘要的每个词进行计算,从而计算文档之间的相似性。而里面采用的TFIDF算法正好是我研究论文相似性所用的方法。最近研究的基于内容相似性的网络构建,其实所谓的 ...
个人分类: 随笔|2470 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-6 03:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部