科学网

 找回密码
  注册
NB-MAFIA: 基于N-List 的最长频繁项集挖掘算法
邓志鸿 2016-6-18 23:17
基于N-List, 提出一个高效的最长频繁项集挖掘算法NB-MAFIA,发表在《北京大学学报》上,论文可从以下网址免费下载: http://xbna.pku.edu.cn/CN/abstract/abstract2916.shtml
个人分类: 数据挖掘|2826 次阅读|没有评论
能高效挖掘频繁模式的项集表示DiffNodesets
邓志鸿 2016-1-21 11:34
DiffNodesets: An efficient structure for fast mining frequent itemsets http://www.sciencedirect.com/science/article/pii/S156849461600017X 源码见:http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/dfin.cpp
个人分类: 数据挖掘|2078 次阅读|没有评论
基于节点列表的项集表示框架的频繁项集挖掘最新进展
邓志鸿 2015-4-20 20:53
最新的论文在Expert Systems with Applications 2015 42卷13期上发表。 这篇论文采用等价类提升的策略,极大地提升了挖掘的速度,并且节省了内存消耗。所形成的PrePost+算法在时间和空间的性能度要明显优于 PrePost和FIN算法。 PrePost+ 算法的下载地址为: http://www.cis.pku.edu.cn/faculty/system/dengzhihong/ ...
个人分类: 数据挖掘|2028 次阅读|没有评论
PrePost和FIN算法的JAVA版本
邓志鸿 2014-11-24 20:40
频繁模式挖掘开源库SPMF上已经提供了PrePost和FIN算法的JAVA版本。 具体见 SPMF的网址:http://www.philippe-fournier-viger.com/spmf/
个人分类: 数据挖掘|2835 次阅读|没有评论
高效频繁模式挖掘算法FIN的C++源码
邓志鸿 2014-11-21 15:18
FIN.cpp FIN的C++源码见附件。算法内容参见论文: Fast mining frequent itemsets using Nodesets,下载地址: http://www.sciencedirect.com/science/article/pii/S0957417414000463 或 http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm 该算法的效率要优于传统主流挖掘算法,可以在其基础上 ...
个人分类: 数据挖掘|2763 次阅读|没有评论
高效频繁模式挖掘算法PrePost的C++源码
邓志鸿 2014-11-21 15:14
PrePost.cpp PrePost的C++源码见附件。算法内容参见论文:A New Algorithm for Fast Mining Frequent Itemsets Using N-Lists) 免费下载地址: http://info.scichina.com:8084/sciFe/EN/abstract/abstract508369.shtml 或 http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm 该 ...
个人分类: 数据挖掘|3102 次阅读|没有评论
基于节点列表的项集表示框架的频繁模式(项集)挖掘新进展
邓志鸿 2014-3-6 10:27
我们小组提出了基于模式树节点集的新颖数据结构,并把这类结构应用到数据挖掘核心任务-频繁模式挖掘中,形成了一系列的算法。这种结构从底层改变了频繁项集的挖掘方式和效率,有效地提升了挖掘速度,可以重写所有与频繁项集挖掘相关的任务,如闭模式、最长模式和TOP-K模式等。 我们已发表的算法包括2010年发表在《Interna ...
个人分类: 数据挖掘|3464 次阅读|没有评论
最近发表在SCIENCE CHINA Information Sciences的一篇代表性论文
热度 1 邓志鸿 2013-7-31 15:23
这篇论文是关于挖掘频繁模式的文章。频繁模式挖掘是数据挖掘的核心任务,我为频繁模式挖掘提出了一套全新的以树节点为索引单位的数据结构,我进一步证明了这种数据结构包含了挖掘频繁模式所必须的关键信息。由于这种结构是基于前缀树的,因此。它具有对原数据库的天然压缩性质。因此,挖掘效率要比基于事务ID号的垂直挖掘 ...
个人分类: 数据挖掘|5397 次阅读|2 个评论 热度 1

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 16:08

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部