||
坐在泳池边休息,去掉泳镜。发现泳道中的水池底竟然是变形的:正对我的泳池为平的;两侧泳池向上呈流线型弯曲,更远的地方,则拉平,仿佛经典的流形形状。其它泳道类似。发现:水折射起了作用,灯光照射起了更基础的作用,水池起了约束作用。统一起来就是:灯光照在水上,起了第一步作用,促进了池底的反光,让我看到一切;水起了第二步作用,折射出池底的变形;泳池壁起了容器的作用,对水的范围进行了约束。水所有的“活动”,都是在该容器内进行的。这与奔腾的河水明显不同,河水只受两岸约束,可以直流到海。就如,我们研究的数据是在一定的范围内的,我们设计的算法就是适用这个范围,如果要跳出这个范围,就要考虑它的泛化性能;而现在较热的大数据却超出了这个范围,甚至超出了河的范围,是海。而且在不断变化其容量。对大数据的处理,则不能用小数据库的思路,至少要考虑泛化的作用,泛化的合理性、泛化的范围、与数学机理,比如pagerank的方式;还要考虑简化形式,比如indexing形式,以便用一般的服务器就能完成大数据研究功能;还要考虑检索的准确度,避开不完备不确切的信息干扰检索效能,比如hashing形式。从这几点出发,可以考虑大数据的研究。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-22 00:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社