yaozhixiong的个人博客分享 http://blog.sciencenet.cn/u/yaozhixiong

博文

matlab数据类型和转换

已有 20795 次阅读 2013-5-28 21:37 |个人分类:matlab|系统分类:科研笔记| MATLAB, 时间, 日期, 转换


matlab数据类型和转换


日期和时间

Matlab提供三种日期格式:日期字符串如’1996-10-02’,日期序列数如729300(0000年1月1日为1)以及日期向量如 1996 10 2 0 0 0,依次为年月日时分秒。

常用的日期操作函数

datestr(d,f) 将日期数字转换为字符串
      datenum(str,f) 将字符串转换为日期数字
      datevec(str) 日期字符串转换向量
      weekday(d) 计算星期数
      eomday(yr,mth) 计算指定月份最后一天
      calendar(str) 返回日历矩阵
       clock 当前日期和时间的日期向量
      date 当前日期字符串
      now 当前日期和时间的序列数



code-1:


>> n = datenum('19-Oct-2000')

n =

     730778

>> datestr(730778)

ans =

19-Oct-2000

>> datenum(2000,10,19)

ans =

     730778



code-2:


http://zhiqiang.org/blog/it/datestr-datenum-efficiency-in-matlab.html 


最近用Matlab写了个东西,运行效率不如我意。用Profiler跟踪了一下,结果让我大吃一惊。其中三分之一的时间花费在datestr这个函数上,六分之一的时间花费在save和load数据上。这里先谈前一个问题,关于save和load的效率以后再谈。

1.datestr和datenum的功能

这两个函数的功能需要从日期(和时间)的表示方法谈起。一个日期,它可以用一个字符串来表示,比如"2010-10-30 13:45:17",或"Oct.30,2010 3:45:17 PM",Matlab内置31种默认表示方法,同时还支持自定义格式。这种字符串的表示方式具有可读性,多用于外部展现。或者用一个向量来表示日期,比如[2010 10 30 13 45 17];日期还可以为一个序列值,比如上面的日期可以为73444.1573113426。在进行数据处理时常使用数字型的日期,因为储存、比较、计算都要快得多。Excel表格中日期外面看上去是一个字符串,但在内部存储的是一个数字,就是基于这个原因。

这样datestr和datenum的功能就很清晰了,datestr把指定日期转化为字符串形式,datenum则获取指定日期的序列值。

注:Excel的日期的数字表示和Matlab不一样,具体情况参见Matlab、Excel、SQL中的日期的数字序列形式。另外Excel的日期类型在vba的match函数上有一个bug,参见VBA中的Date类型的匹配问题

2.datestr和datenum的效率

直接运行10000次datenum:

>> tic; for i = 1:10000, a = datenum('2010-10-10'); end; tocElapsed time is 26.869241 seconds.

通过Profiler发现大部分时间都消耗在判断输入的字符串表示格式上,通过直接指定输入格式,可将速度加快5倍:

>> tic; for i = 1:10000, a = datenum('2010-10-10', 'yyyy-mm-dd'); end; tocElapsed time is 5.048942 seconds.

datestr函数要好一些:

>> tic; for i = 1:10000, a = datestr(734421); end; tocElapsed time is 1.760489 seconds.

够快吗?在处理大数据集时还是不够快。下面有些简单的方法让datenum再快100倍,让datestr再快5倍。

3.提速方法

如果不想改变自己的使用习惯和使用别的替代函数(比如为了保持兼容性),一个直接的办法(习惯)是在使用datenum时对输入指定格式,比如datenum('2010-10-10', 'yyyy-mm-dd')要比datenum('2010-10-10')快5倍。

其次是使用datenum和datestr的替代函数,比如datenummx和datestrmx。虽然在Matlab的正式文档中找不到datenummx和datevecmx,它们是真实存在的,并且是MEX格式,速度超快,实现从向量型日期到序列值的转换,其原型如下:

number = datenummx(year, month, day, hour, minute, second)[year, month, day, hour, minute, second] = datevecmx(number)

在日期序列值和字符串表示的转换可直接通过sscanf和sprintf实现,这两个函数的性能都还不错。

如果嫌麻烦的话,matlab file exchange上有现成的已经封装好的函数可以用,比如DateConvert。我自个也封装了一个,分别为mdatenum, mdatestr分别用来代替datenum和datestr:

datetime.zip1,000 bytes
按照Excel中的用数字表示日期的方法,在字符串形式和数字形式的日期之间互相转化,比Matlab自带的datestr和datenum要快5到10倍。

性能(可与上面直接的比较):

>> tic; for i = 1:10000, a = mdatenum('2010-10-30'); end; tocElapsed time is 0.259976 seconds.>> tic; for i = 1:10000, a = mdatestr(734421); end; tocElapsed time is 0.364543 seconds.

当然如果你追求极致的话,还有另一个选择,用C写一个,编辑为MEX文件来调用。同样,已经有别人写好了,见DateStr2Num,按照其宣称的速度,将比上面的datenummx、mdatenum再快5倍。


datetime.zip




https://blog.sciencenet.cn/blog-419857-694442.html

上一篇:matlab eof
下一篇:MATlAB如何添加工具箱
收藏 IP: 122.224.232.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 14:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部