bigdataresearch的个人博客分享 http://blog.sciencenet.cn/u/bigdataresearch

博文

[转载]时间频率科学数据管理控制与应用

已有 847 次阅读 2022-1-21 16:58 |系统分类:论文交流|文章来源:转载

时间频率科学数据管理控制与应用


章宇1,2, 袁海波1,2,3, 王燕平1,2, 董绍武1,2,3, 张继海1,2,3

1 中国科学院国家授时中心,陕西 西安 710600

2 中国科学院时间频率基准重点实验室,陕西 西安 710600

3 中国科学院大学,北京 100049

 

 摘要时间频率系统已经成为国家的战略资源,时间频率科学数据的应用涉及通信、电力、交通、战事等方面,因此时间频率科学数据的统筹梳理、管理控制、应用分析具有重要的现实意义。首先对时间频率科学数据进行分类分级,同时制定数据共享策略,详述时间频率科学数据管理系统的组成架构以及时间频率科学数据的质量控制方法;然后分析时间频率科学数据开放共享面临的问题,给出解决方案;最后阐述时间频率科学数据的若干应用方向,对时间频率科学数据的管理控制进行总结并展望。


关键词时间频率科学数据 ; 分类分级 ; 系统架构 ; 质量控制


论文引用格式:

章宇, 袁海波, 王燕平, 等. 时间频率科学数据管理控制与应用[J]. 大数据, 2021, 7(6): 120-127.

ZHANG Y, YUAN H B, WANG Y P, et al. Management control and application of the time-frequency scientific data[J]. Big Data Research, 2021, 7(6): 120-127.


1 引言

高精度时间频率是国家重要的战略资源,精密时间/频率信号对国民经济建设、科学研究、社会生活等方面产生了至关重要的影响。从科技研究领域(如天文学、地球动力学、物理学等)到工程技术领域(如信息传递、电力输配、深空探测、空间旅行、导航定位、武器实验、地震监测、计量测试等),再到民生领域(如交通运输、金融证券、邮电通信)等,时间频率涉及生活的方方面面。

中国科学院国家授时中心(National Time Service Center, Chinese Academy of Sciences,NTSC)作为我国标准时间、标准频率的发播单位,在长期的时间保持过程中,积累了大量的时间频率科学数据,这些数据包含国家标准时间基准系统原子钟测量比对数据、远程溯源比对数据、授时监测数据、国际原子时合作数据等与时间频率信号的产生、保持、发播过程相关的数据。本文探讨如何对时间频率科学数据进行统筹管理、科学运用,以期为进一步提高我国守时、授时发播水平提供支撑,为多模导航系统兼容及互操作提供基础保障,同时为我国参与国际标准时间——协调世界时(coordinate universal time,UTC)的计算提供更有效的依据。

2 时间频率科学数据的管理控制及共享机制

2.1 时间频率科学数据的分类分级管理与共享

国务院办公厅于2018年3月印发的《科学数据管理办法》要求要遵循分级管理、安全可控、充分利用的原则,对时间频率科学数据进行分级管控,以提高时间频率科学数据的管理效率。时间频率科学数据的分类分级分为如下两步。

首先对时间频率科学数据进行类型划分。时间频率科学数据主要分为国家标准时间基准系统测量比对数据、时间频率公报数据、国际权度局(Bureau International des Poids et Mesures, BIPM)公布数据、国际地球自转服务(international earth rotation service, IERS)数据、国际全球卫星导航系统服务(international global navigation satellite system service,IGS)数据。其中,国家标准时间基准系统测量比对数据包括守时系统原子钟测量比对数据、国际时间同步链路比对数据;时间频率公报数据包括长/短波授时监测相关数据、时号改正数及国际时间频率相关科学数据资料、国内外主要授时服务系统的授时监测结果;BIPM公布数据主要包括UTC数据、国际原子时(international atomic time, TAI)数据以及原子钟权重、速率、频率漂移数据,其中,国际原子时是由全球80多个实验室500多台原子钟运用加权平均算法计算得到的自由原子时通过基准钟校准后获得的;IERS数据主要包括地球自转相关参数、闰秒等信息,其中闰秒可保障UTC与世界时的偏差不超过一定的范围;IGS数据主要包括GPS、北斗导航的精密星历、极移日常变化量等。

随后,进行时间频率科学数据的分级。时间频率科学数据的级别分为核心科研数据、临时数据、公开发行数据3级。第一级为核心科研数据,主要指时间频率科学数据分类中的国家标准时间基准系统测量比对数据,即守时系统原子钟测量比对数据、国际时间同步链路比对数据,这部分数据是原始数据,在使用时需要进行预处理操作,普通用户未对该数据结构及特性进行梳理就直接使用,分析得出的结论可能会有一定的偏差,因此这部分数据需要认证使用,同时使用后需进行归档处理。第二级为临时数据,主要包括时间尺度计算、主钟系统驾驭处理、稳定度计算等过程分析、实验数据,其中,时间尺度指以原子钟测量比对数据为基础进行加权平均运算形成的更加稳定可靠的时间参考数据。实验室通常选择一台性能优良的原子钟作为主钟,同时依据驾驭量对其输出进行修正,使其更接近协调世界时,其中主钟及驾驭设备构成了主钟系统。第二级数据主要供专业时间频率工作人员科学研究使用,因此不进行发布,用户若有需求,需提出申请并得到认证后才能被授权使用。所有用户在使用数据时需要按照规范标注引用。第三级为公开发行数据,包括时间频率科学数据分类中的时间频率公报数据、BIPM公布数据、IERS数据、IGS数据,这部分数据经过数据字典匹配得到本地实验室数据后,进行共享发布,用户可以下载查看并使用,这里的数据字典包括本地原子钟钟号、实验室编号等字段。

2.2 时间频率科学数据管理系统架构

时间频率科学数据管理系统架构被划分为表示层、应用层、数据访问层3层,依据组件化方式进行系统的设计。数据访问层模块包含文件的导入导出模块、数据库访问模块、日志记录模块,应用层主要包含数据服务模块和内部管理模块,其中数据服务模块包含数据分级后的比对数据、BIPM公布数据、公报数据,内部管理模块主要涉及设备管理(原子钟增加/退出)、用户管理、系统配置等,具体如图1所示。


image.png


图1   时间频率科学数据管理系统架构


表示层、应用层、数据访问层3层体系结构将数据与程序、数据控制、应用逻辑分层独立管理,能更严格地控制信息访问,对权限的划分更加准确、灵活、严格,数据库位于底层(即数据访问层)部分,不会直接暴露给用户,可以有效地提高时间频率科学数据管理系统的安全性。整个系统由表示层、应用层、数据访问层3层以及每层中的各个组件构成,这些组件之间以及层与层之间的信息传递是完整的,但是对用户是透明的。需要特别注意的是,应用层的数据服务模块依据第2.1节的时间频率科学数据的分类分级结果进行模块划分,对于用户而言,搜索、查看、导出等功能使用便捷、流畅。

2.3 时间频率科学数据的质量控制

为了保障时间频率科学数据输出的准确稳定、有效可靠,需要在时间频率科学数据采集、处理、存储、校验各个环节进行质量控制。在采集数据时,对数据文件进行标识和备份(标识和备份依据约化儒略日(modified julian date,MJD)、原子钟钟号、钟的不同类型等信息进行操作,其中MJD为时间频率领域常用的日期时间表示方式),其一方面保障了数据采集的完整性,另一方面保障了数据采集过程的安全性。此外,数据采集的频率依据数据比对频率、公报公开发行频率进行设定。数据采集后需要进行预处理,包括对数据进行异常值检测以及缺失值判断,随后剔除奇异值,通过数学拟合算法补充缺失值、替换异常值,保障数据的连续性及有效性。最后将数据集中统一存储并进行校验,校验主要针对的是数据文件是否缺失,可根据文件的版本号、流水号、公报编号、原子钟编号、年月日/MJD等信息进行校验。

3 时间频率科学数据开放共享面临的问题及解决方法

3.1 时间频率科学数据开放共享面临的问题

在推进时间频率科学数据开放共享的过程中面临一些困难挑战,主要有以下几个方面。

首先是数据集种类的局限性。目前生成的时间频率科学数据集种类不够丰富,主要侧重的是对本地守时系统比对数据的采集,其中本地守时系统指本地守时实验室实现原子钟测量比对、驾驭控制,最终输出时间频率信号的时间系统。由国际链路比对结果形成的数据集相对较少,而这部分数据体量较大,种类也较为丰富,需要进一步加强该部分数据集的采集,这是守时工作的重要部分。

其次是数据个性化服务问题。不同行业的人群对时间频率科学数据的诉求深度不同,因此需要为用户提供个性化服务,如普通用户更侧重于科普数据的需求,如世界时(universal time,UT1)、UTC、TAI、闰秒、不同类型守时型原子钟的特性参数等数据;时间频率相关科学研究更注重需求原子钟的比对结果,如本地原子钟的权重、速率、频率漂移等数据。然而目前未对数据共享进行个性化的区分。

再次,由于时间频率科学数据本身的特殊性,用户在不了解数据结构特性的前提下使用数据,可能会造成计算结果的偏差。因此,指导用户了解并合理使用时间频率科学数据也是至关重要的。目前此部分未有相关的服务。

最后,时间频率科学数据的安全也需进一步保障。目前数据的备份操作仅依靠系统自动备份软件,一旦出现存储介质失效、服务器故障等情况,备份过程将中断、备份数据会缺失,导致守时系统的可靠性、稳定性大大降低。

3.2 解决方法

下面针对上述问题提出相应处理方案。对于国际链路比对数据集较少的问题,未来将增加标准RINEX观测数据集(一种标准的数据格式)、全球卫星导航时间比对标准(common GNSS generic time transfer standard,CGGTTS)共视数据集、GNSS精密单点定位(precise point positioning,PPP)数据集等国际链路数据集,以促进远距离时间比对研究。

对于用户个性化服务问题,在统筹用户权限时进行规划,依据科研用户和非科研用户进行大类的权限划分,随后依据时间频率科学数据分级分类的结果进行权限的细化,用户在注册申请访问时注明用户类型,管理员审核申请并给用户分配相应权限。

针对时间频率科学数据本身的特殊性导致用户不了解数据结构特性的问题,在数据共享的同时,并行发布不同类型的时间频率科学数据结构介绍、时间频率科学数据详细说明、时间频率科学数据的分析方法,也可以以数据服务网站公告的形式发布。此外,还可以设定触发邮件,管理员对不同问题进行针对性回复,保障用户合理有效地使用时间频率科学数据。

对于时间频率科学数据的安全问题,定期进行数据的备份操作。备份计划采取双机热备份,定期检查数据备份介质是否有效,特别要求在操作系统配置更新升级的时候必须进行数据的备份。此外,针对时间频率科学数据的风险防控,还需要对数据全生命周期进行记录,以保障数据能够被溯源。

4 时间频率科学数据的应用

4.1 守时系统的相关应用

针对守时系统,时间频率科学数据的应用主要包括守时系统状态监测,守时系统时间预报、驾驭参考,守时实验室时间保持能力评估3个方面,具体如下。

首先,时间频率科学数据可被应用于守时系统状态监测。基于时间频率比对大数据进行分析,对原子钟、主钟系统、驾驭控制系统中的异常数据特征进行挖掘提取,分析并归纳总结系统关键部分的数据异常类型,这些故障类型一般包括原子钟测量比对数据的缺失、频率跳变、相位跳变,主钟系统的频率突变、相位突变,驾驭控制系统控制命令的有效性,系统输出信号的稳定度、准确度变化等。先具体分析,再详细分类,然后依据原子钟类型、驾驭控制设备类型、原子钟测量比对类型(频差、相差)、主钟类型等进行划分,最后将划分结果作为守时系统状态监测的重要参考,当系统出现异常的时候,依据分析结果快速锁定问题源头,及时、高效地处理故障,保障守时系统的连续、稳定运转。

其次,时间频率科学数据可被应用于守时系统的时间预报、驾驭参考。守时实验室的主钟频率源常常是一台运行稳定、性能良好的原子钟,原子钟是自由运转的,其相对于BIPM发布的UTC[6]可能有一定的频率偏差,为了获得接近UTC的频率输出,需要对主钟系统的输出频率UTC(k)进行驾驭控制,即需要计算频率驾驭量,运用原子钟比对数据进行钟差预报[7-8],结合BIPM公布的交互数据(即权重、速率、频率漂移数据)可以计算驾驭量,其中通过调节权重可充分发挥不同类型原子钟的性能优势。此外,BIPM公布的UTC与UTC(k)偏差(数据每五天产生一个点,每个月公布滞后的值)可分别作为主钟系统长期驾驭量、外部驾驭量。

最后,时间频率科学数据可被应用于对守时实验室时间保持能力的评估。守时实验室可通过BIPM发布的Circular-T数据、权重w报、速率r报、频率漂移d报,匹配本地实验室数据字典,获得本地守时原子钟权重数据、原子钟相对TA I速率数据、频率漂移数据,并结合时间频率公报数据,利用本地原子时算法及本地时间频率信号控制技术,产生并保持标准时间UTC(k),UTC(k)与国际标准时间的偏差可作为评估守时实验室守时能力的重要指标。2020年至今,UTC与UTC(NTSC)的偏差(UTC-UTC(NTSC))情况如图2所示。


image.png

图2   2020年至今UTC与UTC(NTSC)的偏差


此外,前面提到的原子钟权重数据也可以从另一方面反映本地守时系统运行的稳定性,如果原子钟普遍权重较大,则说明本地原子钟性能稳定、可预测性良好,产生的时间尺度具有可靠性。

4.2 远距离时间比对应用

为了保障本地时间与国际标准时间同步,远距离时间比对常用的方法有卫星双向时间频率传递(two way satellite time and frequency transfer,TWSTFT)、GNSS共视(common view,CV)、GNSS全视(all in view,AV)、PPP、远距离光纤比对、远距离激光比对等。不同的比对方法具有不同的特性,通过大数据分析可以总结不同远距离时间比对技术对应的特点以及比对精度,从而在对精度、实时性要求不同的应用场景,选择或自由设计相应的远距离时间比对手段或多种手段的组合。目前生成的远距离时间比对数据集为TWSTFT数据集,该数据精度高、实时性强,对精度、实时性要求较高的应用场景具有良好的适用性。

未来,将增加PPP、远距离光纤比对、远距离激光比对等比对数据集,通过对其特性进行分析挖掘,将满足更多远距离时间比对链路的应用需求。

4.3 时间同步应用

在计量与校准方面,可使用时间频率科学数据研究远程标准时间的复现以及相关复现方法,基于分析结果实现远距离的计量与校准。

在通信信息传递方面,以通信基站布设(含时间频率同步系统)为基础,通过通信基站与中心站或国家标准时间服务系统的远程比对控制模块,实现基站间相对同步,或者与国家标准时间绝对同步,从而支撑移动通信的实现。

在军事方面,时间频率科学数据可被应用于目标的精确打击、目标方位追踪、目标定位、分布式雷达系统,包括联网观测雷达的时间同步应用、基站间的时间同步应用等。

5 结束语

综上,时间频率科学数据不同于其他科学数据资源,时间频率本身具有一定的特殊性:一是时间是目前测量最准确的物理量,二是标准时间和频率信号具有实时应用和服务的功能。因此,开展时间频率科学数据管理及共享应用研究旨在进一步促进国内时间频率领域的科学研究,改进时间频率科学数据单文本服务方式,为国家科学数据资源建设做出更大的贡献。


作者简介


章宇(1992-),男,中国科学院国家授时中心研究实习员,主要研究方向为时间保持技术与方法、数据处理方法。


袁海波(1974-),男,博士,中国科学院国家授时中心研究员、博士生导师,主要研究方向为时间尺度计算、高精度时间传递等。


王燕平(1963-),男,中国科学院国家授时中心高级工程师,主要研究方向为守时技术。


董绍武(1963-),男,博士,中国科学院国家授时中心研究员、博士生导师,主要研究方向为中国标准标准时间UTC(NTSC)产生保持。


张继海(1988-),男,中国科学院大学博士生,中国科学院国家授时中心助理研究员,主要研究方向为全球导航卫星系统高精度时间比对与时差监测。


联系我们:

Tel:010-81055448

       010-81055490

       010-81055534

E-mail:bdr@bjxintong.com.cn 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/



大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年、2019年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。




https://blog.sciencenet.cn/blog-3472670-1322052.html

上一篇:[转载]水环境模型与大数据技术融合研究
下一篇:[转载]“国家科学数据中心”联合专刊即将出版,敬请期待~
收藏 IP: 124.202.175.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 03:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部