Appearance
开放数据联盟链可信共享
科学数据可信共享需求
科学数据是科技创新、经济发展和国家安全的重要战略资源。科学数据的有序管理、安全保障、开放共享与有效应用具有重要的科学研究和社会经济意义。目前,我国科学数据共享管理工作已初见成效,但仍有很多工作亟待推进。尤其是在跨部门、跨平台、跨学科的数据交换共享与综合治理过程中,针对科学数据及其元数据信息的规范性、一致性、可信度和可溯源性等问题尚未形成成熟的技术方案与系统平台。同时,科学数据的应用情况追踪与最终成果效益评价等方面的技术基础也较为薄弱,目前科学领域重大项目和其他来源科学数据应用情况的追踪仍主要基于科研团队的主动上报反馈以及数据中心团队的人工整理与统计分析,未能有效触及所有使用了相关科学数据的科研成果与行业应用,也耗费较多的人力成本。
区块链技术保障数据可信共享
区块链技术已在其他领域与行业中形成了若干有效应用示范,其应用场景与科学数据的可信共享中的需求具有相似性,因此基于区块链技术有望在科学数据的综合治理、发布共享、可信性验证及应用效益跟踪中得到有效应用,解决参与交换共享的科学数据信息的安全性、规范性、一致性、可溯源性等问题,解决对科学数据应用情况的挖掘分析与统计评价。
区块链技术为科学数据提供信息共享能力,包括支持建立若干子链,实现子链中各节点间科学数据元数据的上链、共享与自动同步;支持子链加入开放共享联盟,使该子链数据与信息进入更广泛的共享范围,并基于区块链的技术特征,保证数据信息的长期安全可用。同时,支持不少于DOI(Digital Object Identifier)、PID(Persistent Identifier)和CSTR(China Science & Technology Resource)等三类科学数据唯一标识符的解析能力和基于科学数据唯一标识符对所共享科学数据提供引用情况统计分析功能。
针对一些涉及数据安全和隐私保护问题的科学数据,科研机构不能直接将原始数据开放共享给科研人员,科研人员可以通过提交数据分析算法的方式只获取数据分析结果,而不需要直接下载原始数据,同时也需要保证提交的算法可以如约执行。科研人员也可以通过直接提交数据分析代码到科研机构的数据中心以合约的方式运行,保证原始数据不脱离科研机构物理控制,只返回数据分析结果,同时通过智能合约和账本保证算法如约执行。通过上述两种方式,打消科学数据开放共享的顾虑,全面提升科学数据研究价值与社会价值。
数据可信共享
基于ODC对科学数据进行可信共享是通过在区块链上存储科学数据元数据实现的,通过在ODC联盟链中开放共享元数据,原始数据存储在数据中心本地,实现科学数据的可信共享。
科学数据中心在成功注册科学数据标识后,数据集相关元数据信息同步注册到标识服务平台,通过数据标识可查询到具体元数据信息。数据中心将数据集标识和元数据等信息发布到区块链上,在正式写入账本前,智能合约将验证数据中心的身份及权限信息,验证通过后在区块链账本正式记录该信息。元数据信息正式写入账本后,数据中心可以通过输入数据集标识作为参数调用智能合约查询元数据信息,如果其他数据中心也注册了引用该数据集的论文标识,通过智能合约也可以查询到数据引用信息。