Skip to content

开放数据联盟链数据溯源

科学数据亟需新的溯源模式

在大数据背景下,科学数据成为重要的数字资产,这些科学数据可以分为两类:一类是原始数据,另一类是对原始数据进行加工后生成的数据。在科学研究过程中,需要对数据进行一系列处理,由于中间过程缺少必要的透明度,很难判断其来源和可靠性。科学数据溯源涉及生成一段数据或事物的实体、活动以及人的信息,可用于评估数据或事物的质量、可靠性或可信度。传统的数据溯源系统一般采用中心化方式存储数据,在遭受内部、外部攻击时,存在单点故障等风险问题,威胁数据安全性。

区块链技术保障数据可信溯源

科学数据在开放共享的大趋势下,在学术、科学及教育等整个生命周期内对科学数据进行数据溯源,通过重现及组织数据以供当前科研活动获取,进而用于未来再发现及再利用。科学数据溯源目的是为了实现数据的追溯,确保单个溯源记录的真实性及记录顺序不可被修改。而区块链具备数据的防篡改、可追溯特性,两者的结合对于科学数据溯源具有重要作用。科学数据标识技术将为科学数据提供互联网环境下访问的便利途径,确保数据溯源信息互联互通,实现对数据全生命周期的跟踪与溯源。

将合约执行的关键点通过账本进行存证。包括合约的调用者、调用时间、运行节点情况、合约输入、合约关键点、合约返回值等。通过监控数据流转的全生命周期,保障科学数据可信流通可溯源,支持数据共享开放过程可信、可管、可控。

数据溯源

科学数据溯源是通过记录数据流转的信息来实现数据溯源,但是记录信息本身也是数据,同样存在安全问题。为了防止有人恶意篡改数据溯源记录的相关信息,实现对溯源记录信息的分布式可信存证,利用区块链技术有效地防止恶意篡改联盟链中的溯源记录,对科学数据在生命周期内修改行为的记录,按时间先后组成溯源链,通过溯源链记录数据上链、更新等数据全生命周期信息。

1cde6d7d829348a6357e85922128fb67.png

科学数据溯源链可以支持研究人员有效地验证数据集的真实性,查看历史数据并验证所有权信息,跟踪来源并安全存储有关科学数据的元数据和验证信息,以可验证的方式跟踪数据更改,以可独立验证的方式促进数据重用,从而推动科学数据开放共享的可持续发展。

科学数据上链流程

  1. 科学数据上链准备工作,确定上链元数据格式及类型,如数据集包括实体文件推荐上链文件签名信息
  2. 注册数据标识,推荐使用科技资源标识 CSTR ,标识注册地址:科技资源标识服务平台 https://www.cstr.cn/
  3. 调用编写的智能合约上链数据,可通过调用 OpenAPI 接口或使用客户端等服务工具

版权所有@2019-2022 中国科学院计算机网络信息中心 京ICP备 09112257号-115