数据完整性和公平原则-常见问题

经过|06.07.2021|实验室数字化

阅读时间:5.分钟

在Bi金宝搏平台oSistemika,我们遇到了许多关于数据完整性的问题,以及在实验室或组织中实施FAIR原则时什么是重要的。我们收集了一份常见问题列表,并在这篇博文中与您分享答案。

什么是数据完整性?

数据完整性是用于描述整个生命周期内的数据质量的术语。这意味着数据有效,完整,真实的和一致,并且不应在源和目标之间更改。为了满足这些要求,您需要具有适当的质量和风险管理系统,以确保数据的安全性和可靠性。

为什么数据完整性重要?

数据完整性至关重要,因为它确保了科学数据的透明度和可信度。正如国家科学院解释的那样,有必要确保在研究数据中的公众信任,这在当前时代非常重要。这对于确保科学知识和创新可以提高至关重要。

什么是常见的数据完整性问题?

大多数数据完整性问题与手动任务(如数据创建的名称和时间)有关,用于对数据进行数据的仪器以及其他媒体或计算机的其他数据路径。

研究表明,在每年可用的科学数据的可能性明显减少。虽然我们可以在出版后2年内获得近100%的数据,但只有33%的数据可以从10年前的研究中获得(图1)。在大多数情况下,由于丢失或无法访问的存储介质,数据不可用。

如何提高数据完整性?

我们每个人都有许多领域可以找到改善生成数据完整性的机会。在大多数情况下,减少数据质量的步骤和任务与手动工作有关,这比自动工作流程更容易出错。

实验室流程的数字化可以是有效的贡献科学环境和公众眼中的数据完整性和可信度。您今天可以采取的第一步是开始映射您的进程和数据流。在许多情况下,您将得出结论,至少一些过程可以全自动。实验室自动化也将使您更接近实现数据完整性,主要是因为它将消除手动完成任务所产生的错误。您可以在我们的中阅读更多相关信息博客

什么是公平数据原则?

开发了公平的数据原则以提高数据完整性。公平原则应作为生产和发布数据的任何人的任何人的指南。这些原则的使用也应扩展到实验室中的算法,工具和工作流程,该算法产生数据,以及数据所在的数字环境。

文章的照片

为什么我会使用公平的数据原则?

让你的数据公平合理有几个原因:

结果验证

如果您与使用的所有工具和软件一起发布结果,您曾经进行过科学数据,则您的研究将更容易重现和验证。这将提高数据的完整性,即使在一段时间过去,您也能够回到此过程。

预算节省

长期以来,当您的数据值得信赖时,您将避免与重复分析相关的不必要成本。当您的研究公开资助时,这尤其重要,并且您需要一个专门的(部分)项目进行实验。

加速科学发现

持续重新使用的可靠数据的能力可以提高我们面临的面临和解决不同的全球挑战的能力。

公平数据原则的含义

公平数据原则是在思考实验室中提高数据完整性时的高级指导。要将这些原则实施到日常实验室例程中,我们分享了一个概述,这将进一步详细阐述可接受的可互操作性 - 可重复使用的原则的意义。

可发现的

可查找的意思是人或电脑都能找到你的数据。这适用于数据和元数据,元数据本质上描述了其他数据。

F1。(元)数据被分配了全局唯一和持久的标识符

F2。数据描述了丰富的元数据(由下面的R1定义)

F3。元数据清晰明确地包括所描述的数据的标识符

F4。(元)数据在可搜索资源中注册或索引

可访问的

可访问的数据并不意味着您的数据必须为每个人访问,而是需要足够的身份验证来访问它。

A1。(元)数据可由使用标准化通信协议的标识符检索

A1.1。该协议是开放的、免费的,并且普遍可实现

A1.2。必要时,协议允许认证和授权过程

A2。即使数据不再可用,也可以访问元数据

互操作

数据的互操作性意味着人员和机器都可以识别和使用某些数据。可识别文件格式的标准化和使用对于实现这一目标是必不可少的。

I1。元数据使用一种正式的、可访问的、共享的和广泛适用的语言来表示知识。

I2。(元)数据使用遵循FAIR原则的词汇表

I3。(META)数据包括对其他(META)数据的合格引用

可重复使用的

可重复使用的数据是其他科学家可以轻松理解和重建实验的数据。

R1。Meta(数据)被大量精确和相关的属性描述

R1.1。(META)数据发布了清晰可访问的数据使用许可证

R1.2。(META)数据与详细的出处相关联

R1.3。(META)数据符合域相关的社区标准

如何在您的实验室中实现公平数据

在许多不同位置的保存数据在实验室中仍然很常见。但是,通过纸质文档搜索并不容易检索文件夹和文件,而没有适当的元数据可以是噩梦。

为了避免这种情况,我们建议使用专用的(实验室)软件,它可以支持上述FAIR原则。然而,重要的是要记住,没有一个单一的解决方案可以确保数据完整性。更有可能的情况是,为了实现数据完整性,您将需要一个集成的应用程序生态系统和不同涉众(It部门、QA部门、研发部门、仪器供应商等)的协作。

回家的消息

  • 数据完整性很重要,因为它确保了科学数据的透明度和可信度。
  • 大多数数据完整性问题与可以自动化的手动任务有关。
  • 在讨论数据完整性的高级方法时使用公平(可接受 - 可访问 - 可互操作性的可重用)数据原理。
  • 您可以通过实验室流程和工作流程的数字化和自动化来提高数据的完整性。

您是否正在经历您的数字化旅程并面临挑战?

欢迎与我们的实验室数字化咨询专家预订会议。


Baidu