数据完整性和公平原则-常见问题

通过|06.07.2021|实验室数字化

阅读时间:5分钟

在Bi金宝搏平台oSistemika,我们遇到了许多关于数据完整性的问题,以及在实验室或组织中实施FAIR原则时什么是重要的。我们收集了一份常见问题列表,并在这篇博文中与您分享答案。

什么是数据完整性?

数据完整性是一个术语,用于描述整个生命周期中的数据质量。这意味着数据是有效的、完整的、可信的和一致的,并且不应该在源和目标之间更改数据。为了满足这些要求,您需要有适当的质量和风险管理系统,以确保数据的安全性和可靠性。

为什么数据完整性很重要?

数据完整性至关重要,因为它确保了科学数据的透明度和可信性。就像国家科学院解释的那样,有必要确保国民对研究资料的信任,这在当今时代非常重要。这对确保科学知识和创新的发展至关重要。

常见的数据完整性问题是什么?

大多数数据完整性问题都与手工任务有关,比如数据创建的名称和时间、用于处理数据的工具以及其他数据到其他媒体或计算机的路径。

研究显示科学数据可获得的可能性每年都在显著下降。虽然在发表2年后,我们几乎可以访问到100%的数据,但10年前的研究中只有33%的数据可用(图1)。在大多数情况下,由于存储介质丢失或不可访问,数据无法使用。

如何提高数据完整性?

在许多领域,我们每个人都可以找到改进生成数据完整性的机会。在大多数情况下,降低数据质量的步骤和任务与手工工作有关,这比自动化工作流更容易出现错误。

在科学环境和公众眼中,实验室过程的数字化可以是促进数据完整性和可信度的有效方法。您现在可以采取的第一步是开始映射流程和数据流。在许多情况下,您会得出结论,至少有一些流程可以完全自动化。实验室自动化还将使您更接近实现数据完整性,主要是因为它将消除由手工完成的任务产生的错误。你可以在我们的博客

什么是公平数据原则?

制定公平数据原则是为了提高数据完整性。公平原则应该作为科学领域任何正在生产和发布数据的人的指南。这些原则的使用也应该扩展到生成数据的实验室的算法、工具和工作流程,以及数据所在的数字环境。

文章的照片

我为什么要使用FAIR数据原则?

让你的数据公平合理有几个原因:

结果验证

如果你把你的研究结果和你用于管理科学数据的所有工具和软件一起发表,你的研究将更容易复制和验证。这将提高你的数据的完整性,你将能够回到这个程序,即使过了一段时间。

预算节省

当您的数据从长期来看是可信的时,您将避免与重复分析相关的不必要成本。当你的研究是由政府资助的,并且你需要一个专门的(部分的)实验项目时,这一点尤其重要。

加速科学发现

不断重复使用可靠数据的能力可以提高我们面对和解决我们面临的不同全球挑战的能力。

公平数据原则的含义

FAIR数据原则是在考虑提高实验室数据完整性时要遵循的高层次指导。为了将这些原则应用到您的日常实验室程序中,我们将分享一个概述,进一步阐述“可查找—可访问—可互操作—可重用”原则背后的含义。

可发现的

可查找的意思是人或电脑都能找到你的数据。这适用于数据和元数据,元数据本质上描述了其他数据。

F1。(元)数据被分配一个全局唯一和持久的标识符

F2。数据是用丰富的元数据描述的(由下面的R1定义)

F3。元数据清楚且显式地包括它所描述的数据的标识符

F4。元数据在可搜索资源中注册或建立索引

可访问的

可访问的数据并不意味着您的数据必须开放给所有人访问,而是需要充分的身份验证才能访问它。

A1。(元)数据可由使用标准化通信协议的标识符检索

A1.1。该协议是开放的、免费的,并且普遍可实现

A1.2。该协议允许在必要时进行身份验证和授权过程

A2。元数据是可访问的,即使数据不再可用

可互操作的

数据互操作性是指人与机器都能识别和使用某些数据。标准化和可识别文件格式的使用是实现这一目标的必要条件。

I1。元数据使用一种正式的、可访问的、共享的和广泛适用的语言来表示知识。

I2。(元)数据使用遵循FAIR原则的词汇表

I3。(元)数据包括对其他(元)数据的有条件的引用

可重用的

可重复使用的数据是其他科学家可以很容易地用来理解和重现实验的数据。

R1。Meta(数据)被大量精确和相关的属性描述

R1.1。(元)数据发布与清晰和可访问的数据使用许可证

R1.2。(元)数据与详细的来源相关联

R1.3。(元)数据满足领域相关的社区标准

如何在您的实验室中实现公平数据

在许多不同的地方保存数据在实验室中仍然很常见。然而,在纸质文档中进行搜索并不容易,在没有适当元数据的情况下检索文件夹和文件可能是一场噩梦。

为了避免这种情况,我们建议使用专用的(实验室)软件,它可以支持上述FAIR原则。然而,重要的是要记住,没有一个单一的解决方案可以确保数据完整性。更有可能的情况是,为了实现数据完整性,您将需要一个集成的应用程序生态系统和不同涉众(It部门、QA部门、研发部门、仪器供应商等)的协作。

回家的消息

  • 数据完整性很重要,因为它确保了科学数据的透明度和可信性。
  • 大多数数据完整性问题都与可以自动化的手工任务有关。
  • 在讨论数据完整性的高级方法时使用FAIR(可查找-可访问-可互操作-可重用)数据原则。
  • 您可以通过实验室流程和工作流程的数字化和自动化来提高数据的完整性。

您是否正在经历数字化的旅程,并面临着挑战?

欢迎与我们实验室数字化咨询专家预约会议。


Baidu