近年来,高通量、高含量的分析已经成为数字化实验室分析方法的趋势,这必然导致数据的生成比以前多几倍甚至几十倍。但是要知道,大量的数据并不是所谓的大数据。几乎每个行业都会产生大量的数据,随着时间的推移,数据会迅速增加。

什么是大数据

大量的数据本身并不是大数据:只有当这些数据能够以一定的格式保存,并且能够得到有效的查询和综合分析,从而获得一些新的相互关系,并从中获取更多有用的信息,这样的“大量数据”才能被称为大数据。

人们容易理解的大数据,实际上是通过实验获得的,就像一堆杂乱的过程和结果数据。过去,虽然进行了测试,但这些所谓的源数据并不能得到有效的利用。此时,一个非常简单的大数据应用程序可以为您节省时间、金钱和资源。

成熟的高通量和高内容分析方法将被集成到互联网技术中使用。此外,与研究机构、制药商和小型实验室的合作日益增加,大大增加了数据量。不断增长的数据量不仅对实验室的信息技术系统提出了挑战,也为数据处理和分析以及相关的增值过程提供了更多新的可能性,可以概括为大数据的概念。

要将积累的大量数据转化为大数据,还有很多工作要做。很多实验室数据和信息存储在本地数据库中,更多的记录在纸质报告和记录中,分散在文件夹中,无法用于大数据分析。

数字实验室面临的挑战

多年来,实验室数据的数字化一直是实验室日常工作的严峻挑战。目前,有许多不同类型的电子实验室记录和实验室信息管理系统,但并非所有实验室都使用统一的系统来管理数字文件。平板电脑、智能手机等一些移动输入设备的不同发展趋势,有利于数字系统的应用和普及。许多数字实验室要求使用完全不同数据格式的数据。有Word、Excel、PDF、图像格式等一些通用的数据格式,但也经常使用一些特殊的数据格式。

为了更广泛地使用这些数据,需要根据数据生成的过程来管理组织数据。例如,光谱的光谱图数据可以用作数字检测报告。事实上,图像数据可以与其他格式的数据进行比较,而不是并排比较所有的地图,只有可比较的谱图文件可以相互比较。这个例子告诉我们,要使用大数据,首先要解决小数据的问题,但大多数实验室都存在小数据太多难以关联的问题。

在使用大数据的过程中,首先要制定标准,可以很容易的对实验过程中的数据进行总结、整理、对比。但到目前为止,跨学科的实验室流程还没有统一的数据格式。

大数据在实验室中的应用

大数据的应用条件是将实验室的所有数据保存在统一的数字平台上。这个平台允许对所有数据进行分类,并且有一个统一结构化的数据采集流程,这样就可以在流程层面对数据进行比较。为了应对日益增长的数据量,从长远发展的角度来看,需要将用于分析和生产的仪器设备与it系统直接连接起来,以确保随时对数据进行持续跟踪。根据这些数据,我们可以看到许多隐藏的影响因素。仔细分析这些影响因素后,我们可以找出它们对过程的影响并进行调整。

数据设备连接标准的建立

许多成功的案例可以实现实验室仪器和设备之间的连接,例如,与LIMS数字测试记录和实验室管理系统的连接,但这种连接往往复杂而昂贵。未来可能实现实验室仪器设备的即插即用连接。将数字测试记录集成到与实验室自动化标准SiLA兼容的过程管理系统中,可以大大简化大量实验室仪器设备的日常连接,就像Flawn的Hof研究所协会和Labfolder公司联合开发的方案一样。

接下来需要的方案是制定一个统一的连接协议标准,只有有了这个标准,才能在仪器设备上检测到的数据和填写的数字测试记录之间建立关联。这个标准的目的应该是建立一个基础平台,能够以最大的自由度看到基础平台中存储的数据。当过去的数据被自动应用到新的流程优化中时,使用一个集成的、灵活的实验室就变得容易了,可以说真正实现了大数据的应用。

仪器和信息技术系统之间的联网

测试设备和测试仪器被视为实验室数据采集设备,可以记录和生成大量数据。这些数据通常存储在联网的计算机中。如果没有网络接口,它们可以存储在网络驱动器中。除了分布式设备配置带来的限制数据传输畅通的缺点外,即使使用u盘,也很难在不同工作组之间自动建立仪器结果数据与实验室报告文档数据的对应关系。

为了填补实验室仪器与IT系统空的空白,仪器设备制造商、数字化实验室用品制造商、科研机构、制药企业建立了名为“‘SiLA Rapid Integration’”的国际组织,制定了统一的实验室仪器设备控制标准。本标准的目的是不同厂家生产的设备有一个统一的接口,称为PMS过程管理系统接口。该项目管理系统过程管理系统可以通过网络服务器或通过互联网的安全连接登录和访问。

这样,同一个实验室的同事可以通过不同计算机上的安全访问登录到这个网络,登录的计算机可以是同一栋楼的不同计算机,也可以是另一个区域的任何计算机。登录后,他们可以随意访问任何仪器设备,输入工艺参数,同时接收设备数据。在自动控制环境下,整个检测过程或文件录入过程也可以远程控制或监控。

在SiLA实验室的自动化标准中,有不同的方式来集成各种仪器设备。比如通过与SiLA Lab Automation兼容的驱动,可以将不符合标准的设备通讯纳入网络服务器的管理。SiLA接口转换器可以为仪器操作提供一个兼容的平台,并通过网络服务器与过程管理系统建立通信。在第三层方案中,SILA兼容仪器设备通过其网络服务器将第三方与过程管理系统连接起来。IT有助于各种设备的兼容,可以将实验室安装的仪器设备与实验室的IT网络系统连接起来。

1.《数字化实验室 什么是大数据?什么是数字化实验室?你了解多少?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《数字化实验室 什么是大数据?什么是数字化实验室?你了解多少?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/1779497.html