聯系我們contact

電(diàn)話(huà):027-59760188-801

地(dì)址:武漢市(shì)東(dōng)湖(hú)高(gāo÷‍♥)新開(kāi)發區(qū)光(guāng)谷大(dà↔")道(dào)120号現(xiàn)代森(sēn)林(lín)小(xiǎo)¥←鎮A座609室

分(fēn)析儀器(qì)原始數(shù)據格式的(de)通(tō  ₹ng)用(yòng)标準AnIML

發布時(shí)間(jiān):2018-03-1₹≈π✔8 浏覽次數(shù):1028次

所有(yǒu)實驗室面對(duì)一(yī)個(gè)<★共同問(wèn)題是(shì)實驗數(shù)據的(de)處理(lǐ)☆×↔ε和(hé)交換,這(zhè)裡(lǐ)尤其以分(fēn)析實驗室最為(wè ☆i)典型。我們走訪諸多(duō)分(fēn)析實驗室時(shí),大(‌¶™dà)家(jiā)談到(dào)最多(duδ§‍ō)的(de)就(jiù)是(shì)分(fēn)析儀器(qì)的(de)原'±‍∞始數(shù)據,包括其保存,處理(lǐ),₽±≠再分(fēn)析等問(wèn)題。大(dà)家(jiā)都(dōu)有(y€‍¥♣ǒu)一(yī)個(gè)烏托邦式的(de)夢想×$§',那(nà)就(jiù)是(shì)可(kě)以用(yφ ↓γòng)一(yī)種軟件(jiàn)打開(kāi)多(duō)個(gè)不←♣δ&(bù)同廠(chǎng)家(jiā),不≈¶®↑(bù)同類型的(de)分(fēn)析數(shù)據。夢想ε×✘δ歸夢想,現(xiàn)實仍然是(shì)現(xiàn)實。儀器(qì)供應商們λ© Ω提供儀器(qì)的(de)同時(shí)都(dōu)會(huì)采用ε↑β≤(yòng)自(zì)己的(de)專有(yǒu)格式的(≠↕≤de)數(shù)據,這(zhè)導緻了(le)數(shù)據處理(l♠>€ ǐ),協作(zuò),儀器(qì)集成和(hé)存檔遇到(d'λπào)很(hěn)多(duō)問(wèn)題。在處理(lǐ)這(zhè)些‌★(xiē)原始數(shù)據時(shí) ε除了(le)廠(chǎng)家(jiā)配套的(de)軟件(jiàn),很(±δ λhěn)少(shǎo)有(yǒu)可(kě)選的©♦β(de)餘地(dì)。

從(cóng)2003年(nián)開(kāi‌<∏♠)始, ASTM E13.15小(xiǎo)組委員(yuán)會(h↕‍↑uì)開(kāi)始籌劃開(kāi)發一(yī✘©)套分(fēn)析數(shù)據的(de)通(tōng)用σ≠£(yòng)标準,力求适用(yòng)于所有δγ€®(yǒu)分(fēn)析儀器(qì)技(jì)術(shù),并将其'γ命名為(wèi)AnIML。為(wèi)了(le)平衡各£<↓方利益,該小(xiǎo)組聚集了(le)來(​€lái)自(zì)儀器(qì)廠(chǎn←'↓g)商,最終用(yòng)戶,政府機(jī)α¥構和(hé)學術(shù)界的(de)人(rén)士,共同商討(t™​≈£ǎo)以确保格式完整,适用(yòng)性強。

AnIML并不(bù)是(shì)業(yè)界第一(yī∑↕)次嘗試将分(fēn)析數(shù)據标準化(huà)。之÷∞前已經設計(jì)過多(duō)種标準,如(rú)ANDI(也(yě)叫Net•π< CDF,适用(yòng)于GC,LC,MS),JCAMP-DX(IR,FTIR"≈₩,NMR,UV/Vis),SpectroML(分(fēn)子(zǐ)光(guā↑©←ng)譜數(shù)據)以及mzML(質譜¥∞‌),以及一(yī)些(xiē)儀器(qì)公司倡導的(de)标準♣♦,如(rú)Thermo 所提出的(de)GAML。雖©±說(shuō)這(zhè)些(xiē)數(shù)據格式在分(φ★>™fēn)析儀器(qì)行(xíng)業(yè)取得(de)了(le)較大×↔®↕(dà)的(de)支持力度,但(dàn)它們大(dàε®)都(dōu)隻針對(duì)特定的(de)分(fēnπ☆)析技(jì)術(shù),例如(rú)JCAMP-DX主要(yào)針對(d"★★uì)的(de)光(guāng)譜技(jì)術(sα σhù),而AnIML期望建立的(de)是(shì)一(yī)種适★&用(yòng)于所有(yǒu)分(fēn)析技(jì)術(∑'≠shù)的(de)數(shù)據格式。借助清晰完整的(de)→→擴展方式,即便将來(lái)出現(xiàn)了(le)新的(de)分Ω♣(fēn)析技(jì)術(shù),也(yě)不(bù)用(Ω←​yòng)改變現(xiàn)有(yǒu)的(de)軟件(÷♣jiàn),從(cóng)而簡化(huà)數(shù)據管理(lǐ)的(♦λλ©de)工(gōng)作(zuò)。由此,XML這(zhè)門(mén)>©λ強大(dà)而影(yǐng)響深遠(yuǎn)的(d™∞‌e)語言終于可(kě)以将其影(yǐng)響力擴展到(dào)分↑¥(fēn)析實驗室。

AnIML是(shì)基于W3C XML标準的(de>‌π€)技(jì)術(shù)。XML獨立于平台,易于創建,£←使用(yòng)和(hé)維護。這(zhè)降低(dī)了(le)使≥φ↑用(yòng)門(mén)檻,幾乎所有(yβ ✔♦ǒu)的(de)主流軟件(jiàn)開(kāi)發商都(dōu)支持'→XML,并且存在大(dà)量以XML格式為(wèi)基礎的(de)工(gōng$$)具。 由于XML是(shì)基于文(wén)本的(de)。因此∞®可(kě)以用(yòng)最簡單的(de)文(wén)本編輯器(qì)編輯An ♠≠IML文(wén)件(jiàn) – 而不(bù)需要(yào)特定的(de)₩₽↔≠軟件(jiàn)。盡管這(zhè)樣不(b>‍★ ù)一(yī)定方便,但(dàn)保留這(zhè)一(yī)特性是(shì)±≠&用(yòng)于長(cháng)期數(shù)據保存方案的(de♥↕Ω)關鍵:即使丢失了(le)之前的(de)軟★γ件(jiàn),我們仍舊(jiù)可(kě)以獲取我們需要±∏(yào)的(de)數(shù)據。

實現(xiàn)AnIML的(de)靈活性和(hé)通 δ(tōng)用(yòng)性的(de)方法并不(bù)複∏<↓雜(zá),AnIML數(shù)據标準☆♦₩©包含兩個(gè)部分(fēn),一(yī)個(gè)是(shì)通®↑♠(tōng)用(yòng)的(de)數(shù)據容器(qì),稱為(wè♥π®βi)AnIML核心(AnIML core),可(kě)☆♦✘以存儲任何科(kē)學數(shù)據。構成AnIML核★≤"心的(de)包括樣品數(shù)據集(SampleSet)、實驗步驟<&₽∏數(shù)據集(ExperimentStepSet)、審計(jì)跟蹤記φ♠'↑錄數(shù)據集(AuditTrailEntrySet)、簽名記錄集(♣"SignatureSet)。

 

在AnIML的(de)核心之上(shàng),是(shì)¶₽↑α“技(jì)術(shù)定義”(Techni®↓que Definition)部分(fēn)×'✔,所謂的(de)“技(jì)術(shù)α©↑≤定義”就(jiù)是(shì)說(shuō)明(m&♣•↑íng)針對(duì)某種分(fēn)析技(jì)術(shù)如(rΩ>σ∏ú)何去(qù)使用(yòng)數(shù)據容器(qì)。技(jì)術Ω★$(shù)定義(Technique Defin★¥ition)可(kě)以被看(kàn)作(zuò)是(shσ£ì)記錄某種分(fēn)析實驗所需要(yào)的(de)數εε® (shù)據字段的(de)目錄。技(jì)術(shù)定義文(wén)件(ji® àn)屬于常規的(de)XML文(wén)件(jiàn)中的(de)DT÷÷D文(wén)件(jiàn),可(kě)以₹ →随時(shí)重新創建。通(tōng)過 DTD,每→↔<™一(yī)個(gè) XML 文(wén)件(jiàn)均可(kλβ•ě)攜帶一(yī)個(gè)有(yǒu)關其自(zì)身(shēn)格式 ∏↕的(de)描述。雖說(shuō)AnIML是(shì)普适性的(d☆δπΩe),但(dàn)對(duì)于一(yī)些(xiē)具 &δφ體(tǐ)的(de)很(hěn)流行(xíng)的(de)分(fēn≥♣)析技(jì)術(shù),例如(rú)液相(x≤≠✔iàng)色譜,紫外(wài)光(guāng)譜,除↓÷β 了(le)實驗的(de)一(yī)些(xiē)公共特征,₩ ♣✘還(hái)是(shì)有(yǒu)其自(zì)身(shēn)獨有(y₽÷≈ǒu)的(de)一(yī)些(xiē)屬性的(de)。通(tōng)過 ÷✘×DTD,大(dà)家(jiā)可(kě)ππ≤一(yī)緻地(dì)使用(yòng)某個(g∏&è)标準的(de) DTD(HPLC,IR) 來(lái)交換數(σ€shù)據。而應用(yòng)程序也(yě)可(‍©kě)使用(yòng)某個(gè)标準的(de) DTD 來(láλπελi)驗證從(cóng)外(wài)部接收到(dào)的(de)數(shù)據Ω®≠β。同時(shí)還(hái)可(kě)以使用(yòng) DTD 來(&♥lái)驗證自(zì)身(shēn)的(de)數(shù)據。

作(zuò)為(wèi)一(yī)種通(tōng)用(yòng)型的↓★(de)數(shù)據表示方法,AnIML适合于包括光(guāngασ)譜,色譜,圖像,生(shēng)物(wù)分(λ♣fēn)析等各種數(shù)據的(de)表  示。除了(le)經常使用(yòng)的(de)分(fēn)析儀器(q≠®↓​ì)數(shù)據,AnIML也(yě)可(kě)用(yòngΩ↔'δ)于新興的(de)數(shù)據格式或一(yī)次性的(de)探索性實驗,∏©例如(rú)微(wēi)流體(tǐ)芯片或特殊的(de)傳感器(qì)。≤&→随著(zhe)技(jì)術(shù)的(de)δ©發展,新的(de)分(fēn)析技(jì)術(shù)和(hé)其相(xiàn≠¶♦g)應的(de)技(jì)術(shù)說(shuō)明(míng)都(‍≈"‌dōu)将取得(de)進步。這(zhè)種通(tōng)用( ×↔λyòng)性的(de)方法允許系統繼續使用¶♣♣<(yòng)這(zhè)些(xiē)早期的(de)AnIML文(wé©↑↕ n)件(jiàn),而無需對(duì)軟件(jiàn)進行(xεβ&íng)修改或升級。

 專有(yǒu)格式

 通(tōng)用(yòng)格式Ω★•÷/标準格式

 二進制(zhì)

 基于ASCII碼 (例如(r♥ "ú)XML)

 結構緊湊

 冗長(cháng)

 快(kuài)速讀(dú)/§>≈寫

 讀(dú)寫慢(màn)

 用(yòng)戶數(shù)據采集和(hé)處理(lǐ)

 主要(yào)用(yòng)于數©★(shù)據共享和(hé)長(cháng)期保存

如(rú)果我們有(yǒu)心好(hǎo)好(hǎo)看(kΩ∏β∞àn)看(kàn)AnIML的(de)技('♦jì)術(shù)文(wén)檔,你(nǐ)會(huì)發✔₽§現(xiàn)AnIML就(jiù)是(sh↑φεì)純粹的(de)XML技(jì)術(shù)。這(zh™✔← è)将大(dà)大(dà)降低(dī)我們利用(yò♣λng)這(zhè)一(yī)新技(jì)術(shù)的(de)難度。能(nén×↑εg)夠讀(dú)取和(hé)解析XML文(wén)檔的(de)軟件(j↑¥iàn)不(bù)勝枚舉。為(wèi)了(le)掃盲,我這(zhè)裡☆♣←↓(lǐ)再啰嗦幾句。XML是(shì)完全基于普通(tō£€εng)文(wén)本的(de)。即便存儲二進制(zhì)表示的(de §©)圖片,也(yě)會(huì)先将二進制(zhì)轉換為(wèi)字符♦♥≠ 串再放(fàng)入XML文(wén)檔中。我們可(kě)以用(yòng)‌<最簡單的(de)閱讀(dú)工(gōng)具 ↑——記事(shì)本查看(kàn)XML文(wén)檔ε‍。想想就(jiù)知(zhī)道(dào≈π)這(zhè)是(shì)多(duō)麽美(měi)好(hǎ¶←o)的(de)一(yī)件(jiàn)事(shì)情,數(shù)據長(chá•'£™ng)期存儲的(de)擔心可(kě)以落地(dì)了&'§(le),找不(bù)到(dào)原始工(gōng)作(zuò)站∏✔α↔(zhàn)軟件(jiàn)的(de)人(rén)也(yě)可‌₹γ(kě)以出口氣了(le)。當然,那(nà)些(xiē)認為(wèi)可(k☆‌ ™ě)以更方便修改數(shù)據的(de)人(rén)美(měi§επ✔)夢做(zuò)得(de)就(jiù)有(yǒu> ↔♦)點早了(le)。

1  應用(yòng)AnIML解決現(xiàn)實問($✔®wèn)題

想想,如(rú)果能(néng)将我們所有(yǒu)的(dπ§e)分(fēn)析數(shù)據都(dōu)轉變成同樣的(de)格式,許多(Ω  ♥duō)實驗室中的(de)共性問(wèn)題就(jiù)"☆都(dōu)能(néng)得(de)到(dào<☆£Ω)解決。

LIMS和(hé)ELN集成采用(yòng)AnIML數(shù)據格式可(kě)以使得(de)儀器(q÷α©ì)中的(de)數(shù)據更容易方便地(dì)傳輸到(dàoσ✔δ♣)其他(tā)的(de)一(yī)些(xiē)數(shù)據系統中,例 '♣↔如(rú)LIMS(實驗室信息管理(lǐ)系統)和(hé)ELN(電(diàn↑'→')子(zǐ)實驗記錄本系統)。大(dà)家(jiā)知(zhī)道←₹≈ (dào),不(bù)管是(shì)LIMS還(hái) §是(shì)ELN與儀器(qì)的(de)集成都(dōu)是(sh§₩ì)這(zhè)類項目實施的(de)一(yī)個(gè)難點€≈,既耗錢(qián)又(yòu)費(fèi)力,最終• 可(kě)能(néng)還(hái)不(bù)β‌討(tǎo)好(hǎo)。儀器(qì)種類一(yī)多(duō),因為(wè£♠i)每種儀器(qì)的(de)數(shù‌≠π)據格式都(dōu)不(bù)一(yī)樣,工(gōng)作(zuò)量就(j​₽∑iù)會(huì)成倍增加。有(yǒu)了(le)AnIγ↓§ML,就(jiù)不(bù)再需要(yào)為∑§φ↓(wèi)每種儀器(qì)做(zuò)獨立的±✘×∏(de)接口。通(tōng)過數(shù)據标準化(hu ¥™à),從(cóng)一(yī)個(gè)接口就(jiù)可(kě)以§$獲取所有(yǒu)儀器(qì)的(de)數(shù)據,既減少(sh←∞↓ǎo)了(le)接口的(de)數(shù)δγ量,也(yě)降低(dī)了(le)集成的(de)成本。

協作(zuò):在許多(duō)行(xíng)業(yè),企業(yè)經常需∑¥要(yào)與內(nèi)部或外(wài)部的(de≥‌)人(rén)員(yuán)進行(xíng)合作(zuò),特别是(shìΩ∏¥)在制(zhì)藥行(xíng)業(yè)中,外(wà← i)包業(yè)務的(de)發展更是(shì)如★±(rú)火(huǒ)如(rú)荼。由于雙方使用(yòng)的₽‍♣←(de)儀器(qì)和(hé)軟件(jiàn)>&α有(yǒu)差别,數(shù)據産生(shēng)方往'£'φ往需要(yào)将這(zhè)些(xiē)儀器(qì)産生(shēng)的(d ♦​αe)數(shù)據進行(xíng)處理(lǐ)後生(shēng)成各種電( •diàn)子(zǐ)表格或Pdf文(wén)件(jiàn)後,✔≤₽再傳遞給合作(zuò)方。傳遞的(de)數(shù)據主要(yà♦ o)是(shì)處理(lǐ)後的(de)結果₹∑數(shù)據,其中丢失很(hěn)多(duō)重要φ→¶ (yào)的(de)原始數(shù)據信息。采用(yòγ≤ng)AnIML标準後的(de)分(fēn)析儀器(q£αì)原始數(shù)據文(wén)件(jiàn)可(kě§≥)以更容易地(dì)交換數(shù)據。不(b₽↑©¶ù)同于傳統的(de)Excel電(diàn)子(zǐ)表δ★格和(hé)PDF報(bào)告,AnIM♠εL使我們能(néng)夠傳輸完整的(de)分(fēn)析數(sh✔​₽ù)據,合作(zuò)方可(kě)以看(k✔φΩσàn)到(dào)完整的(de)原始數(shù)據。這(zhè)既可(kě)‌"★以提高(gāo)數(shù)據質量,合作(zuò)方也(yě)可'←✘↓(kě)對(duì)這(zhè)些(xiē)↑↕§✘數(shù)據進行(xíng)再分(fēn)析,提高(g ∏∏āo)數(shù)據的(de)利用(yòng)率。

長(cháng)期數(shù)據保存,在受監管的(de)行(xíng)業(yè)裡(lǐ)(例如(rú)制(zhì•φ"π)藥行(xíng)業(yè)),分(fēn)析數(s∞σ§↑hù)據的(de)保存一(yī)直是(shì)Ω‌一(yī)個(gè)難以解決的(de)問(wèn)題€✔。原因主要(yào)在于數(shù)據所需要(yào)保存的(de)時(shí•→)間(jiān)較長(cháng),甚至達數(shù)十年(niánφ±¥↑)。數(shù)十年(nián)的(de)時(s☆↕©hí)間(jiān)對(duì)于IT技(★<πjì)術(shù)來(lái)講,可(kě)能(néng)會(∏✔≈>huì)發生(shēng)天翻地(dì)覆的(de)變化(huà)。同樣對(d∏ ★≤uì)于儀器(qì)配套的(de)軟件(jiàn)↓γ↔∞來(lái)說(shuō),其也(yě)會(♥✔huì)經曆無數(shù)個(gè)版本的(de)升級。更為←εβ≈(wèi)關鍵的(de)是(shì),即便解Ω₽"≥決軟件(jiàn)的(de)問(wèn)題,其讀(↑‌dú)取數(shù)據的(de)基礎環境也(♦¶φ§yě)會(huì)發生(shēng)變化(huà),例如(rú)該軟® >¥件(jiàn)所适合的(de)操作(zuò)系統。要(π★σαyào)在幾十年(nián)裡(lǐ)為(wèi​β€)某一(yī)類原始數(shù)據保存一(yī)個(gè)λ¥≠讀(dú)取的(de)環境似乎不(bù)太合乎實際,尤其是₽÷©£(shì)在儀器(qì)種類和(hé)數(shù)據種類™σ>比較多(duō)的(de)情況下(xià)。将這(zh✘↔è)些(xiē)數(shù)據轉換為(wèi)AnIML可(δ₽♥kě)能(néng)是(shì)一(yī)個(gè)好(hǎo)α∏的(de)解決辦法。此舉能(néng)大(dà)為(wèi)減少(shǎo)>₽¥≥所需要(yào)的(de)配套軟件(jiàn)工(gōng)具λ ,也(yě)不(bù)會(huì)受到(dào)λ∏​基礎環境的(de)制(zhì)約,很(h£ε&ěn)自(zì)然會(huì)減少(shǎo)一(yī)個(gè)×£>π信息系統的(de)運行(xíng)成本。

數(shù)據分(fēn)析和(hé)報(bào)告通(tōng)常情況下(xià),采集和(hé)處理($&σ≥lǐ)分(fēn)析數(shù)據僅僅是(s&'∏hì)第一(yī)步。我們看(kàn)到(dào←♥↓‍)各種數(shù)據驅動的(de)工(gōng)作(zuò)流應用(≈₽≈ yòng)在不(bù)斷增加。這(zhè)些(xiē)☆'≥↔數(shù)據流方法在數(shù)據源頭上(shàng∞λ↔)在不(bù)斷下(xià)探,逐步深入到(dào)原始☆₹♣數(shù)據,并進一(yī)步對(du↔÷ì)這(zhè)些(xiē)數(shù)據集應用(λ↕yòng)可(kě)視(shì)化(huà),實驗βε'設計(jì),多(duō)變量分(fēn)析♣✔等統計(jì)學工(gōng)具進行(xíng)數(shù)據分$★÷∏(fēn)析。通(tōng)過AnIML歸一(yī)化(huà)的≥>±(de)原始數(shù)據将會(huì)使得(de)→γ為(wèi)這(zhè)些(xiē)流程提供數(shù)據變得(de)更加簡φ¥γ>單。

但(dàn)這(zhè)世界上(shàng)沒 π"♣有(yǒu)免費(fèi)的(de)午餐,我們需要(yào)有±≠β(yǒu)能(néng)夠将原來(lái)儀器(qì)格式的♥""∏(de)數(shù)據轉換為(wèi)AnIML格式的(de)σδ工(gōng)具,還(hái)得(de)有(y£©Ωǒu)能(néng)夠查看(kàn)AnIML格式數(shù)據的(de)工($‍♣ gōng)具。

為(wèi)了(le)建立AnIML,大(dà)家(jiā)花(₽↔↔≤huā)了(le)很(hěn)長(cháng)的(de)時(shí)'→間(jiān),這(zhè)裡(lǐ)面不(bù)單是(shì)技(jì)術↓✔δ(shù)性的(de)問(wèn)題,還(hái)與一(yī)些(xiē λβ )非技(jì)術(shù)性的(de)因素。分(∞✔fēn)析實驗室雖小(xiǎo),利益相(xiàng)關者卻衆多(d♥βuō)。到(dào)目前為(wèi)止,An≥≠IML的(de)技(jì)術(shù)性的(de)工(gōng)作 ↑(zuò)早已完成,大(dà)家(jiā)可(kě)以"‌λ↔放(fàng)心使用(yòng)。經過ASTM表決之後,Anε±♥IML将成為(wèi)一(yī)個(gè)開(k←<āi)放(fàng)的(de)公共的(de)标→±γ準。與此同時(shí),真正施行(xíng)這(zhè)個(gè)标準所需♣‌δ$要(yào)的(de)工(gōng)具的(de)開(kāi)發早已走在了(l₩®♣e)前面。對(duì)于終端用(yòng)戶來(lái)說(shuō) $€,桌面版的(de)AnIML數(shù)據查看(kàn)工(gōng±∞≠)具,Web和(hé)移動平台,集成工(gō‍ ng)具,數(shù)據轉換器(qì)都(dōu)已經有(yǒu)現∞™£♦(xiàn)成的(de)了(le)。對(d÷ε←♣uì)于供應商來(lái)說(shuō),在他(tā)們現(xiàn)÷γ'有(yǒu)的(de)儀器(qì)軟件(≠ ↕jiàn)中嵌入AnIML功能(néng)也(yě)并非難事(shì)。↕×