聯系我們contact

電(diàn)話(huà):027-59760188-801

地(dì)址:武漢市(shì)東(dōng)湖(hú≠"§)高(gāo)新開(kāi)發區(qū)光(guāng)谷大(dà)道(d×£πào)120号現(xiàn)代森(sēn)林(lín)小(xiβ<ǎo)鎮A座609室

分(fēn)析儀器(qì)原始數(shù)據格式的(de)通(tōn‌ g)用(yòng)标準AnIML

發布時(shí)間(jiān):2018-03-18 浏覽次數(shù):1029次

所有(yǒu)實驗室面對(duì)一(yī)個(gè)共同問(wèn)題≈"£是(shì)實驗數(shù)據的(de)處理(lγ$₽↕ǐ)和(hé)交換,這(zhè)裡(lǐ)尤其以分(fēn)析實驗™ε室最為(wèi)典型。我們走訪諸多(duō)分(β¶≈fēn)析實驗室時(shí),大(dà)家(jiā)談到(dào≈&♣)最多(duō)的(de)就(jiù)是(sh€ ì)分(fēn)析儀器(qì)的(de)原始數↕&©↑(shù)據,包括其保存,處理(lǐ),再分(fēn)析等問(wèn)≤♣題。大(dà)家(jiā)都(dōu)有(yǒu)一(yī↔δ)個(gè)烏托邦式的(de)夢想,那(nà)就(jiù)是(s♣ε∞hì)可(kě)以用(yòng)一(yī)種軟件(jiàn)打開(kāi)多σ≈(duō)個(gè)不(bù)同廠(chǎng)家→₩®(jiā),不(bù)同類型的(de)分(fēn)析數(s ♥hù)據。夢想歸夢想,現(xiàn)實仍然是(shì)現(xi™∏♦àn)實。儀器(qì)供應商們提供儀器(qì)的(de)同時(sh≈<í)都(dōu)會(huì)采用(yòng)自(zì)己的(de)專有(yǒε↕£♥u)格式的(de)數(shù)據,這(zhè)導緻了(le)數(s∏♦₩βhù)據處理(lǐ),協作(zuò),儀器(qì)集成£€和(hé)存檔遇到(dào)很(hěn)多(duō)問÷ ↑(wèn)題。在處理(lǐ)這(zhè)些(xiē)原始數(shù)據δ≠∏時(shí)除了(le)廠(chǎng)家(j"±‌iā)配套的(de)軟件(jiàn),很(hěn)少(shǎ☆©o)有(yǒu)可(kě)選的(de)餘地(dì)。

從(cóng)2003年(nián)開(kāi)始, ASTM E1♦↓β3.15小(xiǎo)組委員(yuán)會(huì©λ •)開(kāi)始籌劃開(kāi)發一(yī)套分(​∏♦δfēn)析數(shù)據的(de)通(tōng)用§∑&(yòng)标準,力求适用(yòng)于所有(λ>π¶yǒu)分(fēn)析儀器(qì)技(jì)術(shù),并将其命↔÷®≤名為(wèi)AnIML。為(wèi)了(le)平衡各方利益,↔σ≤£該小(xiǎo)組聚集了(le)來(lái)自(zì)儀器(qì)廠(ch♥ ǎng)商,最終用(yòng)戶,政府機(jī)構和(hφπφ‌é)學術(shù)界的(de)人(rén)士,共同商討(tǎo)以确保≥♣‍β格式完整,适用(yòng)性強。

AnIML并不(bù)是(shì)業(yè)界第↔÷γ₩一(yī)次嘗試将分(fēn)析數(shù)據标準化(huà)。之前已經設計β  (jì)過多(duō)種标準,如(rú)ANDI(也(yě)叫Ne€♠γ<tCDF,适用(yòng)于GC,LC,MS),J>♣CAMP-DX(IR,FTIR,NMR,UV/Vis) &€₩,SpectroML(分(fēn)子(zǐ♠§ ✔)光(guāng)譜數(shù)據)以及mzML(質譜♣φ★),以及一(yī)些(xiē)儀器(qì)公>↔α↕司倡導的(de)标準,如(rú)Thermo 所提出的(de)<♥GAML。雖說(shuō)這(zhè)些(xiē)數(shù)據格式在分≈↕(fēn)析儀器(qì)行(xíng)業×✔♠÷(yè)取得(de)了(le)較大(dà)的(de)支持力&σα度,但(dàn)它們大(dà)都(dōu)隻針對(duì)特定的(de&λ)分(fēn)析技(jì)術(shù),例如(rú)JC♥✘™®AMP-DX主要(yào)針對(duì)的(de)光‌↓ ←(guāng)譜技(jì)術(shù),而AnIML期望建立的(de)是(₽ shì)一(yī)種适用(yòng)于所有(yǒu)分(fēn)析技(×  jì)術(shù)的(de)數(shù)據格式。借助清晰完整的(de)擴展方<₹±式,即便将來(lái)出現(xiàn)了(le)新的(de)分(fē ♣★↑n)析技(jì)術(shù),也(yě)不(bù)用(yòng←®✔)改變現(xiàn)有(yǒu)的(de)軟件∏↕↕(jiàn),從(cóng)而簡化(huà)數βΩ(shù)據管理(lǐ)的(de)工(gōng)作(zuò)。∏∑由此,XML這(zhè)門(mén)強大(dà)而影(yǐng)響深遠(yu∏ε←ǎn)的(de)語言終于可(kě)以将其影(yǐng)響力擴♠≤展到(dào)分(fēn)析實驗室。

AnIML是(shì)基于W3C XML标準的(de)ε€γ技(jì)術(shù)。XML獨立于平台,易于創建,使用(yò≤↕ng)和(hé)維護。這(zhè)降低(dī)了(l→>✔e)使用(yòng)門(mén)檻,幾乎所有(yǒu)的(dδ¥$e)主流軟件(jiàn)開(kāi)發商都(dōu)支持XM→$↓>L,并且存在大(dà)量以XML格式為(wèi)基礎的(de)σγ工(gōng)具。 由于XML是(shì)基☆↔α 于文(wén)本的(de)。因此可(kě)以用(yφ≠®φòng)最簡單的(de)文(wén)本編輯‍ ‌器(qì)編輯AnIML文(wén)件(jiàn)  ©δ♣– 而不(bù)需要(yào)特定的(de)軟件(jiàn)。盡φε®®管這(zhè)樣不(bù)一(yī)定方便,但(d∞ àn)保留這(zhè)一(yī)特性是(shì)用(yòng)于長(c≤×♠háng)期數(shù)據保存方案的(de)關鍵:即‍∏☆✔使丢失了(le)之前的(de)軟件(jiàn)ε >÷,我們仍舊(jiù)可(kě)以獲取我們需要(yào)的(de)數(€∏shù)據。

實現(xiàn)AnIML的(de)靈活性和(hé)‌↕Ω±通(tōng)用(yòng)性的(de)方法并≥‌∑↓不(bù)複雜(zá),AnIML數(shù)據标δγ£♥準包含兩個(gè)部分(fēn),一(y≤φ'×ī)個(gè)是(shì)通(tōng)用(yòng∑")的(de)數(shù)據容器(qì),稱為(wèi)AnIML核♣ →心(AnIML core),可(kě)以存儲↔¶任何科(kē)學數(shù)據。構成AnIML核心​™ε的(de)包括樣品數(shù)據集(SampleSet↑<÷)、實驗步驟數(shù)據集(ExperimentStβ₹epSet)、審計(jì)跟蹤記錄數(shù)據集→™(AuditTrailEntrySet)、簽名記錄集(SigΩ£εΩnatureSet)。

 

在AnIML的(de)核心之上(shàng),是(shì)“技(jì)術(sh¥>¶ù)定義”(Technique Definition)部分(f∏®ēn),所謂的(de)“技(jì)術(shù)定義”就(jiφγ×≈ù)是(shì)說(shuō)明(míng)針對(duì)某種分(fēn→ )析技(jì)術(shù)如(rú)何去(qù)使用(yòng)數(s•α★♦hù)據容器(qì)。技(jì)術(sh★$✘αù)定義(Technique Definition)可(→₩kě)以被看(kàn)作(zuò)是(shì)記♦$錄某種分(fēn)析實驗所需要(yào)的(de)數(shù)據字段的§​(de)目錄。技(jì)術(shù)定義文(wén)件(jiàn)屬于ε₹'常規的(de)XML文(wén)件(jiàn)中的"¶(de)DTD文(wén)件(jiàn),可(kě)以随時(shí π)重新創建。通(tōng)過 DTD,每一(yī)個(gè) X>¶ΩML 文(wén)件(jiàn)均可(kě)攜 π帶一(yī)個(gè)有(yǒu)關其自(zì)身(s™>​≥hēn)格式的(de)描述。雖說(shuō)AnIM₽∏L是(shì)普适性的(de),但(dàn)對(duì)于一(yī)些♠£ →(xiē)具體(tǐ)的(de)很(hěn)流行(xíng)的(d‍σ≥e)分(fēn)析技(jì)術(shù),例如(rú)液相(xiàng₹←←Ω)色譜,紫外(wài)光(guāng)譜,除了(le)實驗的(de)一(yī☆<)些(xiē)公共特征,還(hái)是(shì)有(yǒu)其自(zì)身♣ (shēn)獨有(yǒu)的(de)一(yī)些(xiē)屬性的(de)。通(<&tōng)過 DTD,大(dà)家(jiā)可(kě)一(yΩ γ±ī)緻地(dì)使用(yòng)某個(gè)标準的(de) DTD(HPL'π≥ C,IR) 來(lái)交換數(shù)據。而應用(yòng₩​)程序也(yě)可(kě)使用(yòng)某個(gè)标準的(γ×de) DTD 來(lái)驗證從(cóng)外(wài)部接收到£§≠∞(dào)的(de)數(shù)據。同時(shí)還(hái)可(kě)以使♦•‍£用(yòng) DTD 來(lái)驗證自(zì)身(shēn)ε'↔的(de)數(shù)據。

作(zuò)為(wèi)一(yī)種通(tōng)用(yòng)型的(de)數α✘λ§(shù)據表示方法,AnIML适合于包括光(guāng)譜,色≠Ω↔↕譜,圖像,生(shēng)物(wù)分(fēn)析等各種數(s≤∑€φhù)據的(de)表示。除了(le)經常使用(yòngγ•≈>)的(de)分(fēn)析儀器(qì)數(shù)據,AnIML也(≥•∞✘yě)可(kě)用(yòng)于新興的(de)數∏'(shù)據格式或一(yī)次性的(de)探δε✘ 索性實驗,例如(rú)微(wēi)流體(tǐ)芯片或特殊的('' ‌de)傳感器(qì)。随著(zhe)技(jì)術(shù)的(φ'$de)發展,新的(de)分(fēn)析技(jì)術(shù)和(hé)其相(♣λλ×xiàng)應的(de)技(jì)術(shù)說(shuō)明(m✘←íng)都(dōu)将取得(de)進步。這(zhè)種通←→(tōng)用(yòng)性的(de)方法允許系統繼≤α續使用(yòng)這(zhè)些(xiē)早期的(de)AnIML文∑♠¶•(wén)件(jiàn),而無需對(duì)軟件(jiàn)進行(xíng)修₽φ改或升級。

 專有(yǒu)格式

 通(tōng)用(yòng)格≠∑式/标準格式

 二進制(zhì)

 基于ASCII碼 (例如(rú)XML)

 結構緊湊

 冗長(cháng)

 快(kuài)速讀(dú)/寫

 讀(dú)寫慢(màn)

 用(yòng)戶數(shù)據采集和(hé)處理(→'lǐ)

 主要(yào)用(yòng)于數(shù)據共Ω "享和(hé)長(cháng)期保存

如(rú)果我們有(yǒu)心好(hǎo)好δ♦(hǎo)看(kàn)看(kàn)AnIML的(de)技(jπ↔<σì)術(shù)文(wén)檔,你(nǐ)會(huì)發現(xiàn)≤™↕AnIML就(jiù)是(shì)純粹的α≠(de)XML技(jì)術(shù)。這(zhè₩β♣)将大(dà)大(dà)降低(dī)我們利用(yòng)這(zhè)一(yī©₹↓)新技(jì)術(shù)的(de)難度。能(néng)夠讀(dú)取和(hé  £ )解析XML文(wén)檔的(de)軟件(jià$™φ≠n)不(bù)勝枚舉。為(wèi)了(le)掃盲,我這(zhè)裡​σ(lǐ)再啰嗦幾句。XML是(shì)完全基于普通(tō♣✘ng)文(wén)本的(de)。即便存儲二進制(zhì)¶β表示的(de)圖片,也(yě)會(huì)先将二進制(zhì)轉換為(wβ∞λèi)字符串再放(fàng)入XML文(w↕₽<'én)檔中。我們可(kě)以用(yòng)最簡單的(de)閱讀(dú)工€§★(gōng)具——記事(shì)本查看(kàn)XML文(&∏wén)檔。想想就(jiù)知(zhī)道(dào)這(zhè)↔®÷™是(shì)多(duō)麽美(měi)好(hǎo)的(de™≈ )一(yī)件(jiàn)事(shì)情,數(shù)據長(cháng)≠₽♦≈期存儲的(de)擔心可(kě)以落地(dì)了(le),找不(bù §)到(dào)原始工(gōng)作(zuò)↓ 站(zhàn)軟件(jiàn)的(de)人(rén)也(©♣yě)可(kě)以出口氣了(le)。當然, ™∑那(nà)些(xiē)認為(wèi)可(kα→ě)以更方便修改數(shù)據的(de)人∑≥∑(rén)美(měi)夢做(zuò)得(de)就(jiù)有(yǒu)點早了 &'☆(le)。

1  應用(yòng)AnIML解決現(xià•ε±≈n)實問(wèn)題

想想,如(rú)果能(néng)将我們所"Ω₩÷有(yǒu)的(de)分(fēn)析數(s&↕hù)據都(dōu)轉變成同樣的(de)格式,許多$‍✘(duō)實驗室中的(de)共性問(wèn)題就(jiù)都(↔←∏dōu)能(néng)得(de)到(dào)♥₩ •解決。

LIMS和(hé)ELN集成采用(yòng)AnIML數(shù)據格式±↕γ可(kě)以使得(de)儀器(qì)中的¶'≠φ(de)數(shù)據更容易方便地(dì)傳輸到(dào)其他(tā)δ↔→的(de)一(yī)些(xiē)數(shù)據系統中,例如(rú)LIMS π®(實驗室信息管理(lǐ)系統)和(hé)ELN(電(diàn)子(zǐ)≤¶✘↔實驗記錄本系統)。大(dà)家(jiā)知(zhī)道(dào),↔×不(bù)管是(shì)LIMS還(hái)是(shì)E$™π✘LN與儀器(qì)的(de)集成都(dōu)是(shì)這(zh∏∏è)類項目實施的(de)一(yī)個(gè)難點,既耗錢(q®$'ián)又(yòu)費(fèi)力,最終可(kě)能(n≤∞☆éng)還(hái)不(bù)討(tǎo)好 ​$(hǎo)。儀器(qì)種類一(yī)多(duō),因為(wèi)≤φ€™每種儀器(qì)的(de)數(shù)據格式都(dōu)不(bù)一(yī)<¥λ樣,工(gōng)作(zuò)量就(jiù)會(Ωγ‍huì)成倍增加。有(yǒu)了(le)AnIML,就 ←‌(jiù)不(bù)再需要(yào)為(wèi)每種儀器(qì)做(zu©≠ò)獨立的(de)接口。通(tōng)過↔γ數(shù)據标準化(huà),從(cóng)一(yε"ī)個(gè)接口就(jiù)可(kě)以獲取所有(yǒu)儀器(qì)♥'的(de)數(shù)據,既減少(shǎo)了(le÷∑)接口的(de)數(shù)量,也(yě)降♣‌低(dī)了(le)集成的(de)成本。

協作(zuò):在許多(duō)行(xíng)業(yè),企業(yè)經常需要(y↓βγ&ào)與內(nèi)部或外(wài)部的(de)人(rén)員(yΩαuán)進行(xíng)合作(zuò),特别是(shì)‌♦​在制(zhì)藥行(xíng)業(yè)中,外(wài)包業(yè <•φ)務的(de)發展更是(shì)如(rú)火(huǒ)如(rú)荼。 ©₹δ由于雙方使用(yòng)的(de)儀器(γ qì)和(hé)軟件(jiàn)有(yǒu)差别,數(shù)據産生(>≠shēng)方往往需要(yào)将這(zhè)些(xiē)儀器(qì)産生↑₹(shēng)的(de)數(shù)據進行(xíng)處理(lǐ)後生λ‍‍(shēng)成各種電(diàn)子(zǐ)表格或Pdf文(wén♣≠$÷)件(jiàn)後,再傳遞給合作(zuò)方。傳遞的(‍♦¶♠de)數(shù)據主要(yào)是(sh↑¥ ì)處理(lǐ)後的(de)結果數(shù)據,其中丢失很(hě™×↑'n)多(duō)重要(yào)的(de)原始數(₩∏>shù)據信息。采用(yòng)AnIML标準後的(de)分(fēn)析λ"儀器(qì)原始數(shù)據文(wén)件(jiàn)∞¶₽可(kě)以更容易地(dì)交換數(shù)據。不α¥≤≤(bù)同于傳統的(de)Excel電(diàn)∞λ↑&子(zǐ)表格和(hé)PDF報(bàoδ★¶)告,AnIML使我們能(néng)夠傳輸完整的(de)分(fēn)析數Ωα(shù)據,合作(zuò)方可(kě)以看(kàn)到(dào)完整的(de✘¥✘<)原始數(shù)據。這(zhè)既可(kě)以≈∑提高(gāo)數(shù)據質量,合作(zuò)方也(yě)可(kě)對(d☆♦☆uì)這(zhè)些(xiē)數(shù)據進☆®ε£行(xíng)再分(fēn)析,提高(gāo)數(shù)據的(de)利用(y♠>σòng)率。

長(cháng)期數(shù)據保存,在受監管的(de)行(xíng)業(yè)↓≤裡(lǐ)(例如(rú)制(zhì)藥行(xíng‌πσ&)業(yè)),分(fēn)析數(shù)據的(de)保存一(y©λ"ī)直是(shì)一(yī)個(gè)難以解決的≥©≥φ(de)問(wèn)題。原因主要(yào)在于數(shù)據所需要(✘★©yào)保存的(de)時(shí)間(jiān)較長($♠cháng),甚至達數(shù)十年(nián)。‍ 數(shù)十年(nián)的(de)時(shí)間(jiān)對(duì)于★₹IT技(jì)術(shù)來(lái)講,可(α®kě)能(néng)會(huì)發生(shēng)天翻‌←↕∑地(dì)覆的(de)變化(huà)。同樣對(duì)于儀器(qì)配套的( ≤βde)軟件(jiàn)來(lái)說(shuō)₩★,其也(yě)會(huì)經曆無數(shù)個(gè)版本的(de)升 £​級。更為(wèi)關鍵的(de)是(shì),即便解決軟件α∑ ★(jiàn)的(de)問(wèn)題,其讀(dú)取數(shù)據的(d‌¥¥✘e)基礎環境也(yě)會(huì)發生(shēng)變化(huà),例如₩←←‌(rú)該軟件(jiàn)所适合的(de)操作(zuò)®☆γλ系統。要(yào)在幾十年(nián)裡(lǐ)為(w&∑èi)某一(yī)類原始數(shù)據保存一(yī)ε♥個(gè)讀(dú)取的(de)環境似乎不(bù)太合乎實際,尤其是(sh→≠"ì)在儀器(qì)種類和(hé)數(shù)據種類比較多(duō)的λδ"(de)情況下(xià)。将這(zhè)些¶σ₹×(xiē)數(shù)據轉換為(wèi)AnIML可(kě)能(néng)是(¶$shì)一(yī)個(gè)好(hǎo)的(de)解決辦法。此舉能(né§∑§ng)大(dà)為(wèi)減少(shǎo)所需要(yào)的(de)配套軟™✘件(jiàn)工(gōng)具,也(yě)不(bù¶∑£)會(huì)受到(dào)基礎環境的(©☆∞de)制(zhì)約,很(hěn)自(zì)然會(huì)減少(shǎo)→<"φ一(yī)個(gè)信息系統的(de)運行(xíng)成本。

數(shù)據分(fēn)析和(hé)報(bào)告通(tōng)常情況下(xià),采集和(hé)處理(lǐ)分(fē∑&♦n)析數(shù)據僅僅是(shì)第一(yī)步。我們看​‍(kàn)到(dào)各種數(shù)據驅§≥​動的(de)工(gōng)作(zuò)流應用(yòng)在不(bù)斷增加≤☆‌。這(zhè)些(xiē)數(shù)據流方法在數(shù)據源頭上(♥£'δshàng)在不(bù)斷下(xià)探,逐步深入 ∑©到(dào)原始數(shù)據,并進一(yī)步對(duì)這(zh$↔è)些(xiē)數(shù)據集應用(yòng)可(kě↕≥¶)視(shì)化(huà),實驗設計(jì)δ™,多(duō)變量分(fēn)析等統計(₽€↓jì)學工(gōng)具進行(xíng)數(shù)據分(fēn)析∞★∏。通(tōng)過AnIML歸一(yī)化(huà)的(de)原始數(sγ ≈​hù)據将會(huì)使得(de)為(wèi)這(zhè)些(xi♥αē)流程提供數(shù)據變得(de)更加簡單'σ。

但(dàn)這(zhè)世界上(shàng)沒有(yǒu)免費(fèi)σ♥δ的(de)午餐,我們需要(yào)有(yǒu)>φ$能(néng)夠将原來(lái)儀器(qì)格式的(de)數♣γ÷(shù)據轉換為(wèi)AnIML格σ↕≈式的(de)工(gōng)具,還(hái)得(de)有(yǒu)能(néng§•‍≠)夠查看(kàn)AnIML格式數(shù"♠)據的(de)工(gōng)具。

為(wèi)了(le)建立AnIML,大(dà)家(jiā)÷σ•花(huā)了(le)很(hěn)長(cháng)的(de)時(sh§₽ í)間(jiān),這(zhè)裡(lǐ)面不(bù)單是(shì✘♦☆β)技(jì)術(shù)性的(de)問(wèn)題,↔↓≈還(hái)與一(yī)些(xiē)非技(jì)術(s☆™hù)性的(de)因素。分(fēn)析實驗室雖小(xiǎα‍®o),利益相(xiàng)關者卻衆多(duō)。到(d✘∏♦δào)目前為(wèi)止,AnIML的(de)技(jì)術‍€♣↔(shù)性的(de)工(gōng)作(zuò)早 π已完成,大(dà)家(jiā)可(kě)以放(fà¥δng)心使用(yòng)。經過ASTM表決之後,AnIML将成為(w₹‌ ™èi)一(yī)個(gè)開(kāi)放(fàng↕ε")的(de)公共的(de)标準。與此同時(shí),真正施行(xíng)這‌φβ♦(zhè)個(gè)标準所需要(yào)的(de)• ₩ 工(gōng)具的(de)開(kāi)發早已走在了(σ©>↕le)前面。對(duì)于終端用(yòng)戶來(l×¥ái)說(shuō),桌面版的(de)AnIML數(shù)↕∏←據查看(kàn)工(gōng)具,Web和(hé)移動≠♠ ≤平台,集成工(gōng)具,數(shù)據轉換器(π♦qì)都(dōu)已經有(yǒu)現(xiàn)成的(dπ♣ e)了(le)。對(duì)于供應商來(lái¥÷")說(shuō),在他(tā)們現(xiàn)有(yǒu)的(< ✔de)儀器(qì)軟件(jiàn)中嵌入AnIML功能→≥¥(néng)也(yě)并非難事(shì)。