聯系我們contact
電(diàn)話(huà):027-59760188-801
地(dì)址:武漢市(shì)東(dōng)湖(hú)高(gāo÷♥)新開(kāi)發區(qū)光(guāng)谷大(dà↔")道(dào)120号現(xiàn)代森(sēn)林(lín)小(xiǎo)¥←鎮A座609室
分(fēn)析儀器(qì)原始數(shù)據格式的(de)通(tō ₹ng)用(yòng)标準AnIML
發布時(shí)間(jiān):2018-03-1₹≈π✔8 浏覽次數(shù):1028次
所有(yǒu)實驗室面對(duì)一(yī)個(gè)<★共同問(wèn)題是(shì)實驗數(shù)據的(de)處理(lǐ)☆×↔ε和(hé)交換,這(zhè)裡(lǐ)尤其以分(fēn)析實驗室最為(wè ☆i)典型。我們走訪諸多(duō)分(fēn)析實驗室時(shí),大(¶™dà)家(jiā)談到(dào)最多(duδ§ō)的(de)就(jiù)是(shì)分(fēn)析儀器(qì)的(de)原'±∞始數(shù)據,包括其保存,處理(lǐ),₽±≠再分(fēn)析等問(wèn)題。大(dà)家(jiā)都(dōu)有(y€¥♣ǒu)一(yī)個(gè)烏托邦式的(de)夢想×$§',那(nà)就(jiù)是(shì)可(kě)以用(yφ ↓γòng)一(yī)種軟件(jiàn)打開(kāi)多(duō)個(gè)不←♣δ&(bù)同廠(chǎng)家(jiā),不≈¶®↑(bù)同類型的(de)分(fēn)析數(shù)據。夢想ε×✘δ歸夢想,現(xiàn)實仍然是(shì)現(xiàn)實。儀器(qì)供應商們λ© Ω提供儀器(qì)的(de)同時(shí)都(dōu)會(huì)采用ε↑β≤(yòng)自(zì)己的(de)專有(yǒu)格式的(≠↕≤de)數(shù)據,這(zhè)導緻了(le)數(shù)據處理(l♠>€ ǐ),協作(zuò),儀器(qì)集成和(hé)存檔遇到(d'λπào)很(hěn)多(duō)問(wèn)題。在處理(lǐ)這(zhè)些★(xiē)原始數(shù)據時(shí) ε除了(le)廠(chǎng)家(jiā)配套的(de)軟件(jiàn),很(±δ λhěn)少(shǎo)有(yǒu)可(kě)選的©♦β(de)餘地(dì)。
從(cóng)2003年(nián)開(kāi<∏♠)始, ASTM E13.15小(xiǎo)組委員(yuán)會(h↕↑uì)開(kāi)始籌劃開(kāi)發一(yī✘©)套分(fēn)析數(shù)據的(de)通(tōng)用σ≠£(yòng)标準,力求适用(yòng)于所有δγ€®(yǒu)分(fēn)析儀器(qì)技(jì)術(shù),并将其'γ命名為(wèi)AnIML。為(wèi)了(le)平衡各£<↓方利益,該小(xiǎo)組聚集了(le)來(€lái)自(zì)儀器(qì)廠(chǎn←'↓g)商,最終用(yòng)戶,政府機(jī)α¥構和(hé)學術(shù)界的(de)人(rén)士,共同商討(t™≈£ǎo)以确保格式完整,适用(yòng)性強。
AnIML并不(bù)是(shì)業(yè)界第一(yī∑↕)次嘗試将分(fēn)析數(shù)據标準化(huà)。之÷∞前已經設計(jì)過多(duō)種标準,如(rú)ANDI(也(yě)叫Net•π< CDF,适用(yòng)于GC,LC,MS),JCAMP-DX(IR,FTIR"≈₩,NMR,UV/Vis),SpectroML(分(fēn)子(zǐ)光(guā↑©←ng)譜數(shù)據)以及mzML(質譜¥∞),以及一(yī)些(xiē)儀器(qì)公司倡導的(de)标準♣♦,如(rú)Thermo 所提出的(de)GAML。雖©±說(shuō)這(zhè)些(xiē)數(shù)據格式在分(φ★>™fēn)析儀器(qì)行(xíng)業(yè)取得(de)了(le)較大×↔®↕(dà)的(de)支持力度,但(dàn)它們大(dàε®)都(dōu)隻針對(duì)特定的(de)分(fēnπ☆)析技(jì)術(shù),例如(rú)JCAMP-DX主要(yào)針對(d"★★uì)的(de)光(guāng)譜技(jì)術(sα σhù),而AnIML期望建立的(de)是(shì)一(yī)種适★&用(yòng)于所有(yǒu)分(fēn)析技(jì)術(∑'≠shù)的(de)數(shù)據格式。借助清晰完整的(de)→→擴展方式,即便将來(lái)出現(xiàn)了(le)新的(de)分Ω♣(fēn)析技(jì)術(shù),也(yě)不(bù)用(Ω←yòng)改變現(xiàn)有(yǒu)的(de)軟件(÷♣jiàn),從(cóng)而簡化(huà)數(shù)據管理(lǐ)的(♦λλ©de)工(gōng)作(zuò)。由此,XML這(zhè)門(mén)>©λ強大(dà)而影(yǐng)響深遠(yuǎn)的(d™∞e)語言終于可(kě)以将其影(yǐng)響力擴展到(dào)分↑¥(fēn)析實驗室。
AnIML是(shì)基于W3C XML标準的(de>π€)技(jì)術(shù)。XML獨立于平台,易于創建,£←使用(yòng)和(hé)維護。這(zhè)降低(dī)了(le)使≥φ↑用(yòng)門(mén)檻,幾乎所有(yβ ✔♦ǒu)的(de)主流軟件(jiàn)開(kāi)發商都(dōu)支持'→XML,并且存在大(dà)量以XML格式為(wèi)基礎的(de)工(gōng$$)具。 由于XML是(shì)基于文(wén)本的(de)。因此∞®可(kě)以用(yòng)最簡單的(de)文(wén)本編輯器(qì)編輯An ♠≠IML文(wén)件(jiàn) – 而不(bù)需要(yào)特定的(de)₩₽↔≠軟件(jiàn)。盡管這(zhè)樣不(b>★ ù)一(yī)定方便,但(dàn)保留這(zhè)一(yī)特性是(shì)±≠&用(yòng)于長(cháng)期數(shù)據保存方案的(de♥↕Ω)關鍵:即使丢失了(le)之前的(de)軟★γ件(jiàn),我們仍舊(jiù)可(kě)以獲取我們需要±∏(yào)的(de)數(shù)據。
實現(xiàn)AnIML的(de)靈活性和(hé)通 δ(tōng)用(yòng)性的(de)方法并不(bù)複∏<↓雜(zá),AnIML數(shù)據标準☆♦₩©包含兩個(gè)部分(fēn),一(yī)個(gè)是(shì)通®↑♠(tōng)用(yòng)的(de)數(shù)據容器(qì),稱為(wè♥π®βi)AnIML核心(AnIML core),可(kě)☆♦✘以存儲任何科(kē)學數(shù)據。構成AnIML核★≤"心的(de)包括樣品數(shù)據集(SampleSet)、實驗步驟<&₽∏數(shù)據集(ExperimentStepSet)、審計(jì)跟蹤記φ♠'↑錄數(shù)據集(AuditTrailEntrySet)、簽名記錄集(♣"SignatureSet)。
在AnIML的(de)核心之上(shàng),是(shì)¶₽↑α“技(jì)術(shù)定義”(Techni®↓que Definition)部分(fēn)×'✔,所謂的(de)“技(jì)術(shù)α©↑≤定義”就(jiù)是(shì)說(shuō)明(m&♣•↑íng)針對(duì)某種分(fēn)析技(jì)術(shù)如(rΩ>σ∏ú)何去(qù)使用(yòng)數(shù)據容器(qì)。技(jì)術Ω★$(shù)定義(Technique Defin★¥ition)可(kě)以被看(kàn)作(zuò)是(shσ£ì)記錄某種分(fēn)析實驗所需要(yào)的(de)數εε® (shù)據字段的(de)目錄。技(jì)術(shù)定義文(wén)件(ji® àn)屬于常規的(de)XML文(wén)件(jiàn)中的(de)DT÷÷D文(wén)件(jiàn),可(kě)以₹ →随時(shí)重新創建。通(tōng)過 DTD,每→↔<™一(yī)個(gè) XML 文(wén)件(jiàn)均可(kλβ•ě)攜帶一(yī)個(gè)有(yǒu)關其自(zì)身(shēn)格式 ∏↕的(de)描述。雖說(shuō)AnIML是(shì)普适性的(d☆δπΩe),但(dàn)對(duì)于一(yī)些(xiē)具 &δφ體(tǐ)的(de)很(hěn)流行(xíng)的(de)分(fēn≥♣)析技(jì)術(shù),例如(rú)液相(x≤≠✔iàng)色譜,紫外(wài)光(guāng)譜,除↓÷β 了(le)實驗的(de)一(yī)些(xiē)公共特征,₩ ♣✘還(hái)是(shì)有(yǒu)其自(zì)身(shēn)獨有(y₽÷≈ǒu)的(de)一(yī)些(xiē)屬性的(de)。通(tōng)過 ÷✘×DTD,大(dà)家(jiā)可(kě)ππ≤一(yī)緻地(dì)使用(yòng)某個(g∏&è)标準的(de) DTD(HPLC,IR) 來(lái)交換數(σ€shù)據。而應用(yòng)程序也(yě)可(©kě)使用(yòng)某個(gè)标準的(de) DTD 來(láλπελi)驗證從(cóng)外(wài)部接收到(dào)的(de)數(shù)據Ω®≠β。同時(shí)還(hái)可(kě)以使用(yòng) DTD 來(&♥lái)驗證自(zì)身(shēn)的(de)數(shù)據。
作(zuò)為(wèi)一(yī)種通(tōng)用(yòng)型的↓★(de)數(shù)據表示方法,AnIML适合于包括光(guāngασ)譜,色譜,圖像,生(shēng)物(wù)分(λ♣fēn)析等各種數(shù)據的(de)表 示。除了(le)經常使用(yòng)的(de)分(fēn)析儀器(q≠®↓ì)數(shù)據,AnIML也(yě)可(kě)用(yòngΩ↔'δ)于新興的(de)數(shù)據格式或一(yī)次性的(de)探索性實驗,∏©例如(rú)微(wēi)流體(tǐ)芯片或特殊的(de)傳感器(qì)。≤&→随著(zhe)技(jì)術(shù)的(de)δ©發展,新的(de)分(fēn)析技(jì)術(shù)和(hé)其相(xiàn≠¶♦g)應的(de)技(jì)術(shù)說(shuō)明(míng)都(≈"dōu)将取得(de)進步。這(zhè)種通(tōng)用( ×↔λyòng)性的(de)方法允許系統繼續使用¶♣♣<(yòng)這(zhè)些(xiē)早期的(de)AnIML文(wé©↑↕ n)件(jiàn),而無需對(duì)軟件(jiàn)進行(xεβ&íng)修改或升級。
專有(yǒu)格式 | 通(tōng)用(yòng)格式Ω★•÷/标準格式 |
二進制(zhì) | 基于ASCII碼 (例如(r♥ "ú)XML) |
結構緊湊 | 冗長(cháng) |
快(kuài)速讀(dú)/§>≈寫 | 讀(dú)寫慢(màn) |
用(yòng)戶數(shù)據采集和(hé)處理(lǐ) | 主要(yào)用(yòng)于數©★(shù)據共享和(hé)長(cháng)期保存 |
如(rú)果我們有(yǒu)心好(hǎo)好(hǎo)看(kΩ∏β∞àn)看(kàn)AnIML的(de)技('♦jì)術(shù)文(wén)檔,你(nǐ)會(huì)發✔₽§現(xiàn)AnIML就(jiù)是(sh↑φεì)純粹的(de)XML技(jì)術(shù)。這(zh™✔← è)将大(dà)大(dà)降低(dī)我們利用(yò♣λng)這(zhè)一(yī)新技(jì)術(shù)的(de)難度。能(nén×↑εg)夠讀(dú)取和(hé)解析XML文(wén)檔的(de)軟件(j↑¥iàn)不(bù)勝枚舉。為(wèi)了(le)掃盲,我這(zhè)裡☆♣←↓(lǐ)再啰嗦幾句。XML是(shì)完全基于普通(tō£€εng)文(wén)本的(de)。即便存儲二進制(zhì)表示的(de §©)圖片,也(yě)會(huì)先将二進制(zhì)轉換為(wèi)字符♦♥≠ 串再放(fàng)入XML文(wén)檔中。我們可(kě)以用(yòng)<最簡單的(de)閱讀(dú)工(gōng)具 ↑——記事(shì)本查看(kàn)XML文(wén)檔ε。想想就(jiù)知(zhī)道(dào≈π)這(zhè)是(shì)多(duō)麽美(měi)好(hǎ¶←o)的(de)一(yī)件(jiàn)事(shì)情,數(shù)據長(chá•'£™ng)期存儲的(de)擔心可(kě)以落地(dì)了&'§(le),找不(bù)到(dào)原始工(gōng)作(zuò)站∏✔α↔(zhàn)軟件(jiàn)的(de)人(rén)也(yě)可₹γ(kě)以出口氣了(le)。當然,那(nà)些(xiē)認為(wèi)可(k☆ ™ě)以更方便修改數(shù)據的(de)人(rén)美(měi§επ✔)夢做(zuò)得(de)就(jiù)有(yǒu> ↔♦)點早了(le)。
1 應用(yòng)AnIML解決現(xiàn)實問($✔®wèn)題
想想,如(rú)果能(néng)将我們所有(yǒu)的(dπ§e)分(fēn)析數(shù)據都(dōu)轉變成同樣的(de)格式,許多(Ω ♥duō)實驗室中的(de)共性問(wèn)題就(jiù)"☆都(dōu)能(néng)得(de)到(dào<☆£Ω)解決。
LIMS和(hé)ELN集成:采用(yòng)AnIML數(shù)據格式可(kě)以使得(de)儀器(q÷α©ì)中的(de)數(shù)據更容易方便地(dì)傳輸到(dàoσ✔δ♣)其他(tā)的(de)一(yī)些(xiē)數(shù)據系統中,例 '♣↔如(rú)LIMS(實驗室信息管理(lǐ)系統)和(hé)ELN(電(diàn↑'→')子(zǐ)實驗記錄本系統)。大(dà)家(jiā)知(zhī)道←₹≈ (dào),不(bù)管是(shì)LIMS還(hái) §是(shì)ELN與儀器(qì)的(de)集成都(dōu)是(sh§₩ì)這(zhè)類項目實施的(de)一(yī)個(gè)難點€≈,既耗錢(qián)又(yòu)費(fèi)力,最終• 可(kě)能(néng)還(hái)不(bù)β討(tǎo)好(hǎo)。儀器(qì)種類一(yī)多(duō),因為(wè£♠i)每種儀器(qì)的(de)數(shù≠π)據格式都(dōu)不(bù)一(yī)樣,工(gōng)作(zuò)量就(j₽∑iù)會(huì)成倍增加。有(yǒu)了(le)AnIγ↓§ML,就(jiù)不(bù)再需要(yào)為∑§φ↓(wèi)每種儀器(qì)做(zuò)獨立的±✘×∏(de)接口。通(tōng)過數(shù)據标準化(hu ¥™à),從(cóng)一(yī)個(gè)接口就(jiù)可(kě)以§$獲取所有(yǒu)儀器(qì)的(de)數(shù)據,既減少(sh←∞↓ǎo)了(le)接口的(de)數(shù)δγ量,也(yě)降低(dī)了(le)集成的(de)成本。
協作(zuò):在許多(duō)行(xíng)業(yè),企業(yè)經常需∑¥要(yào)與內(nèi)部或外(wài)部的(de≥)人(rén)員(yuán)進行(xíng)合作(zuò),特别是(shìΩ∏¥)在制(zhì)藥行(xíng)業(yè)中,外(wà← i)包業(yè)務的(de)發展更是(shì)如★±(rú)火(huǒ)如(rú)荼。由于雙方使用(yòng)的₽♣←(de)儀器(qì)和(hé)軟件(jiàn)>&α有(yǒu)差别,數(shù)據産生(shēng)方往'£'φ往需要(yào)将這(zhè)些(xiē)儀器(qì)産生(shēng)的(d ♦αe)數(shù)據進行(xíng)處理(lǐ)後生(shēng)成各種電( •diàn)子(zǐ)表格或Pdf文(wén)件(jiàn)後,✔≤₽再傳遞給合作(zuò)方。傳遞的(de)數(shù)據主要(yà♦ o)是(shì)處理(lǐ)後的(de)結果₹∑數(shù)據,其中丢失很(hěn)多(duō)重要φ→¶ (yào)的(de)原始數(shù)據信息。采用(yòγ≤ng)AnIML标準後的(de)分(fēn)析儀器(q£αì)原始數(shù)據文(wén)件(jiàn)可(kě§≥)以更容易地(dì)交換數(shù)據。不(b₽↑©¶ù)同于傳統的(de)Excel電(diàn)子(zǐ)表δ★格和(hé)PDF報(bào)告,AnIM♠εL使我們能(néng)夠傳輸完整的(de)分(fēn)析數(sh✔₽ù)據,合作(zuò)方可(kě)以看(k✔φΩσàn)到(dào)完整的(de)原始數(shù)據。這(zhè)既可(kě)"★以提高(gāo)數(shù)據質量,合作(zuò)方也(yě)可'←✘↓(kě)對(duì)這(zhè)些(xiē)↑↕§✘數(shù)據進行(xíng)再分(fēn)析,提高(g ∏∏āo)數(shù)據的(de)利用(yòng)率。
長(cháng)期數(shù)據保存,在受監管的(de)行(xíng)業(yè)裡(lǐ)(例如(rú)制(zhì•φ"π)藥行(xíng)業(yè)),分(fēn)析數(s∞σ§↑hù)據的(de)保存一(yī)直是(shì)Ω一(yī)個(gè)難以解決的(de)問(wèn)題€✔。原因主要(yào)在于數(shù)據所需要(yào)保存的(de)時(shí•→)間(jiān)較長(cháng),甚至達數(shù)十年(niánφ±¥↑)。數(shù)十年(nián)的(de)時(s☆↕©hí)間(jiān)對(duì)于IT技(★<πjì)術(shù)來(lái)講,可(kě)能(néng)會(∏✔≈>huì)發生(shēng)天翻地(dì)覆的(de)變化(huà)。同樣對(d∏ ★≤uì)于儀器(qì)配套的(de)軟件(jiàn)↓γ↔∞來(lái)說(shuō),其也(yě)會(♥✔huì)經曆無數(shù)個(gè)版本的(de)升級。更為←εβ≈(wèi)關鍵的(de)是(shì),即便解Ω₽"≥決軟件(jiàn)的(de)問(wèn)題,其讀(↑dú)取數(shù)據的(de)基礎環境也(♦¶φ§yě)會(huì)發生(shēng)變化(huà),例如(rú)該軟® >¥件(jiàn)所适合的(de)操作(zuò)系統。要(π★σαyào)在幾十年(nián)裡(lǐ)為(wèiβ€)某一(yī)類原始數(shù)據保存一(yī)個(gè)λ¥≠讀(dú)取的(de)環境似乎不(bù)太合乎實際,尤其是₽÷©£(shì)在儀器(qì)種類和(hé)數(shù)據種類™σ>比較多(duō)的(de)情況下(xià)。将這(zh✘↔è)些(xiē)數(shù)據轉換為(wèi)AnIML可(δ₽♥kě)能(néng)是(shì)一(yī)個(gè)好(hǎo)α∏的(de)解決辦法。此舉能(néng)大(dà)為(wèi)減少(shǎo)>₽¥≥所需要(yào)的(de)配套軟件(jiàn)工(gōng)具λ ,也(yě)不(bù)會(huì)受到(dào)λ∏基礎環境的(de)制(zhì)約,很(h£ε&ěn)自(zì)然會(huì)減少(shǎo)一(yī)個(gè)×£>π信息系統的(de)運行(xíng)成本。
數(shù)據分(fēn)析和(hé)報(bào)告:通(tōng)常情況下(xià),采集和(hé)處理($&σ≥lǐ)分(fēn)析數(shù)據僅僅是(s&'∏hì)第一(yī)步。我們看(kàn)到(dào←♥↓)各種數(shù)據驅動的(de)工(gōng)作(zuò)流應用(≈₽≈ yòng)在不(bù)斷增加。這(zhè)些(xiē)☆'≥↔數(shù)據流方法在數(shù)據源頭上(shàng∞λ↔)在不(bù)斷下(xià)探,逐步深入到(dào)原始☆₹♣數(shù)據,并進一(yī)步對(du↔÷ì)這(zhè)些(xiē)數(shù)據集應用(λ↕yòng)可(kě)視(shì)化(huà),實驗βε'設計(jì),多(duō)變量分(fēn)析♣✔等統計(jì)學工(gōng)具進行(xíng)數(shù)據分$★÷∏(fēn)析。通(tōng)過AnIML歸一(yī)化(huà)的≥>±(de)原始數(shù)據将會(huì)使得(de)→γ為(wèi)這(zhè)些(xiē)流程提供數(shù)據變得(de)更加簡φ¥γ>單。
但(dàn)這(zhè)世界上(shàng)沒 π"♣有(yǒu)免費(fèi)的(de)午餐,我們需要(yào)有±≠β(yǒu)能(néng)夠将原來(lái)儀器(qì)格式的♥""∏(de)數(shù)據轉換為(wèi)AnIML格式的(de)σδ工(gōng)具,還(hái)得(de)有(y£©Ωǒu)能(néng)夠查看(kàn)AnIML格式數(shù)據的(de)工($♣ gōng)具。
為(wèi)了(le)建立AnIML,大(dà)家(jiā)花(₽↔↔≤huā)了(le)很(hěn)長(cháng)的(de)時(shí)'→間(jiān),這(zhè)裡(lǐ)面不(bù)單是(shì)技(jì)術↓✔δ(shù)性的(de)問(wèn)題,還(hái)與一(yī)些(xiē λβ )非技(jì)術(shù)性的(de)因素。分(∞✔fēn)析實驗室雖小(xiǎo),利益相(xiàng)關者卻衆多(d♥βuō)。到(dào)目前為(wèi)止,An≥≠IML的(de)技(jì)術(shù)性的(de)工(gōng)作 ↑(zuò)早已完成,大(dà)家(jiā)可(kě)以"λ↔放(fàng)心使用(yòng)。經過ASTM表決之後,Anε±♥IML将成為(wèi)一(yī)個(gè)開(k←<āi)放(fàng)的(de)公共的(de)标→±γ準。與此同時(shí),真正施行(xíng)這(zhè)個(gè)标準所需♣δ$要(yào)的(de)工(gōng)具的(de)開(kāi)發早已走在了(l₩®♣e)前面。對(duì)于終端用(yòng)戶來(lái)說(shuō) $€,桌面版的(de)AnIML數(shù)據查看(kàn)工(gōng±∞≠)具,Web和(hé)移動平台,集成工(gō ng)具,數(shù)據轉換器(qì)都(dōu)已經有(yǒu)現∞™£♦(xiàn)成的(de)了(le)。對(d÷ε←♣uì)于供應商來(lái)說(shuō),在他(tā)們現(xiàn)÷γ'有(yǒu)的(de)儀器(qì)軟件(≠ ↕jiàn)中嵌入AnIML功能(néng)也(yě)并非難事(shì)。↕×
上(shàng)一(yī)條:電(diàn)子(zǐ)實驗記錄系統實施&md γ↕↕ash;—之業(yè)務分(f←₹ēn)析篇
下(xià)一(yī)條:構建符合21 CFR Part11的(de)©'₽α安全控制(zhì)機(jī)制(zhì)