目前,我們的日常生活中接觸到的工業(yè)化學(xué)物質(zhì)大約超過(guò)100,000種,其中一些可能對(duì)人體健康產(chǎn)生不利影響。
化學(xué)物質(zhì)的安全性通常通過(guò)動(dòng)物試驗(yàn)、細(xì)胞試驗(yàn)、微生物試驗(yàn)等生物檢測(cè)來(lái)評(píng)估。然而,在考慮時(shí)間、勞動(dòng)力、物質(zhì)成本和動(dòng)物倫理等多種因素時(shí),以這種方式測(cè)試如此大量的化學(xué)物質(zhì)是不現(xiàn)實(shí)的。
▌定量構(gòu)效關(guān)系(QSAR)
為了實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo),需要一種能夠迅速準(zhǔn)確識(shí)別有害化學(xué)物質(zhì)的有效篩選工具。定量構(gòu)效關(guān)系(Quantitative Structure Activity Relationships,QSAR)是一種計(jì)算機(jī)模擬方法,它主要基于各種分子描述符和模型算法,建立化合物的結(jié)構(gòu)與其理化性質(zhì),生物學(xué)活性,毒理學(xué)效應(yīng),環(huán)境行為和歸趨等的定性/定量關(guān)系,即根據(jù)目標(biāo)物質(zhì)的化學(xué)結(jié)構(gòu)特征預(yù)測(cè)其生理效應(yīng)或理化性質(zhì)等,具有快速高效的特點(diǎn),能夠有效節(jié)約測(cè)試成本。
QSAR是目前國(guó)內(nèi)外一個(gè)活躍的研究領(lǐng)域,美國(guó)環(huán)境保護(hù)署(United States Environmental Protection Agency,簡(jiǎn)稱US EPA)就基于QSAR開(kāi)發(fā)了針對(duì)化學(xué)物質(zhì)毒性預(yù)測(cè)的軟件——Toxicity Estimation Software Tool (T.E.S.T)。
▌T.E.S.T
T.E.S.T軟件可根據(jù)大量的數(shù)據(jù)處理和統(tǒng)計(jì)識(shí)別目標(biāo)化合物中潛在的有毒基團(tuán),還能快速地分析與目標(biāo)物質(zhì)結(jié)構(gòu)相似的化合物的毒性,進(jìn)一步綜合預(yù)測(cè)目標(biāo)物質(zhì)的毒性。
T.E.S.T界面簡(jiǎn)潔,操作簡(jiǎn)單,并且軟件內(nèi)配有指南,易上手,用戶可通過(guò)CAS號(hào)、SMILES碼、物質(zhì)名稱、InChi碼、DTXSID或是手動(dòng)繪制載入化學(xué)物質(zhì)結(jié)構(gòu),然后選定預(yù)測(cè)終點(diǎn)與方法,更改結(jié)果輸出路徑后即可進(jìn)行預(yù)測(cè),軟件預(yù)測(cè)完畢會(huì)自動(dòng)生成結(jié)果報(bào)告。
T.E.S.T軟件用戶界面與基本操作流程
T.E.S.T的預(yù)測(cè)終點(diǎn)包括毒性和理化性質(zhì)兩大類別。
毒性預(yù)測(cè)終點(diǎn):
預(yù)測(cè)終點(diǎn) | 介紹 |
LC50(Fathead minnow 96-hr) | 96小時(shí)導(dǎo)致50%黑頭呆魚(yú)(Fathead minnow)死亡的水中試驗(yàn)化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(D. magna 48-hr) | 48小時(shí)導(dǎo)致50%大型蚤(Daphnia magna)死亡的水中試驗(yàn)化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(T. pyriformis 48-hr) | 48小時(shí)對(duì)50%梨形四膜蟲(chóng)(Tetrahymena pyriformis)生長(zhǎng)產(chǎn)生抑制作用的水中試驗(yàn)化學(xué)物質(zhì)濃度(mg/L)。 |
LC50(Oral rat) | 導(dǎo)致50%的大鼠口服后死亡的化學(xué)物質(zhì)量 (mg/kg bw)。 |
生物富集因子 (Bioaccumulation factor) | 達(dá)到平衡狀態(tài)時(shí),化合物在生物體內(nèi)濃度與環(huán)境介質(zhì)中濃度的比值。 |
發(fā)育毒性 (Developmental toxicity) | 化學(xué)物質(zhì)是否會(huì)對(duì)人類或動(dòng)物產(chǎn)生發(fā)育毒性效應(yīng)。 |
鼠傷寒沙門(mén)氏桿菌回復(fù)突變?cè)囼?yàn) (Ames mutagenicity) | 如果化學(xué)物質(zhì)在鼠傷寒沙門(mén)菌菌株(Salmonella typhimurium)中誘導(dǎo)回復(fù)突變菌落生長(zhǎng),則該化合物為致突變物。 |
理化性質(zhì)預(yù)測(cè)終點(diǎn):
預(yù)測(cè)終點(diǎn) | 介紹 |
標(biāo)準(zhǔn)沸點(diǎn) (Normal boiling poin) | 化學(xué)物質(zhì)在標(biāo)準(zhǔn)大氣壓(1個(gè)大氣壓)下沸騰的溫度(℃) |
蒸汽壓 (Vapor pressure) | 在25℃的密閉條件中,與固體或液體處于相平衡的蒸氣所具有的壓強(qiáng)(mmHg)。 |
熔點(diǎn) (Melting point) | 化學(xué)物質(zhì)從固體變?yōu)橐后w的溫度(℃)。 |
閃點(diǎn) (Flash point) | 化學(xué)物質(zhì)與外界空氣形成混合氣與火焰接觸時(shí)發(fā)生閃火并立刻燃燒的最低溫度 |
密度 (Density) | 單位體積質(zhì)量(g/cm3) |
表面張力 (Surface tension) | 液體表面層由于分子引力不均衡而產(chǎn)生的沿表面作用于任一界線上的張力(dyn/cm)。 |
熱導(dǎo)率 (Thermal conductivity) | 物質(zhì)傳導(dǎo)熱量能力的量度值 (mW/mK)。 |
黏度 (Viscosity) | 流體對(duì)流動(dòng)所表現(xiàn)的阻力(cP) |
水溶性 (Water solubility) | 化學(xué)物質(zhì)溶于液態(tài)水中形成均相溶液的濃度(mg/L)。 |
預(yù)測(cè)方法:
T.E.S.T內(nèi)包含了Chi連接指數(shù)、Kappa形狀指數(shù)、2D結(jié)構(gòu)特征等14類,共計(jì)797個(gè)描述符。
同時(shí),T.E.S.T的預(yù)測(cè)方法有5種,即層次聚類法、單一模型法、基團(tuán)貢獻(xiàn)計(jì)算法、最近鄰法、一致性評(píng)價(jià)方法。用戶可依據(jù)自身需求選擇和合適的預(yù)測(cè)方法來(lái)增加預(yù)測(cè)結(jié)果的可信度。
方法 | 介紹 |
層次聚類法 (Hierarchical method) | 使用來(lái)自幾種不同聚類模型的預(yù)測(cè)加權(quán)平均值來(lái)預(yù)測(cè)化學(xué)物質(zhì)的毒性。 |
單一模型法 (Single model method) | 使用適合訓(xùn)練集的多元線性回歸模型進(jìn)行預(yù)測(cè)(使用分子描述符作為獨(dú)立變量)。 |
基團(tuán)貢獻(xiàn)計(jì)算法 (Group contribution method) | 使用適合訓(xùn)練集的多元線性回歸模型進(jìn)行預(yù)測(cè)(使用分子片段計(jì)數(shù)作為獨(dú)立變量)。 |
最近鄰法 (Nearest neighbor method) | 通過(guò)取訓(xùn)練集中與測(cè)試化學(xué)物質(zhì)最相似的3種化學(xué)物質(zhì)的平均值來(lái)預(yù)測(cè)目標(biāo)化學(xué)物質(zhì)的毒性。 |
一致性評(píng)價(jià)方法 (Consensus method) | 通過(guò)取上述QSAR方法預(yù)測(cè)毒性的平均值來(lái)預(yù)測(cè)化學(xué)物質(zhì)的毒性(預(yù)測(cè)結(jié)果在各自方法的適用范圍內(nèi))。 |
模型擬合度:
用戶在進(jìn)行QSAR預(yù)測(cè)時(shí)往往最關(guān)心的是預(yù)測(cè)結(jié)果的準(zhǔn)確性。T.E.S.T.指南文件指出,如果QSAR模型滿足以下條件,則認(rèn)為該模型具有可接受的預(yù)測(cè)能力:
R2是真實(shí)值與預(yù)測(cè)值之間的相關(guān)系數(shù)(即為不過(guò)原點(diǎn)回歸時(shí)相關(guān)系數(shù)的平方),R02是回歸曲線截距為零時(shí)真實(shí)值和預(yù)測(cè)值之間的相關(guān)系數(shù)(即為過(guò)原點(diǎn)回歸時(shí)相關(guān)系數(shù)的平方),k是回歸曲線截距為零時(shí)的回歸方程系數(shù)。公式(1)(2)都是對(duì)線性回歸模型的擬合度量,滿足(1)(2)公式條件,即說(shuō)明模型擬合度較好,具有良好的預(yù)測(cè)能力。
指南文件介紹了軟件中各個(gè)QSAR模型的統(tǒng)計(jì)參數(shù),本文以LC50(fathead minnow 96-hr)毒性終點(diǎn)和標(biāo)準(zhǔn)沸點(diǎn)(Normal boiling point)的測(cè)試集結(jié)果為例介紹T.E.S.T中的模型性能。
LC50(fathead minnow 96-hr)測(cè)試集結(jié)果:
LC50(fathead minnow 96-hr)測(cè)試集結(jié)果顯示,五種方法的R2均滿足公式(1)的條件,且一致性評(píng)價(jià)方法的結(jié)果最好。單一模型法、基團(tuán)貢獻(xiàn)計(jì)算法、一致性評(píng)價(jià)方法不滿足公式(2)的條件。
依據(jù)T. E. S. T.指南指出不滿足這些條件的模型本身并非絕對(duì)無(wú)效的,其預(yù)測(cè)結(jié)果是相對(duì)保守的,應(yīng)該謹(jǐn)慎使用。
標(biāo)準(zhǔn)沸點(diǎn)(Normal boiling poin)測(cè)試集結(jié)果:
單一模型法不適用于標(biāo)準(zhǔn)沸點(diǎn)的預(yù)測(cè),因此沒(méi)有其測(cè)試集結(jié)果,其余四種方法的三種指標(biāo)均符合公式(1)(2)的條件??偟膩?lái)說(shuō),標(biāo)準(zhǔn)沸點(diǎn)的測(cè)試集預(yù)測(cè)統(tǒng)計(jì)整體是很好的。
應(yīng)用域介紹:
對(duì)于一個(gè)可靠的QSAR預(yù)測(cè)結(jié)果而言除了關(guān)注模型預(yù)測(cè)能力外,還需確定目標(biāo)化合物是否在該模型的應(yīng)用域范圍內(nèi)。應(yīng)用域的功能就是界定能夠被QSAR模型可靠預(yù)測(cè)的化合物,也可理解為模型適用化合物的集合,通常可通過(guò)可從4方面來(lái)表征模型的應(yīng)用域:
①描述符變化范圍;②結(jié)構(gòu)相似性;③機(jī)理相似性;④代謝轉(zhuǎn)化途徑和產(chǎn)物,
若目標(biāo)化合物的上述特征在QSAR模型的應(yīng)用域內(nèi),則預(yù)測(cè)結(jié)果具有良好的可靠性;反之,則預(yù)測(cè)結(jié)果不具備良好的可靠性。
以3-氯-2-甲基苯胺(CAS:87-60-5)的IGC50(T. pyriformis 48-hr)預(yù)測(cè)為例,如下圖所示,3-氯-2-甲基苯胺均在層次聚類法建立的多個(gè)預(yù)測(cè)模型的應(yīng)用域范圍內(nèi),即Applicability Domain的一列結(jié)果均為“OK”,因此模型的總體預(yù)測(cè)結(jié)果相對(duì)可靠。
若目標(biāo)化合物預(yù)測(cè)結(jié)果此列并非“OK”,而顯示為“Rmax constraint not met”、“Model ellipsoid constraint not met”或是某個(gè)結(jié)構(gòu)片段超出應(yīng)用域范圍,其預(yù)測(cè)結(jié)果須謹(jǐn)慎使用。
綜上所述,T.E.S.T是一款由US EPA官方研究開(kāi)發(fā)的QSAR毒性預(yù)測(cè)軟件,可以根據(jù)化合物的結(jié)構(gòu)信息預(yù)測(cè)其潛在毒性及理化性質(zhì),其中包括較為常見(jiàn)的7種毒性預(yù)測(cè)終點(diǎn)和9種理化性質(zhì)預(yù)測(cè)終點(diǎn),并且具有5種預(yù)測(cè)方法,預(yù)測(cè)能力較好,結(jié)果可信度較高,但在使用的過(guò)程中仍需要對(duì)目標(biāo)物質(zhì)和預(yù)測(cè)結(jié)果進(jìn)行專家評(píng)估以得出專業(yè)準(zhǔn)確的結(jié)論。
在使用方面,軟件整體安裝簡(jiǎn)單,操作便捷,用戶界面友好,并且配有較為詳細(xì)的用戶指南。隨著US EPA地不斷更新與完善,目前TSET已經(jīng)更新至5.1.2版本,適用于Windows和macOS系統(tǒng)。更詳細(xì)的內(nèi)容請(qǐng)參考軟件指南User’s Guide for T. E. S. T. (Toxicity Estimation Software Tool) Version 5.1。
軟件鏈接:Toxicity Estimation Software Tool (T.E.S.T) | US EPA
參考文獻(xiàn):
[1] Honma M. An assessment of mutagenicity of chemical substances by (quantitative) structure-activity relationship. Genes Environ. 2020;42:23.
[2] De P, Kar S, Ambure P, et al. Prediction reliability of QSAR models: an overview of various validation tools. Arch Toxicol. 2022;96(5):1279-1295.
[3] U.S. EPA (2020). User’s Guide for T.E.S.T (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular Structure.
[4] 唐睿,張松林,粱云明,等. 毒性評(píng)估軟件T.E.S.T及其在農(nóng)業(yè)污染化合物QSAR研究中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué),2010,38(36):20878-20879,20882
[5] US EPA. Environmental Optimization Using the Waste Reduction Algorithm. 2011 4/18/16]; Available from: nepis.epa.gov/Exe/ZyPURL.cgi?Dockey=P100DZKT.TXT.
[6] Martin TM, Harten P, Young DM, et al. Does rational selection of training and test sets improve the outcome of QSAR modeling?. J Chem Inf Model. 2012;52(10):2570-2578.
[7] 王中鈺,陳景文,傅志強(qiáng),等.QSAR模型應(yīng)用域的表征方法[J].科學(xué)通報(bào),2022,67(3):255-266.
[8] 陳景文,李雪花,于海瀛,王亞南,喬顯亮.面向毒害有機(jī)物生態(tài)風(fēng)險(xiǎn)評(píng)價(jià)的(Q)SAR技術(shù):進(jìn)展與展望[J].中國(guó)科學(xué)(6期):461-474[2024-01-16]
※ 以勒申明:
本文內(nèi)容來(lái)源:由以勒標(biāo)準(zhǔn)翻譯整理。以勒標(biāo)準(zhǔn)尊重知識(shí)產(chǎn)權(quán),如轉(zhuǎn)載內(nèi)容涉及版權(quán)問(wèn)題,煩請(qǐng)聯(lián)系我們及時(shí)處理。翻譯/整理不易,凡轉(zhuǎn)載或引用本網(wǎng)站內(nèi)容,請(qǐng)注明來(lái)源:杭州以勒標(biāo)準(zhǔn),感謝您的支持!更多法規(guī)資訊實(shí)時(shí)跟蹤,可搜索“以勒標(biāo)準(zhǔn)”官方微信公眾號(hào),獲取第一手法規(guī)資訊,掌握最佳貿(mào)易時(shí)機(jī)!
< 上一個(gè):專家文章|走進(jìn)計(jì)算毒理學(xué):QSAR從原理到應(yīng)用
> 下一個(gè):ICH M7(R2)指導(dǎo)原則的介紹與解讀
0571-8519 0521
157875742
infor@jirehstandard.com