ZenoTOF? 7600系統(tǒng):生物制藥從頭測序
?2021年,我國生物制品研制與生產(chǎn)取得多項重要突破。生物大分子藥物熱度持續(xù)增高,重組蛋白藥物、血液制品新增上市產(chǎn)品數(shù)量是2020年的6倍;細(xì)胞和基因治療藥物新增上市2款CAR-T產(chǎn)品,較2020年實現(xiàn)了零突破;全球首款吸入式疫苗研發(fā)取得突破。資本市場對生物藥領(lǐng)域持續(xù)加碼,投融資金額較2020年增長1.6倍,顯示我國生物藥領(lǐng)域擁有巨大創(chuàng)新活力和增長潛力[1].
抗體從頭測序在生物制藥行業(yè)中是非常重要的手段,在發(fā)現(xiàn)新的候選抗體藥物、鑒定用于研究的試劑以及生物仿制藥開發(fā)中創(chuàng)新產(chǎn)品的結(jié)構(gòu)確定等方面具有重要應(yīng)用。目前有多種算法和軟件可以根據(jù)肽段母離子質(zhì)量和二級碎片信息進(jìn)行從頭測序,此外,通過搜庫的方法也可以獲得更完整的信息。但是對于抗體而言,肽段從頭測序和搜庫策略都具有很大的挑戰(zhàn),因為抗體序列會針對特定抗原進(jìn)行微調(diào),每個免疫反應(yīng)都會產(chǎn)生獨(dú)特的抗體序列,人類中獨(dú)特抗體序列的數(shù)量預(yù)計約 100 億之多[2],這對于從頭測序或者蛋白質(zhì)搜庫來說是不可想象的。
目前在抗體從頭測序分析中,常用的策略包括譜圖的人工注解,迭代搜索及手動序列組裝,以及噬菌體展示與質(zhì)譜的正交結(jié)合方法等。但是這些方法非常復(fù)雜,時間成本很高,非常不適用于高通量分析需求。我們建立了高效的抗體自動從頭測序流程,利用ZenoTOF? 7600系統(tǒng)產(chǎn)出的碰撞誘導(dǎo)裂解(CID)和電子活化裂解(EAD)數(shù)據(jù),使用Protein Metrics軟件的De Novo sequencing功能,對曲妥珠單抗進(jìn)行了完整序列測定,序列覆蓋度達(dá)到100%,而且在EAD模式下產(chǎn)出的數(shù)據(jù),可以對亮氨酸和異亮氨酸進(jìn)行明確的區(qū)分,為抗體從頭測序提供了高通量和高可信度的方案。
曲妥珠單抗,作為抗Her 2的單克隆抗體,是第一個用于治療實體瘤的人源化單克隆抗體,第一個被批準(zhǔn)的酪氨酸激酶抑制劑,也是第一個成功以生物標(biāo)志物為引導(dǎo)的抗癌癥藥物。它通過將自身附著在Her 2上來阻止人體表皮細(xì)胞生長因子在Her 2上的附著,從而阻斷癌細(xì)胞的生長。
曲妥珠單抗自動從頭測序分析的序列覆蓋度
曲妥珠單抗樣品分別經(jīng)過Trypsin、GluC、Chymotrypsin、Pepsin和LysC五種酶酶解后得到的肽段樣品,在ZenoTOF? 7600系統(tǒng)中進(jìn)行CID和EAD數(shù)據(jù)采集,將數(shù)據(jù)文件導(dǎo)入Protein Metrics軟件中,在De Novo sequencing模塊中進(jìn)行分析。Protein Metrics軟件可以對曲妥珠單抗的重鏈和輕鏈序列進(jìn)行正確的解析,序列覆蓋度達(dá)到100%(圖1)。圖2展示了輕鏈 V 區(qū)的序列覆蓋度,可以看到所有三個互補(bǔ)決定區(qū)(CDR)均能很好地被鑒定到。氨基酸序列中綠色序列代表根據(jù)二級離子信息得到的高可信度序列,黃色突出顯示部分代表中可信度序列。 此外,可變翻譯后修飾位點在圖中進(jìn)行了標(biāo)注,可進(jìn)一步在軟件中查看。
圖1. 曲妥珠單抗從頭測序輕鏈和重鏈序列覆蓋度
圖2. 曲妥珠單抗輕鏈可變區(qū)序列覆蓋度
ZenoTOF? 7600系統(tǒng)搭載了Zeno TRAP模塊,大幅提高離子占空比,有助于提升二級譜圖質(zhì)量。無論在CID模式(圖3)還是EAD模式(圖4)下,7600系統(tǒng)都可以得到質(zhì)量很高的二級譜圖,BY離子或CZ離子的覆蓋度都很高,這對于從頭測序的分析來說具有重要意義。
圖3. CID模式下肽段二級譜圖及序列覆蓋
圖4. EAD模式下肽段二級譜圖及序列覆蓋
EAD模式可以很好地區(qū)分亮氨酸及異亮氨酸
在ZenoTOF? 7600系統(tǒng)可以實現(xiàn)EAD碎裂,因此可以對在CID模式下完全無法區(qū)分的同分異構(gòu)體亮氨酸和異亮氨酸進(jìn)行很好的鑒別,從而得到準(zhǔn)確的抗體序列。亮氨酸在EAD模式下可產(chǎn)生z-43的特征性離子,異亮氨酸產(chǎn)生z-29的特征性離子,根據(jù)特征性離子的不同可對二者進(jìn)行區(qū)分。圖5中展示了在EAD碎裂模式下,含有亮氨酸的序列中產(chǎn)生z-43離子,據(jù)此確定序列中氨基酸為亮氨酸,并且此肽段中包含三個亮氨酸,所有亮氨酸均可由二級譜圖中的z-29特征離子加以確認(rèn)。
圖5. 包含多各個亮氨酸的片段在EAD模式下的二級譜圖
結(jié)論
利用ZenoTOF? 7600系統(tǒng)產(chǎn)出的CID和EAD數(shù)據(jù),結(jié)合Protein Metrics軟件的De Novo sequencing功能,我們建立了高效的抗體從頭測序流程,適用于高通量的分析,并且使用EAD數(shù)據(jù)可以很好地區(qū)分亮氨酸和異亮氨酸,從而得到準(zhǔn)確可信的序列信息。
【1】2021生物藥領(lǐng)域發(fā)展回顧,火石創(chuàng)造
【2】Frank, A., Pevzner, P.: PepNovo: de novo peptide sequencing via probabilistic network modeling. Anal. Chem. 77, 964–973 (2005)