專利名稱:黃脂菌素的生物合成基因簇的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種生物醫(yī)學(xué)技術(shù)領(lǐng)域的基因簇,具體涉及的是一種具有抗革 蘭氏陽(yáng)性菌及抗腫瘤活性的抗生素一黃脂菌素(xantholipin)的生物合成基因簇。
背景技術(shù):
Xantholipin是灰黃鏈霉菌(Streptomyces flavogriseus)發(fā)酵產(chǎn)生的一種占噸酮 (xanthome)類抗生素。占噸酮類抗生素是一類具有特定結(jié)構(gòu)的微生物天然產(chǎn)物,目前 已發(fā)現(xiàn)二十多種,此類抗生素生物活性包括抑制細(xì)菌,真菌及細(xì)胞毒性,其活性位點(diǎn)主 要作用于細(xì)胞壁,能夠與合成細(xì)胞壁的前體物質(zhì)產(chǎn)生競(jìng)爭(zhēng)性抑制,從而干擾細(xì)胞壁的合 成。研究證實(shí)xantholipin對(duì)革蘭氏陽(yáng)性菌具有較廣泛的抑制作用,同時(shí)最近實(shí)驗(yàn)表 明其可抑制肝纖維化,腎小球腎炎,腎間質(zhì)腎炎等病癥中熱休克蛋白HSP47的大量表 達(dá),從而可作為此類病癥的潛力藥物。關(guān)于xantholipin的生物合成途徑至今尚未闡明,根據(jù)結(jié)構(gòu)推測(cè)其由13個(gè)丙二酰 輔酶A延伸形成碳骨架,后經(jīng)過(guò)一系列氧化還原酶,甲基轉(zhuǎn)移酶,鹵代酶,天冬酰氨合 酶等酶對(duì)其進(jìn)行復(fù)雜的后修飾,形成了高度氧化的占噸酮結(jié)構(gòu)。xantholipin的生物活性 與其結(jié)構(gòu)密切相關(guān),隨著xantholipin整個(gè)生物合成基因簇的克隆與功能分析,可以從分 子水平上闡明xantholipin獨(dú)特的生物合成機(jī)理,在此基礎(chǔ)上運(yùn)用代謝工程的原理,合理 修飾xantholipin的生物合成途徑,探索水溶性好,生物利用度高,活性更好,并能通過(guò) 微生物發(fā)酵大量生產(chǎn)的新型藥物。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,公開(kāi)一種黃脂菌素的生物合成基因 簇,本發(fā)明由鏈霉菌Streptomyces flavogriseus產(chǎn)生的具有抗革蘭氏陽(yáng)性菌及抗腫瘤活性的 抗生素xantholipin的生物合成基因簇的克隆、測(cè)序、分析及其應(yīng)用。本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的本發(fā)明包括49個(gè)基因的核苷酸序列或由序列1形成的互補(bǔ)序列,其中負(fù) 責(zé)合成碳骨架及對(duì)其進(jìn)行后修飾共二十九個(gè)基因xanOl、xan02、xan03、xan04、 xan05、xan06、xan07、xan08、xan09、xanOlO、xanMl、xanM2、xanM3、xanZl、 xanZ2、xanZ3、xanZ4、xanSl、xanS2、xanG、xanA、xanH、xanK、xanD、xanE、 xanF、xanCU xanC2、xanC3 ;負(fù)責(zé)提供碳骨架延伸單位及后修飾過(guò)程中的甲基供體共 八個(gè)基因xanBl、xanB2、xanB3、xanYl、xanY2、xanY3、xanY4、xanY5 ;負(fù)責(zé)對(duì) xantholipin的生物合成進(jìn)行調(diào)控共三個(gè)基因xanRl、xanR2、xanR3 ;負(fù)責(zé)為宿主菌提 供抗性共三個(gè)基因xanU、xanN、xanQ ;在此生物合成過(guò)程中還有六個(gè)基因xanJ、 xanP、xanL、xanW、xanT、xanV。本發(fā)明還提供了一個(gè)編碼腺苷高半胱氨酸水解酶的核苷酸序列,由序列2中的氨基酸序列組成,命名為xanYl,其基因核苷酸序列位于序列1中第1419-1堿基處。本發(fā)明還提供了一個(gè)編碼5,10-亞甲基四氫葉酸還原酶的核苷酸序列,由序列 3中的氨基酸序列組成,命名為xanY2,其基因核苷酸序列位于序列1中第2299-1397堿基處。本發(fā)明還提供了一個(gè)編碼甲硫氨酸合成酶的核苷酸序列,由序列4中的氨基酸 序列組成,命名為xanY3,其基因核苷酸序列位于序列1中第5802-2305堿基處。本發(fā)明還提供了一個(gè)編碼糖激酶的核苷酸序列,由序列5中的氨基酸序列組 成,命名為xanY4,其基因核苷酸序列位于序列1中第6791-5799堿基處。本發(fā)明還提供了一個(gè)編碼S-甲硫腺苷合酶的核苷酸序列,由序列6中的氨基酸 序列組成,命名為xanY5,其基因核苷酸序列位于序列1中第8037-6817堿基處。本發(fā)明還提供了一個(gè)編碼單加氧酶的核苷酸序列,由序列7中的氨基酸序列組 成,命名為xanOl,其基因核苷酸序列位于序列1中第8583-8146堿基處。本發(fā)明還提供了一個(gè)編碼脫氫酶的核苷酸序列,由序列8中的氨基酸序列組 成,命名為xanSl,其基因核苷酸序列位于序列1中第9803-8580堿基處。本發(fā)明還提供了一個(gè)編碼功能未知蛋白的核苷酸序列,由序列9中的氨基酸序 列組成,命名為xanJ,其基因核苷酸序列位于序列1中第9867-10595堿基處。本發(fā)明還提供了一個(gè)編碼孢子外衣蛋白的核苷酸序列,由序列10中的氨基酸序 列組成,命名為xanP,其基因核苷酸序列位于序列1中第10592-12211堿基處。本發(fā)明還提供了一個(gè)編碼糖基轉(zhuǎn)移酶的核苷酸序列,由序列11中的氨基酸序列 組成,命名為xanG,其基因核苷酸序列位于序列1中第12379-13554堿基處。本發(fā)明還提供了一個(gè)編碼天冬酰氨合酶的核苷酸序列,由序列12中的氨基酸序 列組成,命名為xanA,其基因核苷酸序列位于序列1中第13542-15386堿基處。本發(fā)明還提供了一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)因子的核苷酸序列,由序列13中的氨基酸序 列組成,命名為xanRl,其基因核苷酸序列位于序列1中第15392-16075堿基處。本發(fā)明還提供了一個(gè)編碼細(xì)胞色素P450羥化酶的核苷酸序列,由序列14中的氨 基酸序列組成,命名為xan02,其基因核苷酸序列位于序列1中第16114-17316堿基處。本發(fā)明還提供了一個(gè)編碼3Fe_S還原蛋白的核苷酸序列,由序列15中的氨基酸 序列組成,命名為xanK,其基因核苷酸序列位于序列1中第17333-17602堿基處。本發(fā)明還提供了一個(gè)編碼抗性轉(zhuǎn)運(yùn)蛋白的核苷酸序列,由序列16中的氨基酸序 列組成,命名為xanU,其基因核苷酸序列位于序列1中第17599-19728堿基處。本發(fā)明還提供了一個(gè)編碼黃素單加氧酶的核苷酸序列,由序列17中的氨基酸序 列組成,命名為xan03,其基因核苷酸序列位于序列1中第19908-21086堿基處。本發(fā)明還提供了一個(gè)編碼乳酸酰谷胱苷肽裂解酶的核苷酸序列,由序列18中的 氨基酸序列組成,命名為xanL,其基因核苷酸序列位于序列1中第21707-21147堿基處。本發(fā)明還提供了一個(gè)編碼非血紅素鹵化酶的核苷酸序列,由序列19中的氨基酸 序列組成,命名為xanH,其基因核苷酸序列位于序列1中第22057-23472堿基處。本發(fā)明還提供了一個(gè)編碼肽鏈轉(zhuǎn)移蛋白的核苷酸序列,由序列20中的氨基酸序 列組成,命名為xanQ,其基因核苷酸序列位于序列1中第23469-25070堿基處。本發(fā)明還提供了一個(gè)編碼氧甲基轉(zhuǎn)移酶的核苷酸序列,由序列21中的氨基酸序列組成,命名為xanMl,其基因核苷酸序列位于序列1中第25067-26086堿基處。本發(fā)明還提供了一個(gè)編碼還原酶的核苷酸序列,由序列22中的氨基酸序列組 成,命名為xanZl,其基因核苷酸序列位于序列1中第26651-27508堿基處。本發(fā)明還提供了一個(gè)編碼膜離子反向運(yùn)輸?shù)鞍椎暮塑账嵝蛄?,由序?3中的氨 基酸序列組成,命名為xanN,其基因核苷酸序列位于序列1中第28888-27593堿基處。本發(fā)明還提供了一個(gè)編碼功能未知蛋白的核苷酸序列,由序列24中的氨基酸序 列組成,命名為xanW,其基因核苷酸序列位于序列1中第29473-28985堿基處。本發(fā)明還提供了一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的核苷酸序列,由序列25中的氨基酸序 列組成,命名為xanR2,其基因核苷酸序列位于序列1中第29600-30061堿基處。本發(fā)明還提供了一個(gè)編碼氧甲基轉(zhuǎn)移酶的核苷酸序列,由序列26中的氨基酸序 列組成,命名為xanM2,其基因核苷酸序列位于序列1中第31105-30083堿基處。本發(fā)明還提供了一個(gè)編碼黃素單加氧酶的核苷酸序列,由序列27中的氨基酸序 列組成,命名為xan04,其基因核苷酸序列位于序列1中第32742-31120堿基處。本發(fā)明還提供了一個(gè)編碼甲基轉(zhuǎn)移酶的核苷酸序列,由序列28中的氨基酸序列 組成,命名為xanM3,其基因核苷酸序列位于序列1中第33084-34118堿基處。本發(fā)明還提供了一個(gè)編碼黃素單加氧酶的核苷酸序列,由序列29中的氨基酸序 列組成,命名為xan05,其基因核苷酸序列位于序列1中第34203-35798堿基處。本發(fā)明還提供了一個(gè)編碼還原酶的核苷酸序列,由序列30中的氨基酸序列組 成,命名為xanS2,其基因核苷酸序列位于序列1中第35868-36554堿基處。本發(fā)明還提供了一個(gè)編碼氧化還原酶的核苷酸序列,由序列31中的氨基酸序列 組成,命名為xanZ2,其基因核苷酸序列位于序列1中第37667-36759堿基處。本發(fā)明還提供了一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的核苷酸序列,由序列32中的氨基酸序 列組成,命名為xanR3,其基因核苷酸序列位于序列1中第37715-38722堿基處。本發(fā)明還提供了一個(gè)編碼生物素羧化酶的核苷酸序列,由序列33中的氨基酸序 列組成,命名為xanBl,其基因核苷酸序列位于序列1中第40187-38844堿基處。本發(fā)明還提供了一個(gè)編碼生物素羧基載體蛋白的核苷酸序列,由序列34中的氨 基酸序列組成,命名為xanB2,其基因核苷酸序列位于序列1中第40714-40190堿基處。本發(fā)明還提供了一個(gè)編碼羧基轉(zhuǎn)移酶的核苷酸序列,由序列35中的氨基酸序列 組成,命名為xanB3,其基因核苷酸序列位于序列1中第42468-40774堿基處。本發(fā)明還提供了一個(gè)編碼單加氧酶的核苷酸序列,由序列36中的氨基酸序列組 成,命名為xan06,其基因核苷酸序列位于序列1中第42857-42546堿基處。本發(fā)明還提供了一個(gè)編碼單加氧酶的核苷酸序列,由序列37中的氨基酸序列組 成,命名為xan07,其基因核苷酸序列位于序列1中第43194-42847堿基處。本發(fā)明還提供了一個(gè)編碼3-氧酰-?;d體蛋白還原酶的核苷酸序列,由序列 38中的氨基酸序列組成,命名為xanZ3,其基因核苷酸序列位于序列1中第43946-43194 堿基處。本發(fā)明還提供了一個(gè)編碼單加氧酶的核苷酸序列,由序列39中的氨基酸序列組 成,命名為xanOS,其基因核苷酸序列位于序列1中第44431-43970堿基處。本發(fā)明還提供了一個(gè)編碼環(huán)化酶的核苷酸序列,由序列40中的氨基酸序列組成,命名為xanCl,其基因核苷酸序列位于序列1中第44909-44442堿基處。本發(fā)明還提供了一個(gè)編碼β -酮酰合酶β的核苷酸序列,由序列41中的氨基酸 序列組成,命名為xanE,其基因核苷酸序列位于序列1中第46303-45017堿基處。本發(fā)明還提供了一個(gè)編碼β -酮酰合酶α的核苷酸序列,由序列42中的氨基酸 序列組成,命名為xanF,其基因核苷酸序列位于序列1中第47583-46306堿基處。本發(fā)明還提供了一個(gè)編碼環(huán)化酶的核苷酸序列,由序列43中的氨基酸序列組 成,命名為xanC2,其基因核苷酸序列位于序列1中第48014-47580堿基處。本發(fā)明還提供了 一個(gè)編碼CurD同源蛋白的核苷酸序列,由序列44中的氨基酸序 列組成,命名為xanT,其基因核苷酸序列位于序列1中第48198-48584堿基處。本發(fā)明還提供了一個(gè)編碼氧化酶類似蛋白的核苷酸序列,由序列45中的氨基酸 序列組成,命名為xan09,其基因核苷酸序列位于序列1中第48596-50014堿基處。本發(fā)明還提供了一個(gè)編碼單加氧酶的核苷酸序列,由序列46中的氨基酸序列組 成,命名為xanOlO,其基因核苷酸序列位于序列1中第50513-50067堿基處。本發(fā)明還提供了一個(gè)編碼功能未知蛋白的核苷酸序列,由序列47中的氨基酸序 列組成,命名為xanV,其基因核苷酸序列位于序列1中第50908-50528堿基處。本發(fā)明還提供了一個(gè)編碼3-氧酰-?;d體蛋白還原酶的核苷酸序列,由序列 48中的氨基酸序列組成,命名為xanZ4,其基因核苷酸序列位于序列1中第51663-50908 堿基處。本發(fā)明還提供了一個(gè)編碼?;d體蛋白的核苷酸序列,由序列49中的氨基酸序 列組成,命名為xanD,其基因核苷酸序列位于序列1中第51920-51660堿基處。本發(fā)明還提供了一個(gè)編碼環(huán)化酶的核苷酸序列,由序列50中的氨基酸序列組 成,命名為xanC3,其基因核苷酸序列位于序列1中第52255-51917堿基處。所述的序列1的互補(bǔ)序列可依據(jù)DNA堿基互補(bǔ)原則隨時(shí)得到,序列1的核苷酸 序列或部分核苷酸序列可以通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或用限制性內(nèi)切酶酶切DNA得 到。所述的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的方 法或包含本發(fā)明序列的DNA作為探針進(jìn)行Southern雜交的方法從其他微生物中得到 xantholipin生物合成基因的同源基因。所述的從至少攜帶有部分序列1重組載體中,或從微生物文庫(kù)中,或從微生物 基因組DNA中分離xantholipin生物合成基因的途徑。所述的得到至少包含部分序列1中DNA序列的重組DNA載體的途徑。所述的產(chǎn)生在基因組中有xantholipin生物合成基因被改造或缺失的微生物體的途徑。本發(fā)明提供的核苷酸序列或多個(gè)序列可以與載體序列融合而得到重組序列和相 應(yīng)的DNA分子。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過(guò) 打斷xantholipin生物合成的一個(gè)或幾個(gè)合成步驟而得到新的xantholipin衍生物。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段可以通過(guò) 打斷xantholipin生物合成的一個(gè)或幾個(gè)修飾步驟而得到新的xantholipin衍生物。
包含DNA片段或基因可以用來(lái)提高xantholipin或其衍生物的產(chǎn)量。例如,轉(zhuǎn)入 更多拷貝的正調(diào)節(jié)基因或打斷負(fù)調(diào)節(jié)基因。包含本發(fā)明所提供核苷酸序列或至少部分序列的克隆DNA可用來(lái)從鏈霉菌 xantholipin基因組文庫(kù)中定位更多的文庫(kù)粘粒。這些文庫(kù)質(zhì)粒至少包含有本發(fā)明中的部 分序列,也包含有鏈霉菌xantholipin基因組中以前鄰近區(qū)域未克隆的DNA。所述的核苷酸序列可以被修飾或突變。這些途徑包括插入或置換,聚合酶鏈?zhǔn)?反應(yīng),錯(cuò)誤介導(dǎo)聚合酶鏈?zhǔn)椒磻?yīng),位點(diǎn)特異性突變,或與其它來(lái)源的同源序列進(jìn)行直接 進(jìn)化(DNAshuffling)等。包含本發(fā)明的序列或至少部分序列的克隆基因可以通過(guò)合適的表達(dá)系統(tǒng)在外源 宿主中表達(dá)以得到修飾的酶或更高的生物活性或更高的產(chǎn)量。這些外源宿主包括鏈霉 菌,大腸桿菌,芽孢桿菌,酵母,植物和動(dòng)物細(xì)胞等。xantholipin生物合成修飾基因,調(diào)節(jié)基因,抗性相關(guān)基因的核苷酸序列提供了 通過(guò)缺失或改造這些修飾基因,調(diào)節(jié)基因,轉(zhuǎn)運(yùn)基因而得到xantholipin結(jié)構(gòu)衍生物或 xantholipin及其衍生物產(chǎn)量提高的途徑。包含本發(fā)明的氨基酸序列或至少部分序列(序列2-50)的多肽可能在去除或替代 某個(gè)或某些氨基酸之后仍有生物活性甚至有新的生物學(xué)活性,或者提高了產(chǎn)量或優(yōu)化蛋 白動(dòng)力學(xué)特征或其它致力于得到的性質(zhì)。本發(fā)明包含的氨基酸序列或基因序列可以通過(guò)轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、接合轉(zhuǎn)移等方式轉(zhuǎn) 入到其他與核苷類抗生素產(chǎn)生菌中,從而產(chǎn)生該抗生素的衍生物。本發(fā)明提供的xantholipin生物合成相關(guān)的所有基因和蛋白信息,有助于闡明與 理解xantholipin及相關(guān)占噸酮類抗生素家族生物合成的分子機(jī)理,從而為進(jìn)一步利用基 因工程手段改造提供理論基礎(chǔ)與材料。本發(fā)明提供的基因及其所編碼的蛋白質(zhì),也可以 用來(lái)查找和發(fā)展可用于醫(yī)藥,工業(yè),農(nóng)業(yè)的化合物或蛋白。
圖IXantholipin 的化學(xué)結(jié)構(gòu)。圖2Xanth0lipin生物合成基因簇的結(jié)構(gòu)組成與限制性內(nèi)切酶譜。其中(A)3個(gè)重疊的粘粒代表了灰黃鏈霉菌基因組92kb的DNA區(qū)域,探針1_3 表示探針部分;(B)Xantholipin生物合成基因簇的結(jié)構(gòu)組成。圖3 40kb片段缺失突變株的構(gòu)建與檢測(cè)。其中(A)構(gòu)建40kb片段缺失突變株的過(guò)程示意圖;(B)大片段缺失突變株的在培養(yǎng)基ISP-3的生長(zhǎng)表型,(1)平板正面菌絲及孢子 表型a:野生型,b-c:大片段缺失突變株;(2)平板反面產(chǎn)色素表型a :野生型,b-c: 大片段缺失突變株;(C)大片段缺失突變株的HPLC (高效液相色譜)檢測(cè),Wild type Streptomyces flavogriseus野生型,ZWKl 40kb片段缺失突變株。圖4灰黃鏈霉菌發(fā)酵產(chǎn)物的MS (質(zhì)譜)檢測(cè)。 圖5本發(fā)明xantholipin的生物合成途徑示意圖。
具體實(shí)施例方式下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明,本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn) 行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的 實(shí)施例。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,或按照制造廠 商所建議的條件。以下實(shí)施例中所涉及的菌種保藏信息如下灰黃鏈霉菌(Streptomyces flavogriseus)分離于山東南長(zhǎng)山島潮間帶植物根際土
壤,現(xiàn)保藏于中國(guó)典型培養(yǎng)物保藏中心(CCTCC,武漢大學(xué)(武漢市武昌珞珈山,郵編 430072,電話(027)-68752319),中國(guó)武漢),保藏日期2010年7月20日,保藏編號(hào) CCTCC NO.M2010183。大腸桿菌DHlOB 購(gòu)買自美國(guó)馬里蘭州蓋色斯堡生物制劑公司Gibco-BRL。l.xantholipin生物合成基因簇的克隆、分析如圖1所示,xantholipin屬于II型聚酮合酶合成的占噸酮類抗生素,與Iysolipin
結(jié)構(gòu)相似。由于兩者在類似位置均有氯原子,推測(cè)其合成基因簇中有同源性較高的鹵 代酶。利用Iysolipin鹵代酶的核苷酸保守序列設(shè)計(jì)一對(duì)PCR(聚合酶鏈?zhǔn)椒磻?yīng))弓丨物 (5' -CCGACGGCTGGTTCTGGTCCATCCC-3‘)禾Π (5' -ACAGCAGCGGGTCGA GGAAGCAGGC-3’ )成功從xantholipin產(chǎn)生菌灰黃鏈霉菌中擴(kuò)增出一條預(yù)期大小的特 異性產(chǎn)物,序列分析表明兩者氨基酸序列的同源性達(dá)70%。根據(jù)此引物出發(fā),利用PCR 技術(shù)從灰黃鏈霉菌中克隆出陽(yáng)性克隆。進(jìn)一步的基因中斷實(shí)驗(yàn)表明,40kb的缺失突變株 完全喪失xantholipin的產(chǎn)生能力(圖3C)。通過(guò)染色體步移(chromosome walking)獲得 了 3個(gè)相互重疊的粘粒,覆蓋了染色體上約92kb的區(qū)域(圖2A),DNA測(cè)序了染色體上 92445bp連續(xù)區(qū)域,GC含量為70.8%。生物信息學(xué)分析包含了 86個(gè)開(kāi)放讀碼框,對(duì)其 中的58個(gè)開(kāi)放讀碼框進(jìn)行進(jìn)一步實(shí)驗(yàn)研究,如圖2B所示。2.40kb片段缺失28B8是包含xanU到orflO約40kb片段的載體,通過(guò)將其外源片段兩端的KpnI 片段克隆到穿梭載體上,導(dǎo)入到灰黃鏈霉菌中對(duì)xanU到orflO約40kb片段進(jìn)行缺失, 研究證實(shí)此40kb片段缺失突變株喪失了產(chǎn)生xantholipin的能力,說(shuō)明此40kb片段與 xantholipin的生物合成相關(guān)。xantholipin本身是黃色化合物,野生型灰黃鏈霉菌會(huì)產(chǎn)生 xantholipin使培養(yǎng)基顯示黃色,而ZWKl突變株培養(yǎng)基仍為原始的乳白色,證實(shí)了 xanU 到orf 10約40kb片段與xantholipin的生物合成直接相關(guān)。HPLC檢測(cè)說(shuō)明,xantholipin 標(biāo)準(zhǔn)品和野生型能在保留時(shí)間28.6分鐘左右出現(xiàn)xantholipin的特征性峰,而ZWKl突變 株則沒(méi)有(圖3C),從而進(jìn)一步證實(shí)xanU到orflO與xantholipin的生物合成直接相關(guān)。3.Xantholipin生物合成基因簇邊界的確定根據(jù)基因編碼蛋白的功能分析,xantholipin的生物合成基因簇被確定為從基因 xanYl到xanC3,涵蓋了染色體上52kb的區(qū)域,包含49個(gè)開(kāi)放讀碼框。通過(guò)基因中斷 實(shí)驗(yàn)進(jìn)一步確認(rèn)了 xantholipin生物合成基因簇的邊界。中斷orfl,orf2, orf3, orf4, orf5發(fā)現(xiàn)不會(huì)影響xantholipin的生物合成。根據(jù)生物信息學(xué)分析orfl-orf5所編碼的蛋 白與xantholipin的生物合成無(wú)關(guān),而xanYl_xanY5所編碼的蛋白與xantholipin后修飾相關(guān),因此xanYl被確定為xantholipin生物合成基因簇的左邊界。同時(shí)中斷orf6-orfll對(duì) xantholipin的生物合成也沒(méi)有影響,而根據(jù)生物信息學(xué)分析xanC3是負(fù)責(zé)xantholipin生物 合成的結(jié)構(gòu)基因,所以xanC3被確定為xantholipin生物合成的右邊界。4.Xantholipin的生物合成途徑(A)碳骨架的合成13個(gè)丙二酰輔酶A在xanD,xanE, xanF分別編碼的酰基載體蛋白,β -酮酰 合酶α,β-酮酰合酶β的共同作用下形成了 26個(gè)碳原子的聚酮長(zhǎng)鏈,然后在xanZl, xanZ3, xanZ4編碼的酮基還原酶的催化下,11位的酮基被還原為羥基,從而造成碳鏈 空間結(jié)構(gòu)的折疊,接著xanCl,xanC2, xanC3編碼的環(huán)化酶催化了碳鏈的進(jìn)一步折疊及 C9, C14環(huán)化,C7,C16環(huán)化,C5,C18環(huán)化,C4,C21環(huán)化,C2,C23環(huán)化,然后天 冬酰胺合酶將從天冬酰胺水解的氨基轉(zhuǎn)移到一位碳原子與羧基中的羥基發(fā)生置換反應(yīng), 新生成的氨基與26位酮基發(fā)生自發(fā)環(huán)化反應(yīng),形成核心的碳骨架結(jié)構(gòu)。(B)后修飾途徑新形成的碳骨架在一系列單加氧酶及氧化還原酶的催化下發(fā)生了 C3,C4,C6, C8, C15,C17,C19,C22八個(gè)位置的氧化還原,然后在xan04,xan05編碼的黃素單 加氧酶的作用下發(fā)生Bayer-Villiger氧化反應(yīng)在C14,C15碳碳鍵中插入氧原子形成內(nèi)酯 結(jié)構(gòu),隨后發(fā)生7元環(huán)的分子重排將C15變?yōu)檠踉?,接下?lái)xanMl,xanM2, xanM3 編碼的甲基轉(zhuǎn)移酶催化了 C13,C19位羥基的氧甲基化,然后在Xan02編碼的細(xì)胞色素 P450氧化酶作用下C17位的羥基與C19位的氧甲基發(fā)生環(huán)化形成亞甲基雙氧橋的結(jié)構(gòu), 最后在xanH編碼的鹵代酶的催化下將氯原子加載到C12位發(fā)生苯環(huán)的氯代,從而最終形 成了化合物 xantholipin。實(shí)施例1Xantholipin產(chǎn)生菌灰黃鏈霉菌基因組DNA的提取接種20 μ 1 20%甘油保存的灰黃鏈霉菌孢子至5ml的種子培養(yǎng)基(葡萄糖10g, 可溶性淀粉25g,酵母提取物2g,魚粉5g,棉籽餅粉3g,酪蛋白酸解物3g,碳酸鈣2g, 蒸餾水1000ml,pH7.2)中,置于30°C搖床培養(yǎng)36小時(shí),離心收集菌體待用,用500 μ 1 溶菌酶溶液重新懸浮50mg菌絲體,在37°C溫育約30min,或溫育至細(xì)胞成為半透明狀。 WASOOyU^SDS,混合振蕩約Imin直到溶液的粘度顯著下降,37°C溫育20min,然后 加入25 μ 1中性苯酚/氯仿,混合振蕩均勻后,12000r/min離心5min,移取上清液,棄去 白色中間層。用中性苯酚/氯仿重復(fù)二次抽提直至看不見(jiàn)(或非常少)中間層為止,最 后加入0.1倍體積的3M醋酸鈉(pH自然),混合后加入1倍體積的異丙醇(或2.2倍體 積的無(wú)水乙醇),再次混合后在室溫下放置5min(或者在_20°C放置30min),12000r/min 離心,棄去上清液,用70%乙醇洗滌DNA沉淀兩次,最后棄去所有上清液,待乙醇揮發(fā) 后,溶解于一定量TE緩沖液中。實(shí)施例2Xantholipin產(chǎn)生菌灰黃鏈霉菌接合轉(zhuǎn)移系統(tǒng)的建立收集生長(zhǎng)于ISP-3培養(yǎng)基灰黃鏈霉菌的新鮮孢子備用。含有OriT的目標(biāo)質(zhì)粒必 須在輔助質(zhì)粒PUZ8002的協(xié)助下,才能通過(guò)接合轉(zhuǎn)移導(dǎo)入到受體鏈霉菌細(xì)胞中。先將待 轉(zhuǎn)移到灰黃鏈霉菌中的質(zhì)粒轉(zhuǎn)化大腸桿菌ET12567/pUZ8002,然后培養(yǎng)含目標(biāo)質(zhì)粒的大腸桿菌ET12567/pUZ8002,12h后收集菌體,用新鮮LB培養(yǎng)基洗滌菌體2次備用。作為 受體的鏈霉菌孢子需經(jīng)熱激和預(yù)萌發(fā)處理。將鏈霉菌孢子重新懸浮于5ml 0.05M pH8.0的 TES緩沖液中,在50°C水浴中熱激lOmin,冷卻至室溫后加入等體積2 X孢子預(yù)萌發(fā)培養(yǎng) 基(Oxide酵母膏10%,Oxide酪蛋白氨基酸1%,CaCl2(XOlM)(需配制5M的原液,分 開(kāi)滅菌后加到酵母膏酪蛋白氨基酸溶液中)預(yù)萌發(fā)2-3h,離心收集孢子并重新懸浮于適 量的LB中,在混合器上振蕩打散孢子,按IO8 IO8與大腸桿菌細(xì)胞等量混合,26-30h 后用Iml無(wú)菌水含適量抗生素和萘啶酮酸(用來(lái)抑制大腸桿菌的生長(zhǎng))來(lái)覆蓋,置30°C 培養(yǎng)數(shù)天后即可看到接合子。實(shí)施例3Xantholipin產(chǎn)生菌灰黃鏈霉菌基因組文庫(kù)的構(gòu)建與篩選基因組文庫(kù)的構(gòu)建方法參照試劑盒CopyControl Fosmid Library Production Kit
提供的實(shí)驗(yàn)方法。利用lysolipin鹵代酶的核苷酸保守序列設(shè)計(jì)一對(duì)PCR(聚合酶鏈?zhǔn)椒磻?yīng))引 物(5,-CCGACGGCTGGTTCTGGTCCATCCC-3,)禾口(5,-ACAGCAGCGGGTCGA GGAAGCAGGC-3,)成功從xantholipin產(chǎn)生菌灰黃鏈霉菌中擴(kuò)增出一條預(yù)期大小的 特異性產(chǎn)物,序列分析表明兩者氨基酸序列的同源性達(dá)70%。根據(jù)此引物出發(fā),利用 PCR(聚合酶鏈?zhǔn)椒磻?yīng))來(lái)篩選基因組文庫(kù),首先將每個(gè)96孔板的克隆混合培養(yǎng),提混合 粘粒作為模板然后進(jìn)行PCR反應(yīng),先將陽(yáng)性信號(hào)定位于每個(gè)96孔板,同樣的方法接著定 位于排,最后定位于點(diǎn)。實(shí)施例4Xantholipin的發(fā)酵、分離純化及分析鑒定發(fā)酵流程凍干管中菌種用種子培養(yǎng)基傳一代后涂于ISP3培養(yǎng)基,7天后收孢子于甘油管 中保存。甘油管中取適量孢子(約50ul)接種至80ml種子培養(yǎng)基(500ml三角瓶)(葡 萄糖10g,可溶性淀粉25g,酵母提取物2g,魚粉5g,棉籽餅粉3g,酪蛋白酸解物3g, 碳酸鈣2g,蒸餾水1000ml,pH 7.2), 30°C, 220rpm培養(yǎng)2天。以5%的接種量將種子 接種至80ml發(fā)酵培養(yǎng)基中(500ml三角瓶)(葡萄糖10g,糊精25g,燕麥粉20g,棉籽餅 粉10g,魚粉5g,酵母提取物2g,碳酸鈣3g,蒸餾水定容至1000ml,滅菌前將PH調(diào)至 7.2),30°C, 220rpm 培養(yǎng) 6 天。發(fā)酵過(guò)程測(cè)過(guò)pH值,前兩天都在5-6,放瓶時(shí)pH 8-8.5。分離純化將80ml發(fā)酵液用等體積的丙酮浸泡,室溫過(guò)夜。然后離心,棄菌體,取上清, 45°C旋轉(zhuǎn)蒸掉丙酮,剩余水相用約80ml乙酸乙酯萃取,然后將乙酸乙酯45°C旋轉(zhuǎn)蒸干, 用約Iml甲醇溶解,-70°C保存。HPLC分離條件將粗品溶于甲醇后,離心取上清,過(guò)0.22μιη的有機(jī)相濾膜,用于HPLC分 析或LC/MS分析。HPLC的分離條件為,流動(dòng)相Α: 0.2%甲酸,0.1%三氟乙酸超純 水,流動(dòng)相B: HPLC級(jí)乙腈,檢測(cè)波長(zhǎng)384nm,0_3min內(nèi),流動(dòng)相B相應(yīng)從10%升至 20% ; 3-50min,流動(dòng)相 B 從 20%升至 55% ; 50-52min,流動(dòng)
權(quán)利要求
1.一種黃脂菌素的生物合成基因簇,其特征在于,包括49個(gè)基因的核苷酸序列或 由序列1形成的互補(bǔ)序列,其中負(fù)責(zé)合成碳骨架及對(duì)其進(jìn)行后修飾共二十九個(gè)基因 xanOl、xan02、xan03、xan04、xan05、xan06、xan07、xan08、xan09、xanOlO、 xanMl、xanM2、xanM3、xanZl、xanZ2、xanZ3、xanZ4、xanSl、xanS2、xanG、 xanA、xanH、xanK、xanD、xanE、xanF、xanCl、xanC2、xanC3 ;負(fù)責(zé)提供碳骨架延伸 單位及后修飾過(guò)程中的甲基供體共八個(gè)基因xanBl、xanB2、xanB3、xanYl、xanY2、 xanY3、xanY4、xanY5 ;負(fù)責(zé)對(duì)xantholipin的生物合成進(jìn)行調(diào)控共三個(gè)基因xanRl、 xanR2、xanR3 ;負(fù)責(zé)為宿主菌提供抗性共三個(gè)基因xanU、xanN、xanQ ;在此生物合 成過(guò)程中還有六個(gè)基因xanJ、xanP、xanL、xanW、xanT、xanV。
2.根據(jù)權(quán)利要求1所述的黃脂菌素的生物合成基因簇,其特征是,所述的序列1, 一個(gè)編碼腺苷高半胱氨酸水解酶的核苷酸序列由序列2中的氨基酸序列組成,命名為 xanYl,其基因核苷酸序列位于序列1中第1419-1堿基處;一個(gè)編碼5,10-亞甲基四氫葉酸還原酶的核苷酸序列由序列3中的氨基酸序列組 成,命名為xanY2,其基因核苷酸序列位于序列1中第2299-1397堿基處;一個(gè)編碼甲硫氨酸合成酶的核苷酸序列由序列4中的氨基酸序列組成,命名為 xanY3,其基因核苷酸序列位于序列1中第5802-2305堿基處;一個(gè)編碼糖激酶的核苷酸序列由序列5中的氨基酸序列組成,命名為xanY4,其基因 核苷酸序列位于序列1中第6791-5799堿基處。一個(gè)編碼S-甲硫腺苷合酶的核苷酸序列由序列6中的氨基酸序列組成,命名為 xanY5,其基因核苷酸序列位于序列1中第8037-6817堿基處;一個(gè)編碼單加氧酶的核苷酸序列由序列7中的氨基酸序列組成,命名為xanOl,其基 因核苷酸序列位于序列1中第8583-8146堿基處;一個(gè)編碼脫氫酶的核苷酸序列由序列8中的氨基酸序列組成,命名為xanSl,其基因 核苷酸序列位于序列1中第9803-8580堿基處;一個(gè)編碼功能未知蛋白的核苷酸序列由序列9中的氨基酸序列組成,命名為xanJ,其 基因核苷酸序列位于序列1中第9867-10595堿基處;一個(gè)編碼孢子外衣蛋白的核苷酸序列由序列10中的氨基酸序列組成,命名為xanP, 其基因核苷酸序列位于序列1中第10592-12211堿基處;一個(gè)編碼糖基轉(zhuǎn)移酶的核苷酸序列由序列11中的氨基酸序列組成,命名為xanG,其 基因核苷酸序列位于序列1中第12379-13554堿基處;一個(gè)編碼天冬酰氨合酶的核苷酸序列由序列12中的氨基酸序列組成,命名為xanA, 其基因核苷酸序列位于序列1中第13542-15386堿基處;一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)因子的核苷酸序列由序列13中的氨基酸序列組成,命名為 xanRl,其基因核苷酸序列位于序列1中第15392-16075堿基處;一個(gè)編碼細(xì)胞色素P450羥化酶的核苷酸序列由序列14中的氨基酸序列組成,命名為 xan02,其基因核苷酸序列位于序列1中第16114-17316堿基處;一個(gè)編碼3Fe_S還原蛋白的核苷酸序列由序列15中的氨基酸序列組成,命名為 xanK,其基因核苷酸序列位于序列1中第17333-17602堿基處;一個(gè)編碼抗性轉(zhuǎn)運(yùn)蛋白的核苷酸序列由序列16中的氨基酸序列組成,命名為xanU,其基因核苷酸序列位于序列1中第17599-19728堿基處;一個(gè)編碼黃素單加氧酶的核苷酸序列由序列17中的氨基酸序列組成,命名為 xan03,其基因核苷酸序列位于序列1中第19908-21086堿基處;一個(gè)編碼乳酸酰谷胱苷肽裂解酶的核苷酸序列由序列18中的氨基酸序列組成,命名 為xanL,其基因核苷酸序列位于序列1中第21707-21147堿基處;一個(gè)編碼非血紅素鹵化酶的核苷酸序列由序列19中的氨基酸序列組成,命名為 xanH,其基因核苷酸序列位于序列1中第22057-23472堿基處;一個(gè)編碼肽鏈轉(zhuǎn)移蛋白的核苷酸序列由序列20中的氨基酸序列組成,命名為xanQ, 其基因核苷酸序列位于序列1中第23469-25070堿基處;一個(gè)編碼氧甲基轉(zhuǎn)移酶的核苷酸序列由序列21中的氨基酸序列組成,命名為 xanMl,其基因核苷酸序列位于序列1中第25067-26086堿基處;一個(gè)編碼還原酶的核苷酸序列由序列22中的氨基酸序列組成,命名為xanZl,其基 因核苷酸序列位于序列1中第26651-27508堿基處;一個(gè)編碼膜離子反向運(yùn)輸?shù)鞍椎暮塑账嵝蛄杏尚蛄?3中的氨基酸序列組成,命名為 xanN,其基因核苷酸序列位于序列1中第28888-27593堿基處;一個(gè)編碼功能未知蛋白的核苷酸序列由序列24中的氨基酸序列組成,命名為 xanW,其基因核苷酸序列位于序列1中第29473-28985堿基處;一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的核苷酸序列由序列25中的氨基酸序列組成,命名為 xanR2,其基因核苷酸序列位于序列1中第29600-30061堿基處;一個(gè)編碼氧甲基轉(zhuǎn)移酶的核苷酸序列由序列26中的氨基酸序列組成,命名為 xanM2,其基因核苷酸序列位于序列1中第31105-30083堿基處;一個(gè)編碼黃素單加氧酶的核苷酸序列由序列27中的氨基酸序列組成,命名為 xan04,其基因核苷酸序列位于序列1中第32742-31120堿基處;一個(gè)編碼甲基轉(zhuǎn)移酶的核苷酸序列由序列28中的氨基酸序列組成,命名為xanM3, 其基因核苷酸序列位于序列1中第33084-34118堿基處;一個(gè)編碼黃素單加氧酶的核苷酸序列由序列29中的氨基酸序列組成,命名為 xan05,其基因核苷酸序列位于序列1中第34203-35798堿基處;一個(gè)編碼還原酶的核苷酸序列由序列30中的氨基酸序列組成,命名為xanS2,其基 因核苷酸序列位于序列1中第35868-36554堿基處;一個(gè)編碼氧化還原酶的核苷酸序列由序列31中的氨基酸序列組成,命名為xanZ2, 其基因核苷酸序列位于序列1中第37667-36759堿基處;一個(gè)編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的核苷酸序列由序列32中的氨基酸序列組成,命名為 xanR3,其基因核苷酸序列位于序列1中第37715-38722堿基處;一個(gè)編碼生物素羧化酶的核苷酸序列由序列33中的氨基酸序列組成,命名為 xanBl,其基因核苷酸序列位于序列1中第40187-38844堿基處;一個(gè)編碼生物素羧基載體蛋白的核苷酸序列由序列34中的氨基酸序列組成,命名為 xanB2,其基因核苷酸序列位于序列1中第40714-40190堿基處;一個(gè)編碼羧基轉(zhuǎn)移酶的核苷酸序列由序列35中的氨基酸序列組成,命名為xanB3, 其基因核苷酸序列位于序列1中第42468-40774堿基處;一個(gè)編碼單加氧酶的核苷酸序列由序列36中的氨基酸序列組成,命名為Xan06,其 基因核苷酸序列位于序列1中第42857-42546堿基處;一個(gè)編碼單加氧酶的核苷酸序列由序列37中的氨基酸序列組成,命名為Xan07,其 基因核苷酸序列位于序列1中第43194-42847堿基處;一個(gè)編碼3-氧酰-酰基載體蛋白還原酶的核苷酸序列由序列38中的氨基酸序列組 成,命名為xanZ3,其基因核苷酸序列位于序列1中第43946-43194堿基處;一個(gè)編碼單加氧酶的核苷酸序列由序列39中的氨基酸序列組成,命名為xanOS,其 基因核苷酸序列位于序列1中第44431-43970堿基處;一個(gè)編碼環(huán)化酶的核苷酸序列由序列40中的氨基酸序列組成,命名為xanCl,其基 因核苷酸序列位于序列1中第44909-44442堿基處;一個(gè)編碼β-酮酰合酶β的核苷酸序列由序列41中的氨基酸序列組成,命名為 xanE,其基因核苷酸序列位于序列1中第46303-45017堿基處;一個(gè)編碼β-酮酰合酶α的核苷酸序列由序列42中的氨基酸序列組成,命名為 xanF,其基因核苷酸序列位于序列1中第47583-46306堿基處;一個(gè)編碼環(huán)化酶的核苷酸序列由序列43中的氨基酸序列組成,命名為xanC2,其基 因核苷酸序列位于序列1中第48014-47580堿基處;一個(gè)編碼CurD同源蛋白的核苷酸序列由序列44中的氨基酸序列組成,命名為 xanT,其基因核苷酸序列位于序列1中第48198-48584堿基處;一個(gè)編碼氧化酶類似蛋白的核苷酸序列由序列45中的氨基酸序列組成,命名為 xan09,其基因核苷酸序列位于序列1中第48596-50014堿基處;一個(gè)編碼單加氧酶的核苷酸序列由序列46中的氨基酸序列組成,命名為xanOlO,其 基因核苷酸序列位于序列1中第50513-50067堿基處;一個(gè)編碼功能未知蛋白的核苷酸序列由序列47中的氨基酸序列組成,命名為xanV, 其基因核苷酸序列位于序列1中第50908-50528堿基處;一個(gè)編碼3-氧酰-酰基載體蛋白還原酶的核苷酸序列由序列48中的氨基酸序列組 成,命名為xanZ4,其基因核苷酸序列位于序列1中第51663-50908堿基處;一個(gè)編碼?;d體蛋白的核苷酸序列由序列49中的氨基酸序列組成,命名為xanD, 其基因核苷酸序列位于序列1中第51920-51660堿基處;一個(gè)編碼環(huán)化酶的核苷酸序列由序列50中的氨基酸序列組成,命名為xanC3,其基 因核苷酸序列位于序列1中第52255-51917堿基處。
3.根據(jù)權(quán)利要求1或者2所述的黃脂菌素的生物合成基因簇,其特征是,所述的序 列1的核苷酸序列或部分核苷酸序列通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)或用限制性內(nèi)切酶酶切DNA得 到。
4.根據(jù)權(quán)利要求1或者2所述的黃脂菌素的生物合成基因簇,其特征是,所述的核苷 酸序列或部分核苷酸序列,利用聚合酶鏈?zhǔn)椒磻?yīng)的方法或以上市地方序列的DNA作為探 針進(jìn)行Southern雜交的方法得到xantholipin生物合成基因的同源基因。
5.根據(jù)權(quán)利要求1或者2所述的黃脂菌素的生物合成基因簇,其特征是,所述的核苷 酸序列或至少部分序列的克隆基因或DNA片段通過(guò)打斷xantholipin生物合成的一個(gè)或幾 個(gè)合成步驟而得到xantholipin衍生物。
6.根據(jù)權(quán)利要求1或者2所述的黃脂菌素的生物合成基因簇,其特征是,所述的核苷 酸序列或至少部分序列的克隆基因或DNA片段通過(guò)打斷xantholipin生物合成的一個(gè)或幾 個(gè)修飾步驟而得到新的xantholipin衍生物。
全文摘要
一種生物醫(yī)學(xué)技術(shù)領(lǐng)域的黃脂菌素的生物合成基因簇,包括49個(gè)基因的核苷酸序列或由序列1形成的互補(bǔ)序列,其中負(fù)責(zé)合成碳骨架及對(duì)其進(jìn)行后修飾共二十九個(gè)基因;負(fù)責(zé)提供碳骨架延伸單位及后修飾過(guò)程中的甲基供體共八個(gè)基因;負(fù)責(zé)為宿主菌提供抗性共三個(gè)基因;在此生物合成過(guò)程中還有六個(gè)基因。本發(fā)明產(chǎn)生的抗生素具有生物合成基因簇的克隆、測(cè)序、分析及其應(yīng)用。
文檔編號(hào)C12N15/54GK102010871SQ20101025126
公開(kāi)日2011年4月13日 申請(qǐng)日期2010年8月11日 優(yōu)先權(quán)日2010年8月11日
發(fā)明者張維克, 王輅, 由德林, 褚以文, 趙子翰, 鄧子新 申請(qǐng)人:上海交通大學(xué), 中國(guó)醫(yī)藥集團(tuán)總公司四川抗菌素工業(yè)研究所