專(zhuān)利名稱(chēng):雪蓮查耳酮合成酶基因(chs)、其編碼蛋白及其克隆方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物技術(shù)領(lǐng)域。本發(fā)明公開(kāi)了通過(guò)篩選雪蓮cDNA文庫(kù)及PCR法克隆查耳酮合成酶基因方法,提供了克隆查耳酮合成酶基因全長(zhǎng)cDNA核酸序列及其編碼的蛋白序列。
背景技術(shù):
雪蓮花又名雪蓮,菊科風(fēng)毛菊屬。是民間常用的一類(lèi)名貴藥用植物,屬多年生草本植物。一般分布于海拔4,000米以上的高山流石灘上。早在《西北域記》和《相園小識(shí)》中,就有關(guān)于雪蓮的記載。具有散寒除濕,活血通經(jīng)、強(qiáng)筋助陽(yáng)、抗炎、鎮(zhèn)痛、收縮子宮等功能,民間用于治療風(fēng)濕性關(guān)節(jié)炎,延緩衰老、動(dòng)脈硬化、終止妊娠,婦女小腹冷痛、閉經(jīng)、胎衣不下、麻疹不透、肺寒咳嗽、陽(yáng)萎等癥。雪蓮花原生植物種類(lèi)較多,雖然據(jù)中藥文獻(xiàn)記載均可同等入藥,但其品質(zhì)有優(yōu)劣之分。據(jù)有關(guān)報(bào)道,在以上幾種雪蓮中銷(xiāo)售量最大的是新疆天山雪蓮(雪荷花)(S.involucrata Kar.et Kir.)和水母雪蓮(S.medusa Maxim)。而水母雪蓮(Saussurea medusaMaxim.)是藏藥“雪蓮”藥材的原植物,分布在我國(guó)青海、甘肅、西藏等地。水母雪蓮是藏藥中的名貴藥材,具有散寒除濕、活血通絡(luò)、抗癌、抗炎及抗疲勞等功效,可治療風(fēng)濕性關(guān)節(jié)炎、婦女月經(jīng)不調(diào)、癰瘡腫毒和高山不適應(yīng)等多種疾病。
黃酮類(lèi)化合物的藥理作用包括抗癌、抗腫瘤,抗心腦血管疾病,鎮(zhèn)咳祛痰,抗炎、鎮(zhèn)痛作用,免疫調(diào)節(jié)作用,雌性激素樣作用,抗菌及抗病毒作用,抗氧化、抗衰老作用,抗輻射。雪蓮中含黃酮、生物堿、內(nèi)酯、甾醇、揮發(fā)油、多糖等多種成分,其有效成分主要為黃酮類(lèi)化合物。如用來(lái)治療偏癱的雪蓮?fù)}丸、雪蓮注射液和治療腦動(dòng)脈硬化與缺血性中風(fēng)的雪蓮?fù)}口服液,都是以黃酮類(lèi)化合物含量為質(zhì)量標(biāo)準(zhǔn)的。雪蓮黃酮藥理作用顯著,如水母雪蓮黃酮成分對(duì)中樞神經(jīng)系統(tǒng)有抑制作用;以黃酮類(lèi)化合物為有效成分的雪蓮注射液治療偏頭痛效果顯著。
黃酮類(lèi)化合物的生物合成是通過(guò)苯丙烷類(lèi)生物合成途徑實(shí)現(xiàn)的。是由1分子4-香豆酰-CoA和3分子丙二酰-CoA在查耳酮合酶(CHS)催化下產(chǎn)生查耳酮(苯基苯乙烯酮)開(kāi)始的,查耳酮合酶是將苯丙烷類(lèi)代謝途徑引向黃酮類(lèi)合成的第一個(gè)最關(guān)鍵酶。
在此專(zhuān)利公開(kāi)之前,尚沒(méi)有發(fā)現(xiàn)任何他人公開(kāi)或報(bào)道的本專(zhuān)利申請(qǐng)?zhí)峒暗难┥彶槎铣擅富蚣捌鋍DNA全長(zhǎng)序列和編碼蛋白的氨基酸序列。
發(fā)明內(nèi)容
本發(fā)明的目的就是提供一種新的水母雪蓮查耳酮合成酶基因及其全長(zhǎng)序列。
在本發(fā)明中,“分離的”的cDNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來(lái),還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開(kāi),而且已經(jīng)與細(xì)胞中伴隨其蛋白質(zhì)分開(kāi)。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的載體,包括質(zhì)粒、粘粒等。在產(chǎn)生本發(fā)明的雪蓮查耳酮合成酶基因時(shí),可以將雪蓮查耳酮合成酶基因編碼序列可操作地連于表達(dá)調(diào)控序列,從而形成雪蓮查耳酮合成酶基因的表達(dá)載體。
“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號(hào)肽DNA作為前體表達(dá)并參與多肽的分泌,那么信號(hào)肽(分泌前導(dǎo)序列)DNA就是可操作地連于多肽DNA;如果啟動(dòng)子控制序列的轉(zhuǎn)錄,那么它是可操作地連于編碼序列;如果核糖體結(jié)合位點(diǎn)被置于能使其翻譯的位置時(shí),那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對(duì)于分泌前導(dǎo)序列則意味著在閱讀框中相鄰。
本發(fā)明的雪蓮查耳酮合成酶基因全長(zhǎng)cDNA序列或其片段通??梢杂肞CR擴(kuò)增法、重組法或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開(kāi)的有關(guān)核酸序列,尤其是開(kāi)放閱讀框序列來(lái)設(shè)計(jì)引物,按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫(kù)作為模板,擴(kuò)增而得到有關(guān)序列。當(dāng)序列較長(zhǎng)時(shí),常常需要進(jìn)行兩次或多次PCR擴(kuò)增,然后再將各次擴(kuò)增出來(lái)的的片段按正確次序拼接在一起。
獲得有關(guān)序列后,用重組法來(lái)大批量的獲得有關(guān)序列。通常是將其克隆入載體,再轉(zhuǎn)入細(xì)胞,然后通過(guò)常規(guī)方法從增殖后的宿主細(xì)胞中分離得到有關(guān)序列。
此外,還可以用人工化學(xué)合成的方法來(lái)合成有關(guān)序列。在本申請(qǐng)之前,現(xiàn)有技術(shù)已完全可以通過(guò)先合成多個(gè)多核苷酸小片段,然后再進(jìn)行連接而獲得編碼本發(fā)明的雪蓮查耳酮合成酶基因的核酸序列。然后,可將該核酸序列引入本領(lǐng)域中各種現(xiàn)有的DNA分子(如載體)和細(xì)胞中。
下面結(jié)合具體步驟,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些步驟僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列步驟中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如J.薩姆布魯克等《分子克隆實(shí)驗(yàn)指南》(科學(xué)出版社2002)、F.奧斯伯等《精編分子生物學(xué)實(shí)驗(yàn)指南》(科學(xué)出版社1998)所述條件,或按照所用產(chǎn)品制造廠商所建議的條件。所涉及到的雪蓮中編碼CHS的核苷酸片段的序列及其編碼蛋白質(zhì)已在附錄中列出,其中SEQ ID NO1是編碼CHScDNA的全長(zhǎng)核苷酸序列;SEQ ID NO2是編碼CHScDNA中開(kāi)放閱讀框的核苷酸序列;SEQ ID NO3是SEQ NO2中核苷酸序列的翻譯氨基酸序列;具體而言,本發(fā)明提供以下各項(xiàng)1.一種克隆基因的方法,其特征在于(a)構(gòu)建cDNA文庫(kù);(b)用簡(jiǎn)并引物篩選文庫(kù)中陽(yáng)性單克隆;(c)用特異引物從cDNA中克隆目的片段。
2.按照1的方法,其中所說(shuō)的基因?yàn)檠┥彶槎铣擅富颉?br>
3.按照1的方法,其中所說(shuō)的簡(jiǎn)并引物為CP1和CP2,其各自序列為CP1AAT GCG ATG AAT GAA TGG GG;CP2AAG CAA CCG TGTTAC ATC AT,所說(shuō)的特異引物為CP3ATG GTG ACC GTC GAG GAAGTC CG;CP4GCA CTA CTA GTG GCG TTG;CP5GGC CAC ATCAAG AGA TAG ACT AGG。
4.按照3的方法,其特征在于簡(jiǎn)并引物中CP1和CP2進(jìn)行文庫(kù)篩選獲得陽(yáng)性單克隆,并得到特異性探針片段,根據(jù)此探針片段設(shè)計(jì)CP4和CP5,CP3和CP4,并以cDNA為模板進(jìn)行PCR獲得文庫(kù)篩選未獲得的部分缺失部分,用CP3和CP5為引物,并以cDNA為模板進(jìn)行PCR最終獲得CHS的全長(zhǎng)cDNA。
5.用權(quán)利要求1的方法構(gòu)建的雪蓮cDNA文庫(kù)。
6.用按照5中的cDNA文庫(kù)篩選雪蓮中編碼基因的方法。
7.用按照1的方法所獲得的一種的編碼雪蓮查耳酮合成酶(CHS)的cDNA序列,其特征在于該cDNA序列具有如SEQ ID NO1所示的核苷酸1到1313的序列。
8.按照5的cDNA序列,其中所說(shuō)的cDNA序列包括該序列的部分序列。
9.按照5的cDNA序列,其中所說(shuō)的cDNA序列包括該序列的同源序列。
10.一種多肽序列,其特征在于該多肽序列是由按照5的cDNA所編碼,且具有如SEQ ID NO3所示的氨基酸1到389的序列。
11.按照8的多肽序列,其中所說(shuō)的多肽序列包括該序列的部分序列。
12.按照8的多肽序列,其中所說(shuō)的多肽序列包括該序列的同源序列。
13.一種基因構(gòu)建體(重組質(zhì)粒),其特征在于該構(gòu)建體根據(jù)5到7的任何一種核苷酸序列所構(gòu)建。
14.一個(gè)大腸桿菌細(xì)胞,其特征是,含由按照11的重組質(zhì)粒轉(zhuǎn)化該細(xì)胞。
具體實(shí)施例方式
以下是本發(fā)明的實(shí)施實(shí)例實(shí)施例實(shí)施例1雪蓮cDNA文庫(kù)的建立建庫(kù)所用水母雪蓮(原植株采自甘肅省祁連4500-5000海拔山脈,并經(jīng)植物所陳藝林研究員保存并鑒定為水母雪蓮)(Saussurea.medusa)1-15天愈傷組織紅色系為本實(shí)驗(yàn)室誘導(dǎo)獲得,并在附加2mg/L NAA和0.5mg/LBA的MS培養(yǎng)基中,25±1℃,16h光照/8h黑暗下培養(yǎng)、繼代擴(kuò)繁。
稱(chēng)取1-14天紅色系愈傷組織,每天50mg,共計(jì)700mg混合樣品于研缽中,用TRIZOL Reagent(購(gòu)自GIBCO公司)提取總RNA。取1~3μl總RNA樣品,用SMART cDNA Library Construction Kit(Catlog#K1051-1)(CLONTEC)自帶的CDSIII酶切位點(diǎn)的PolyT引物合成第一鏈cDNA.采用LD PCR(long distance PCR)擴(kuò)增用cDNA第一鏈以獲得雙鏈cDNA。
加入蛋白酶K消化去除cDNA中的Taq酶,再用Sfi I酶切cDNA,然后用CHROMA SPIN-400對(duì)cDNA進(jìn)行大小分離。收集大?。?00bp的cDNA,將收集到的cDNA與λTripIEx2 Vector(Promega)連接,連接反應(yīng)中cDNA與載體中的比例對(duì)于轉(zhuǎn)染效率及庫(kù)中獨(dú)立克隆的數(shù)目至關(guān)重要。對(duì)于每對(duì)cDNA/載體,這一比例都需要優(yōu)化。連接好的DNA由包裝蛋白Packagene Lambda DNA Packaging System(購(gòu)自Promega公司)包裝后,加入明膠使終濃度為0.01%,DMSO終濃度為7%,可以在-70℃下保存1年滴度不變。將文庫(kù)分成20個(gè)亞文庫(kù),避免反復(fù)凍溶,每個(gè)亞文庫(kù)來(lái)自于在原始文庫(kù)擴(kuò)增時(shí)不同培養(yǎng)皿的回收物,其組成可能不同可保存,這樣就完成了雪蓮噬菌體文庫(kù)構(gòu)建。
實(shí)施例2從文庫(kù)篩選雪蓮查耳酮合成酶基因chs cDNA根據(jù)GenBank中已發(fā)表的chs基因保守的氨基酸序列用軟件DNAMAN4.0(美國(guó)Lynnon Biosoft公司)設(shè)計(jì)合成上下游部分簡(jiǎn)并引物CP15′-AAT GCG ATG AAT GAA TGG GG-3′CP25′-AAG CAA CCG TGT TAC ATC AT-3′每個(gè)亞文庫(kù)取1μL為模板,以CP1、CP2為引物,以25μL體系,先于95℃加熱10min裂解噬菌體,加入PCR擴(kuò)增混合物,進(jìn)行TD-PCR擴(kuò)增。程序94℃變性5min,隨之以94℃1min,65-50℃退火1min(每進(jìn)行一個(gè)循環(huán)退火溫度比上一循環(huán)下降0.5℃),72℃延伸1min,進(jìn)行30循環(huán);94℃變性1min,50℃退火1min,72℃延伸1min,15循環(huán);72℃延伸5min,1循環(huán)。1.6%瓊脂糖電泳檢測(cè),確定陽(yáng)性池。選取信號(hào)最強(qiáng)的陽(yáng)性池,作10倍梯度稀釋到106倍,每個(gè)梯度稀釋物取1μL為模板,按同樣程序進(jìn)行PCR檢測(cè),確定在下一級(jí)篩選時(shí)本級(jí)陽(yáng)性池的最大稀釋倍數(shù)N(能夠檢測(cè)到陽(yáng)性信號(hào)的極限稀釋倍數(shù))。將選中的初級(jí)陽(yáng)性池按其最大稀釋倍數(shù)N稀釋?zhuān)?μL稀釋物感染大腸桿菌并鋪制10個(gè)9cm LB平板,培養(yǎng)并回收洗脫物。從平板上挑取生長(zhǎng)并分離良好的單噬菌斑,置于緩沖液中,渦旋震蕩,稍離心,于4℃冰箱過(guò)夜。取3μL洗脫物為模板,PCR程序擴(kuò)增檢測(cè),獲得陽(yáng)性單克隆。
選取PCR檢測(cè)陽(yáng)性單克隆,送上海生物工程公司測(cè)序。測(cè)序結(jié)果在GenBank中比較分析以確認(rèn)所克隆的片段為帶有完整3′端Poly A尾巴的,大小為1232bp的chs特異片段,通過(guò)比較發(fā)現(xiàn)并不是完整的chs全長(zhǎng)cDNA基因,在5′端缺失了100bp左右片段。
實(shí)施例3PCR法克隆雪蓮查耳酮合成酶基因chs全長(zhǎng)cDNA根據(jù)GenBank中已公布的chs cDNA的序列,在開(kāi)放閱讀框上游,即5′端,根據(jù)保守性設(shè)計(jì)一段引物,再用軟件DNAMAN4.0從測(cè)序序列的中部設(shè)計(jì)一段引物
CP35′-ATG GTG ACC GTC GAG GAA GTC CG-3′CP45′-GCA CTA CTA GTG GCG TTG-3′用TRIZOL Reagent小量提取總RNA,取2μL總RNA,20μL反應(yīng)混合體系中在M-MLV反轉(zhuǎn)錄酶(購(gòu)自Promega公司)作用下合成第一鏈cDNA,以此第一鏈cDNA為模板,以上述CP3,CP4為引物進(jìn)行PCR擴(kuò)增94℃變性5min,隨之以94℃1min,55℃退火1min,72℃延伸1min,進(jìn)行30循環(huán);72℃延伸10min,1循環(huán)。
PCR產(chǎn)物送上海生物工程公司測(cè)序。測(cè)序結(jié)果為406bp左右的片段,在GeneBank中比對(duì)為chs基因的上游序列。用DNAMAN4.0軟件將此406bp片段與上述1232bp片段拼接起來(lái),得到一個(gè)長(zhǎng)度為1313bp的chscDNA序列。根據(jù)這拼接后的堿基序列,在開(kāi)放閱讀框3′端后面,且PolyA尾巴前面設(shè)計(jì)一段引物CP55′-GGC CAC ATC AAG AGA TAG ACT AGG-3′。
以第一鏈cDNA為模板,CP3,CP5為引物進(jìn)行PCR擴(kuò)增94℃變性5min熱啟動(dòng)后,隨之以94℃1min,50℃退火1min,72℃延伸2min,進(jìn)行35循環(huán);72℃延伸10min,1循環(huán)。取3μL經(jīng)凝膠電泳,回收純化后的PCR產(chǎn)物,再加1μL的連接緩沖液,1μL T-easy載體(購(gòu)自Promega公司),4μL無(wú)菌雙蒸水,1μL的T4DNA連接酶,總共反應(yīng)體積10μL。4℃下連接過(guò)夜。CaCl2法制備感受態(tài)大腸桿DH5α。取連接產(chǎn)物加入CaCl2溶液制備的感受態(tài)細(xì)胞中,輕輕混勻內(nèi)容物,在冰上放置30min。將管放入預(yù)加熱到42℃的循環(huán)水浴中,靜置90s,后快速將管轉(zhuǎn)移到冰浴中,使細(xì)胞冷卻1-2min。每管加入400μl LB培養(yǎng)基,用水浴將培養(yǎng)基加熱到37℃,然后將管轉(zhuǎn)移到搖床上,溫育45min,使細(xì)菌復(fù)蘇并表達(dá)質(zhì)粒編碼的抗生素標(biāo)記基因。將適當(dāng)體積轉(zhuǎn)化細(xì)胞轉(zhuǎn)移涂布到相應(yīng)抗生素LB平板上。于37℃培養(yǎng),篩選轉(zhuǎn)化子。挑取單菌落接于加入0.5ml附加50mg/L Amp的LB培養(yǎng)基的離心管中,37℃、300rpm振蕩培養(yǎng)5-8h,取菌液為模板,CP3,CP5為引物進(jìn)行PCR擴(kuò)增94℃變性5min熱啟動(dòng)后,隨之以94℃1min,50℃退火1min,72℃延伸2min,進(jìn)行35循環(huán);72℃延伸10min,1循環(huán)。選取PCR檢測(cè)陽(yáng)性單克隆,送上海生物工程公司測(cè)序。測(cè)序結(jié)果為1313bp大小,在GenBank中比較分析以確認(rèn)所克隆的片段chs全長(zhǎng)cDNA(SEQID NO1)。其中開(kāi)放閱讀框1170bp大小(SEQ ID NO2)。翻譯后的蛋白質(zhì)為389個(gè)氨基酸,分子量為42268(SEQ ID NO3)。將含有完整chs全長(zhǎng)cDNA序列質(zhì)粒的大腸桿菌保存于-20℃中。
實(shí)施例4 chs全長(zhǎng)cDNA的鑒定采用BLAST同源性分析,BLAST(網(wǎng)址為www.ncbi.nlm.nih.gov/BlAST/)是在BLAST“nr”數(shù)據(jù)庫(kù)中(包括所有非冗余GenBank CDS、具有三維結(jié)構(gòu)的蛋白質(zhì)數(shù)據(jù)庫(kù)的序列、SWISS-PROT蛋白質(zhì)序列數(shù)據(jù)庫(kù)、EMBL及DDBJ數(shù)據(jù)庫(kù))進(jìn)行同源性搜尋的一種方式。BLASTX是NCBI(National Center of Biology Information)提供的一種將核苷酸序列的6種翻譯序列與蛋白質(zhì)數(shù)據(jù)庫(kù)進(jìn)行比較的一種方式。P值(probability)是被查詢(xún)cDNA序列與數(shù)據(jù)庫(kù)中的某一序列相比較的同源性程度,P值越大,其二者的同源性就越大。所有的比較都是由BLASTXnr完成的,通過(guò)比較得知,chs全長(zhǎng)cDNA序列與八仙花(Hydrangeamacrophylla AB011467)中的CHS基因的同源性最高,達(dá)到79%。蛋白質(zhì)序列與核桃(Juglans nigra x Juglans regia CAA64452)的CHS氨基酸序列同源性最高,達(dá)到89%,可以認(rèn)為兩者在功能上有很大相似性。從BLAST序結(jié)果在GenBank中比較分析以確認(rèn)所克隆的片段為chs全長(zhǎng)cDNA,并且是正向插入載體的。BLASTX比較結(jié)果見(jiàn)表1表1BLAST結(jié)果Score ESequences producing significant alignments(Bits)Valuegi|1296816|emb|CAA64452.1|naringenin-chalcone synthase[Juglans7240.0gi|20536|emb|CAA32737.1|chalcone synthase[Petunia x hybrida...7230.0gi|19848923|gb|AAL92879.1|chalcone synthase[Cannabis sativa]7220.0gi|11096319|gb|AAG30295.1|chalcone synthase[Hypericum andro...7200.0gi|1345787|sp|P48387|CHS2 CAMSIChalcone synthase 2(Naringen...7190.0gi|18376653|dbj|BAB84111.1|chalcone synthase[Vitis vinifera]7190.0gi|1296818|emb|CAA64366.1|naringenin-chalcone synthase[Juglans7190.0gi|18308038|gb|AAL67805.1|chalcone synthase[Hypericum perforat7180.0gi|1345785|sp|P48386|CHS1 CAMSIChalcone synthase 1(Naringen...7160.0
gi|3551031|dbj|BAA32732.1|chalcone synthase[Hydrangea macro...7140.0gi|4191255|emb|CAA10641.1|chalcone synthase[Casuarina glauc...7130.0gi|5921769|sp|Q43163|CHSB SOLTUChalcone synthase 1B (Naringe...7110.0gi|37727303|gb|AAO13091.1|chalcone synthase[Camellia sinensis]7110.0gi|5921776|sp|O22046|CHSE IPONIChalcone synthase E (Naringen...7110.0gi|5921768|sp|Q41436|CHSA SOLTUChalcone synthase 1A (Naringe...7110.0gi|5921775|sp|022047|CHSE IPOPUChalcone synthase E (Naringen...7100.0……>gi|1296816|emb|CAA64452.1|naringenin-chalcone synthase[Juglans nigra x Juglansregia]Length=389Score=724bits (1868),Expect =0.0,MethodComposition-based stats.
Identities =346/388(89%),Positives =370/388(95%),Gaps=0/388(0%)Query 1 MVTVEEVRKATRAEGPATIMAIGTATPPNCVLQSAYPDYYFRVTKSEHKKELKEKFRRMC 60MVTVE+VR+A RAEGPAT+MAIGTATPPNCV QSAYPDYYFR+T SEHK ELKEKF+RMCSbjct 1 MVTVEDVRRAQRAEGPATVMAIGTATPPNCVDQSAYPDYYFRITNSEHKTELKEKFKRMC 60Query 61 DKSMIKKRYMHLTEEILQEKPNICAYMAPSLDERQDIVVVEVPKLGKEAATRAIKEWGQP 120+KSMIKKRYMHLTEEIL+E PN+CAYMA SLD RQD+VVVEVPKLGKEAAT+AIKEWGQPSbjct 61 EKSMIKKRYMHLTEEILKENPNVCAYMASSLDARQDMVVVEVPKLGKEAATKAIKEWGQP 120Query 121 KSKITHLVFCTTSGVDMPGADYQLTKLLGLRPSVKRLMMYQQGCFAGGTVLRLAKDLAEN 180KSKITHLVFCTTSGVDMPGADYQLTKLLGLRPSVKRLMMYQQGCFAGGTVLRLAKDLAENSbjct 121 KSKITHLVFCTTSGVDMPGADYQLTKLLGLRPSVKRLMMYQQGCFAGGTVLRLAKDLAEN 180Query 181 NKGARVLVVCSEITAVTFRGPNETHLDSLVGQALFGDGAAAIIVGSDPLLGVEKPLFEIV 240NKGARVLVVCSEITAVTFRGP++THLDSLVGQALFGDGAAA+IVG+DP+ GVEKPLFE+VSbjct 181 NKGARVLVVCSEITAVTFRGPSDTHLDSLVGQALFGDGAAALIVGADPVPGVEKPLFELV 240Query 241 SAAQTILPDSEGAIDGHLREVGLTFHLLEDVPGLNSKHIEKSLLEAFRPLGIFDWNSLFW 300SAAQTILPDS+GAIDGHLREVGLTFHLL+DVPGL SK+IEKSL+EAF+PLGI DWNSLFWSbjct 241 SAAQTILPDSDGAIDGHLREVGLTFHLLKDVPGLISKNIEKSLVEAFQPLGITDWNSLFW 300Query 301 IAHPGGPAILDQVEEKLSLKPDKLRATRHVLSEYGNMSSACVLFILNEMRHASATDGFNT 360IAHPGGPAILDQVE KL LKP+KLRATRHVLSEYGNMSSACVLFIL+EMR SA D TSbjct 301 IAHPGGPAILDQVESKLELKPEKLRATRHVLSEYGNMSSACVLFILDEMRKKSAEDRLKT 360Query 361 TGEGLEWGVLFGFGPGLTVETLVLHSVS 388TGEGLEWGVLFGFGPGLTVET+VLHSVSSbjct 361 TGEGLEWGVLFGFGPGLTVETVVLHSVS 388
附錄SEQ ID NO1序列特征長(zhǎng)度1313bp類(lèi)型核酸鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性最初來(lái)源水母雪蓮分子類(lèi)型cDNA序列描述1 ATGGTGACCG TCGAGGAAGT CCGTAAGGCG ACACGAGCTG AAGGTCCAGC51CACCATCATG GCCATCGGCA CCGCCACACC GCCTAATTGC GTGCTTCAAA101 GCGCATATCC CGATTACTAT TTTCGTGTTA CAAAAAGCGA GCACAAAAAA151 GAACTTAAAG AGAAATTTAG ACGCATGTGT GATAAATCTA TGATCAAAAA201 ACGATACATG CACTTGACGG AGGAGATTTT GCAAGAAAAA CCGAACATTT251 GTGCCTACAT GGCACCTTCG TTAGACGAGC GACAAGATAT TGTGGTCGTG301 GAAGTACCAA AGCTCGGGAA AGAAGCCGCG ACACGGGCAA TCAAGGAGTG351 GGGCCAACCA AAATCGAAAA TCACCCATCT TGTTTTTTGC ACTACTAGTG401 GCGTTGACAT GCCAGGAGCT GATTATCAGC TCACAAAGCT TCTCGGTCTT451 CGGCCTTCAG TCAAACGCCT GATGATGTAC CAGCAAGGTT GTTTTGCTGG501 AGGAACTGTC TTGCGTTTGG CCAAAGACCT GGCTGAGAAC AACAAGGGGG551 CCCGCGTACT GGTGGTCTGC TCTGAGATCA CCGCAGTGAC TTTCCGCGGG601 CCCAATGAAA CCCATCTCGA TAGCCTGGTG GGCCAAGCTT TGTTTGGCGA651 TGGTGCAGCC GCGATAATAG TCGGGTCTGA CCCATTGCTC GGCGTAGAGA701 AGCCTCTTTT CGAGATTGTT TCCGCGGCCC AAACAATTCT CCCCGATAGT751 GAGGGCGCAA TCGATGGACA CCTTCGCGAA GTCGGGCTTA CGTTTCATCT801 CCTCGAAGAC GTTCCCGGAC TTAACTCAAA ACACATCGAA AAGAGCCTGT851 TAGAGGCCTT TCGACCATTG GGCATTTTCG ATTGGAACTC GCTTTTCTGG901 ATCGCGCATC CGGGCGGGCC CGCGATCTTG GACCAAGTTG AGGAAAAACT951 AAGCCTGAAG CCCGATAAAT TACGGGCCAC ACGACACGTG CTGAGCGAAT
1001 ACGGAAACAT GTCGAGTGCT TGTGTGCTGT TTATCCTAAA CGAAATGCGA1051 CACGCTTCGG CTACAGATGG GTTCAACACC ACGGGTGAGG GGCTCGAGTG1101 GGGGGTGTTG TTTGGGTTCG GACCTGGGCT AACCGTCGAG ACCCTGGTCC1151 TCCATAGTGT GTCCATTTAA TTGGTCCATC CTAGTCTATC TCTTGATGTG1201 GCCAAATATC TTCTATTTGT GATTGTATTT TTCTTTATTT ACATGCCAAT1251 AAATAATACG TCGTACCAGC AGCAATGGAA ATTTGTAAAA AAAAAAAAAA1301 AAAAAAAAAA AAASEQID NO2序列特征長(zhǎng)度1170堿基對(duì)類(lèi)型核酸序列鏈型雙鏈拓?fù)浣Y(jié)構(gòu)線性最初來(lái)源水母雪蓮分子類(lèi)型cDNA序列描述1 ATGGTGACCG TCGAGGAAGT CCGTAAGGCG ACACGAGCTG AAGGTCCAGC51CACCATCATG GCCATCGGCA CCGCCACACC GCCTAATTGC GTGCTTCAAA101 GCGCATATCC CGATTACTAT TTTCGTGTTA CAAAAAGCGA GCACAAAAAA151 GAACTTAAAG AGAAATTTAG ACGCATGTGT GATAAATCTA TGATCAAAAA201 ACGATACATG CACTTGACGG AGGAGATTTT GCAAGAAAAA CCGAACATTT251 GTGCCTACAT GGCACCTTCG TTAGACGAGC GACAAGATAT TGTGGTCGTG301 GAAGTACCAA AGCTCGGGAA AGAAGCCGCG ACACGGGCAA TCAAGGAGTG351 GGGCCAACCA AAATCGAAAA TCACCCATCT TGTTTTTTGC ACTACTAGTG401 GCGTTGACAT GCCAGGAGCT GATTATCAGC TCACAAAGCT TCTCGGTCTT451 CGGCCTTCAG TCAAACGCCT GATGATGTAC CAGCAAGGTT GTTTTGCTGG501 AGGAACTGTC TTGCGTTTGG CCAAAGACCT GGCTGAGAAC AACAAGGGGG
551CCCGCGTACT GGTGGTCTGC TCTGAGATCA CCGCAGTGAC TTTCCGCGGG601CCCAATGAAA CCCATCTCGA TAGCCTGGTG GGCCAAGCTT TGTTTGGCGA651TGGTGCAGCC GCGATAATAG TCGGGTCTGA CCCATTGCTC GGCGTAGAGA701AGCCTCTTTT CGAGATTGTT TCCGCGGCCC AAACAATTCT CCCCGATAGT751GAGGGCGCAA TCGATGGACA CCTTCGCGAA GTCGGGCTTA CGTTTCATCT801CCTCGAAGAC GTTCCCGGAC TTAACTCAAA ACACATCGAA AAGAGCCTGT851TAGAGGCCTT TCGACCATTG GGCATTTTCG ATTGGAACTC GCTTTTCTGG901ATCGCGCATC CGGGCGGGCC CGCGATCTTG GACCAAGTTG AGGAAAAACT951AAGCCTGAAG CCCGATAAAT TACGGGCCAC ACGACACGTG CTGAGCGAAT1001 ACGGAAACAT GTCGAGTGCT TGTGTGCTGT TTATCCTAAA CGAAATGCGA1051 CACGCTTCGG CTACAGATGG GTTCAACACC ACGGGTGAGG GGCTCGAGTG1101 GGGGGTGTTG TTTGGGTTCG GACCTGGGCT AACCGTCGAG ACCCTGGTCC1151 TCCATAGTGT GTCCATTTAASEQ ID NO3序列特征長(zhǎng)度389氨基酸分子大小42680等電點(diǎn)7.09類(lèi)型氨基酸序列鏈型單鏈拓?fù)浣Y(jié)構(gòu)線性最初來(lái)源水母雪蓮分子類(lèi)型蛋白質(zhì)序列描述1 M V T V E E V R K A T R A E G P A T I M21A I G T A T P P N C V L Q S A Y P D Y Y41F R V T K S E H K K E L K E K F R R M C61D K S M I K K R Y M H L T E E I L Q E K81P N I C A Y M A P S L D E R Q D I V V V101 E V P K L G K E A A T R A I K E W G Q P
121K S K I T H L V F C T T S G V D M P G A141D Y Q L T K L L G L R P S V K R L M M Y161Q Q G C F A G G T V L R L A K D L A E N181N K G A R V L V V C S E I T A V T F R G201P N E T H L D S L V G Q A L F G D G A A221A I I V G S D P L L G V E K P L F E I V241S A A Q T I L P D S E G A I D G H L R E261V G L T F H L L E D V P G L N S K H I E281K S L L E A F R P L G I F D W N S L F W301I A H P G G P A I L D Q V E E K L S L K321P D K L R A T R H V L S E Y G N M S S A341C V L F I L N E M R H A S A T D G F N T361T G E G L E W G V L F G F G P G L T V E381T L V L H S V S I
序列表<110>中國(guó)科學(xué)院植物研究所<120>雪蓮查耳酮合成酶基因(chs)、其編碼蛋白及其克隆方法<130>IB061108<160>3<170>PatentIn version 3.1<210>1<211>1313<212>DNA<213>Saussurea medusa<400>1atggtgaccg tcgaggaagt ccgtaaggcg acacgagctg aaggtccagc caccatcatg60gccatcggca ccgccacacc gcctaattgc gtgcttcaaa gcgcatatcc cgattactat120tttcgtgtta caaaaagcga gcacaaaaaa gaacttaaag agaaatttag acgcatgtgt180gataaatcta tgatcaaaaa acgatacatg cacttgacgg aggagatttt gcaagaaaaa240ccgaacattt gtgcctacat ggcaccttcg ttagacgagc gacaagatat tgtggtcgtg300gaagtaccaa agctcgggaa agaagccgcg acacgggcaa tcaaggagtg gggccaacca360aaatcgaaaa tcacccatct tgttttttgc actactagtg gcgttgacat gccaggagct420gattatcagc tcacaaagct tctcggtctt cggccttcag tcaaacgcct gatgatgtac480cagcaaggtt gttttgctgg aggaactgtc ttgcgtttgg ccaaagacct ggctgagaac540aacaaggggg cccgcgtact ggtggtctgc tctgagatca ccgcagtgac tttccgcggg600cccaatgaaa cccatctcga tagcctggtg ggccaagctt tgtttggcga tggtgcagcc660gcgataatag tcgggtctga cccattgctc ggcgtagaga agcctctttt cgagattgtt720tccgcggccc aaacaattct ccccgatagt gagggcgcaa tcgatggaca ccttcgcgaa780gtcgggctta cgtttcatct cctcgaagac gttcccggac ttaactcaaa acacatcgaa840aagagcctgt tagaggcctt tcgaccattg ggcattttcg attggaactc gcttttctgg900atcgcgcatc cgggcgggcc cgcgatcttg gaccaagttg aggaaaaact aagcctgaag960cccgataaat tacgggccac acgacacgtg ctgagcgaat acggaaacat gtcgagtgct1020tgtgtgctgt ttatcctaaa cgaaatgcga cacgcttcgg ctacagatgg gttcaacacc1080
acgggtgagg ggctcgagtg gggggtgttg tttgggttcg gacctgggct aaccgtcgag1140accctggtcc tccatagtgt gtccatttaa ttggtccatc ctagtctatc tcttgatgtg1200gccaaatatc ttctatttgt gattgtattt ttctttattt acatgccaat aaataatacg1260tcgtaccagc agcaatggaa atttgtaaaa aaaaaaaaaa aaaaaaaaaa aaa 1313<210>2<211>1170<212>DNA<213>Saussurea medusa<400>2atggtgaccg tcgaggaagt ccgtaaggcg acacgagctg aaggtccagc caccatcatg60gccatcggca ccgccacacc gcctaattgc gtgcttcaaa gcgcatatcc cgattactat120tttcgtgtta caaaaagcga gcacaaaaaa gaacttaaag agaaatttag acgcatgtgt180gataaatcta tgatcaaaaa acgatacatg cacttgacgg aggagatttt gcaagaaaaa240ccgaacattt gtgcctacat ggcaccttcg ttagacgagc gacaagatat tgtggtcgtg300gaagtaccaa agctcgggaa agaagccgcg acacgggcaa tcaaggagtg gggccaacca360aaatcgaaaa tcacccatct tgttttttgc actactagtg gcgttgacat gccaggagct420gattatcagc tcacaaagct tctcggtctt cggccttcag tcaaacgcct gatgatgtac480cagcaaggtt gttttgctgg aggaactgtc ttgcgtttgg ccaaagacct ggctgagaac540aacaaggggg cccgcgtact ggtggtctgc tctgagatca ccgcagtgac tttccgcggg600cccaatgaaa cccatctcga tagcctggtg ggccaagctt tgtttggcga tggtgcagcc660gcgataatag tcgggtctga cccattgctc ggcgtagaga agcctctttt cgagattgtt720tccgcggccc aaacaattct ccccgatagt gagggcgcaa tcgatggaca ccttcgcgaa780gtcgggctta cgtttcatct cctcgaagac gttcccggac ttaactcaaa acacatcgaa840aagagcctgt tagaggcctt tcgaccattg ggcattttcg attggaactc gcttttctgg900atcgcgcatc cgggcgggcc cgcgatcttg gaccaagttg aggaaaaact aagcctgaag960cccgataaat tacgggccac acgacacgtg ctgagcgaat acggaaacat gtcgagtgct1020tgtgtgctgt ttatcctaaa cgaaatgcga cacgcttcgg ctacagatgg gttcaacacc1080acgggtgagg ggctcgagtg gggggtgttg tttgggttcg gacctgggct aaccgtcgag1140accctggtcc tccatagtgt gtccatttaa 1170
<210>3<211>389<212>PRT<213>Saussurea medusa<400>3Met Val Thr Val Glu Glu Val Arg Lys Ala Thr Arg Ala Glu Gly Pro1 5 10 15Ala Thr Ile Met Ala Ile Gly Thr Ala Thr Pro Pro Asn Cys Val Leu20 25 30Gln Ser Ala Tyr Pro Asp Tyr Tyr Phe Arg Val Thr Lys Ser Glu His35 40 45Lys Lys Glu Leu Lys Glu Lys Phe Arg Arg Met Cys Asp Lys Ser Met50 55 60Ile Lys Lys Arg Tyr Met His Leu Thr Glu Glu Ile Leu Gln Glu Lys65 70 75 80Pro Asn Ile Cys Ala Tyr Met Ala Pro Ser Leu Asp Glu Arg Gln Asp85 90 95Ile Val Val Val Glu Val Pro Lys Leu Gly Lys Glu Ala Ala Thr Arg100 105 110Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu Val115 120 125Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Gln Leu130 135 140Thr Lys Leu Leu Gly Leu Arg Pro Ser Val Lys Arg Leu Met Met Tyr145 150 155 160Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys Asp165 170 175Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser Glu180 185 190Ile Thr Ala Val Thr Phe Arg Gly Pro Asn Glu Thr His Leu Asp Ser
195 200 205Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Ile Ile Val210 215 220Gly Ser Asp Pro Leu Leu Gly Val Glu Lys Pro Leu Phe Glu Ile Val225 230 235 240Ser Ala Ala Gln Thr Ile Leu Pro Asp Ser Glu Gly Ala Ile Asp Gly245 250 255His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Glu Asp Val Pro260 265 270Gly Leu Asn Ser Lys His Ile Glu Lys Ser Leu Leu Glu Ala Phe Arg275 280 285Pro Leu Gly Ile Phe Asp Trp Asn Ser Leu Phe Trp Ile Ala His Pro290 295 300Gly Gly Pro Ala Ile Leu Asp Gln Val Glu Glu Lys Leu Ser Leu Lys305 310 315 320Pro Asp Lys Leu Arg Ala Thr Arg His Val Leu Ser Glu Tyr Gly Asn325 330 335Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asn Glu Met Arg His Ala340 345 350Ser Ala Thr Asp Gly Phe Asn Thr Thr Gly Glu Gly Leu Glu Trp Gly355 360 365Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Leu Val Leu370 375 380His Ser Val Ser Ile38權(quán)利要求
1.一種克隆基因的方法,其特征在于(a)構(gòu)建cDNA文庫(kù);(b)用簡(jiǎn)并引物篩選文庫(kù)中陽(yáng)性單克隆;(c)用特異引物從cDNA中克隆目的片段。
2.權(quán)利要求1的方法,其中所說(shuō)的基因?yàn)檠┥彶槎铣擅富颉?br>
3.權(quán)利要求1的方法,其中所說(shuō)的簡(jiǎn)并引物為CP1和CP2,其各自序列為CP1AAT GCG ATG AAT GAA TGG GG;CP2AAG CAA CCGTGT TAC ATC AT,所說(shuō)的特異引物為CP3ATG GTG ACC GTC GAGGAA GTC CG;CP4GCA CTA CTA GTG GCG TTG;CP5GGC CACATC AAG AGA TAG ACT AGG。
4.權(quán)利要求3的方法,其特征在于簡(jiǎn)并引物中CP1和CP2進(jìn)行文庫(kù)篩選獲得陽(yáng)性單克隆,并得到特異性探針片段,根據(jù)此探針片段設(shè)計(jì)CP4和CP5,CP3和CP4,并以cDNA為模板進(jìn)行PCR獲得文庫(kù)篩選未獲得的部分缺失部分,用CP3和CP5為引物,并以cDNA為模板進(jìn)行PCR最終獲得CHS的全長(zhǎng)cDNA。
5.用權(quán)利要求1的方法構(gòu)建的雪蓮cDNA文庫(kù)。
6.用權(quán)利要求5中的cDNA文庫(kù)篩選雪蓮中編碼基因的方法。
7.用權(quán)利要求1的方法所獲得的一種的編碼雪蓮查耳酮合成酶(CHS)的cDNA序列,其特征在于該cDNA序列具有如SEQ ID NO1所示的核苷酸1到1313的序列。
8.權(quán)利要求5的cDNA序列,其中所說(shuō)的cDNA序列包括該序列的部分序列。
9.權(quán)利要求5的cDNA序列,其中所說(shuō)的cDNA序列包括該序列的同源序列。
10.一種多肽序列,其特征在于該多肽序列是由權(quán)利要求5的cDNA所編碼,且具有如SEQ ID NO3所示的氨基酸1到389的序列。
11.權(quán)利要求8的多肽序列,其中所說(shuō)的多肽序列包括該序列的部分序列。
12.權(quán)利要求8的多肽序列,其中所說(shuō)的多肽序列包括該序列的同源序列。
13.一種基因構(gòu)建體(重組質(zhì)粒),其特征在于該構(gòu)建體根據(jù)權(quán)利要求5到7的任何一種核苷酸序列所構(gòu)建。
14.一個(gè)大腸桿菌細(xì)胞,其特征是,含由權(quán)利要求11中的重組質(zhì)粒轉(zhuǎn)化該細(xì)胞。
全文摘要
本發(fā)明提供了雪蓮cDNA文庫(kù)構(gòu)建方法,并利用此文庫(kù)通過(guò)簡(jiǎn)并引物篩選雪蓮中編碼基因(包括雪蓮查耳酮合成酶基因)的方法,和利用特異引物通過(guò)PCR克隆雪蓮查耳酮合成酶基因的方法。提供了雪蓮查耳酮合成酶基因chs的全長(zhǎng)cDNA序列及編碼的氨基酸多肽序列。該cDNA序列全長(zhǎng)1,313bp,編碼389個(gè)氨基酸的多肽。該cDNA可用于構(gòu)建正義基因構(gòu)建體。利用該構(gòu)建體可控制植物或植物培養(yǎng)體提高黃酮產(chǎn)量。
文檔編號(hào)C12N9/00GK101029306SQ20061001140
公開(kāi)日2007年9月5日 申請(qǐng)日期2006年3月1日 優(yōu)先權(quán)日2006年3月1日
發(fā)明者趙德修, 虞珍珍, 程麗琴, 徐亮勝, 金治平 申請(qǐng)人:中國(guó)科學(xué)院植物研究所