專利名稱:新的β-肌動(dòng)蛋白和RPS21啟動(dòng)子及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及調(diào)節(jié)基因元件,如啟動(dòng)子及其應(yīng)用,例如,在表達(dá)蛋白中的應(yīng)用。更特 別地,本發(fā)明涉及β-肌動(dòng)蛋白和核糖體蛋白S21基因的啟動(dòng)子。
背景技術(shù):
每種真核基因含有驅(qū)動(dòng)該基因轉(zhuǎn)錄的調(diào)節(jié)元件。該調(diào)節(jié)元件包括典型地直接位于 該基因編碼區(qū)上游的啟動(dòng)子。作為轉(zhuǎn)錄機(jī)制的一部分,啟動(dòng)子通過提供轉(zhuǎn)錄因子的結(jié)合位 點(diǎn)來調(diào)節(jié)轉(zhuǎn)錄。啟動(dòng)子通常被用于在細(xì)胞培養(yǎng)中和體內(nèi)表達(dá)蛋白質(zhì)。很多啟動(dòng)子是已知的 并被用于各種表達(dá)系統(tǒng)中表達(dá)蛋白質(zhì)。啟動(dòng)子的例子包括巨細(xì)胞病毒(CMV)立即早期啟動(dòng) 子、勞氏肉瘤病毒基因組大基因組長末端重復(fù)(RSV)、猿病毒40(SV40)啟動(dòng)子、干擾素基因 啟動(dòng)子、金屬硫因啟動(dòng)子、和胸腺嘧啶激酶啟動(dòng)子及其它,如Fernandez等人(1999)在Gene ExpressionSystem, Academic Press中所描述的。然而,在本領(lǐng)仍需要提供一種可以產(chǎn)生 高表達(dá)水平和/或在長時(shí)間內(nèi)維持表達(dá)的啟動(dòng)子。肌動(dòng)蛋白是一種結(jié)構(gòu)蛋白,其通常在從原核到真核,包括人的所有物種中表 達(dá)。先前描述了人和雞的β-肌動(dòng)蛋白啟動(dòng)子。一般而言,β-肌動(dòng)蛋白啟動(dòng)子表現(xiàn)出比 廣泛被應(yīng)用的CMV啟動(dòng)子更普遍的活性(Xu等(2001)Gene 272:149-156)。僅僅當(dāng)其被連 接到CMV增強(qiáng)子序列時(shí),雞的β-肌動(dòng)蛋白啟動(dòng)子比病毒CMV和SV40啟動(dòng)子具有更高的 活性(Xu 等,supra)。核糖體蛋白S21(rpS21)與核糖體40S亞單位有關(guān)。人的rpS21基因的啟動(dòng)子已 被鑒別(GenBank 接收號(hào)No. AJ250907)。與大多數(shù)核糖體啟動(dòng)子基因相似,其缺少傳統(tǒng) 的轉(zhuǎn)錄元件,如 TATA 盒和 CAAT 序歹Ij (Smirnova 等(2000) Bioorg. Khim. 26 (5) :392_396)。
發(fā)明內(nèi)容
本發(fā)明提供了一種新的肌動(dòng)蛋白啟動(dòng)子,其與前述公知的肌動(dòng)蛋白啟動(dòng) 子相比具有低水平的序列同源性(如,人或雞)。本發(fā)明還提供了新的rpS21啟動(dòng)子,其與 前述公知的rpS21啟動(dòng)子相比具有低水平的序列同源性(如,人或小鼠)。本發(fā)明部分基于對(duì)中國倉鼠卵巢細(xì)胞(CHO)系來源的β-肌動(dòng)蛋白和rpS21啟動(dòng) 子的發(fā)現(xiàn)和分離。本發(fā)明進(jìn)一步部分基于倉鼠肌動(dòng)蛋白啟動(dòng)子比CMV啟動(dòng)子具有顯著 的高活性的觀察。本發(fā)明進(jìn)一步部分基于當(dāng)被用于表達(dá)一定基因時(shí),rpS21啟動(dòng)子至少具 有與倉鼠肌動(dòng)蛋白啟動(dòng)子相同的活性的觀察。本發(fā)明提供了這些啟動(dòng)子的核酸序列,并包括具有啟動(dòng)子活性的各種核酸序列的變種。在一些實(shí)施例中,本發(fā)明的肌動(dòng)蛋白 啟動(dòng)子來源于嚙齒類,如倉鼠、大鼠和小鼠。典型地rpS21啟動(dòng)子來源于倉鼠。本發(fā)明進(jìn)一步提供了含有可操作地連接到異源核酸上的本發(fā)明的肌動(dòng)蛋白 或rpS21啟動(dòng)子的載體。在某些實(shí)施例中,本發(fā)明的載體包括可操作地連接到異源核酸上 的啟動(dòng)子,該異源核酸編碼異源表達(dá)產(chǎn)物,如治療蛋白質(zhì)或其片段。在示例性實(shí)施例中,表 達(dá)產(chǎn)物是酸性鞘磷脂酶(ASM)、α-葡萄糖苷酶(GAA)、或組織血漿酶原激活劑(tPA)。本發(fā)明還提供了用本發(fā)明的載體轉(zhuǎn)染的宿主細(xì)胞。在描述性實(shí)施例中,宿主細(xì)胞 是哺乳動(dòng)物細(xì)胞,如CHO、HEK和BHK。本發(fā)明還提供了用于產(chǎn)生蛋白質(zhì)的方法。產(chǎn)生蛋白質(zhì)的方法包括,例如,培養(yǎng)轉(zhuǎn)染 細(xì)胞,該細(xì)胞用含有可操作地連接到編碼蛋白質(zhì)的異源核酸上的本發(fā)明的β-肌動(dòng)蛋白啟 動(dòng)子和/或rpS21啟動(dòng)子的載體轉(zhuǎn)染的細(xì)胞,以及回收蛋白質(zhì)。在一些實(shí)施例中,異源表達(dá) 產(chǎn)物是分泌蛋白,其從培養(yǎng)基中被回收。在描述性實(shí)施例中,蛋白質(zhì)是六511、6六六、或1 八。本發(fā)明還涉及1. 一種選自SEQ ID NOs :1、2、3的核苷酸序列的分離的嚙齒動(dòng)物β -肌動(dòng)蛋白啟 動(dòng)子或其具有啟動(dòng)子活性的變種。2. 一種SEQ ID NO=I中列出的分離的倉鼠β _肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其 具有啟動(dòng)子活性的變種。3. 一種SEQ ID NO :2中列出的分離的大鼠β -肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其 具有啟動(dòng)子活性的變種。4. 一種SEQ ID NO :3中列出的分離的小鼠β -肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其 具有啟動(dòng)子活性的變種。5. 一個(gè)包括SEQ ID NO 1中列出的核苷酸序列的分離的核酸,或其具有啟動(dòng)子活 性的變種。6. 一個(gè)包括SEQ ID NO 2中列出的核苷酸序列的分離的核酸,或其具有啟動(dòng)子活 性的變種。7. 一個(gè)載體,其包括SEQ ID NO 1中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。8. 一個(gè)載體,其包括SEQ ID NO 2中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。9. 一個(gè)載體,其包括SEQ ID NO 3中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。10.根據(jù)權(quán)利要求7-9的任何一項(xiàng)所述的載體,其中啟動(dòng)子被可操作地連接到異 源核酸上。11.根據(jù)權(quán)利要求10所述的載體,其中異源核酸編碼治療性蛋白。12.根據(jù)權(quán)利要求11所述的載體,其中治療性蛋白選自酸性鞘磷脂酶、α -葡萄糖 苷酶或組織血漿酶原激活劑。13.用權(quán)利要求7-12的任何一項(xiàng)的所述的載體轉(zhuǎn)染的宿主細(xì)胞。14.根據(jù)權(quán)利要求13的宿主細(xì)胞,其中細(xì)胞是CHO細(xì)胞。15. 一種生產(chǎn)蛋白質(zhì)的方法,其包括(a)培養(yǎng)用含有倉鼠肌動(dòng)蛋白啟動(dòng)子或其變種的載體轉(zhuǎn)染的細(xì)胞,該啟動(dòng)子 或其變種被可操作地連接到編碼該蛋白質(zhì)的核酸上,和;(b)回收蛋白質(zhì)。
16.根據(jù)權(quán)利要求15所述的方法,其中蛋白質(zhì)是抗體。17.根據(jù)權(quán)利要求16所述的方法,其中抗體結(jié)合TGF-β族成員。18.根據(jù)權(quán)利要求15所述的方法,其中蛋白質(zhì)是治療性蛋白。19.根據(jù)權(quán)利要求18所述的方法,其中治療性蛋白選自酸性鞘磷脂酶、α-葡萄糖 苷酶或組織血漿酶原激活劑。20.含有權(quán)利要求1-6的任何一項(xiàng)所述的啟動(dòng)子的轉(zhuǎn)基因動(dòng)物。 根據(jù)權(quán)利要求20所述的轉(zhuǎn)基因動(dòng)物,其中動(dòng)物是哺乳動(dòng)物。 具有SEQ ID NO :39的核苷酸序列的分離的rpS21啟動(dòng)子,或其具有啟動(dòng)子活21.22.
性的變種。 上。脂酶。
23.含有SEQIDNO :39的核苷酸序列或其具有啟動(dòng)子活性的變種的載體。
24.根據(jù)權(quán)利要求23所述的載體,其中核苷酸序列被可操作地連接到異源核酸
25.根據(jù)權(quán)利要求24所述的載體,其中異源核酸編碼治療性蛋白。
26.根據(jù)權(quán)利要求25所述的載體,其中治療性蛋白是α-葡萄糖苷酶或酸性鞘磷
27.用權(quán)利要求23-26的任何一項(xiàng)所述的載體轉(zhuǎn)染的宿主細(xì)胞。
28.根據(jù)權(quán)利要求27所述的宿主細(xì)胞,其中細(xì)胞是CHO細(xì)胞。
29.—種生產(chǎn)蛋白的方法,其包括
(a)培養(yǎng)用含有倉鼠rpS21啟動(dòng)子或其變種的載體轉(zhuǎn)染的細(xì)胞,該啟動(dòng)子或其變 種被可操作地連接到該編碼蛋白質(zhì)的核酸上,和; 回收蛋白質(zhì)。
根據(jù)權(quán)利要求29所述的方法,其中蛋白是抗體。 根據(jù)權(quán)利要求29所述的方法,其中蛋白是治療性蛋白。 根據(jù)權(quán)利要求31所述的方法,其中治療性蛋白是α -葡萄糖苷酶或酸性鞘磷
一種含有權(quán)利要求22所述的啟動(dòng)子的轉(zhuǎn)基因動(dòng)物。 根據(jù)權(quán)利要求33所述的轉(zhuǎn)基因動(dòng)物,其中動(dòng)物是哺乳動(dòng)物。 一種分離的β “肌動(dòng)蛋白啟動(dòng)子,其核苷酸序列作為ATCC參考號(hào)ΡΤΑ-5309 被保藏,其分類命名為含有克隆到噬菌粒載體PBluescript II KS+的β-肌動(dòng)蛋白啟 動(dòng)子的倉鼠基因組克隆pBlueP-肌動(dòng)蛋白/Avr(Hamster genomic clone containing β -actinpromoter cloned in phagemid vector pBlueScript II KS+:pBlueβ-actin/ Avr),保藏單位為美國典型培養(yǎng)物保藏中心(American TypeCulture Collection,ATCC), 保藏日為2003年7月3日。 36. 一種分離的rpS21啟動(dòng)子,其核苷酸序列作為ATCC參考號(hào)_被保藏。(b)
30.
31.
32.脂酶。
33.
34.
35.
圖IA顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與大鼠 β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO :2)的比對(duì),顯示出SEQ IDNO :1中的核苷酸487-893與SEQ ID NO :2中的核苷酸1-417具有79%的同一性。大鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 2)與倉鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 1)的全長相比具有67%的同一性。圖IB顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與大鼠 β -肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 2)的比對(duì),顯示出SEQ IDNO 1中的核苷酸1047-3006與 SEQ ID NO 2中的核苷酸546-2493具有83%的同一性。圖2Α顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與小鼠 β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 3)的比對(duì),顯示出SEQ IDNO 1中的核苷酸33-487與SEQ ID NO :3中的核苷酸1-449具有84%的同一性。小鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 3) 與倉鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 1)的全長相比具有80%的同一性。圖2Β顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與小鼠 β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID NO 3)的比對(duì),顯示出SEQ IDNO :1中的核苷酸996-3006與 SEQ ID NO :1中的核苷酸921-2953具有83%的同一性。圖3顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與倉鼠 β-肌動(dòng)蛋白基因(GenBank 接收號(hào)No.U20114 ;SEQ ID NO 4)的比對(duì),顯示出SEQ ID NO :1中的核苷酸1775-3006與SEQ ID NO :4中的核苷酸1-1232具有98%的同一性。倉 鼠β-肌動(dòng)蛋白基因序列與倉鼠β-肌動(dòng)蛋白啟動(dòng)子序列(SEQ ID NO 1)的全長相比具 有40%的同一性。圖4顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子部分核苷酸序列(SEQ ID Ν0:1)與在先已知 的人β-肌動(dòng)蛋白啟動(dòng)子(GenBank 接收號(hào)No. gi28337 ;SEQ ID NO 5)的比對(duì),顯示出 SEQ ID NO 1中的核苷酸113-148與SEQ ID NO 5中的核苷酸38-73具有94%的同一性, SEQ ID NO :1中的核苷酸362-433與SEQ ID NO :5中的核苷酸303-374具有83%的同一 性,SEQ ID NO 1中的核苷酸1728-1764與SEQ ID NO 5中的核苷酸1791-1830具有90% 的同一性,SEQ ID NO 1中的核苷酸1797-1966與SEQ ID NO 5中的核苷酸1840-2007具 有91%的同一性。倉鼠β-肌動(dòng)蛋白啟動(dòng)子序列(SEQ ID NO 5)與人β-肌動(dòng)蛋白啟動(dòng) 子(SEQ IDNO=I)的全長相比具有10%的同一性。圖5顯示了倉鼠β-肌動(dòng)蛋白啟動(dòng)子核苷酸序列(SEQ ID Ν0:1)與先前已知的雞 β-肌動(dòng)蛋白啟動(dòng)子(GenBank 接收號(hào)No. gi217043 ;SEQ ID NO 6)的比對(duì),顯示出SEQ ID NO 1中的核苷酸1878-1919與SEQ ID NO 6中的核苷酸186-227具有83%的同一性。 雞的β-肌動(dòng)蛋白啟動(dòng)子序列(SEQ ID NO 6)與倉鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQIDN0 1)的 全長相比具有的同一性。圖6Α描述了 CHO-Kl細(xì)胞中的半乳糖結(jié)合蛋白、鐵蛋白和β -肌動(dòng)蛋白的RNA斑 點(diǎn)印跡。mRNAs分別分離自放射菌素D處理后0、4、8、10和15小時(shí)后的細(xì)胞。圖6B描述了半乳糖結(jié)合蛋白、鐵蛋白和β-肌動(dòng)蛋白的相對(duì)mRNA表達(dá)水平。 mRNAs分別分離自放射菌素D處理后的CHO-Kl細(xì)胞10、4、8、10和15小時(shí)后的細(xì)胞。圖7A描述了在CHO-Kl細(xì)胞中的瞬時(shí)轉(zhuǎn)染分析檢測下列啟動(dòng)子的相對(duì)啟動(dòng)子強(qiáng) 度CMV、人EF-1、倉鼠GAPDH、倉鼠rpS21和倉鼠β-肌動(dòng)蛋白。在pDsRED_l質(zhì)粒中啟動(dòng)子 分別被克隆到紅色熒光蛋白(RFP)基因的上游。用FACS檢測熒光。圖7B描述了在CHO-Kl細(xì)胞中的穩(wěn)定轉(zhuǎn)染分析檢測中下列啟動(dòng)子的相對(duì)啟動(dòng)子強(qiáng) 度CMV、人EF-1、倉鼠GAPDH、倉鼠rpS21_和倉鼠β-肌動(dòng)蛋白。在pDsRED-Ι質(zhì)粒中分別 將啟動(dòng)子被克隆到紅色熒光蛋白(RFP)基因的上游。用FACS檢測平均熒光。
圖8A描述了在來源于三個(gè)被含有可操作地連接到CMV啟動(dòng)子或倉鼠β -肌動(dòng)蛋 白啟動(dòng)子上的ASM cDNA的載體轉(zhuǎn)染的CH0-DXB11細(xì)胞池的培養(yǎng)基中酸性鞘磷脂酶(ASM) 蛋白的表達(dá)。用分析ASM酶活性的分析方法分析ASM的表達(dá)。圖8B描述了在來源于三個(gè)被含有可操作地連接到CMV啟動(dòng)子或倉鼠β -肌動(dòng)蛋 白啟動(dòng)子上的GAA cDNA的載體轉(zhuǎn)染的CH0-DXB11細(xì)胞池的培養(yǎng)基中α-葡萄糖苷酶(GAA) 蛋白的表達(dá)。用分析α-葡萄糖苷酶(GAA)蛋白酶活性的分析方法分析GAA的表達(dá)。圖9描述了在來源于被含有可操作地連接到倉鼠β-肌動(dòng)蛋白啟動(dòng)子上的tPA cDNA的載體轉(zhuǎn)染的CH0-DXB11細(xì)胞池的培養(yǎng)基中tPA蛋白的表達(dá)。用ELISA方法分析tPA 的表達(dá)。
具體實(shí)施例方式為了更容易地理解本發(fā)明,首先對(duì)術(shù)語進(jìn)行定義。另外的定義在貫穿說明書的詳 細(xì)說明中列出。術(shù)語“啟動(dòng)子”指調(diào)節(jié)元件,其指導(dǎo)與其可操作地連接的核酸的轉(zhuǎn)錄。啟動(dòng)子可以 調(diào)節(jié)可操作地連接到其上的核酸的轉(zhuǎn)錄速率和效率。啟動(dòng)子還可以被可操作地連接到其它 的調(diào)節(jié)元件上,其可增強(qiáng)(“增強(qiáng)子”)或抑制(“抑制子”)啟動(dòng)子依賴的的核酸轉(zhuǎn)錄。術(shù) 語“可操作地連接”指處于與其它核酸有功能關(guān)系的位置的核酸。啟動(dòng)子通常位于核酸轉(zhuǎn) 錄起始點(diǎn)的5’端(S卩,上游)。然而,啟動(dòng)子可以包括轉(zhuǎn)錄起始點(diǎn)的3’端(S卩,下游)。啟 動(dòng)子還可以包括可操作地連接的核酸的轉(zhuǎn)錄起始點(diǎn)的5’和3’端。術(shù)語“啟動(dòng)子活性”指啟動(dòng)子啟動(dòng)與其可操作連接的核酸轉(zhuǎn)錄的能力??梢詰?yīng)用 本領(lǐng)域公知的或?qū)嵤├忻枋龅姆椒z測啟動(dòng)子活性。例如,可以通過測量被轉(zhuǎn)錄的mRNA 的量測量啟動(dòng)子的活性,例如,RNA印跡或聚合酶鏈反應(yīng)(PCR)??晒┻x擇地,可以通過測 量被翻譯的蛋白產(chǎn)物的量測量啟動(dòng)子的活性,例如,蛋白印跡、ELISAjn Bradford分析 (Bradford(1976) Anal. Biochem. ,72 248)的色比色分析和各種活性分析,包括報(bào)告基因 分析和其他本領(lǐng)域公知的或?qū)嵤├忻枋龅姆椒?。術(shù)語“載體”指可以攜帶其他核酸的病毒或非病毒、原核或真核、脫氧核糖核酸、核 糖核酸或核酸類似物。載體可攜帶核酸進(jìn)入被稱為“宿主細(xì)胞”的細(xì)胞,從而使核酸的全部 或部分被轉(zhuǎn)錄或表達(dá)??晒┻x擇地,載體可被用于體外轉(zhuǎn)錄分析中。載體通常來源于不同病 毒、細(xì)菌或哺乳動(dòng)物基因元件的組合物裝配而成。載體含有各種包括編碼選擇性標(biāo)記(如, 抗生素抗性基因)、有助于其在細(xì)菌中增殖的序列、或僅在某些細(xì)胞類型中表達(dá)的一個(gè)或多 個(gè)轉(zhuǎn)錄單位的編碼和非編碼序列。例如,哺乳動(dòng)物表達(dá)載體通常即含有有助于載體在細(xì)菌 中增殖的原核序列,又含有僅在真核細(xì)胞中表達(dá)的一個(gè)或多個(gè)真核轉(zhuǎn)錄單位。本領(lǐng)域技術(shù) 人員應(yīng)該理解載體的設(shè)計(jì)取決于如所選擇的被轉(zhuǎn)染的宿主細(xì)胞、所需的蛋白質(zhì)表達(dá)水平等 因素。載體包括例如,質(zhì)粒、噬菌粒和病毒載體。對(duì)于已具有啟動(dòng)子的載體,可以使用本 領(lǐng)域熟知的標(biāo)準(zhǔn)重組DNA技術(shù)對(duì)載體進(jìn)行修飾,從而用任何SEQ ID NOs :1、2、3或39或其變 種列出的啟動(dòng)子序列取代已存在的啟動(dòng)子序列,。一般而言,合適的載體或者可以選自商售 的那些,也可以應(yīng)用本領(lǐng)域熟知的標(biāo)準(zhǔn)重組DNA技術(shù)構(gòu)建。(見,如Molecular Cloning =A Laboratory Manual :2n edition,Sambrook etal. , 1989,Cold Spring Harbor LaboratoryPress.)術(shù)語“轉(zhuǎn)化”和“轉(zhuǎn)染”指向細(xì)胞內(nèi)導(dǎo)入核酸。可以使用本領(lǐng)域熟知的方法或此處 描述的方法將核酸導(dǎo)入植物或動(dòng)物細(xì)胞,或原核或真核細(xì)胞。術(shù)語“分離的”指使用不是自然發(fā)生的方式,從其他核酸序列中分離的脫氧核糖核 酸、核糖核酸、或多聚核苷酸的核酸類似物。分離的核酸包括使用本領(lǐng)域的標(biāo)準(zhǔn)技術(shù)部分或 全部化學(xué)地或重組地合成和/或純化的核酸。涉及啟動(dòng)子的術(shù)語“變種”指如果變種具有啟動(dòng)子活性,則與啟動(dòng)子序列全長或其 互補(bǔ)鏈全長基本上具有同一性的核苷酸序列。只要其長度至少有1250個(gè)核苷酸β -肌動(dòng)蛋白啟動(dòng)子的變種可以與SEQ ID NOs 1、2或3的核苷酸序列同樣長、或短。只要其具啟動(dòng)子活性rpS21啟動(dòng)子的變種可以與SEQ ID NOs :39的核苷酸序列同樣長、或短。β-肌動(dòng)蛋白啟動(dòng)子的變種可以是自然發(fā)生的, 如從除人和雞以外的物種分離的自然發(fā)生的肌動(dòng)蛋白,或人工生成的肌動(dòng)蛋白啟 動(dòng)子。當(dāng)被最優(yōu)比對(duì)時(shí),在SEQ ID NO 1序列的核苷酸1-3007的全長上,SEQ ID NO 1列 出的倉鼠β -肌動(dòng)蛋白啟動(dòng)子與其變種之間的同一性至少為45 %、50 %、55 %、60 %、65 %、 70%、75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、或 99%。相似地, 在SEQID NO 2列出的序列的核苷酸1-2493的全長上,SEQ ID NO 2的大鼠β -肌動(dòng)蛋白 啟動(dòng)子與其變種之間的同一性至少為60%,65%,70%,75%,80%,85%,90%,92%,93%, 94%、95%、96%、97%、98%、或 99%。SEQ ID NO :3 序列的核苷酸 1-2953 的全長上,SEQ ID NO :3的小鼠3_肌動(dòng)蛋白啟動(dòng)子與其變種之間的同一性至少為55%、60%、65%、70%、 75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、或99%。相似地,在 SEQ ID NO 39列出的序列的核苷酸1-1958的全長上,SEQ ID NO 39的倉鼠rpS21啟動(dòng)子與其變種 之間在最優(yōu)比對(duì)時(shí)的同一性,至少為40%,50%,55%,60%,65%,70%,80%,90%,91%, 92%、93%、94%、95%、96%、97%、98%、或 99%。β _肌動(dòng)蛋白啟動(dòng)子的變種可以,例如,包括其他物種中的β _肌動(dòng)蛋白啟動(dòng)子的 同源物(orthologs),其他物種包括嚙齒動(dòng)物和其他哺乳動(dòng)物,但除外人和雞β -肌動(dòng)蛋白 啟動(dòng)子及其已知的變種。本發(fā)明的啟動(dòng)子的變種還可以在其他嚙齒動(dòng)物中被發(fā)現(xiàn),如豚鼠、 花白旱獺、麝鼠、沙鼠、松鼠、花栗鼠、土撥鼠、海貍、豪豬和野鼠。術(shù)語“變種”進(jìn)一步包括具有啟動(dòng)子活性的任何一個(gè)或多個(gè)本發(fā)明啟動(dòng)子的片段。 β-肌動(dòng)蛋白啟動(dòng)子的變種具有至少1250核苷酸的長度。例如,可通過5’端切斷SEQ ID NO :1中列出的的倉鼠β -肌動(dòng)蛋白啟動(dòng)子的而衍生出本發(fā)明的β -肌動(dòng)蛋白啟動(dòng)子。在一 些實(shí)施方案中,β-肌動(dòng)蛋白啟動(dòng)子的變種包括SEQ ID NO :1的核苷酸50-3000、100-3000、 150-3000、200-3000、250-3000、500-3000、1000-3000、或 1500-3000 的序列。在另一些實(shí)施 例中,可通過5’端切斷SEQ ID NO :2中序列而衍生出β -肌動(dòng)蛋白啟動(dòng)子,例如包括SEQ ID NO 2 的核苷酸 50-2490、100-2490、150-2490、200-2490、250-2490、500-2490、或 1000-2490 的序列。還可通過5’端切斷SEQ ID NO :3中序列而衍生出β -肌動(dòng)蛋白啟動(dòng)子,其包括 例如,SEQ ID NO :3 的核苷酸50-2950、100-2950、150-2950、200-2950、250-2950、500-2950、 1000-2950或1500-2950的序列。例如,可以通過切斷SEQ ID NO :7中較長的倉鼠啟動(dòng)子 核苷酸序列的5’端而衍生出倉鼠β-肌動(dòng)蛋白啟動(dòng)子的長片段。此種變種包括,如,核苷 酸 50-3668、100-3668、150-3668、200-3668、250-3668、500-3668 或 600-3668 的序列。
8
可以通過5,和/或3,端的切斷SEQ ID NO :39的序列來衍生rpS21啟動(dòng)子的變種。 此變種包括,例如,核苷酸 50-1958、100-1958、150-1958、200-1958、250-1958、500-1958、 1000-1958、1-1900、1-1850、1-1800、1-1750、1-1700、1-1600 或 1-1500 的序列。在某些實(shí)施方案中,本發(fā)明的β-肌動(dòng)蛋白啟動(dòng)子包括來自于SEQID NOs :1、2或3 的至少 1250、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2500 或 3000 個(gè)核苷酸的相鄰的分支。此SEQ ID NOs :1、2和3的相鄰分支還可以包括一個(gè)突變(插入 或缺失),前提是突變序列保留了至少原始序列的一些功能以及在低、中等或高度嚴(yán)格的條 件下可以分別與SEQ ID NOs :1、2或3雜交的能力??梢酝ㄟ^5’切斷SEQ ID NOs :1、2、3 或7或上述其變種的任何序列的而衍生出β-肌動(dòng)蛋白啟動(dòng)子的相鄰分支。在其他實(shí)施方案中,本發(fā)明的rpS21啟動(dòng)子包括來自SEQ ID NO 39的至少500、 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1850 或 1900 個(gè)核 苷酸的相鄰分支。本發(fā)明的β-肌動(dòng)蛋白啟動(dòng)子的變種進(jìn)一步包括可以和SEQ IDNOs :1、2或3中所 示的β-肌動(dòng)蛋白啟動(dòng)子或其互補(bǔ)序列全長雜交的核苷酸序列,兩者具有最多0、1、2、3、4、 5、10、15、20、25、30、35、40、45%的堿基對(duì)錯(cuò)配。本發(fā)明的rpS21啟動(dòng)子序列包括可與SEQID NOs :39中所示的全長rpS21啟動(dòng)子序列或其互補(bǔ)序列雜交的核苷酸序列,兩者具有最多0、 1、2、3、4、5、10、15、20、30、40、45、50、55、60%的堿基對(duì)錯(cuò)配??墒褂帽绢I(lǐng)域公知的或此處描 述的技術(shù)測定堿基對(duì)的錯(cuò)配率。在此處用于修飾核酸的術(shù)語“異源的”是指除可操作地連 接到自然發(fā)生的基因組的啟動(dòng)子核酸以外的核酸。例如,術(shù)語“異源的”指當(dāng)此核酸被可操 作地連接到倉鼠肌動(dòng)蛋白啟動(dòng)子時(shí),除倉鼠肌動(dòng)蛋白基因以外的任何核酸。同樣 地,當(dāng)此核酸被可操作地連接到大鼠β-肌動(dòng)蛋白啟動(dòng)子時(shí),術(shù)語“異源的”指除大鼠β-肌 動(dòng)蛋白基因以外的任何核酸。相似地,當(dāng)此核酸被可操作地連接到小鼠肌動(dòng)蛋白啟動(dòng) 子時(shí),術(shù)語“異源的”指任何核酸。類似地,當(dāng)此核酸被可操作地連接到倉鼠rpS21啟動(dòng)子 時(shí),此術(shù)語可以指除倉鼠rpS21基因以外的任何核酸。術(shù)語“轉(zhuǎn)基因”指含有基因操作細(xì)胞的任何動(dòng)物,其中本發(fā)明的啟動(dòng)子不再被可操 作地連接如天然發(fā)生的基因組中的相同的核酸上。術(shù)語“轉(zhuǎn)基因”包括,例如,含有具有整 合到動(dòng)物染色體中的本發(fā)明的啟動(dòng)子或其變種的細(xì)胞的動(dòng)物。術(shù)語“轉(zhuǎn)基因”還包括含有 在染色體外具有由本發(fā)明的啟動(dòng)子或其變種組成的復(fù)制的DNA序列的細(xì)胞的動(dòng)物。轉(zhuǎn)基因 動(dòng)物可以是如嚙齒動(dòng)物或人的哺乳動(dòng)物。本發(fā)明部分基于新的β-肌動(dòng)蛋白和rpS21基因的啟動(dòng)子的發(fā)現(xiàn)和分離。特別 地,本發(fā)明的特征為包括但不局限于倉鼠、大鼠和小鼠的嚙齒動(dòng)物β-肌動(dòng)蛋白啟動(dòng)子,以 及倉鼠rpS21啟動(dòng)子。如實(shí)施例中所描述的,本發(fā)明是基于發(fā)現(xiàn)和證實(shí)本發(fā)明的β-肌動(dòng) 蛋白啟動(dòng)子具有高于CMV的啟動(dòng)子活性的基礎(chǔ)上。本發(fā)明進(jìn)一步基于當(dāng)用于表達(dá)某些基因 時(shí),倉鼠rpS21啟動(dòng)子的活性至少與倉鼠β-肌動(dòng)蛋白啟動(dòng)子的活性相同的發(fā)現(xiàn)的基礎(chǔ)上。本發(fā)明提供了包括倉鼠、大鼠和小鼠的嚙齒動(dòng)物β-肌動(dòng)蛋白啟動(dòng)子的核苷酸序 列,以及其應(yīng)用方法。本發(fā)明進(jìn)一步提供了鑒別和分離本發(fā)明的啟動(dòng)子變種的方法,包括具 有啟動(dòng)子活性的啟動(dòng)子的同源物或片段。另外,本發(fā)明提供了用于倉鼠rpS21啟動(dòng)子的核 苷酸序列及其使用方法。在導(dǎo)致本發(fā)明的實(shí)驗(yàn)中,倉鼠β-肌動(dòng)蛋白啟動(dòng)子的基因克隆被稱為基因表達(dá)的系列分析技術(shù)或 “SAGE”(Valculesco et al. (1995) Science,270 :484_487 和 Valculesco et al. (1987)Cell,88 =243-251)鑒定為活性啟動(dòng)子在識(shí)別后從CHO細(xì)胞中分離出來。SAGE 技術(shù)可被用于整個(gè)基因組的轉(zhuǎn)錄圖譜中。使用SAGE技術(shù),β-肌動(dòng)蛋白啟動(dòng)子被鑒定為是 CHO細(xì)胞中最具活性的啟動(dòng)子之一。因此從CHO細(xì)胞中克隆β-肌動(dòng)蛋白啟動(dòng)子??蓱?yīng)用 相似的方法從CHO細(xì)胞中克隆倉鼠rpS21啟動(dòng)子。該方法可被用于其他基因組的轉(zhuǎn)錄圖 譜以確認(rèn)在其他基因組中相應(yīng)的β-肌動(dòng)蛋白啟動(dòng)子或rpS21啟動(dòng)子的活性??墒褂帽绢I(lǐng) 域公知的標(biāo)準(zhǔn)技術(shù)或此處描述的技術(shù)克隆這些啟動(dòng)子??梢酝ㄟ^將其與一個(gè)或多個(gè)SEQID NOs :1、2、3或39列出的啟動(dòng)子序列雜交的方法鑒別本發(fā)明的啟動(dòng)子的變種。同源性每降低 1%,雙鏈核酸的熔點(diǎn)(Tm)就降低1-1. 5°C是公知的(見,如Bormer et al. (1973) J. Mol. Biol. ,81 :123)。因此,例如可以將公認(rèn)的核苷酸序列與SEQ ID NOs :1、2、3或39或其變種 序列雜交,并將此雜化物的熔點(diǎn)和SEQ ID NOs :1、2、3或39或其變種序列與其互補(bǔ)序列的 雜化物的熔點(diǎn)相比較,從而鑒定物種間的同源性。然后可以計(jì)算待測雜化物的堿基對(duì)錯(cuò)配 數(shù)。因此,待測雜化物的熔點(diǎn)與含有任何SEQ ID NOs :1、2、3或39的公認(rèn)同源物的雜化物 的熔點(diǎn)的差別越小,表明公認(rèn)的核苷酸序列與本發(fā)明的啟動(dòng)子序列之間的同源性越大。例 如,在其他嚙齒動(dòng)物如,豚鼠、花白旱獺、麝鼠、沙鼠、松鼠、花栗鼠、土撥鼠、海貍、豪豬和野 鼠中的變種可以表現(xiàn)為與本發(fā)明的啟動(dòng)子及其變種具有更高的同源性。已知多種因子影響核酸雙鏈的雜交效率。其包括,例如,核酸序列的長度,鹽濃度 和序列的G/C含量。例如,為了雜交DNA的長片段,Howley et al. (1997) J. Biol. Chem., 254 :4876,確定了使50% DNA與互補(bǔ)鏈雜交的熔點(diǎn)為Tm = 81. 5+16. 61ogM+41(% G+% C) -500/L-0. 62F,其中,M是單價(jià)陽離子的摩爾濃度;(%G+%C)是序列中G和C核苷酸各自的份額,L是雜合DNA的長度;
F是甲酰胺的摩爾濃度。本領(lǐng)域技術(shù)人員可以如 Ausubel et al. (1995) Current Protocols inMolecular Biology,John Wiley & Sons,的第2、4和6部分列舉的通過最少的實(shí)驗(yàn)來選擇恰當(dāng)?shù)碾s交 條件。另夕卜,嚴(yán)格的雜交條件在 Sambrooket al. (1989)Molecular Cloning :A Laboratory Manual, 2nd ed.,Cold SpringHarbor Press,第 7、9 禾口 11 章中描述。低嚴(yán)格的雜交條件的非限制性的例子如下。含有DNA的濾紙?jiān)?0°C下,在含有 35%甲酰胺、5父55(、501111111^8-!1(1化!17.5)、51111 EDTA, 0. 1% PVP.O. 1 % Ficoli U% BSA, 和500ug/ml變性的鮭魚精子DNA的溶液中預(yù)處理6小時(shí)。雜交在具有以下變動(dòng)的相同的 溶液中進(jìn)行0. 02% PVP,0. 02% Ficoli 、0. 2% BSAUOOug/ml 變性的鮭魚精子 DNA、10% (wt/vol)硫酸葡聚糖以及使用5-20X 10632P-標(biāo)記的探針。濾紙?jiān)?0°C下,在雜交混合液 中孵育 18-20 小時(shí),然后在 55°C 的含 2XSSC、25mM Tris-HCl (pH7. 4)、5mM EDTA 禾Π 0. 1% SDS 的溶液中洗脫1.5小時(shí)。用新鮮溶液替換洗脫液并在60°C下繼續(xù)賦育1.5小時(shí)。吸干濾 紙,使其暴露于射線自顯儀。也可以使用本領(lǐng)域公知的其他的低嚴(yán)格條件(如,種間雜交所 用的)。一個(gè)高度嚴(yán)格的雜交條件的非限制性的示例如下所述。含有DNA的濾紙的預(yù)雜交 在含有6X SSC、50mM Tris-HCl (ρΗ7· 5)、ImM EDTA.O. 02% PVP.O. 02% Ficoll ,0. 02% BSA和500ug/ml變性的鮭魚精子DNA的緩沖液中,在65°C處理8小時(shí)至過夜。濾紙?jiān)?5°C下, 含有100ug/ml變性的鮭魚精子DNA和5-20X 106cpm的32P-標(biāo)記的探針的雜交液中雜交48 小時(shí)。在37°C下,含有2X SSC、0. 01% PVP,0. 01% Ficoll 和0. 01% BSA的溶液中洗脫濾 紙1小時(shí),之后在50°C,0. IXSSC溶液中洗脫45分鐘。一個(gè)中度嚴(yán)格的雜交條件的非限制性的例子包括在5X SSC.0. 5% SDSU. OmM EDTA,pH8. 0的溶液中預(yù)洗脫;在50%甲酰胺、6XSSC的溶液中42°C進(jìn)行雜交;在0. 5X SSC、 0. 1% SDS的條件下,60°C進(jìn)行洗脫。還可以通過公認(rèn)變種的核苷酸序列和SEQ ID NOs :1、2、3或39中的序列或其互補(bǔ) 鏈間同一性的百分比鑒定本發(fā)明啟動(dòng)子的變種。同一性百分比可以通過,例如,可見觀測或 本領(lǐng)域公知的或?qū)嵤├忻枋龅母鞣N計(jì)算機(jī)程序來確定。例如,可以通過使用Devereux等 (1984)Nucl. Acids. Res. , 12 387中描述的并從威斯康星州大學(xué)的基因計(jì)算機(jī)組(UffGCG) 中可獲得的GAP計(jì)算機(jī)程序比較序列信息來確定兩核苷酸序列的同一性百分比。還可以 通過使用如 Tatusove et al. (1999)FEMS Microbiol. Lett.,174 :247 中描述的 BLAST 程序(www.ncbi.nl m. nih. gov/BLAST)比對(duì)兩核苷酸序列以確定同一性百分比。例如,使 用BLAST 程序進(jìn)行核苷酸序列比對(duì)時(shí),默認(rèn)參數(shù)設(shè)定如下匹配回報(bào)為2,不匹配懲罰 為-2,開口間隙和延伸間隙懲罰分別為5和2,間隙Xdropoff為50,預(yù)期值為10,字大小為 11,過濾器關(guān)閉。通過序列同一性鑒別的本發(fā)明的啟動(dòng)子包括,例如,SEQ ID NOs 2和3序列分別 列出的大鼠和小鼠β-肌動(dòng)蛋白啟動(dòng)子的序列,顯示出與SEQ ID NOl列出的倉鼠β-肌動(dòng) 蛋白啟動(dòng)子序列的1-3007核苷酸相比具有67%和80%的同一性。應(yīng)用此處描述的和本領(lǐng) 域熟知的多種技術(shù)可以很容易地鑒別其他變種??梢酝ㄟ^所描述的方法確定倉鼠β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID Ν01)與已知的 β-肌動(dòng)蛋白啟動(dòng)子間的同一性百分比。例如,當(dāng)用默認(rèn)參數(shù)的BLAST 序列比對(duì)對(duì)SEQ ID NOl與人β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID Ν05)進(jìn)行對(duì)比時(shí),顯示出在SEQ ID NOl的全長 上僅有大約10%的同一性。相似地,當(dāng)SEQ ID NOl與雞β-肌動(dòng)蛋白啟動(dòng)子(SEQ ID Ν06) 對(duì)比時(shí),顯示出在SEQ ID NOl的全長上僅有大約的同一性。由于同源性的水平如此 低,因此不認(rèn)為人和雞的β-肌動(dòng)蛋白啟動(dòng)子是SEQ ID NOl列出的倉鼠β-肌動(dòng)蛋白啟動(dòng) 子的變種。而且,SEQ ID NOl的3’部分顯示出與倉鼠β _肌動(dòng)蛋白基因序列的5’部分( Genbank 接收號(hào)No。U20114;SEQ ID NO 4)具有顯著的同源性。特別地,如圖3所示,SEQ ID NO 4的前1232個(gè)核苷酸顯示出與SEQ ID NOl的3,部分具有98%的同一性。此同一 性位于倉鼠β-肌動(dòng)蛋白基因的第一內(nèi)含子區(qū)內(nèi)。整體上看,在SEQ ID NOl的全長上,SEQ ID NO 4僅顯示出40%的同源性。而且,SEQ ID NO 4或其片段并不具有啟動(dòng)子活性。應(yīng)用具有默認(rèn)參數(shù)的BLAST 序列比對(duì)發(fā)現(xiàn)在先前知道的人rpS21啟動(dòng)子( Genbank 接收號(hào)No AJ250907的核苷酸1-2344)與SEQ ID N039的倉鼠rpS21啟動(dòng)子的 核苷酸1-1958之間沒有同一性。在SEQ ID N039的倉鼠rpS21啟動(dòng)子和跨越小鼠rpS21基 因的小鼠基因組DNA( Genbank 接收號(hào)No NT_039212)之間有很低的同一性。在小鼠的 序列中有兩個(gè)具同源性的區(qū)域。第一個(gè)是SEQ ID NO 39的核苷酸1775-1945 (172個(gè)核苷 酸中有137個(gè)相匹配)。第二個(gè)是SEQ ID NO 39的核苷酸580-851 (274個(gè)核苷酸中有208 個(gè)相匹配)。這兩個(gè)具同一性的區(qū)域在倉鼠序列(SEQ ID NO 39)中被923個(gè)核苷酸分開,在小鼠基因組序列(NT_039212)中被1745個(gè)核苷酸分開。在一些實(shí)施方案中,具有啟動(dòng)子活性的分離的啟動(dòng)子或其變種包括SEQ ID NO 39 中的核苷酸1775-1945和/或SEQ ID NO 39中的核苷酸580-851的核苷酸序列??蛇x擇 的,此啟動(dòng)子或變種進(jìn)一步包括從SEQ ID NO 39的全部或如核苷酸852-1774所示的部分 序列。SEQ ID NOs :1、2、3或39所示的核苷酸序列或其變種可用作探針以用于篩選基因 組庫的,以便分離與一個(gè)或多個(gè)SEQ ID NOs :1、2、3或39所示序列或其變種的基因組序列。根據(jù)本發(fā)明的啟動(dòng)子或其變種被可操作地連接到被其所表達(dá)的異源核酸上。啟動(dòng) 子既可單獨(dú)使用,也可以與其他調(diào)節(jié)元件,如增強(qiáng)子和抑制子聯(lián)合使用。可供選擇地,此啟 動(dòng)子可被整合到宿主細(xì)胞或動(dòng)物的基因組上,從而在宿主細(xì)胞中表達(dá)內(nèi)源性基因。根據(jù)本 發(fā)明的啟動(dòng)子可被用在表達(dá)異源核酸的載體中。在某些實(shí)施方案中,異源核酸編碼治療性 蛋白。治療性蛋白的例子包括,但不局限于α-葡萄糖苷酶、酸性鞘磷脂酶、胰島素、組織血 漿酶原激活劑、促甲狀腺素α注射液刺激的激素(thyrogen stimulating hormon)、紅細(xì) 胞生成素、葡糖腦苷脂酶、α -半乳糖苷酶和各種抗體??贵w的例子包括但不局限于結(jié)合如 TGF-β _1、2和3TGF-β族成員的抗體。本發(fā)明進(jìn)一步提供了含有具有啟動(dòng)子活性的本發(fā)明的啟動(dòng)子或其變種的載體。在 一些實(shí)施方案中,本發(fā)明的載體包括位于啟動(dòng)子下游的合適的限制性酶切位點(diǎn),其可用于 插入異源的核酸。該限制性酶切位點(diǎn)可以包括用于一種限制性酶的一個(gè)限制性位點(diǎn)或其可 包括用于多種限制性酶的多個(gè)限制性位點(diǎn),從而有助于插入多個(gè)不同異源的核酸。本發(fā)明 的載體還可以包括異源核酸插入點(diǎn)下游的一個(gè)多腺苷序列。含有本發(fā)明啟動(dòng)子的載體還可 以含有用于細(xì)菌復(fù)制的原核DNA元件和用于載體在細(xì)菌細(xì)胞中生長和選擇的抗生素選擇 標(biāo)記,以及一個(gè)控制轉(zhuǎn)錄過程的另外的DNA元件,如終止信號(hào)。載體可以進(jìn)一步包含指導(dǎo)蛋 白質(zhì)向細(xì)胞外分泌的DNA序列。在某些實(shí)施方案中,含有本發(fā)明的啟動(dòng)子序列的載體是雙順反子載體。設(shè)計(jì)成雙 順反子載體可以使兩個(gè)核酸被轉(zhuǎn)錄而生成一個(gè)轉(zhuǎn)錄產(chǎn)物。此轉(zhuǎn)錄產(chǎn)物通常含有翻譯成一個(gè) 蛋白的第一部分和翻譯成另一個(gè)蛋白的第二部分。一個(gè)蛋白可以是興趣蛋白,如治療蛋 白,另一個(gè)蛋白可以被用作可供選擇的標(biāo)記。雙順反子載體通常含有一個(gè)啟動(dòng)子和一個(gè)內(nèi) 部的核糖體進(jìn)入位點(diǎn)或位于兩個(gè)核酸間的IRES。這使得兩個(gè)核酸轉(zhuǎn)錄為一個(gè)雙順反mRNA。 在這種方式下,可將載體構(gòu)建成含有本發(fā)明的肌動(dòng)蛋白啟動(dòng)子或其變種和在兩個(gè)異源 核酸間的IRES。含有本發(fā)明的β -肌動(dòng)蛋白啟動(dòng)子或其變種的雙順反子載體可被用于表達(dá) 連接報(bào)告基因的治療蛋白,例如,酸性鞘磷脂酶或α-葡萄糖苷酶。本發(fā)明進(jìn)一步提供了鑒定具有啟動(dòng)子活性的本發(fā)明的肌動(dòng)蛋白和rpS21啟動(dòng) 子的變種的方法。例如,將本發(fā)明的啟動(dòng)子或其變種插入合適載體的報(bào)告基因的上游,并且 報(bào)告基因的表達(dá),擇確定啟動(dòng)子活性的鑒定。例如,為鑒定本發(fā)明的具有啟動(dòng)子活性的啟 動(dòng)子變種,則將此變種克隆到報(bào)告基因的上游。報(bào)告基因可以編碼能催化產(chǎn)生視覺可辨別 信號(hào)的反應(yīng)的酶。此種信號(hào)基因的例子包括半乳糖苷酶和熒光素酶。其他信號(hào)基因 的例子包括堿性磷酸酶、胭脂堿合成酶、章魚堿合成酶、β “葡萄糖醛酸苷酶、氯霉素乙?;?轉(zhuǎn)移酶(chloremphenicol acetyltransferase)。在下列實(shí)施例中,編碼???Discosoma striata)紅色熒光蛋白(RFP)的報(bào)告基因被用于檢測啟動(dòng)子活性。然而,本領(lǐng)域技術(shù)人員可以使用任何適當(dāng)?shù)膱?bào)告基因和分析技術(shù)檢測啟動(dòng)子活性。可以在體外表達(dá)系統(tǒng)或細(xì)胞內(nèi) (如體內(nèi))分析啟動(dòng)子啟動(dòng)的報(bào)告基因的表達(dá)。本發(fā)明進(jìn)一步提供了被含有可操作地連接到異源基因的啟動(dòng)子的本發(fā)明的載體 轉(zhuǎn)染的宿主細(xì)胞。此宿主細(xì)胞可以是原核細(xì)胞或真核細(xì)胞。宿主細(xì)胞可以是培養(yǎng)的,也可以 是動(dòng)物中的細(xì)胞。培養(yǎng)的宿主細(xì)胞的例子包括,但不局限于Hela細(xì)胞、CHO細(xì)胞、NSO, HEK 細(xì)胞、BHK細(xì)胞、NIH-3T3、MDCK細(xì)胞和COS細(xì)胞。如實(shí)施例中所述的,培養(yǎng)中的宿主細(xì)胞可 以懸浮或在微載體中生長??梢允褂迷S多恰當(dāng)?shù)姆椒▽⒈景l(fā)明的核酸導(dǎo)入宿主細(xì)胞。含有本發(fā)明啟動(dòng)子序列 的載體可以被導(dǎo)入原核或真核細(xì)胞??梢詫⒑怂釋?dǎo)入真核細(xì)胞的技術(shù)的例子包括,例如,磷 酸鈣沉淀、DEAE-右旋糖苷轉(zhuǎn)染、電穿孔、脂質(zhì)體介導(dǎo)的轉(zhuǎn)染、應(yīng)用病毒載體的轉(zhuǎn)導(dǎo)等??梢杂迷S多恰當(dāng)?shù)谋磉_(dá)系統(tǒng)來生成使用本發(fā)明的啟動(dòng)子的蛋白質(zhì)。一個(gè)此種表 達(dá)系統(tǒng)應(yīng)用了二氫葉酸還原酶(DHFR)基因,該基因被導(dǎo)入含有可操作地連接到異源核酸 的本發(fā)明啟動(dòng)子或其變種的載體。可供選擇地,如果使用DFHR缺陷細(xì)胞作表達(dá),可將表達(dá) DHFR的表達(dá)載體共同轉(zhuǎn)染到宿主細(xì)胞。當(dāng)增加甲氨蝶呤(MTX),一種主要的酶DHFR的競爭 性抑制劑的濃度被施加到轉(zhuǎn)染細(xì)胞時(shí),僅僅具DHFR較高表達(dá)水平的細(xì)胞存活。進(jìn)一步增加 MTX水平時(shí),僅僅那些DHFR基因的拷貝數(shù)增幅的細(xì)胞存活。在這種方式下,通過增加含啟 動(dòng)子的載體的拷貝數(shù),可以增加異源核酸的表達(dá),從而提高蛋白質(zhì)產(chǎn)量。第二個(gè)表達(dá)系統(tǒng)使 用了谷氨酸合成酶(GS)基因,該基因被導(dǎo)入含有被可操作地連接到異源核酸的本發(fā)明的 啟動(dòng)子或其變種的載體中。使用另外GS的競爭性抑制劑,如,硫代甲硫氨酸(methionine sulphoximine) (MSX),以增加載體的拷貝數(shù),實(shí)現(xiàn)增加的蛋白質(zhì)產(chǎn)量。任何恰當(dāng)?shù)脑嘶蛘婧吮磉_(dá)系統(tǒng)可被用來表達(dá)應(yīng)用本發(fā)明的啟動(dòng)子蛋白質(zhì)。表達(dá) 系統(tǒng)的例子包括,但不局限于,植物、桿狀病毒、酵母、細(xì)菌、果蠅、哺乳動(dòng)物或無細(xì)胞(cell free)表達(dá)系統(tǒng)。例如,在Ausubel (1995),supra中提供了將表達(dá)載體導(dǎo)入哺乳動(dòng)物、細(xì)菌、 酵母、昆蟲和植物細(xì)胞的標(biāo)準(zhǔn)方法。在某些實(shí)施方案中,本發(fā)明的啟動(dòng)子及其變種被用于基因治療的方法中。例如,本 發(fā)明的啟動(dòng)子及其變種被克隆到病毒或非病毒基因治療載體中,使其被可操縱的連接到興 趣基因上。當(dāng)載體被運(yùn)送到目的物,如人類病人時(shí),啟動(dòng)子啟動(dòng)編碼治療蛋白的基因表達(dá)。以下實(shí)施例提供了本發(fā)明的說明性實(shí)施方案。本領(lǐng)域的普通技術(shù)人員將意識(shí)到在 不改變本發(fā)明的主旨和范圍時(shí),可進(jìn)行多種修飾和改動(dòng)。這些修飾和改動(dòng)仍包括在本發(fā)明 的范圍內(nèi)。這些實(shí)施例不以任何方式限制本發(fā)明。實(shí)施例以下描述了實(shí)施例中所用的物質(zhì)和方法A. CHO-Kl細(xì)胞的培養(yǎng)CHO-K 1 M Ifi JA American Type Culture Collection(Manassas, VA)(ATCC No. CRL-9618)獲得。在 250ml 含有 15g/L DE-52 微載體(Whatman,Kent, UK)、和 10%供 體小牛血清(DCS) (Invitrogen)的925細(xì)胞培養(yǎng)基中旋轉(zhuǎn)培養(yǎng)細(xì)胞。細(xì)胞在37°C下,使用 20-40% O2和5% CO2、并在大約60rpm下晃動(dòng)6天。細(xì)胞在血清存在下生長后,每天用不含 血清的925培養(yǎng)基更換80% (ν/ν)培養(yǎng)基。細(xì)胞在不含血清的培養(yǎng)基中生長11天后從細(xì) 胞中提取RNA。為了確定mRNA的半衰期,將7mg/L的放射菌素D加入不含血清相中。
B. RNA的提取和分析使用Promega (Madison, WI)的 RNAgents 試劑盒從 CH0-K1 細(xì)胞中分離 RNA。 用RNA印記法分析基因表達(dá)。為進(jìn)行RNA印記分析,應(yīng)用NorthernMax -Gly試劑盒 (Ambion, Ausein,TX)在變性的glycoxal/二甲基亞砜凝膠上電泳分離5ug RNA。而后將 RNA轉(zhuǎn)到尼龍膜上(Schleiche & Schuell,Dassel,德國)。用通過PCR擴(kuò)增的下述基因 探針雜交斑點(diǎn)半乳糖結(jié)合蛋白(Genbank 接收號(hào)No.M96676,核苷酸14-383) ; β-肌 動(dòng)蛋白(Genbank 接收號(hào) No. U20114,核苷酸 238-381) ;EF-I ( Genbank 接收號(hào) No. D00522,核苷酸 7-192) ;rpS21( Genbank 接收號(hào) No. X79059,核苷酸 68-340);鐵蛋白 (Genbank 接收號(hào)No. M99692,核苷酸182-303)或商業(yè)上可購得的甘油醛-3-磷酸脫氫 酶(GAPDH)片段(Ambion,Austin, TX)。使用隨機(jī)引物將每種PCR產(chǎn)物放射標(biāo)記。用于擴(kuò) 增每種基因的PCR引物在表一中列出。表權(quán)利要求
一種選自SEQ ID NOs1、2、3的核苷酸序列的分離的嚙齒動(dòng)物β 肌動(dòng)蛋白啟動(dòng)子或其具有啟動(dòng)子活性的變種。
2.—種SEQ ID NO :1中列出的分離的倉鼠β -肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其具有 啟動(dòng)子活性的變種。
3.—種SEQ ID NO :2中列出的分離的大鼠β -肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其具有 啟動(dòng)子活性的變種。
4.一種SEQ ID NO :3中列出的分離的小鼠β -肌動(dòng)蛋白啟動(dòng)子核苷酸序列,或其具有 啟動(dòng)子活性的變種。
5.一個(gè)包括SEQ ID NO :1中列出的核苷酸序列的分離的核酸,或其具有啟動(dòng)子活性的 變種。
6.一個(gè)包括SEQ ID NO :2中列出的核苷酸序列的分離的核酸,或其具有啟動(dòng)子活性的 變種。
7.一個(gè)載體,其包括SEQ ID NO 1中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。
8.一個(gè)載體,其包括SEQ ID NO :2中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。
9.一個(gè)載體,其包括SEQ ID NO :3中的啟動(dòng)子,或其具有啟動(dòng)子活性的變種。
10.根據(jù)權(quán)利要求7-9的任何一項(xiàng)所述的載體,其中啟動(dòng)子被可操作地連接到異源核酸上。
全文摘要
本發(fā)明涉及新的β-肌動(dòng)蛋白和核糖體蛋白S21(rpS21)啟動(dòng)子的分離及應(yīng)用。特別地,本發(fā)明的特征為包括倉鼠、大鼠和小鼠的嚙齒動(dòng)物β-肌動(dòng)蛋白啟動(dòng)子和倉鼠rpS21啟動(dòng)子的序列。
文檔編號(hào)C07K14/47GK101942442SQ20101014561
公開日2011年1月12日 申請日期2004年6月24日 優(yōu)先權(quán)日2003年6月24日
發(fā)明者S·D·埃斯蒂斯, W·張 申請人:建新公司