專利名稱:控制水稻中貯藏蛋白的表達(dá)的bZIP轉(zhuǎn)錄因子的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的轉(zhuǎn)錄因子,以及其與水稻(rice)植物種子中貯藏蛋白的胚乳特異性表達(dá)有關(guān)的用途。
背景技術(shù):
種子貯藏蛋白只在種子的成熟階段表達(dá),對(duì)編碼此類蛋白基因的分析可作為研究植物基因轉(zhuǎn)錄調(diào)控機(jī)理的合適模型(Goldberg,R.B.等,Science 266605-614,1994)。已知編碼種子貯藏蛋白的基因的表達(dá)受到啟動(dòng)子中多個(gè)順式因子協(xié)同作用的調(diào)控。在轉(zhuǎn)錄的引發(fā)以及組織和時(shí)間特異性表達(dá)中,轉(zhuǎn)錄因子與特異性順式調(diào)控因子的結(jié)合是重要的。這可以解釋為當(dāng)識(shí)別特異性順式調(diào)控因子的轉(zhuǎn)錄因子結(jié)合并凝聚時(shí),種子貯藏蛋白的表達(dá)受到幾種類型的順式調(diào)控因子的誘導(dǎo),所述調(diào)控因子與種子特異性表達(dá)的調(diào)控有關(guān)。為了闡明種子貯藏蛋白表達(dá)的分子機(jī)理,對(duì)農(nóng)作物貯藏蛋白基因的順式調(diào)控因子和轉(zhuǎn)錄因子進(jìn)行功能性分析(Thomas,T.L.,Plant Cell 51401-1410,1993;Morton,R.L.等,in Seed Development and Germination,pp.103-138,MarcelDekker,Inc.,1995)。
但是,盡管進(jìn)行了大量的研究,采用轉(zhuǎn)化植物的分析沒(méi)有能鑒定在幾乎所有研究過(guò)的農(nóng)作物的基因表達(dá)調(diào)控中必須的順式調(diào)控因子,所述基因表達(dá)調(diào)控的機(jī)理至今未能闡明。特別對(duì)于單子葉植物,只對(duì)水稻植物的種子貯藏蛋白和谷蛋白,采用穩(wěn)定的轉(zhuǎn)化植物進(jìn)行了啟動(dòng)子分析。另一方面,對(duì)玉米,小麥和大麥進(jìn)行基因槍或煙草轉(zhuǎn)化體的分析實(shí)驗(yàn)(Muller,M.和Knudsen,S.,Plant J.6343-355,1993;Albani,D.等,Plant Cell 9171-184,1997;Marzabal,P.M.等,Plant J.1641-52,1998)。
已表明谷物種子貯藏蛋白基因的胚乳特異性表達(dá)受到幾種類型順式調(diào)控因子協(xié)同作用的調(diào)控。通過(guò)減益(loss-of-function)和增益(gain-of-function)分析,確定在多種谷物的種子貯藏蛋白基因的啟動(dòng)子中保守的谷醇溶蛋白盒(TGTAAAG),GCN4基元(TGA(G/C)TCA),AACA基元(AACAAAA),和ACGT基元是參與胚乳特異性表達(dá)的順式調(diào)控因子(Morton,R.L.等,InSeedDevelopment and Germination,pp.103-138,Marcel Dekker Inc.,1995)。
所述GCN4基元不但在種子貯藏蛋白基因中,還在涉及代謝的基因的啟動(dòng)子中經(jīng)常發(fā)現(xiàn)(Muller,M.和Knudsen,S.,Plant J.6343-355,1993)。最近,發(fā)現(xiàn)水稻植物谷蛋白基因的GCN4基元的聚合體在轉(zhuǎn)化水稻植物中再現(xiàn)(reproduce)胚乳特異性表達(dá),并發(fā)現(xiàn)由于GCN4基元上核苷酸的取代或缺失,啟動(dòng)子活性顯著降低并且其表達(dá)方式改變。這些事實(shí)證明GCN4基元在胚乳特異性表達(dá)中起重要作用(Wu,C.Y.等,Plant J.14673-683,1998)。許多情況下所述GCN4基元通過(guò)多個(gè)堿基與谷醇溶蛋白盒(TGTAAAG)偶聯(lián),是在幾乎所有谷物的谷醇溶蛋白基因啟動(dòng)子中發(fā)現(xiàn)的雙因子胚乳盒的組成之一,包括小麥麥谷蛋白,大麥的大麥醇溶蛋白,黑麥的黑麥堿,高粱cafulin,薏苡corxin。AACA基元參與幾乎所有水稻谷蛋白基因的表達(dá)。盡管基因表達(dá)需要兩個(gè)基元的結(jié)合(GCN4基元和谷醇溶蛋白盒或GCN4基元和AACA基元),為了足夠地發(fā)揮胚乳特異性啟動(dòng)子的作用,還需要一個(gè)額外的基元(Takaiwa,F(xiàn).等,Plant Mol.Biol.301207-1221,1996;Yoshihara,T.等,F(xiàn)EBSLetts.383213-218,1996;Wu,C.Y.等,Plant J.(在印))。最近,已經(jīng)闡明,為了作為能在水稻植物谷蛋白基因(GluB1)中再現(xiàn)胚乳特異性表達(dá)的最小啟動(dòng)子起作用,至少需要三種組成,即存在于197bp啟動(dòng)子區(qū)內(nèi)的GCN4基元,AACA基元和ACGT基元(Wu,C.Y.等,Plant J.14673-683,1998;Wu,C.Y.等,Plant J.23415-421,2000)。
玉米的Opaque2(O2)是bZIP型的胚乳特異性轉(zhuǎn)錄因子,此O2與玉米的22kDaα-玉米醇溶蛋白基因啟動(dòng)子的ACGT基元結(jié)合以激活轉(zhuǎn)錄(Schmidt,R.J.等,Plant Cell 4689-700,1992)。已有報(bào)道O2通過(guò)與(Ga/tTGAPyPuTGPu)序列結(jié)合,參與b-32核糖體失活蛋白基因的胚乳特異性轉(zhuǎn)錄(Lohmer,S.等,EMBO J.10617-624,1991)。因此認(rèn)為O2具有廣泛的結(jié)合能力。據(jù)報(bào)道,GCN4基元被O2識(shí)別,通過(guò)O2與GCN4基元的結(jié)合激活轉(zhuǎn)錄(Wu,C.Y.等,Plant J.14673-683,1998;Holdsworth,M.J.等,Plant Mol.Biol.29711-720,1995)。在種子的成熟階段,體內(nèi)足跡實(shí)驗(yàn)顯示核蛋白結(jié)合GCN4基元和谷醇溶蛋白盒,所述GCN4基元存在于小麥低分子量麥谷蛋白基因啟動(dòng)子(Vicente-Carbajos,J.等,Plant J.13629-640,1998)和玉米γ-玉米醇溶蛋白基因啟動(dòng)子(Marzabal,P.M.等,Plant J.1641-52,1998)中。此外,體內(nèi)DNaseI足跡實(shí)驗(yàn)表明成熟水稻植物種子的核蛋白以及GST-O2融合蛋白特異性識(shí)別水稻谷蛋白基因啟動(dòng)子的GCN4基元(Wu,C.Y.等,Plant J.14673-683,1998;Kim,S.Y.和Wu,R.,Nucl.Acids Res.186845-6852,1990)。這些發(fā)現(xiàn)暗示O2樣轉(zhuǎn)錄因子存在于谷物種子中,控制由GCN4基元介導(dǎo)的多種種子貯藏蛋白基因的胚乳特異性表達(dá)。
最近,從小麥(Albani,D.等,Plant Cell 9171-184,1997)和大麥(Vicente-Carbajos,J.等,Plant J.13629-640,1998;Onate,L.等,J.Biol.Chem.2749175-9182,1999)中分離了識(shí)別GCN4基元的轉(zhuǎn)錄因子的cDNA克隆,已命名為SPA,BLZ1和BLZ2。已確定這些轉(zhuǎn)錄因子激活在小麥低分子量谷蛋白和大麥的大麥醇溶蛋白B1基因啟動(dòng)子中GCN4基元介導(dǎo)的種子貯藏蛋白基因的轉(zhuǎn)錄。有趣地是,這些轉(zhuǎn)錄因子是種子特異性表達(dá)。盡管已從水稻植物分離了與O2的bZIP區(qū)高度同源的編碼轉(zhuǎn)錄因子的cDNA,仍需要證實(shí)它是否激活GCN4基元介導(dǎo)的種子貯藏蛋白基因的轉(zhuǎn)錄(Izawa,T.等,PlantCell 61277-1287,1994;Nakase,M.等,Plant Mol.Biol.33513-522,1997)。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目標(biāo)是提供一種新的通過(guò)結(jié)合GCN4基元而調(diào)控水稻種子貯藏蛋白表達(dá)的轉(zhuǎn)錄因子,編碼所述因子的基因,已導(dǎo)入所述基因的植物細(xì)胞和植物體,以及生產(chǎn)方法及其用途。
本發(fā)明人進(jìn)行研究以解決上述問(wèn)題。如上所述,GCN4基元是在谷物種子貯藏蛋白基因中高度保守的序列,在所述基因的胚乳特異性表達(dá)中起核心作用。GCN4基元被與玉米蛋白的Opaque2密切相關(guān)的bZIP轉(zhuǎn)錄因子家族識(shí)別。因此,本發(fā)明人認(rèn)為通過(guò)從水稻種子中分離bZIP轉(zhuǎn)錄因子,可能鑒定結(jié)合GCN4基元的轉(zhuǎn)錄因子,所述轉(zhuǎn)錄因子通過(guò)與GCN4基元的結(jié)合控制水稻種子貯藏蛋白的表達(dá)。
首先,本發(fā)明人篩選了源自水稻種子的cDNA文庫(kù)并分離了編碼五種類型bZIP轉(zhuǎn)錄因子(RISBZ1,RISBZ2,RISBZ3,RISBZ4,和RISBZ5)的cDNA?;谕贫ǖ陌被嵝蛄械耐葱?,RISBZ2和RISBZ3分別相同于RITAI(Izawa,T.等,Plant Cell 61277-1287,1994)和REB(Nakase,M.等,PlantMol.Biol.33513-522,1997),剩下的RISBZ1,RISBZ4和RISBZ5都顯示編碼新的蛋白。在研究RISBZ1,RISBZ2,RISBZ3,RISBZ4和RISBZ5與GCN4基元的結(jié)合能力時(shí),它們都表現(xiàn)出對(duì)GCN4基元的結(jié)合活性。而且,測(cè)定了所述五種蛋白通過(guò)結(jié)合GCN4基元的轉(zhuǎn)錄活化能力。結(jié)果,只有RISBZ1通過(guò)結(jié)合GCN4基元活化轉(zhuǎn)錄100倍或更高。此外,采用酵母的GAL4 DNA結(jié)合區(qū)的分析顯示RISBZ1 N末端富含脯氨酸的27個(gè)氨基酸殘基起轉(zhuǎn)錄活化區(qū)的作用。RISBZ1和其它RISBZ蛋白間轉(zhuǎn)錄活化能力的差異主要是由于轉(zhuǎn)錄活化區(qū)的7個(gè)氨基酸殘基的突變(對(duì)于RISBZ2)或缺失(對(duì)于RISBZ3,RISBZ4,和RISBZ5)。此發(fā)現(xiàn)提示RISBZ1和其它RISBZ蛋白間的轉(zhuǎn)錄活化能力的差異是由于轉(zhuǎn)錄活性區(qū)的結(jié)構(gòu)突變。此外,發(fā)現(xiàn)RISBZ1不止形成同二聚體(homodimer),還與其它RISBZ蛋白形成異二聚體。由于RISBZ1的表達(dá)先于種子貯藏蛋白基因的表達(dá)并且只在成熟種子中表達(dá),因此RISBZ1可能控制種子貯藏蛋白的表達(dá)。為研究RISBZ1基因的表達(dá),將RISBZ1基因的啟動(dòng)子與GUS報(bào)道基因相偶聯(lián),將此構(gòu)建體引入水稻植物。在此水稻植物中,GUS基因在糊粉層顯著表達(dá)。
如上所述,本發(fā)明人闡明了新的蛋白R(shí)ISBZ1,RISBZ4和RISBZ5確實(shí)結(jié)合GCN4基元,并澄清了RISBZ1是參與水稻種子貯藏蛋白基因胚乳特異性表達(dá)的轉(zhuǎn)錄活化因子。
本發(fā)明人還制備了轉(zhuǎn)化植物,其包含一種DNA構(gòu)建體(其中本發(fā)明的RISBZ1連接到啟動(dòng)子的下游)和另一種DNA構(gòu)建體(其中報(bào)道基因連接到包含RISBZ1的靶序列的啟動(dòng)子的下游)。然后通過(guò)采用報(bào)道基因的表達(dá)作為指示,本發(fā)明人成功地測(cè)定了轉(zhuǎn)化的植物中RISBZ1的轉(zhuǎn)錄活性。這些發(fā)現(xiàn)使有用的,高附加值的外源基因在轉(zhuǎn)化植物細(xì)胞中高水平表達(dá),在所述植物細(xì)胞中,外源基因,而非上述的報(bào)道基因,連接到包含RISBZ1靶序列的啟動(dòng)子的下游。
本發(fā)明涉及新的轉(zhuǎn)錄因子,其通過(guò)與GCN4基元結(jié)合調(diào)節(jié)水稻種子貯藏蛋白的表達(dá),編碼所述因子的基因,已引入該基因的植物細(xì)胞和植物,其生產(chǎn)方法和用途。更具體地,本發(fā)明提供了[1]一種選自下組的DNA
(a)一種DNA,所述DNA編碼包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列的蛋白;(b)一種DNA,所述DNA編碼包含SEQ ID NO1,3,4和6中任一項(xiàng)所示核苷酸序列的編碼區(qū);(c)一種DNA,所述DNA包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列,所述序列中有一或多個(gè)氨基酸被取代,缺失,添加,和/或插入,并且所述DNA編碼的蛋白在功能上等價(jià)于包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列的蛋白;和(d)一種DNA,所述DNA在嚴(yán)謹(jǐn)條件下與包含SEQ ID NO1,3,4和6中任一項(xiàng)所示核苷酸序列的DNA雜交,并且所述DNA編碼的蛋白在功能上等價(jià)于包含SEQ ID NO2,5,和7中任一項(xiàng)所示氨基酸序列的蛋白;[2][1]的DNA,所述DNA編碼與GCN4基元結(jié)合并活化水稻種子貯藏蛋白的蛋白;[3][1]或[2]的DNA,所述DNA得自水稻植物;[4]一種編碼反義RNA的DNA,所述反義RNA與[1]到[3]任一項(xiàng)DNA的轉(zhuǎn)錄產(chǎn)物互補(bǔ);[5]一種編碼RNA的DNA,所述RNA具有特異性裂解[1]到[3]任一項(xiàng)DNA的轉(zhuǎn)錄產(chǎn)物的核酶活性;[6]一種編碼RNA的DNA,所述RNA具有通過(guò)共抑制作用抑制[1]到[3]任一項(xiàng)DNA在植物細(xì)胞中表達(dá)的活性,并且與[1]到[3]任一項(xiàng)的DNA具有90%或更多的同源性;[7]一種編碼蛋白的DNA,所述蛋白具有[1]到[3]任一項(xiàng)的DNA編碼的蛋白的顯性陰性表型,其在植物細(xì)胞中是內(nèi)源的;[8]一種載體,所述載體包含[1]到[3]任一項(xiàng)的DNA;[9]一種轉(zhuǎn)化細(xì)胞,所述細(xì)胞含有[1]到[3]任一項(xiàng)的DNA或[8]的載體;[10]一種由[1]到[3]任一項(xiàng)的DNA編碼的蛋白;[11]一種產(chǎn)生[10]的蛋白的方法,所述方法包含如下步驟培養(yǎng)[9]的轉(zhuǎn)化細(xì)胞,從該轉(zhuǎn)化細(xì)胞或其細(xì)胞培養(yǎng)上清中收集表達(dá)的蛋白;[12]一種包含[4]到[7]任一項(xiàng)的DNA的載體;[13]一種轉(zhuǎn)化的植物細(xì)胞,所述細(xì)胞含有[1]到[7]任一項(xiàng)的DNA或[8]或[12]中任一項(xiàng)的載體;[14]一種轉(zhuǎn)化植物,所述植物包含[13]的轉(zhuǎn)化的植物細(xì)胞;[15]一種轉(zhuǎn)化植物,所述植物是[14]的轉(zhuǎn)化植物的子代或克??;[16][14]或[15]的轉(zhuǎn)化植物的再生材料;[17]一種與[10]的蛋白結(jié)合的抗體;[18]一種植物,在其基因組上具有兩種DNA構(gòu)建體,其中第一種構(gòu)建體中[1]的DNA可操縱地連接到表達(dá)調(diào)控區(qū)的下游,第二種DNA構(gòu)建體中一種外源基因可操縱地連接到表達(dá)調(diào)控區(qū)的下游,該調(diào)控區(qū)具有[10]的蛋白的靶序列;[19][18]的植物,其中所述靶序列是包含GCN4基元的序列;[20][19]的植物,其中所述GCN4基元具有選自SEQ ID NO8,13,和14中任一項(xiàng)的序列;[21][18]的植物,其中所述靶序列是包含G/C盒的序列;[22]一種生產(chǎn)[18]到[21]任一項(xiàng)的植物的方法,所述方法包括將在其基因組上具有第一種DNA構(gòu)建體的植物與在其基因組上具有第二種DNA構(gòu)建體的植物雜交,所述第一種構(gòu)建體中[1]的DNA可操縱地連接到表達(dá)調(diào)控區(qū)的下游,所述第二種構(gòu)建體中一種外源基因可操縱連地接到包含[10]的蛋白的靶序列的表達(dá)調(diào)控區(qū)的下游。
本發(fā)明提供了編碼源于水稻植物的RISBZ1,RISBZ4,和RISBZ5蛋白的DNA。RISBZ1 cDNA的核苷酸序列表示為SEQ ID NO1,該cDNA編碼的蛋白的氨基酸序列表示為SEQ ID NO2,其基因組DNA的核苷酸序列表示為SEQ ID NO3(以SEQ ID NO3表示的基因組DNA包含內(nèi)含子并由六個(gè)外顯子組成)。RISBZ4和RISBZ5蛋白cDNA的核苷酸序列分別表示為SEQ ID NO4和SEQ ID NO6,而RISBZ4和RISBZ5蛋白cDNA編碼的蛋白的氨基酸序列分別表示為SEQ ID NO5和7。在本說(shuō)明書中,本發(fā)明的RISBZ1,RISBZ4,和RISBZ5統(tǒng)稱為RISBZ。
本發(fā)明的RISBZ蛋白被認(rèn)為是可結(jié)合GCN4基元活性的bZIP轉(zhuǎn)錄因子。在它們中,RISBZ1通過(guò)結(jié)合GCN4基元顯著激活轉(zhuǎn)錄。由于RISBZ1基因的啟動(dòng)子在水稻種子的糊粉層中被激活,因此認(rèn)為RISBZ1是控制水稻種子貯藏蛋白表達(dá)的轉(zhuǎn)錄-激活因子。
此外,有報(bào)道通過(guò)屬于bZIP轉(zhuǎn)錄因子家族的各種因子的組合,bZIP轉(zhuǎn)錄因子可形成各種同/異二聚體。結(jié)果,形成了具有各種功能的控制因子,所述控制因子控制基因的轉(zhuǎn)錄。在下述的實(shí)施例中,RISBZ2和RISBZ3表現(xiàn)出與RISBZ1形成異二聚體。此外,RISBZ4和RISBZ5分別與RISBZ3的bZIP區(qū)具有極高的同源性(分別是96%和82.7%),這些因子也可與RISBZ1形成異二聚體。這些事實(shí)提示本發(fā)明的RISBZ4和RISBZ5會(huì)與本發(fā)明的RISBZ1和其它RISBZ成員形成異二聚體,所述二聚體基于成熟階段和組織的不同,具有各種轉(zhuǎn)錄活化能力和DNA結(jié)合特性,從而控制種子貯藏蛋白的表達(dá)。
因此,本發(fā)明編碼RISBZ蛋白的DNA,或控制所述DNA表達(dá)的分子可用于,例如,調(diào)節(jié)種子貯藏蛋白的表達(dá)。調(diào)節(jié)種子貯藏蛋白的表達(dá)具有各種工業(yè)益處。例如,可以通過(guò)在胚乳中缺失種子貯藏蛋白而積聚豐富的外源基因產(chǎn)物。另一方面,通過(guò)在胚乳中高度地積聚種子貯藏蛋白,可以生產(chǎn)更有營(yíng)養(yǎng)價(jià)值的種子(例如水稻)。
本發(fā)明編碼RISBZ蛋白的DNA包括基因組DNA,cDNA和化學(xué)合成的DNA?;蚪MDNA和cDNA可通過(guò)本領(lǐng)域技術(shù)人員所知的一般方法制備。更具體地,可如下制備基因組DNA,例如(1)從植物細(xì)胞或組織中提取基因組DNA;(2)構(gòu)建基因組文庫(kù)(使用載體,如質(zhì)粒,噬菌體,粘粒,BAC,PAC等);(3)將文庫(kù)鋪平板;(4)采用基于編碼本發(fā)明蛋白的DNA(例如SEQ IDNO1,3,4或6)制備的探針進(jìn)行集落雜交或噬菌斑雜交。或者,可通過(guò)PCR制備基因組DNA,使用特異于編碼本發(fā)明蛋白的DNA(例如SEQ IDNO1,3,4或6)的引物。另一方面,可如下制備cDNA(1)基于提取自植物細(xì)胞或組織中的mRNA合成cDNA;(2)通過(guò)將合成的cDNA插入到載體,如λZAP中,制備cDNA文庫(kù);(3)將cDNA文庫(kù)鋪平板;(4)如上進(jìn)行集落雜交或噬菌斑雜交?;蛘?,cDNA可通過(guò)PCR制備。
本發(fā)明包括DNA,所述DNA編碼的蛋白功能上等價(jià)于SEQ ID NO2,5或7的RISBZ蛋白。此處,術(shù)語(yǔ)“功能上等價(jià)于RISBZ蛋白”是指目標(biāo)蛋白具有相當(dāng)于SEQ ID NO2,5,或7的RISBZ蛋白的生物功能,例如結(jié)合GCN4基元和/或調(diào)節(jié)水稻種子貯藏蛋白表達(dá)的功能。水稻種子貯藏蛋白包括,例如水稻谷蛋白。
這樣的DNA還包括如編碼包含SEQ IDNO2,5或7的氨基酸序列的突變體,衍生物,等位基因,變體和同系物的DNA,其中一個(gè)或多個(gè)氨基酸殘基被取代、缺失、添加和/或插入。
本領(lǐng)域已知制備編碼包含改變的氨基酸的蛋白的DNA的方法包括定點(diǎn)誘變法(Kramer,W.和Fritz,H.-J.,Oligonucleotide-directed construction ofmutagenesis via gapped duplex DNA.Methods in Enzymology,154350-367,1987)。蛋白的氨基酸序列也可由于核苷酸序列的突變而自發(fā)突變。本發(fā)明的DNA也包括這種DNA,所述DNA編碼具有天然RISBZ蛋白(SEQ ID NO2,5或7)的氨基酸序列的蛋白,但其中具有一或多個(gè)氨基酸的取代,缺失,和/或添加,只要其編碼的蛋白功能上等價(jià)于天然RISBZ蛋白。此外,不在蛋白中產(chǎn)生氨基酸序列改變的核苷酸序列突變體(兼并突變體)也包括在本發(fā)明的DNA中。目標(biāo)DNA的核苷酸突變數(shù)量在氨基酸水平上典型是100個(gè)氨基酸或更少,優(yōu)選50個(gè)氨基酸或更少,更優(yōu)選20個(gè)氨基酸或更少,最優(yōu)選10個(gè)氨基酸或更少(例如5個(gè)氨基酸或更少,或3個(gè)氨基酸或更少)。
可通過(guò)例如本領(lǐng)域所熟知的凝膠滯后實(shí)驗(yàn)來(lái)測(cè)定編碼蛋白的某DNA是否具有與GCN4基元結(jié)合的功能。更具體地,此分析可如下進(jìn)行將待測(cè)定DNA整合入載體以使其基因產(chǎn)物與GST形成融合蛋白,此載體可使該融合蛋白表達(dá)。采用GST為指示劑純化該表達(dá)產(chǎn)物,然后與含有GCN4基元的標(biāo)記的DNA探針混合。此混合溶液進(jìn)行非變性丙烯酰胺凝膠電泳??苫谀z中可檢測(cè)條帶的位置評(píng)價(jià)結(jié)合活性。
此外,可通過(guò),例如報(bào)道基因分析(reporter assay)來(lái)確定編碼蛋白的某DNA是否具有激活水稻種子貯藏蛋白表達(dá)的功能。更具體地,此分析可如下進(jìn)行首先構(gòu)建一種載體,使報(bào)道基因連接并位于水稻種子貯藏蛋白啟動(dòng)子的下游。此載體和表達(dá)檢測(cè)DNA基因產(chǎn)物的載體被引入到用于報(bào)道基因分析的細(xì)胞中,通過(guò)測(cè)定報(bào)道基因產(chǎn)物的活性評(píng)價(jià)檢測(cè)DNA基因產(chǎn)物的轉(zhuǎn)錄活性??捎糜诖藞?bào)道基因分析的水稻種子貯藏蛋白啟動(dòng)子的例如有水稻谷蛋白基因啟動(dòng)子。只要其表達(dá)可被檢測(cè)到,對(duì)所述報(bào)道基因沒(méi)有具體的限制,可以采用本領(lǐng)域技術(shù)人員在各種分析系統(tǒng)中所用的任何報(bào)道基因。報(bào)道基因的優(yōu)選例子是β-葡糖醛酸糖甘酶(GUS)基因。
其編碼的蛋白與SEQ ID NO2,5或7所示RISBZ蛋白功能上等價(jià)的DNA可通過(guò),例如本領(lǐng)域所熟知的方法產(chǎn)生,包括采用雜交技術(shù)的方法(Southem,E.M.,Jounal jof Molecular Biology,Vol.98,503,1975);和聚合酶鏈?zhǔn)椒磻?yīng)(PCR)技術(shù)(Saiki,R.K.等,Science,230,1350-1354,1985;Saiki,R.K.等,Science,239,487-491,1988)。本領(lǐng)域技術(shù)人員可常規(guī)地分離與水稻RISBZ基因高度同源的DNA,以及使用RISBZ基因(SEQ ID NO1,3,4,或6)或其部分作探針,特異地與該基因雜交的寡核苷酸為引物。這樣編碼的蛋白在功能上等價(jià)于RISBZ蛋白的DNA(通過(guò)雜交技術(shù)或PCR技術(shù)分離)包含在本發(fā)明的DNA內(nèi)。
分離這樣的DNA的雜交反應(yīng)優(yōu)選在嚴(yán)謹(jǐn)條件下進(jìn)行。本發(fā)明的嚴(yán)謹(jǐn)雜交條件包括如下條件6M尿素,0.4%SDS,0.5×SSC;以及產(chǎn)生與這些條件具有相似嚴(yán)謹(jǐn)度的條件。在更高嚴(yán)謹(jǐn)度條件下進(jìn)行雜交時(shí),例如6M尿素,0.4%SDS,0.1×SSC,預(yù)期對(duì)于具有較高同源性的DNA能有效分離。在這樣的條件下分離的DNA預(yù)計(jì)編碼與RISBZ蛋白(SEQ ID NO2,5或7)在氨基酸水平高度同源的蛋白。這里,高度同源指全部氨基酸序列同一性為至少50%或更多,更優(yōu)選指70%或更多,最優(yōu)選指90%或更多(例如95%或更多)。序列同一性的程度可通過(guò)FASTA檢索(Pearson W.R.和D.J.LipmanProc.Natl.Acad.Sci.USA.852444-2448,1988)或BLAST檢索來(lái)確定。
本發(fā)明的DNA可用于,例如制備如上所述的重組蛋白及產(chǎn)生轉(zhuǎn)基因植物。
通常重組蛋白的制備如下進(jìn)行將編碼本發(fā)明蛋白的DNA插入合適的表達(dá)載體,將載體引入到適合的細(xì)胞,培養(yǎng)轉(zhuǎn)化的細(xì)胞,純化表達(dá)的蛋白。重組蛋白可與其它蛋白一起作為融合蛋白表達(dá)以利于純化,例如作為與大腸桿菌中的麥芽糖結(jié)合蛋白(New England Biolabs,USA,載體pMAL系列)的融合蛋白,作為與谷胱甘肽-S-轉(zhuǎn)移酶(GST)(Amersham Pharmacia Biotech,載體pGEX系列)的融合蛋白,或用組氨酸(Novagen,pET系列)標(biāo)記。宿主細(xì)胞并無(wú)限制,只要該細(xì)胞適于表達(dá)重組蛋白。除上述大腸桿菌外還可能利用如,酵母,植物,昆蟲細(xì)胞或各種其它動(dòng)物細(xì)胞??赏ㄟ^(guò)各種本領(lǐng)域所熟知的方法將載體引入宿主細(xì)胞。例如,采用鈣離子的轉(zhuǎn)化方法(Mandel,M.和Higa,A.Journal of Molecular Biology,53,158-162,1970;Hanahan,D.Journal of Molecular Biology,166,557-580,1983)可用于將載體引入大腸桿菌。可通過(guò)本領(lǐng)域已知方法從宿主細(xì)胞或其培養(yǎng)上清中純化和回收宿主細(xì)胞所表達(dá)的重組蛋白。當(dāng)重組蛋白作為與麥芽糖結(jié)合蛋白或其它配偶體的融合蛋白表達(dá)時(shí),該重組蛋白易于通過(guò)親和層析純化。
所得蛋白可用于制備結(jié)合該蛋白的抗體。例如,通過(guò)用本發(fā)明的純化蛋白或其部分免疫動(dòng)物,如兔,然后在一定時(shí)期后收集血液,除去凝塊,來(lái)制備多克隆抗體。單克隆抗體可如下制備將骨髓瘤細(xì)胞與用上述蛋白或其部分免疫的動(dòng)物的抗體形成細(xì)胞相融合,分離表達(dá)所需抗體的單克隆細(xì)胞(雜交瘤),從該細(xì)胞中回收抗體。如此得到的抗體可用于純化或檢測(cè)本發(fā)明的蛋白。因此,本發(fā)明包括結(jié)合本發(fā)明蛋白的抗體。
表達(dá)本發(fā)明DNA的植物轉(zhuǎn)化體可如下構(gòu)建將編碼本發(fā)明蛋白的DNA插入到合適的載體,將此載體引入植物細(xì)胞,然后使獲得的轉(zhuǎn)化植物細(xì)胞再生。
另一方面,利用抑制編碼本發(fā)明的蛋白的DNA表達(dá)的DNA,可創(chuàng)建植物轉(zhuǎn)化體,所述植物轉(zhuǎn)化體中本發(fā)明DNA的表達(dá)受到抑制,方法是將DNA插入合適的載體中,將該載體引入植物細(xì)胞,再生所得的轉(zhuǎn)化植物細(xì)胞。所述“抑制編碼本發(fā)明的蛋白的DNA表達(dá)”包括基因轉(zhuǎn)錄的抑制以及對(duì)翻譯為蛋白的抑制。此外,它也包括DNA表達(dá)的完全失活(inability)以及表達(dá)的降低。
植物中特異性內(nèi)源基因的表達(dá)可通過(guò)利用本領(lǐng)域傳統(tǒng)的反義技術(shù)抑制。Ecker等借助瞬時(shí)基因表達(dá)(transient gene expression)方法首先證明將反義RNA通過(guò)電穿孔引入植物細(xì)胞的反義影響(J.R.Ecker和R.W.Davis Proc.Natl.Acad.Sci.USA 835372,1986)。此后報(bào)道了通過(guò)表達(dá)反義RNA使目標(biāo)基因在煙草和牽?;ㄖ械谋磉_(dá)降低(A.R.van der Krol等,Nature 333866,1988)。目前反義技術(shù)已確立為抑制植物中靶基因表達(dá)的方法。
多種因素引起反義核酸抑制靶基因的表達(dá)。這些包括通過(guò)形成三鏈抑制轉(zhuǎn)錄的引發(fā);通過(guò)在RNA聚合酶形成局部開(kāi)環(huán)結(jié)構(gòu)的位點(diǎn)形成雜化物(hybrid)抑制轉(zhuǎn)錄;通過(guò)與正被合成的RNA形成雜化物抑制轉(zhuǎn)錄;通過(guò)在內(nèi)含子和外顯子之間的結(jié)合處形成雜化物抑制剪接;通過(guò)在剪接子形成位點(diǎn)形成雜化物抑制剪接;通過(guò)與mRNA形成雜化物抑制mRNA從細(xì)胞核到細(xì)胞質(zhì)的轉(zhuǎn)移;通過(guò)在加帽位點(diǎn)(capping site)或ploy(A)添加位點(diǎn)形成雜化物抑制剪接;通過(guò)在翻譯起始因子的結(jié)合位點(diǎn)形成雜化物來(lái)抑制翻譯的引發(fā);通過(guò)在起始密碼子附近的核糖體結(jié)合位點(diǎn)形成雜化物抑制翻譯;通過(guò)在mRNA的翻譯區(qū)或多核糖體結(jié)合位點(diǎn)形成雜化物抑制肽鏈的延長(zhǎng);通過(guò)在核酸和蛋白的相互作用位點(diǎn)形成雜化物抑制基因的表達(dá)。這些因子通過(guò)抑制轉(zhuǎn)錄,剪接,或翻譯過(guò)程來(lái)抑制靶基因的表達(dá)(Hirashima和Imoue,“Shin seikagakuJikken Koza(New Biochemistry Experimentation Lectures)2,Kakusan(NucleicAcids)IV,Idenshi No Fukusei To Hatsugen(Replication and expression ofGenes),”Nihon Seikagakukai Hen(The Japanese Biochemical Society),TokyoKagaku Dozin,319-347,(1993))。
本發(fā)明的反義序列可通過(guò)上述任一機(jī)制抑制靶基因的表達(dá)。在一種實(shí)施方案中,如果設(shè)計(jì)的反義序列與所述基因mRNA5’末端的非翻譯區(qū)互補(bǔ),就可以有效地抑制基因翻譯。也可使用與編碼區(qū)或3’側(cè)非翻譯區(qū)互補(bǔ)的序列。因此,本發(fā)明所用反義DNA包括具有所述基因的非翻譯區(qū)和翻譯區(qū)的反義序列的DNA。所用反義DNA連接到合適啟動(dòng)子的下游,并優(yōu)選其3’端連接包含轉(zhuǎn)錄終止信號(hào)的序列。如此制備的DNA可通過(guò)已知方法轉(zhuǎn)染到所需植物中。反義DNA的序列優(yōu)選是待轉(zhuǎn)化植物的內(nèi)源基因或其部分的互補(bǔ)序列,但它不必是完全互補(bǔ)的,只要可以有效抑制所述基因表達(dá)。轉(zhuǎn)錄的RNA優(yōu)選與所述靶基因的轉(zhuǎn)錄產(chǎn)物有90%或更多,最優(yōu)選95%或更多的互補(bǔ)性??赏ㄟ^(guò)上述檢索的方法確定序列的互補(bǔ)。為通過(guò)反義序列的方法有效抑制靶基因的表達(dá),反義DNA應(yīng)該至少15個(gè)核苷酸長(zhǎng)或更多,優(yōu)選100個(gè)核苷酸和更多,還優(yōu)選500個(gè)核苷酸或更多。所用反義DNA通常短于5kb,優(yōu)選短于2.5kb。
編碼核酶的DNA可用于抑制內(nèi)源基因的表達(dá)。核酶是指具有催化活性的RNA分子。有許多具有各種活性的核酶。對(duì)作為RNA裂解酶的核酶的研究使得能夠設(shè)計(jì)位點(diǎn)特異性裂解RNA的核酶。組I內(nèi)含子型的一些核酶或包含在RNaseP中的M1RNA由400個(gè)或更多個(gè)核苷酸組成,其它屬于錘頭型或發(fā)夾型的核酶具有約40個(gè)核苷酸的活性區(qū)(Makoto Koizumi和EikoOhtsuka Tanpakushitsu Kakusan Kohso(Nucleic acid,Protein,and Enzyme)352191,1990)。
錘頭性核酶的自裂解區(qū)在序列G13U14C15的C15的3’側(cè)裂解。在U14和第九位置的A之間形成的核苷酸對(duì)對(duì)于核酶活性是重要的。已表明當(dāng)?shù)?5位置的核苷酸是A或U而不是C時(shí)也發(fā)生裂解(M.Koizumi等,F(xiàn)EBS Lett.228225,1988)。如果設(shè)計(jì)核酶的底物結(jié)合位點(diǎn)互補(bǔ)于鄰近靶位點(diǎn)的RNA序列時(shí),就可以創(chuàng)造出限制性酶樣RNA裂解核酶,其識(shí)別靶RNA內(nèi)的序列UC,UU或UA(M.Koizumi等,F(xiàn)EBS Lett.239285,1988;Makoto Koizumi和Eiko Ohtsuka Tanpakushitsu Kakusan Kohso(Protein,Nucleic Acids andEnzyme),352191,1990M.Koizumi等,Nucleic Acids Res.177059,1989)。例如,在RISBZ基因的編碼區(qū)(SEQ ID NO1,3,4,或6)中有多個(gè)位點(diǎn)可用作核酶的靶。
發(fā)夾型核酶也可用于本發(fā)明中。可以在例如,煙草環(huán)斑病毒的衛(wèi)星RNA的負(fù)鏈上分析發(fā)夾型核酶(J.M.Buzayan,Nature 323349,1986)。也已發(fā)現(xiàn)此酶靶特異性地切割RNA(Y.Kikuchi和N.Sasaki(1992)Nucleic Acids Res.196751;Yo Kikuchi(1992)Kagaku to Seibutsu(Chemistry and Biology)30112)。
設(shè)計(jì)切割所述靶的核酶與啟動(dòng)子,如花椰菜花葉病毒35s啟動(dòng)子,和一個(gè)轉(zhuǎn)錄終止序列融合以使其可以在植物細(xì)胞中轉(zhuǎn)錄。如果在轉(zhuǎn)錄的RNA的5’端或3’端添加額外的序列,該核酶的活性可能喪失。在這種情況下,可以放置一個(gè)附加的修剪(trimming)核酶,它順式作用在核酶部分的5’或3’端進(jìn)行修剪,以準(zhǔn)確地從包含該核酶的轉(zhuǎn)錄RNA切下所述核酶部分(K.Taira等,(1990)Protein Eng.3733;A.M.Dzaianott and J.J.Bujarski(1989)Proc.Natl.Acad.Sci.USA 864823;C.A.Grosshands and R.T.Cech(1991)Nucleic AcidsRes.193875;K.Taira等(1991)Nucleic Acid Res.195125)。通過(guò)將這些結(jié)構(gòu)單位串聯(lián)排列,從而達(dá)到更大的效果,可切割靶基因內(nèi)的多個(gè)位點(diǎn),(N.Yuyama等,Biochem.Biophys.Res.Commun.1861271(1992))。通過(guò)使用這些核酶,可能特異性地切割本發(fā)明靶基因的轉(zhuǎn)錄產(chǎn)物,從而抑制所述基因的表達(dá)。
也可通過(guò)采用具有相同或相似于靶基因序列的DNA轉(zhuǎn)化的共抑制來(lái)抑制內(nèi)源基因表達(dá)。“共抑制”是指這樣一種現(xiàn)象,其中當(dāng)具有相同或相似于靶內(nèi)源基因序列的基因通過(guò)轉(zhuǎn)化引入植物中時(shí),引入的外源基因和靶內(nèi)源基因的表達(dá)都被抑制。雖然共抑制的詳細(xì)機(jī)制尚不清楚,其經(jīng)??梢栽谥参镏杏^察到(Curr.Biol.7R793,1997,Curr.Biol.6810,1996)。例如,如果希望得到其中RISBZ基因被共抑制的植物體,可通過(guò)載體DNA轉(zhuǎn)化目的植物,所述DNA被設(shè)計(jì)以表達(dá)RISBZ基因或具有相似序列的DNA,從而挑選具有RISBZ突變體特征的植物,例如所得植物中種子貯藏蛋白的表達(dá)水平改變的植物。用于共抑制的基因不必完全與靶基因相同,但是它至少具有70%或更多的序列同一性,優(yōu)選80%或更多,更優(yōu)選90%或更多(例如95%或更多)??赏ㄟ^(guò)如上所述檢索來(lái)確定序列同一性。
此外,本發(fā)明的內(nèi)源基因表達(dá)可通過(guò)用基因轉(zhuǎn)化植物來(lái)抑制,所述基因編碼具有所述靶基因表達(dá)產(chǎn)物的顯性陰性表型(dominant negative phenotype)的蛋白。這里“編碼具有顯性陰性表型的蛋白的DNA”是指編碼蛋白的DNA,其一旦表達(dá),可以消除或降低植物天然內(nèi)源基因編碼的蛋白的活性。這樣的一個(gè)例子是編碼一種肽的DNA,所述肽具有GCN4結(jié)合活性但不具有本發(fā)明蛋白的轉(zhuǎn)錄活性區(qū)(例如缺失了SEQ ID NO2氨基酸序列中第1-40位氨基酸的肽或與其相應(yīng)的蛋白的肽)。
用于轉(zhuǎn)化植物細(xì)胞的載體并無(wú)具體限制,只要其能在細(xì)胞中表達(dá)插入的基因。例如可使用具有在植物細(xì)胞中進(jìn)行組成型基因表達(dá)的啟動(dòng)子的載體(例如,花椰菜花葉病毒的35s啟動(dòng)子),或被外部刺激物誘導(dǎo)活化的啟動(dòng)子的載體。此外,可以合適地使用能確保組織特異性表達(dá)的啟動(dòng)子。組織特異性啟動(dòng)子例如包括用于在水稻植物種子中表達(dá)的谷蛋白基因的啟動(dòng)子(Takaiwa,F(xiàn).等,Plant Mol.Biol.17875-885,1991)或本發(fā)明的RISBZ1的啟動(dòng)子,用于在莢豆類作物,如菜豆,蠶豆,青豌豆或含油種子作物,如花生,芝麻種子,油菜籽,棉籽,向日葵種子和紅花種子中表達(dá)的谷蛋白基因的啟動(dòng)子,或上述作物中每一種的主要貯藏蛋白的啟動(dòng)子如在菜豆的情況下是菜豆蛋白基因的啟動(dòng)子(Murai,N.等,Science 222476-482,1993)或在油菜籽的情況下是gluciferrin基因的啟動(dòng)子(Rodin,J.等,Plant Mol.Biol.20559-563,1992),或是用于在馬鈴薯塊根中表達(dá)的patatin基因的啟動(dòng)子(Rocha-Sosa,M.等,EMBO J。823-29,1989),在甜馬鈴薯塊根中表達(dá)的sporamin基因的啟動(dòng)子(Hattori,T.和Nakamura,K.,Plant Mol.Biol.11417-426,1988),和用于在菠菜和其它蔬菜的葉中表達(dá)的核酮糖-1,5-二磷酸脫羧酶基因(Orozco,B.M.和Ogren,W.L.,Plant Mol.Biol.231129-1138,1993)。
本文所用引入了載體的植物細(xì)胞包括各種形式的植物細(xì)胞,例如培養(yǎng)的細(xì)胞懸浮液,原生質(zhì)體,葉切片和愈傷組織。
可通過(guò)已知方法將載體引入植物細(xì)胞,例如聚乙二醇方法,電穿孔,農(nóng)桿菌屬介導(dǎo)的傳遞,粒子轟擊??筛鶕?jù)植物細(xì)胞類型通過(guò)已知方法從轉(zhuǎn)化的植物細(xì)胞再生植物(Toki等,(1995)Plant Physiol.1001503-1507)。例如,水稻植物的轉(zhuǎn)化和再生方法包括(1)采用聚乙二醇將基因?qū)朐|(zhì)體和再生植物體(適于indica水稻栽培變種)(Datta,S.K.(1995)in“Gene Transfer toPlants”,Potrykus I和Spangenberg編,66-74頁(yè));(2)采用電脈沖將基因?qū)朐|(zhì)體,然后再生植物體(Christou等,(1994)Plant J.6271-282);等。本領(lǐng)域已知這些方法,并已在本發(fā)明的技術(shù)領(lǐng)域廣泛使用。這樣的方法也可適于本發(fā)明。
一旦獲得轉(zhuǎn)化植物(所述植物的基因組中整合有本發(fā)明的DNA),則可能通過(guò)有性或營(yíng)養(yǎng)繁殖得到該植物體的后代?;蛘?,從得自植物的繁殖材料(例如種子,果實(shí),穗,塊莖,小塊莖(tubercle),茬(tubs),愈傷組織,原生質(zhì)體等)中大規(guī)模產(chǎn)生植物,以及其后代或克隆。用本發(fā)明的DNA轉(zhuǎn)化的植物細(xì)胞,包括這些細(xì)胞的植物體,所述植物的子代和克隆,以及得自所述植物的繁殖材料,其子代和克隆都包括在本發(fā)明中。本發(fā)明的植物體優(yōu)選是單子葉植物,更優(yōu)選是禾本科(Poaceae)植物,最優(yōu)選是水稻植物。
此外,本發(fā)明提供了植物體,其中采用本發(fā)明的RISBZ基因高度表達(dá)外源基因產(chǎn)物。本發(fā)明的植物體在其基因組中具有兩種DNA構(gòu)建體,所述第一種DNA構(gòu)建體中,本發(fā)明的DNA可操縱地連接到表達(dá)控制區(qū)的下游,第二種DNA構(gòu)建體中,外源基因可操縱地連接到具有靶序列的表達(dá)控制區(qū)的下游。。
本發(fā)明的DNA或外源基因“可操縱地連接”到表達(dá)控制區(qū)的下游指本發(fā)明的DNA或外源基因與表達(dá)控制區(qū)結(jié)合,以通過(guò)將轉(zhuǎn)錄因子結(jié)合到表達(dá)控制區(qū)誘導(dǎo)本發(fā)明的DNA或外源基因表達(dá)。
靶序列指本發(fā)明的RISBZ蛋白(其是轉(zhuǎn)錄因子)結(jié)合的DNA序列,其優(yōu)選是包含GCN4基元或G/C盒的DNA序列。GCN4基元例如包括以下所示的各種基因中的序列*GCN4基元(包含GCN4基元的基因的名稱)GCTGAGTCATGA/SEQ ID NO8(GluB-1)
CATGAGTCACTT/SEQ ID NO9(GluA-1)AGTGAGTCACTT/SEQ ID NO10(GluA-3)GGTGAGTCATAT/SEQ ID NO11(LMWG)GGTGAGTCATGT/SEQ ID NO12(大麥醇溶蛋白)GATGAGTCATGC/SEQ ID NO13(麥醇溶蛋白)AATGAGTCATCA/SEQ ID NO14(黑麥堿)優(yōu)選用作靶序列的GCN4基元序列包括“GCTGAGTCATGA/SEQ IDNO8”,“GATGAGTCATGC/SEQ ID NO13”和“AATGAGTCATCA/SEQID NO14”。具體的G/C盒的例子包括序列“AGCCACGTCACA/SEQ ID NO15”。其中上述GCN4基元或G/C盒串聯(lián)重復(fù)的序列也包括在本發(fā)明的靶序列中,優(yōu)選例子是其中GCN4基元或G/C盒串聯(lián)重復(fù)4次的序列。
外源基因的例子包括編碼抗體,酶和生理活性肽的基因。
而且,本發(fā)明提供了產(chǎn)生植物體的方法,所述植物體利用本發(fā)明的RISBZ基因,高度表達(dá)外源基因產(chǎn)物。產(chǎn)生所述植物體的方法包括如將“在其基因組中具有DNA構(gòu)建體的植物體,所述DNA構(gòu)建體中本發(fā)明的DNA可操縱地連接到表達(dá)控制區(qū)的下游”,和“在其基因組中具有DNA構(gòu)建體的植物體,其中所述DNA構(gòu)建體中外源基因可操縱地連接到具有本發(fā)明蛋白的靶序列的表達(dá)控制區(qū)下游”的兩種植物體雜交。
可通過(guò)本領(lǐng)域常用方法將上述“本發(fā)明的DNA可操縱地連接到表達(dá)控制區(qū)下游的DNA構(gòu)建體”和“外源基因可操縱地連接到具有本發(fā)明蛋白靶序列的表達(dá)控制區(qū)下游的所述DNA構(gòu)建體”導(dǎo)入植物基因組,例如采用上述的農(nóng)桿菌屬(Agrobacterium)方法。
此外可采用本領(lǐng)域傳統(tǒng)方法進(jìn)行植物體的雜交。例如,為阻止自體繁殖,在雜交當(dāng)天采用tip shearing方法或采用熱水通過(guò)demasculating只使花粉喪失繁殖能力,以通過(guò)振動(dòng)授粉pollen mother的穗。
圖1表示基于RISBZ蛋白和O2-樣bZIP蛋白的氨基酸序列同源性的系統(tǒng)樹(genealogical tree)。這些蛋白的全部氨基酸序列進(jìn)行了對(duì)比以了解這些蛋白間的相似性和進(jìn)化關(guān)系。
圖2對(duì)比了RISBZ蛋白和O2-樣bZIP蛋白的氨基酸序列。具有黑色背景的字母表示50%保守或更高水平保守的氨基酸。推定的核遷移信號(hào)(NLSASV40-樣基元)(Varagona,M.J.等,Plant cell 41213-1227,1992)和富含絲氨酸的磷酸化位點(diǎn)分別以雙線和虛線標(biāo)出。粗線表示堿性結(jié)構(gòu)域,其具有二因子胞核轉(zhuǎn)移信號(hào)(NLSB)結(jié)構(gòu)。向下的箭頭表示亮氨酸重復(fù)部分。用于產(chǎn)生水稻bZIP探針的引物是基于向右和向左箭頭所示的氨基酸序列設(shè)計(jì)。BLZ1(Vicente-Carbojos,J.等,13629-640,1998)和BLZ2(Onate,L.等,J.Biol.Chem.2749175-9182,1999)代表分離自大麥的O2-樣bZIP蛋白,分離自玉米的O2(Hartings,H.等,EMBO J.82795-2801,1989)和OHP1(Pysh,L.D.等,Plant Cell 5227-236,1993),來(lái)自小麥的SPA(Albani D.等,Plant Cell9171-184,1997),來(lái)自高粱屬(sorghum)的O2-sorg(Pirovano,L.等,Plant Mol.Biol.24515-523,1994),和來(lái)自薏苡的O2-coix(Vettore,A.L.等,Plant Mol.Bilo.36249-263,1998)。
圖3接圖2。
圖4表示了編碼O2-樣bZIP蛋白的基因的結(jié)構(gòu)。圖中表示了大麥BLZ1基因和玉米Opaque2基因(O2)(Hartings,H.等,EMBO J.82795-2801,1989),高粱Opaque2基因(O2-sorg)和薏苡Opaque2基因(O2-coix)的內(nèi)含子/外顯子區(qū)的結(jié)構(gòu)。粗條和細(xì)條分別代表外顯子和內(nèi)含子。數(shù)字表示外顯子和內(nèi)含子的核苷酸數(shù)量。
圖5表示Northern印跡分析結(jié)果,其顯示RISBZ基因的轉(zhuǎn)錄模式。對(duì)來(lái)自根,幼苗,和成熟種子(5,10,15,20,和30 DAF)的總RNA進(jìn)行了Northern印跡分析,采用了bZIP結(jié)構(gòu)域下游區(qū)的特有核苷酸序列作為探針。為對(duì)比轉(zhuǎn)錄模式,采用GluB-1基因-編碼區(qū)作探針進(jìn)行分析。采用溴化乙錠染色得到的25S rRNA的染色圖作對(duì)照。
圖6表示已轉(zhuǎn)化的水稻植物中RISBZ1啟動(dòng)子/GUS報(bào)道基因的組織分析結(jié)果。
(A)RISBZ1啟動(dòng)子/GUS報(bào)道基因的示意圖。(a)和(b)分別表示從RISBZ1基因的轉(zhuǎn)錄起始點(diǎn)開(kāi)始計(jì)數(shù)的-1674th到+4th位的核苷酸,和包含uORF的從-1674th到+213th位的基因序列,兩者在二元(binary)載體上都與GUS報(bào)道基因連接。(c)表示GluB1啟動(dòng)子(-245到+18)結(jié)合到質(zhì)粒載體的GUS報(bào)道基因上的序列。
(B)的照片顯示了種子在成熟階段GUS報(bào)道基因的表達(dá)。在縱向切開(kāi)水稻植物的種子(10DAF)(報(bào)道基因已引入其中)后,將其浸入X-gluc溶液中37℃下孵育。EN表示胚乳,而EM表示胚。
(C)圖示了轉(zhuǎn)化的水稻植物的種子提取物的GUS活性。用15DAF種子進(jìn)行分析。導(dǎo)入基因的啟動(dòng)子結(jié)構(gòu)分別如(A)的(a)和(b)所示。豎線代表平均值。MU代表4-甲基傘形酮。
圖7圖示用于鑒定GluB1啟動(dòng)子上RISBZ1蛋白結(jié)合位點(diǎn)的甲基化干擾實(shí)驗(yàn)的凝膠電泳圖。對(duì)GluB1基因的啟動(dòng)子片段(-245到+18)的每一條鏈進(jìn)行標(biāo)記(top和down)。每一條鏈被部分甲基化后,將它們與GST-RISBZ1蛋白一起孵育,分別收集不與該蛋白結(jié)合和與該蛋白結(jié)合的片段,并在哌啶化學(xué)裂解后進(jìn)行電泳。只在GCN4基元中發(fā)現(xiàn)未被哌啶裂解的位點(diǎn)(以星號(hào)標(biāo)出)。
圖8表示了凝膠移位分析以測(cè)試RISBZ1蛋白對(duì)GCN4基元的結(jié)合能力時(shí)電泳的結(jié)果。
(A)表示21bp的DNA片段,其包含用作探針和競(jìng)爭(zhēng)劑的寡核苷酸的野生型GluB-1啟動(dòng)子序列(-175到-155)的GCN4基元。M1到M7是一系列的21bp DNA片段,它們具有3bp突變。GCN4基元以下劃線標(biāo)出。
(B)到(F)表示GST-RISBZ融合蛋白的凝膠移位分析結(jié)果。加入21bpDNA片段(野生型)作探針。(B)GST-RISBZ1的結(jié)果,(C)是GST-RISBZ2的結(jié)果,(D)是GST-RISBZ3的結(jié)果,(E)是GST-RISBZ4的結(jié)果,(F)是GST-RISBZ5的結(jié)果。加入競(jìng)爭(zhēng)劑,使其化學(xué)計(jì)量比例是探針的100倍或更多。泳道1沒(méi)有蛋白;泳道2沒(méi)有競(jìng)爭(zhēng)劑;泳道3到10有競(jìng)爭(zhēng)劑(野生型(W)和M1到M7)。
圖9表示RISBZ1與其它RISBZ蛋白形成異二聚體的能力。
(A)表示用作體外轉(zhuǎn)錄/翻譯反應(yīng)模板的載體結(jié)構(gòu)。所述載體包括編碼全長(zhǎng)RISBZ1蛋白,短RISBZ2蛋白(sRISBZ2218到329),或短RISBZ3蛋白(sRISBZ3126到237)的DNA。
(B)的凝膠電泳圖表示了DNA結(jié)合試驗(yàn)的結(jié)果。在泳道2,4,6和8中,檢測(cè)到與全長(zhǎng)或短形式的蛋白結(jié)合的DNA復(fù)合物。在泳道3和7中,檢測(cè)到與全長(zhǎng)RISBZ1蛋白和短形式蛋白所形成的異二聚體結(jié)合的DNA復(fù)合物。
圖10表示了由瞬時(shí)分析確定的轉(zhuǎn)錄-活化結(jié)構(gòu)域的鑒定結(jié)果。
(A)表示了報(bào)道質(zhì)粒和效應(yīng)質(zhì)粒的結(jié)構(gòu)。將GUS基因用作報(bào)道子,其中GAL4-DNA結(jié)合位點(diǎn)的9個(gè)拷貝與CaMV35s核心啟動(dòng)子序列連接。效應(yīng)質(zhì)粒包含編碼蛋白的DNA(其中GAL4 DNA結(jié)合結(jié)構(gòu)域與截短型RISBZ1蛋白的N-末端連接)。
(B)圖示了采用報(bào)道質(zhì)粒和效應(yīng)質(zhì)粒時(shí)的GUS活性。
圖11表示了RISBZ1(WT)和突變型RISBZ1(M1-8)蛋白的N-末端區(qū)的親水性模式,由Kyte和Doolittle公式確定(Kyte,J.和Doolittle,R.F.J.,Mol.Biol.157105-132,1982)。正值表示親水。
圖12圖示了以GUS活性為指標(biāo)的RIZBZ1的轉(zhuǎn)錄活性測(cè)定系統(tǒng),Northem印跡分析照片,和GUS活性測(cè)定結(jié)果圖。該圖的縱座標(biāo)代表GUS活性,它是每種轉(zhuǎn)錄因子的轉(zhuǎn)錄活性的強(qiáng)度指標(biāo)。
圖13圖示了轉(zhuǎn)錄因子RISBZ1,Opaque2,SPA和RISBZ3(RITA1)的識(shí)別序列。圖的縱坐標(biāo)表示GUS活性,它是每一轉(zhuǎn)錄因子轉(zhuǎn)錄活性的強(qiáng)度指標(biāo)。實(shí)驗(yàn)所用序列列于圖下。
圖14圖示了本發(fā)明RISBZ1相對(duì)于源于各種基因的GCN4基元的轉(zhuǎn)錄活化能力。圖上縱坐標(biāo)代表GUS活性,它是每一轉(zhuǎn)錄因子轉(zhuǎn)錄活性的強(qiáng)度指標(biāo)。實(shí)驗(yàn)所用GCN4基元的核苷酸序列列于圖下。
實(shí)施本發(fā)明的最佳方式下面參考實(shí)施例對(duì)本發(fā)明更進(jìn)一步描述,但它們并非對(duì)本發(fā)明的限制。
從種子cDNA文庫(kù)分離編碼bZIP轉(zhuǎn)錄因子的cDNA克隆水培培養(yǎng)14天的水稻植物(Oryza sativa L.c.v.Mangetumochi)的葉和根在液氮中冷凍,-80℃保藏備用。從田間培養(yǎng)的水稻植物收集成熟水稻種子。
根據(jù)Opaque2(O2)-樣蛋白的bZIP區(qū)內(nèi)的高度保守氨基酸序列(SNRESA和KVKMAED)設(shè)計(jì)寡核苷酸引物,以水稻種子中提取的poly(A)+mRNA作模板進(jìn)行RT-PCR。從開(kāi)花后6到16天(DAF)的種子提取聚腺苷酸RNA(Takaiwa F.等,Mol.Gen.Genet.20815-22,1987),采用Superscript逆轉(zhuǎn)錄酶(Gibco BRL,Paisly,UK)通過(guò)逆轉(zhuǎn)錄合成單鏈cDNA,以oligo(dT)20為引物。接著擴(kuò)增cDNA,采用以下引物對(duì)5’-TCC AAC/T A/CGI GAA/G A/TCIGC-2’;SEQ ID NO16,和5’-GTC CTC C/TGC CAT CTT CAC CTT-3’;SEQID NO17。這些引物是基于在谷類種子中表達(dá)的位于bZIP-型轉(zhuǎn)錄因子內(nèi)的高度保守氨基酸序列而設(shè)計(jì)。將所述單鏈cDNA溶解在PCR反應(yīng)混合物中(其中含有10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)谷蛋白,200μM dNTPs,1μM寡核苷酸引物),再將TaqI聚合酶加入混合物中,所得混合物在熱循環(huán)儀中94℃孵育5分鐘。然后通過(guò)三個(gè)循環(huán)的PCR合成并擴(kuò)增cDNA(94℃1分鐘,40℃1分鐘,然后72℃2分鐘),然后進(jìn)行30個(gè)循環(huán)的PCR(94℃1分鐘,55℃1分鐘,然后72℃2分鐘)。將擴(kuò)增的DNA片段克隆到TA克隆載體(pCR2.1;Invitrogen),并通過(guò)ABI PRISM染料終止序列系統(tǒng)進(jìn)行測(cè)序。通過(guò)ABI PRISM 310 Genetic Analyzer(Perkin Elmer-AppliedBiosystems)分析反應(yīng)產(chǎn)物以測(cè)定至少50個(gè)克隆的核苷酸序列。分析所得核苷酸序列數(shù)據(jù),并采用GENETYX和BLAST算法對(duì)數(shù)據(jù)庫(kù)檢索。結(jié)果發(fā)現(xiàn)五個(gè)不同的213bp的片段。其中的兩個(gè)與REB(Izawa T.等,Plant Cell 61277-1287,1994)和RITA1(Nakase M.等,Plant Mol.Biol.33513-522,1997)的bZIP區(qū)序列相同。采用這五個(gè)213bp的DNA片段作引物,從成熟(6-16DAF)種子(ZAPII;STRATAGENE)的mRNA中制備cDNA文庫(kù)。然后在高度嚴(yán)謹(jǐn)條件下對(duì)每一片段篩選得到它們的全長(zhǎng)cDNA。通過(guò)隨機(jī)引發(fā)(randompriming)將[α-32P]-dCTP引入所述DNA片段(Amersham Pharmacia Biotech),所得片段用作探針。采用的預(yù)雜交溶液包含5×SSC,5×Denhard溶液,0.1%SDS,50%甲酰胺,100μg/ml鮭精DNA。雜交后,在55℃用2×SSC和0.1%SDS組成的混合液沖洗濾膜一次,然后用0.1×SSC和0.1%SDS組成的混合液沖洗濾膜兩次。
基于每一核苷酸序列的同源性,將所得cDNA克隆命名為RISBZ1(水稻種子b-Zipper1)(SEQ ID NO1),RISBZ2,RISBZ3,RISBZ4(SEQ ID NO4)和RIDBZ5(SEQ ID NO6)。其中,RISBZ2和RISBZ3分別與REB(Izawa T.等,Plant Cell 61277-1287,1994)和RITA1(Nakase M.等,Plant Mol.Biol.33513-522,1997)相同,它們?cè)谙纫褟姆N子和葉的cDNA文庫(kù)分離得到。
鑒定RISBZ cDNA
新證實(shí)的RISBZ cDNA(RISBZ1,RISBZ4,RISBZ5)如下進(jìn)行詳細(xì)鑒定。RISBZ1 cDNA最長(zhǎng),不包括聚腺苷酸的長(zhǎng)度為1742bp,包含一個(gè)編碼436個(gè)氨基酸(估計(jì)分子量為46,491Dal)的讀碼框。RISBZ4和RISBZ5具有編碼278和295個(gè)氨基酸的讀碼框;它們預(yù)計(jì)的分子量分別為29383和31925Dal。
RISBZ1 mRNA具有的前導(dǎo)序列(245堿基長(zhǎng))長(zhǎng)于平均的前導(dǎo)序列。有趣地是,在RISBZ1蛋白的實(shí)際起始密碼子上游的前導(dǎo)序列內(nèi)發(fā)現(xiàn)了編碼31個(gè)氨基酸殘基的一個(gè)小開(kāi)放讀碼框。先前在玉米Opaque2(O2)(Hartings H.等,EMBO J.82795-2801,1989),小麥SPA(Albani D.等,Plant Cell 9171-184,1997),大麥BLZ1和BLZ2(Vincente-Carbojos J.等,Plant J.13629-640,1998;Onate L.等,J.Biol.Chem.2749175-9182,1999)中發(fā)現(xiàn)了類似的小的上游開(kāi)放讀碼框(uORF),但是這些uORF相互間同源性很小。以前有報(bào)道玉米O2mRNA的uORF涉及翻譯控制。uORF只在RISBZ1 mRNA中發(fā)現(xiàn),而在其它RISBZ mRNA中沒(méi)有發(fā)現(xiàn)。
起始密碼子的側(cè)翼序列是GCAATGG。此序列與得自單子葉植物的真核細(xì)胞翻譯起始序列c(a/c)(A/G)(A/C)cAUGGCG相符。在起始密碼子和uORF之間有100bp。編碼RISBZ1的開(kāi)放讀碼框具有兩個(gè)相同的終止密碼子(TAG)。在終止密碼子和聚腺苷酸序列間有229bp。在添加聚腺苷酸位點(diǎn)的-19到-24區(qū)發(fā)現(xiàn)了多腺苷酸化信號(hào)序列(AATATA)。
RISBZ1密切相關(guān)于水稻REB(Nakase,M.等,Plant Mol.Biol.33513-522,1997),玉米OHP-1和OHP-2(Pysh L.D.等,Plant Cell 5227-236,1993)和大麥BLZ1(Vincente-Carbojos J.等,Plant J.13629-640,1998)(圖1),在氨基酸水平表現(xiàn)出的同源性分別為48.2%(水稻REB),45.7%(大麥BLZ1),46.6%(玉米OHP1)。此外,這些bZIP區(qū)是高度保守的(73.7%到76.3%)。在氨基酸水平,RITA1(RISBZ3)與RISBZ4和RISBZ5的同源性分別為88.8%和47.6%。相比而言,RISBZ4與RISBZ5的同源性是48.2%。RISBZ3,RISBZ4和RISBZ5在先前報(bào)道的O2樣轉(zhuǎn)錄因子中組成一個(gè)特有的組(unique group)。此外,從種子cDNA文庫(kù)中分離的5種RISBZ cDNA能基于氨基酸同源性被分為兩組(圖1)。RISBZ3,RISBZ4和RISBZ5缺少RISBZ1和RISBZ2中具有的N-和C-末端區(qū),它們的大小與RISBZ1和RISBZ2相比缺少100到150個(gè)氨基酸殘基(圖2和3)。
RISBZ1和RISBZ2在它們的N-末端區(qū)富含脯氨酸殘基,在其它RISBZ蛋白中則不具有(圖2和3)。RISBZ1和RISBZ2在距它們N-端的60th氨基酸的外周區(qū)(peripheral region)和位于其bZIP結(jié)構(gòu)域上游的中間區(qū)也富含酸性氨基酸。在其它O2-樣轉(zhuǎn)錄因子中發(fā)現(xiàn)了這些富脯氨酸或富酸性氨基酸的區(qū)。
由于在RISBZ1的207th到210th位殘基的區(qū)域內(nèi)發(fā)現(xiàn)了富絲氨酸序列(SGSS),認(rèn)為所述蛋白是酪蛋白激酶II的靶序列(Hunter T.和Karin M.Cell 70375-387,1992)(圖2和3)。在RISBZ2中也發(fā)現(xiàn)了類似的序列(SSSS)。但是所述序列在其它RISBZ蛋白中則缺失(圖2和3)。
至今,已證實(shí)了兩種核轉(zhuǎn)換信號(hào)(NLSASV40-樣基元和NLSB2-因子基元),它們涉及玉米Opaque2(O2)蛋白從細(xì)胞質(zhì)到核的運(yùn)輸(Varagona M.J.等,Plant Cell 41213-1227,1992)。在RISBZ1中搜索這些基元,在與O2同樣的位點(diǎn)發(fā)現(xiàn)了與NLSA和NLSB同源的序列(101到135和232到264)。
RISBZ1基因的基因組結(jié)構(gòu)采用設(shè)計(jì)自RISBZ1 cDNA的核苷酸序列的引物,分離了編碼啟動(dòng)子和RISBZ1蛋白的基因組區(qū)。進(jìn)行PCR反應(yīng),以水稻基因組DNA作模板,兩對(duì)寡核苷酸作引物(RIS1f5’-ATGGGTTGCGTAGCCGTAGCT-3’/SEQ ID NO18和RELr55’-TTGCTTGGCATGAGCATCTGT-3’/SEQ ID NO19)和(RELf25’-GAGGATCAGGCCCATAT-3’/SEQ ID NO20)和RIS1r5’-TCGCTATATTAAGGGAGACCA-3’/SEQ ID NO21)。采用TAKARALA Taq聚合酶(TAKARA)在熱循環(huán)儀中擴(kuò)增DNA片段,采用30個(gè)循環(huán)反應(yīng),98℃10秒,56℃30秒,68℃5分鐘?;贚iu等方法采用熱不對(duì)稱交錯(cuò)(TAIL)PCR也對(duì)RISBZ1基因的啟動(dòng)子區(qū)進(jìn)行擴(kuò)增,其中三個(gè)寡核苷酸被用作特異性引物,tail15’-TGCTCCATTGCGCTCTCGGACGAG-3’/SEQ IDNO22,tail25’-ATGAATTCGCGAGGGGTTTTCGA-3’/SEQ ID NO23,tail35’-GTTTGGGAGAAATTCGATCAAATGC-3’/SEQ ID NO24。
結(jié)果顯示RISBZ1基因包含六個(gè)外顯子和5個(gè)內(nèi)含子(圖4)。此RISBZ1基因中的外顯子/內(nèi)含子構(gòu)造與玉米O2(Hartings H.等,EMBO J.82795-2801,1989),高粱O2(Pirovano L.等,Plant Mol.Biol.24515-523,1994),薏苡O2(Vettore A.L.等,Plant Mol.Biol. 36249-263,1998),和大麥BLZ1(Vicente-Carbojos J.等,Plant J.13629-640,1998)基因的相同(圖4)。
按照Sambrook等方法(Sambrook J.等,Molecular CloningA LaboratoryManual,2ndEd.,pp.7.79-7.83,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY)通過(guò)引物延伸分析確定RISBZ1基因的轉(zhuǎn)錄起始位點(diǎn)。具體地,通過(guò)用T4激酶標(biāo)記包含30個(gè)核苷酸的寡核苷酸的5’末端(其互補(bǔ)于緊接所要區(qū)下游的序列),產(chǎn)生引物5’-ATGGTATGGTGTTCCTAGCACAGGTGTAGC-3’(SEQ ID NO25)。以5μg mRNA為模板,采用Superscript逆轉(zhuǎn)錄酶試劑盒(Gibco BRL,Paisly,UK),采用此引物進(jìn)行逆轉(zhuǎn)錄反應(yīng),42℃下50min。
結(jié)果,將轉(zhuǎn)錄起始位點(diǎn)作圖于距RISBZ1基因的翻譯起始密碼子245-nt上游區(qū)?!甌ATA’盒定位于距轉(zhuǎn)錄起始位點(diǎn)-30到-35-nt處。在距轉(zhuǎn)錄起始位點(diǎn)63-,123-和198-bp上游區(qū)發(fā)現(xiàn)了三個(gè)‘ACGT’基元,但是沒(méi)有發(fā)現(xiàn)負(fù)責(zé)種子特異性基因表達(dá)的基元,如GCN4和‘AAAG’。相反,發(fā)現(xiàn)了多個(gè)Dof區(qū)蛋白的識(shí)別序列,‘AAAG’。這些基元可能涉及RISBZ1基因的階段-和/或組織特異性表達(dá)。例如,如果‘ACGT’基元是RISBZ1蛋白的靶序列,所述RISBZ1基因可以通過(guò)自身進(jìn)行自調(diào)節(jié)。但是,當(dāng)RISBZ1啟動(dòng)子/GUS報(bào)道基因和35s CaMV啟動(dòng)子/RISBZ1基因被導(dǎo)入原生質(zhì)體細(xì)胞時(shí),報(bào)道基因沒(méi)有觀察到轉(zhuǎn)錄活性。這些數(shù)據(jù)表明RISBZ1啟動(dòng)子不具有RISBZ1蛋白的靶序列;即在RISBZ1啟動(dòng)子中發(fā)現(xiàn)的‘ACGT’基元不是所述蛋白的靶序列。因此,RISBZ1基因可能不是自調(diào)節(jié)。相對(duì)照,如果水稻醇溶谷蛋白結(jié)合因子(RPBF)基因(其識(shí)別Dof區(qū))過(guò)表達(dá),RISBZ1啟動(dòng)子/GUS報(bào)道基因的轉(zhuǎn)錄被激活。這提示Dof區(qū)蛋白的識(shí)別序列涉及RISBZ1基因的特異性表達(dá)。
RISBZ mRNA的組織特異性進(jìn)行Northern印跡分析RIABZ基因的表達(dá)。按照Takaiwa等(Varagona M.J.等,Plant Cell 41213-1227,1992)的方法,從5到30 DAF種子,根和幼苗(5-,10-,15-,20-和30-DAF)提取全總RNA,在通過(guò)瓊脂糖凝膠電泳分級(jí)后分離轉(zhuǎn)移到濾膜上。以下RISBZ cDNA中從bZIP區(qū)域-編碼區(qū)的下游序列到3’非編碼區(qū)的DNA片段被用做探針RISBZ1,354-bp,從1388th到1742nd位核苷酸;RISBZ2,346-bp,從1351st到1696th位核苷酸;RISBZ3,486-bp,從741st到1226th位核苷酸;
RISBZ5,621-bp,從742nd到1362nd位核苷酸。
在含有5×SSC,5×Denhard溶液,0.1%SDS,和50%甲酰胺的溶液中,45℃下進(jìn)行雜交。雜交后,用含有2×SSC和0.1%SDS的混合溶液沖洗濾膜2次30分鐘,然后用含有0.1×SSC和0.1%SDS的混合液沖洗濾膜2次30分鐘。
如圖5所示,RISBZ1基因只在種子中表達(dá),沒(méi)有在其它分析的組織中表達(dá)。最大量的RISBZ1 mRNA積聚在5 DAF到10 DAF收獲的種子中。這樣的mRNA大量積累保持到15 DAF,隨著成熟而逐漸減少。RISBZ1基因表達(dá)峰值的出現(xiàn)階段比谷蛋白基因的早。在5 DAF可檢測(cè)到谷蛋白mRNA表達(dá),在15 DAF出現(xiàn)峰值,然后逐漸降低(圖5)。此結(jié)果表明RISBZ1功能是谷蛋白基因的活化劑。相似的表達(dá)方式在玉米O2(Hartings H.等EMBO J.82795-2801,1989),小麥SPA(Albani D.等,Plant Cell 9171-184,1997),和大麥BLZ2基因(Onate L.等,J.Biol.Chem.2749175-9182,1999)中也有報(bào)道。
在所有分析的組織中都有RISBZ2表達(dá)。RISBZ3和RISBZ4特異性表達(dá)于成熟后期的種子中(圖5)。RISBZ3和RISBZ4 mRNA水平逐漸提高直到20 DAF,然后降低。與其它RISBZ基因相比,RISBZ5的表達(dá)水平極低,其mRNA峰值出現(xiàn)在10 DAF。
RISBZ1啟動(dòng)子/GUS報(bào)道基因構(gòu)建體在轉(zhuǎn)化體中的表達(dá)為檢測(cè)RISBZ1基因的表達(dá)方式,將從轉(zhuǎn)錄起始位點(diǎn)計(jì)算的-1674到+213nt的序列片段連接到GUS基因的上游。通過(guò)利用農(nóng)桿菌屬將該報(bào)道基因?qū)胨局参?圖6A)。如下構(gòu)建轉(zhuǎn)化的水稻植物(Oryza sativa L.c.v.kitaake)。兩個(gè)在其5’端具有RstI或BamHI限制性位點(diǎn)的寡核苷酸引物,5’-AAAACTGCAGTTTTCTGA-3’(SEQ ID NO26)和5’-AATGGATCCGCGAGGGGTTTTCGAA-3’(SEQ ID NO27),用于通過(guò)PCR擴(kuò)增RISBZ1基因的5’-末端區(qū)域(從-1674th到+4th和從-1674th到+213rd)。PCR反應(yīng)在反應(yīng)混合物中進(jìn)行(10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)明膠,200μM dNTPs,1μM引物,0.5μg模板DNA,2.5單位的TaqI聚合酶),孵育的30個(gè)循環(huán),94℃1分鐘,50℃1分鐘,72℃2分鐘。用限制性酶PstI和BamHI消化后,所述PCR產(chǎn)物克隆到質(zhì)粒載體pBI201中,用限制酶PstI和SacI裂解。所得包含RISBZ1啟動(dòng)子/GUS基因的DNA片段插入到二元載體p8cHm(其包含CaMV35s啟動(dòng)子/潮霉素磷酸轉(zhuǎn)移酶(HPT)基因)的Sse8387I和SacI位點(diǎn)之間。按照Goto F.等,NatureBiotech.17282-286所述方法進(jìn)行轉(zhuǎn)化。
如下構(gòu)建報(bào)道質(zhì)粒。如Wu等(Wu C.Y.等,Plant J.14673-683,1998)構(gòu)建的1×21bp,3×21bp,和5×21bp的GCN4基元/GUS基因用作報(bào)道基因。將一對(duì)具有懸垂的(overhanged)(ACGT)5’端的48bp寡核苷酸(它們相互互補(bǔ))與之相連以構(gòu)建四聚體,所述四聚體包含12-bp野生型GCN4基元(GCTGAGTCATGA/SEQ ID NO8)和突變體GCN4基元(GCTTCCTCATGA/SEQ ID NO28)。將這些雙鏈寡核苷酸插入到所述-46CaMV/GUS報(bào)道基因的SalI和StuI位點(diǎn)。
按照Wu等所述方法進(jìn)行對(duì)水稻愈傷組織原生質(zhì)體的瞬時(shí)分析。依照J(rèn)efferson(Jefferson R.A.Plant Mol.Biol.Rep.5387-405,1987)所述方法,通過(guò)測(cè)定得自葡糖苷酸前體的4-甲基-傘形酮的熒光強(qiáng)度來(lái)測(cè)定GUS活性。采用Bio Rad Kit,測(cè)定所述蛋白濃度。使用牛血清白蛋白作為標(biāo)準(zhǔn)蛋白。
如圖6B所示,在成熟種子的aleulon和sub aleulon層觀察到高GUS活性,但在胚芽中沒(méi)有觀察到。即使采用高靈敏度熒光檢測(cè)也沒(méi)有在根,葉和莖中發(fā)現(xiàn)GUS活性。這些結(jié)果表明RISBZ1只在aleulon和sub aleulon層表達(dá)。為觀察5’-端非翻譯區(qū)和uORF的作用,將該GUS活性與植物的GUS活性相對(duì)比,所述植物缺失了從轉(zhuǎn)錄起始點(diǎn)計(jì)數(shù)的-1674th到+4th的uORF(圖6A)。結(jié)果由于uORF缺失,在表達(dá)位點(diǎn)觀察不到變化(圖6B),但是觀察到弱5到10倍的啟動(dòng)子活性(圖6C)。與在玉米O2中的結(jié)果(其中uORF作為翻譯抑制因子)相比,這些數(shù)據(jù)提示5’-非翻譯區(qū)在翻譯的正調(diào)節(jié)中可能起作用(Lohmer S.等,Plant Cell 565-73)。
五種RISBZ蛋白通過(guò)與GCN4基元結(jié)合的轉(zhuǎn)錄激活能力通過(guò)瞬時(shí)分析(transient assay)測(cè)定五種RISBZ蛋白通過(guò)與GCN4基元結(jié)合的轉(zhuǎn)錄激活能力。制備質(zhì)粒,其中每一RISBZ1蛋白的編碼序列連接到CaMV35s啟動(dòng)子的下游作為效應(yīng)子。效應(yīng)質(zhì)粒的制備如下通過(guò)PCR制備編碼缺失其N-末端區(qū)的RISBZ1的質(zhì)粒。為擴(kuò)增編碼區(qū)的cDNA,所述區(qū)范圍為從RISBZ1的N-末端的41st,81st,121st,161st位氨基酸到其C-末端,設(shè)計(jì)如下引物
正向引物RIS1-15’-AACCATGGTGCTGGAGCGGTGCCCGT-3’(SEQ IDNO29)RIS1-25’-AACCATGGCGGCGGAGGCGGCGGCG-3’(SEQ IDNO30)RIS1-35’-CCCCATGGAGTACAACGCGATGC-3’(SEQ ID NO31)RIS1-45’-AACCATGGTTGGTTCCATCCTGAGT-3’(SEQ ID NO32)RIS1-55’-AACCATGGCTCATGCCAAGCAAGCT-3’(SEQ ID NO33)RIS1-65’-AACCATGGATGAAGAAGATAAAGTGAAG-3’(SEQ IDNO34)反向引物BRIS1R5’-TAGGATCCGCTCCTACTACTGAAGCT-3’(SEQ ID NO35)設(shè)計(jì)引物在它們的5’端具有NcoI或BamHI限制性位點(diǎn)。由于通過(guò)去除N-末端區(qū)缺失了一個(gè)翻譯起始密碼子,利用NcoI限制性位點(diǎn)的ATG。通過(guò)PCR擴(kuò)增cDNA,在94℃溫育2分鐘,然后是94℃1分鐘,50℃1分鐘,72℃2分鐘的30個(gè)循環(huán),然后在72℃溫育5分鐘。用限制酶NcoI或BamHI消化PCR產(chǎn)物,然后通過(guò)瓊脂糖凝膠電泳純化。所述純化的cDNA片段最終插入到pRT100載體(Topfer R.等,Nucl.Acids Res.155890,1987)。
也構(gòu)建編碼包括GAL4 DNA結(jié)合結(jié)構(gòu)域(從1st到147th的氨基酸殘基)和RISBZ1或RISBZ2基因的融合蛋白的質(zhì)粒。為采用Pfu Taq聚合酶(STRATAGENE)通過(guò)PCR擴(kuò)增編碼RISBZ1或RISBZ2各N-末端區(qū)的cDNA區(qū),制備如下的反向引物,其中在其5’-端添加了一個(gè)BamHI位點(diǎn),終止密碼子,SstI位點(diǎn),以及如下的正向引物正向引物RISBZ1-F15′-AAGGATCCAATGGAGCACGTGTTCGCC-3′(SEQ ID NO36)RISBZ1-F25′-AAGGATCCGGCGGCGGAGGCGGCGCG-3′(SEQ ID NO37)RISBZ1-F35′-GCCGGATCCAGTTGGTTCCATCCTGAG-3′(SEQ ID NO38)RISBZ1-F45′-AAGGATCCTGATGAAGAAGATAAAGT-3′(SEQ ID NO39)RISBZ1 F1-25′-AAGGATCCAGGAGTAGATGACGTCGGC-3′(SEQ ID NO40)RISBZ1 F1-35′-AAGGATCCAGACGAGATCCCCGACCCGCT-3′(SEQ ID NO41)
反向引物RISBZ1-R15′-TAGAGCTCTACGCCGCCGGCATCGGGCT-3′(SEQ ID NO42)RISBZ1-R25′-TAGAGCTCTAAAGGATCATATTTCCCAT-3′(SEQ ID NO43)RISBZ1 R1-15′-TAGAGCTCTAGGCGGCCGCCGCCGGCTG-3′(SEQ ID NO44)RISBZ1 R1-25′-TAGAGCTCTACGGCGGCGGCGGAGCCCA-3′(SEQ ID NO45).
利用所述引物,通過(guò)PCR擴(kuò)增編碼RISBZ1或RISBZ2的各N-末端區(qū)的cDNA,所述PCR包括在94℃溫育2分鐘,然后是94℃1分鐘,50℃1分鐘,72℃1分鐘的30個(gè)循環(huán),然后在72℃溫育5分鐘。PCR產(chǎn)物用限制酶BamHI和SacI消化,然后通過(guò)2%瓊脂糖凝膠電泳純化。所述純化的cDNA片段連接到用同樣的限制酶消化的35s-564載體的GAL4 DNA域編碼區(qū)的下游,以便其讀碼框相匹配。也通過(guò)PCR誘變將突變引入RISBZ1的N末端區(qū)。確認(rèn)cDNA序列,通過(guò)PCR擴(kuò)增其從1st到57th位氨基酸殘基的部分序列。所述產(chǎn)物連接到處于相同讀碼框中的GAL4 DNA結(jié)構(gòu)域編碼區(qū)的下游。
此外,構(gòu)建報(bào)道質(zhì)粒,其中插入了GUS基因,21bp GCN4基元的1或5個(gè)重復(fù)(repeat)或12bp GCN4基元的1或3個(gè)重復(fù)。對(duì)于陰性對(duì)照實(shí)驗(yàn),采用包含突變型12-bp GCN4基元的4個(gè)重復(fù)和GUS報(bào)道基因的質(zhì)粒。所述突變型12-bp GCN4基元在被RISBZ1和O2識(shí)別的靶序列中具有一個(gè)突變。將這些質(zhì)粒構(gòu)建體單獨(dú)或與其它報(bào)道質(zhì)粒或效應(yīng)質(zhì)粒一起導(dǎo)入制備自愈傷組織培養(yǎng)物的水稻原生質(zhì)體細(xì)胞,分析其GUS活性。當(dāng)報(bào)道質(zhì)?;蛐?yīng)質(zhì)粒單獨(dú)引入到原生質(zhì)體時(shí),檢測(cè)GUS活性處于低水平。但是如表1所示,在作為效應(yīng)質(zhì)粒引入的35s/RISBZ1或35s/O2存在下,報(bào)道基因的轉(zhuǎn)錄被激活。即使在這些效應(yīng)質(zhì)粒存在下,突變型12-bp GCN4基元下游的GUS基因的轉(zhuǎn)錄活性與背景活性處于同一水平。這些結(jié)果表明RISBZ1基因產(chǎn)物激活GCN4基元介導(dǎo)的報(bào)道基因。由RISBZ1基因產(chǎn)物誘導(dǎo)的報(bào)道基因轉(zhuǎn)錄活性略高于由O2基因產(chǎn)物誘導(dǎo)的。如表2所示,由RISBZ1誘導(dǎo)的活性基于GCN4基元的拷貝數(shù)得以增強(qiáng)。分析21-bp GCN4基元的1到12個(gè)拷貝,所示轉(zhuǎn)錄活性對(duì)多達(dá)9個(gè)拷貝成比例地增強(qiáng)。但是,即使其它RISBZ基因在35s CaMV啟動(dòng)子控制下表達(dá),所示表達(dá)基因的轉(zhuǎn)錄活性小于或等于由RISBZ1或O2基因產(chǎn)物誘導(dǎo)的轉(zhuǎn)錄活性的1.4%。因此,揭示只有RISBZ1蛋白能通過(guò)與GCN4基元的結(jié)合而活化轉(zhuǎn)錄。表1效應(yīng)子 GUS活性(pM 4-MU/min/mg蛋白)35s/Opaque2 2658±31835s/RISBZ1 2994±15735s/RISBZ2 44±735s/RISBZ3 1.3±1.235s/RISBZ4 17.3±0.935s/RISBZ5 31±8.8將4×12-bp GCN4基元/GUS報(bào)道基因和效應(yīng)質(zhì)粒一起導(dǎo)入原生質(zhì)體細(xì)胞,測(cè)定GUS活性。進(jìn)行三次獨(dú)立測(cè)定得到數(shù)據(jù)。
表2效應(yīng)子GUS活性(pM 4-MU/min/mg蛋白)報(bào)道子 (-) (+)RISBZ1(+)Opaque21×12-bp GCN4 32±1.5 295±4.5 182±6(9.2*) (5.6*)4×12-bp GCN4 21 604±24.5452±7.5(28.7*) (21.5*)1×21-bp GCN4 30±3 1318±55.5 1139±22.5(43.9*) (37.9*)5×21-bp GCN4 104 13222±1094 11932±22.5(127.1*)(114.7*)1×12-bp,4×12-bp,1×21-bp或5×21-bp GCN4基元/GUS基因作為報(bào)道子使用。此表表示了通過(guò)RISBZ1(+RISBZ1)基因或通過(guò)Opaque2(+Opaque2)基因表達(dá)誘導(dǎo)的GUS活性。
RISBZ1蛋白的結(jié)合位點(diǎn)本發(fā)明人先前發(fā)現(xiàn)O2蛋白識(shí)別存在于一種谷蛋白基因,GluB-1的-165th到-160th位的啟動(dòng)子區(qū)的所述GCN4基元(TGAGTCA)(Wu C.Y.等,Plant J.14673-683,1998)。通過(guò)甲基化干擾實(shí)驗(yàn),本發(fā)明人也確定了GluB-1基因啟動(dòng)子區(qū)中RISBZ1蛋白的結(jié)合位點(diǎn)。
如下進(jìn)行GST-RISBZ1融合蛋白的生產(chǎn)和純化。通過(guò)PCR擴(kuò)增RISBZ1cDNA的5個(gè)編碼區(qū),在所用寡核苷酸引物的5’-端已加入下述的適當(dāng)?shù)南拗泼盖形稽c(diǎn);對(duì)RISBZ1加入BamHI-平端,RISBZ2加入BamHI-XhoI,RISBZ3加入BamHI-SalI,RISBZ4加入BamHI-SalI,RISBZ5加入BamHI-XhoI。在用限制酶消化后,所述PCR產(chǎn)物連接到pGEX-4T-3載體(AmershamPharmacia Biotech)的克隆位點(diǎn)。按照Suzuki等方法表達(dá)所述GST-RISBZ融合蛋白(Suzuki A.等,Plant Cell Physiol,39555-559,1998)。在親和純化后,所示GST融合蛋白在結(jié)合緩沖液(包含20mM HEPES-KOH pH7.9,50mMKCl,1mM EDTA,10%甘油)中透析4小時(shí),然后立刻-80℃保存。
如Weinberger等所述進(jìn)行甲基化干擾分析實(shí)驗(yàn)(Weinberger J.等,Nature322846-849,1986)。用限制酶SalI和BamHI消化GluB1基因的5’-側(cè)翼區(qū)(從-245th到+18th位核苷酸),用[α-32P]dCTP通過(guò)“fill-in”反應(yīng)標(biāo)記所述片段的末端。將標(biāo)記的片段用二甲基硫酸鹽處理進(jìn)行甲基化,與GST-RISBZ1混合,然后再溫育。借助非變性丙烯酰胺凝膠(5%,0.25×TBE)電泳,將混有GST-RISBZ1和游離DNA片段的混合DNA片段彼此分離。通過(guò)DEAE瓊脂糖凝膠柱層析進(jìn)一步純化這些DNA片段,用哌啶處理,再借助6%的變性丙烯酰胺凝膠電泳分離。
如圖7所示,GST-RISBZ1融合蛋白保護(hù)位于GluB-1啟動(dòng)子的-165th到-160th區(qū)的鳥嘌呤殘基。所述被保護(hù)的鳥嘌呤殘基與O2啟動(dòng)子中被保護(hù)的殘基相同(Albani D.等,Plant Cell 9171-184,1997)。范圍為-197th到+18th的啟動(dòng)子區(qū)的-79th到-76th位殘基上的‘ACGT’基元(也稱為A/G雜交盒)中存在的鳥嘌呤殘基沒(méi)有保護(hù)。
此外,如下進(jìn)行凝膠移位分析以測(cè)定RISBZ1蛋白是否能識(shí)別GCN4基元。
一對(duì)相互互補(bǔ)的寡核苷酸(通過(guò)加入TCGA序列制備)加入到GluB1啟動(dòng)子區(qū)(從-175th到-155th)的21-nt片段,該片段的末端用[α-32P]dCTP通過(guò)“fill-in”反應(yīng)標(biāo)記用作探針。還合成7對(duì)互補(bǔ)的寡核苷酸,它們具有連續(xù)的三個(gè)核苷酸的突變(圖8A),以用作突變型競(jìng)爭(zhēng)劑片段,并進(jìn)行退火。通過(guò)Wu等(WuC.Y.等,Plant J.14673-683,1998)和Suzuki等(Suzuki A.等,Plant Cell Physiol,39555-559,1998)所述方法進(jìn)行采用GST融合蛋白的凝膠移位分析。標(biāo)記的寡核苷酸探針與0.5μg GST-RISBZ融合蛋白混合,室溫下溫育20分鐘。在競(jìng)爭(zhēng)性實(shí)驗(yàn)中,將競(jìng)爭(zhēng)劑片段以100倍或更高的分子量比加入到混合物中。通過(guò)非變性丙烯酰胺凝膠(5%,0.25×TBE)電泳分析反應(yīng)混合物。
對(duì)遷移的條帶的檢測(cè)表明GST-RISBZ1蛋白能與包含GCN4基元的21bp DNA片段結(jié)合(圖8B)。此外,如圖8A所示,具有連續(xù)三個(gè)核苷酸突變的21-bpDNA片段用作競(jìng)爭(zhēng)劑并測(cè)定。當(dāng)在GCF基元中具有突變的DNA片段作為競(jìng)爭(zhēng)劑加入時(shí),作為探針加入的DNA片段的結(jié)合幾乎不或根本不被抑制(圖8B到F)。相反,當(dāng)在GCN4基元的側(cè)翼序列具有突變的DNA片段作為競(jìng)爭(zhēng)劑加入時(shí),遷移的條帶消失(圖8B到F)。由于GCN4基元突變顯著影響RISBZ1蛋白對(duì)所述基元的結(jié)合,顯示RISBZ1蛋白特異性識(shí)別GCN4基元序列。采用其它RISBZ蛋白進(jìn)行的類似實(shí)驗(yàn)揭示所有的RISBZ蛋白都能特異性識(shí)別該GCN4基元。如圖8B到F所示,每一RISBZ蛋白對(duì)該GCN4基元的親和力略有不同。如果是RISBZ2和RISBZ5,當(dāng)在GCN基元的側(cè)翼序列具有突變的DNA片段用作競(jìng)爭(zhēng)劑時(shí),移位的條帶沒(méi)有完全消失(圖8C和F)。
這些結(jié)果顯示所述RISBZ蛋白特異性識(shí)別GCN4基元,親和性略有不同。
RISZ1蛋白形成異二聚體的能力認(rèn)為RISBZ1蛋白(一種bZIP型轉(zhuǎn)錄因子)當(dāng)與其它RISBZ蛋白形成異二聚體時(shí)可結(jié)合GCN4-樣基元。因此,檢測(cè)了RISBZ1與RISBZ2或RISBZ3形成異二聚體的能力。采用小麥胚芽提取物制備全長(zhǎng)RISBZ1蛋白和短形式的RISBZ2蛋白(sRISBZ2)和短形式的RISBZ3蛋白(sRISBZ3)(圖9A),并用于DNA結(jié)合分析。如下進(jìn)行體外翻譯。擴(kuò)增RISBZ1 cDNA編碼區(qū)和RISBZ2cDNA和RISBZ3 cDNA的bZIP結(jié)構(gòu)域編碼區(qū),采用如下在5’端具有NcoI位點(diǎn)的正向引物以及編碼終止密碼子和BamHI位點(diǎn)的反向引物;擴(kuò)增RISBZ1采用R1F5’-AAACCATGGAGCACGTGTTCGCCGT-3’(SEQ ID NO46)和BRIS1r5’-TAGGATCCGCICCTACTACTGAAGCT-3’(SEQ ID NO47);擴(kuò)增sRISBZ2采用dR2-15’-AAACCATGGAGGGAGAAGCTGAGACC-3’(SEQ ID NO48)R2ral5’-AAAGGATCCTACATATCAGAAGCGGCGGGA-3’(SEQ IDNO49);擴(kuò)增sRISBZ3采用dR3-15’-AAACCATGGATATAGAGGGCGGTCCA-3’(SEQ ID NO50)和R3ral5’-AAAGGATCCTACAGCCCGCCCAGGTGGCCG-3’(SEQ IDNO51)。
進(jìn)行PCR擴(kuò)增,反應(yīng)混合物包含10mM Tris-HCl pH8.3,1.5mM MgCl2,50mM KCl,0.01%(w/v)明膠,200μM dNTPs,1μM引物,0.5mg模板DNA,2.5單位的TaqI聚合酶,進(jìn)行的30個(gè)循環(huán)是94℃溫育1分鐘,50℃1分鐘,72℃2分鐘。
用限制性酶NcoI和BamHI消化所述PCR產(chǎn)物,然后連接到pET8c克隆載體(Novagen)以構(gòu)建質(zhì)粒。采用這些質(zhì)粒作模板,進(jìn)行體外轉(zhuǎn)錄/翻譯(TNT耦合小麥胚芽提取系統(tǒng);Promega)以產(chǎn)生全長(zhǎng)RISBZ1蛋白和短形式的RISBZ2(RISBZ2s)和RISBZ3(RISBZ3s)。上述反應(yīng)中所用的4μL小麥胚芽提取物可以用于凝膠移位分析。
利用凝膠移位分析以分離與21bp GCN4基元結(jié)合的同二聚體和異二聚體。在同sRISBZ2和sRISBZ3預(yù)溫育RISBZ1后,將所述含有GCN4基元的DNA探針加入到溫育混合物中。所述結(jié)果指示RISBZ同二聚體以及異二聚體可與GCN4基元結(jié)合。因此證實(shí)RISBZ蛋白與RISBZ家族其它成員形成異二聚體。
轉(zhuǎn)錄活化中RISBZ1蛋白的N-末端區(qū)的作用進(jìn)行瞬時(shí)分析以識(shí)別轉(zhuǎn)錄活化中涉及的RISBZ1蛋白的結(jié)構(gòu)域。作為報(bào)道基因制備所述GUS基因,其上已連接了21bp GCN4基元的三個(gè)拷貝和CaMV35s的核心啟動(dòng)子序列。采用CaMV35s啟動(dòng)子表達(dá)RISBZ1蛋白的各個(gè)結(jié)構(gòu)域以確定這些結(jié)構(gòu)域是否激活所述報(bào)道基因。
構(gòu)建一系列編碼RISBZ1蛋白的效應(yīng)質(zhì)粒,其中缺失從N-末端到堿性結(jié)構(gòu)域(basic domain)的每40個(gè)氨基酸(SEQ ID NO2的氨基酸序列中的編碼氨基酸區(qū)范圍從41st到436th,81st到436th,121st到436th,161st到436th,201st到436th,235th到436th)。當(dāng)將編碼全長(zhǎng)RISBZ1蛋白的效應(yīng)質(zhì)粒和報(bào)道質(zhì)粒(GUS基因與12-bp GCN基元的4個(gè)拷貝和CaMV35s的核心啟動(dòng)子序列連接)導(dǎo)入原生質(zhì)體時(shí),檢測(cè)到的GUS活性相對(duì)于只導(dǎo)入了報(bào)道質(zhì)粒的原生質(zhì)體的高約30倍。當(dāng)此報(bào)道基因的轉(zhuǎn)錄活性設(shè)定為100%時(shí),缺失了前40個(gè)氨基酸的基因活性下降到20%。此外,每缺失40個(gè)氨基酸報(bào)道基因的活性逐步降低到10%。這樣,提示RISBZ1的N-末端40個(gè)氨基酸主要涉及轉(zhuǎn)錄活化。
為進(jìn)一步分析RISBZ1的N-末端40個(gè)氨基酸與其轉(zhuǎn)錄活化能力的關(guān)系,構(gòu)建酵母轉(zhuǎn)錄活化因子GAL4 DNA結(jié)合結(jié)構(gòu)域和RISBZ1蛋白各部分之間的各種融合蛋白并表達(dá)用于增益(gain-of-function)分析。如圖10所示,構(gòu)建質(zhì)粒并用作效應(yīng)基因,所述質(zhì)粒包含GAL4-DNA結(jié)合結(jié)構(gòu)域和RISBZ1各區(qū)的融合蛋白的編碼序列連接到CaMV35s啟動(dòng)子的下游。將這些效應(yīng)質(zhì)粒與報(bào)道基因構(gòu)建體(所述GUS基因,連接有GAL4-DNA結(jié)合位點(diǎn)的九個(gè)拷貝與CaMV35s核心啟動(dòng)子)一起引入原生質(zhì)體中。
包含GAL4-DNA結(jié)合結(jié)構(gòu)域和RISBZ1的1st到235th位氨基酸的部分O氨基酸序列的融合蛋白的轉(zhuǎn)錄活化能力與一系列融合蛋白對(duì)比沒(méi)有顯著差別,所述一系列融合蛋白中缺失從RISBZ1的C-末端殘基到27th位殘基的氨基酸(圖10)。具有前20個(gè)氨基酸殘基的融合蛋白的轉(zhuǎn)錄活化能力顯著降低(圖10)。缺失了N-末端8個(gè)RISBZ1殘基的融合蛋白失去了轉(zhuǎn)錄活性。相對(duì)照,包含GAL4-DNA結(jié)合域和RISBZ1的其它區(qū)(SEQ ID NO2中的從27th到57th,81st到234th,161st到234th,或235th到436th)的融合蛋白對(duì)報(bào)道基因的轉(zhuǎn)錄活性沒(méi)有影響。這些結(jié)果提示RISBZ1蛋白的N-末端27個(gè)氨基酸殘基內(nèi)的富脯氨酸域涉及轉(zhuǎn)錄活化,與酸性域無(wú)關(guān)。
通過(guò)結(jié)構(gòu)域交換(domain swapping)分析的RISBZ1和其它RISBZ蛋白間轉(zhuǎn)錄活化活性的差別盡管RISBZ蛋白家族的所有成員對(duì)GCN4基元序列有相似的親和性,但只有RISBZ1具有轉(zhuǎn)錄活化活性。為找到這種差別的原因,進(jìn)行RISBZ1-,和RISBZ2-或RISBZ3-蛋白間的結(jié)構(gòu)域交換(domain swapping)。RISBZ1的位于bZIP結(jié)構(gòu)域上游的1st到299th的N-末端區(qū)被RISBZ2的1st到299th位或RISBZ2的1st到137th位的N-末端區(qū)所取代。
與全長(zhǎng)RISBZ1相比,具有RISBZ1的N-末端區(qū)和RISBZ2或RISBZ3的DNA結(jié)合域的融合蛋白分別表現(xiàn)出約15%或38%的轉(zhuǎn)錄活化能力。相對(duì)照地,具有RISBZ2或RISBZ3的N-末端區(qū)和RISBZ1 DNA結(jié)合域的融合蛋白表現(xiàn)出的轉(zhuǎn)錄活性略高于單獨(dú)由RISBZ1 DNA結(jié)合域誘導(dǎo)的。
這些結(jié)果指示所述N-末端區(qū)主要與轉(zhuǎn)錄活化有關(guān)。RISBZ2或RISBZ3轉(zhuǎn)錄活化能力低可能是由于進(jìn)化過(guò)程中缺失或突變了對(duì)應(yīng)RISBZ1轉(zhuǎn)錄活化域的區(qū)?;蛘呖赡苁怯捎谵D(zhuǎn)錄活化域的形成過(guò)程中所導(dǎo)致。RISBZ3的較低活性很可能是由于缺少RISBZ1上的富含脯氨酸域。這也適用于RISBZ4和RISBZ5。凝膠移位分析的結(jié)果可能排除了與GCN4基元的親和力的差異導(dǎo)致轉(zhuǎn)錄活化能力的差異的可能性。
RISBZ1的富含脯氨酸域在RISBZ2這是高度保守的,但與RISBZ1的相比RISBZ2的轉(zhuǎn)錄活化能力極低。當(dāng)編碼包含RISBZ2的N-末端27個(gè)氨基酸的融合蛋白(包含富含脯氨酸域和GAL4-DNA結(jié)合域)的效應(yīng)質(zhì)粒與編碼與GUS基因相連接的GCN4基元的報(bào)道質(zhì)粒一起導(dǎo)入原生質(zhì)體時(shí),沒(méi)有觀察到GUS活性的提高。
由于在RISBZ1和RISBZ2之間觀察到N-末端27個(gè)殘基中只有8個(gè)殘基不同,本發(fā)明人已經(jīng)測(cè)定了此8個(gè)殘基中哪一個(gè)導(dǎo)致了轉(zhuǎn)錄活化能力的差異。RISBZ1與RISBZ2不同的8個(gè)氨基酸殘基被RISBZ2的殘基逐一取代,所得包含40個(gè)氨基酸的嵌合N-末端序列與GAL4-DNA結(jié)合域融合以構(gòu)建編碼融合蛋白的效應(yīng)質(zhì)粒。將這些效應(yīng)質(zhì)粒與報(bào)道質(zhì)粒一起導(dǎo)入原生質(zhì)體中,所述報(bào)道質(zhì)粒中GCN4基元與GUS基因融合。在8個(gè)效應(yīng)質(zhì)粒中,除編碼具有從RISBZ1的N-末端計(jì)算的第7位殘基取代的蛋白的那些外,所有的效應(yīng)基因構(gòu)建體都沒(méi)有活化報(bào)道基因的轉(zhuǎn)錄。采用Kyte和Doolittle公式假定所有這些7個(gè)取代的氨基酸,其喪失了轉(zhuǎn)錄活化能力,會(huì)誘導(dǎo)hydropacy方式的改變(圖11)。
轉(zhuǎn)錄因子RISBZ1對(duì)作物育種的用途本發(fā)明人檢測(cè)了將具有轉(zhuǎn)錄活化能力的轉(zhuǎn)錄因子RISBZ1用于作物育種的可能性。為了在種子中特異性過(guò)表達(dá)轉(zhuǎn)錄因子,用編碼RISBZ1基因的質(zhì)粒構(gòu)建體轉(zhuǎn)化水稻植物,所述基因處于水稻谷醇溶蛋白基因啟動(dòng)子(其編碼種子貯藏蛋白,分子量13kDa)的控制下。將RISBZ1基因的位于-29th位的EcoRI位點(diǎn)到聚腺苷酸添加位點(diǎn)的DNA片段連接到包含從所述基因的翻譯起始位點(diǎn)ATG計(jì)算的-652nd到-13th位的谷醇溶蛋白啟動(dòng)子。將所述構(gòu)建體插入到二元載體pGTV-Bar,借助農(nóng)桿菌屬(Agrobacterium)將所得載體導(dǎo)入水稻植物。通過(guò)此方法建立28個(gè)獨(dú)立的轉(zhuǎn)化株。以RISBZ1的cDNA作探針,通過(guò)提取自成熟種子的RNA的Northem雜交進(jìn)行過(guò)表達(dá)RISBZ1 mRNA的水稻植物的篩選(圖12)。這些過(guò)表達(dá)RISBZ1的品系與轉(zhuǎn)化的水稻植物雜交,在所述水稻植物中引入了編碼21-bp GCN4基元(5’-GTTTGTCATGGCTGAGTCATG-3’/SEQ ID NO52)的5個(gè)串聯(lián)重復(fù)的質(zhì)粒構(gòu)建體,RISBZ1蛋白的靶,其連接到minimum啟動(dòng)子/GUS報(bào)道基因。
結(jié)果顯示由于RISBZ1的過(guò)表達(dá),GUS報(bào)道基因的表達(dá)水平比對(duì)照的,5×GCN4細(xì)胞株(11到14 nmol/min/mg蛋白)增強(qiáng)了400倍或更多(450到750nmol/min/mg蛋白)(圖12)。這些結(jié)果提示可通過(guò)連接具有轉(zhuǎn)錄活化能力的轉(zhuǎn)錄因子RISBZ1的靶序列的外源基因下游并過(guò)表達(dá)RISBZ1來(lái)高度活化外源基因的轉(zhuǎn)錄。
所述RISBZ1蛋白不僅能活化谷蛋白基因而且能活化其它貯藏蛋白基因。采用電穿孔方法將35s CaMV啟動(dòng)子/RISBZ1融合構(gòu)建體同谷蛋白/GUS,谷蛋白啟動(dòng)子(-980th到ATG)/GUS,或13-Kd谷醇溶蛋白啟動(dòng)子(從-652nd到-29th)/GUS一起引入水稻原生質(zhì)體,觀察到它們的瞬時(shí)表達(dá)。
實(shí)驗(yàn)結(jié)果指示RISBZ1蛋白結(jié)合這些啟動(dòng)子中的包含GCN4基元的靶序列并激活外源基因的轉(zhuǎn)錄。揭示了在13Kd谷醇溶蛋白啟動(dòng)子情況下活化比背景高5到10倍,如果是球蛋白啟動(dòng)子則高20到30倍。因此使用甲基化干擾反應(yīng)確定RISBZ1如何識(shí)別這些基因的核苷酸序列。
結(jié)果表明谷醇溶蛋白基因的三個(gè)GCN4基元(TGACACA,GATGACTCA,TGACTCAC)和球蛋白的不同于GCN4基元的三個(gè)基元(GGTGACAC,GTATGTFFSC,和GATCCATGTCAC)被RISBZ1蛋白所識(shí)別。為測(cè)定被RISBZ1所識(shí)別的啟動(dòng)子中的具體序列,通過(guò)采用嵌合啟動(dòng)子序列觀察GUS基因的瞬時(shí)表達(dá),所述嵌合啟動(dòng)子序列中,G,A,C,G/C,A/G,或C/A盒,GCN4,22Kd玉米醇溶蛋白結(jié)合位點(diǎn)和包括b-32結(jié)合位點(diǎn)的12-bp序列的4個(gè)重復(fù)串聯(lián)插入到-46 CaMV 35s核心啟動(dòng)子/GUS報(bào)道基因。實(shí)驗(yàn)結(jié)果指示RISBZ1蛋白優(yōu)先識(shí)別G/C盒和GCN4基元(圖13)。
此外,研究了RISBZ1蛋白是否識(shí)別貯藏蛋白基因啟動(dòng)子上各種不同的GCN4基元。此結(jié)果指示GCN4基元的核心序列“TGAGTCA”的側(cè)翼序列影響轉(zhuǎn)錄活化能力,并且小麥麥醇溶蛋白基因和黑麥黑麥堿基因的GCN4基元具有高轉(zhuǎn)錄活化能力(圖14)。
工業(yè)應(yīng)用性本發(fā)明提供了調(diào)控水稻種子貯藏蛋白表達(dá)的新的轉(zhuǎn)錄因子,以及編碼所述轉(zhuǎn)錄因子的基因。預(yù)計(jì)由本發(fā)明具有轉(zhuǎn)錄活化能力的RISBZ1蛋白調(diào)控的許多種子貯藏蛋白的表達(dá),可通過(guò)將編碼RISBZ1蛋白的基因?qū)爰?xì)胞并超表達(dá)而增強(qiáng)。本發(fā)明還提供了新的基因表達(dá)系統(tǒng),其中一種有用的外源基因,編碼如抗體和酶,可利用本發(fā)明的轉(zhuǎn)錄因子高表達(dá),方法是通過(guò)將所述轉(zhuǎn)錄因子的識(shí)別序列和GCN4基元串聯(lián)連接并將其引入編碼種子貯藏蛋白的基因啟動(dòng)子中以利于其與轉(zhuǎn)錄因子的結(jié)合。這樣,在所述修飾的啟動(dòng)子控制下可以大大增強(qiáng)編碼貯藏蛋白的基因和有用的外源基因的表達(dá)。這使胚乳中種子貯藏蛋白大量積累,種子(例如水稻)更富營(yíng)養(yǎng)以及產(chǎn)生有用蛋白高度積累的種子。
序列表序列表<110>獨(dú)立行政法人農(nóng)業(yè)生物資源研究所(National Institute of Agrobiological Sciences)生物系特定產(chǎn)業(yè)技術(shù)研究所推進(jìn)機(jī)構(gòu)(Bio-or iented Technology Research Advancement Institution)<120>控制水稻中貯藏蛋白的表達(dá)的bZIP轉(zhuǎn)錄因子<130><140>PCT/JP01/08936<141>2001-10-11<150>JP 2000-311295<151>2000-10-11<160>52<170>PatentIn Ver.2.0<210>1<211>1735<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(211)..(1518)<400>1ggcacgagaa aaaacccatg ggttgcgtag ccgtagcttt cccaccattt ccttctctcc 60gaagcctcct cctctccgct tcctcccgcg aaaccaaatt ccaaagcatt tgatcgaatt 120tctcccaaac ttttccagcg ttttcaattt cgccccgatt tcggttcgaa aacccctcgc 180gaattcattt caaactcgtc cgagagcgca atg gag cac gtg ttc gcc gtc gac 234Met Glu His Val Phe Ala Val Asp1 5gag atc ccc gac ccg ctg tgg gct ccg ccg ccg ccg gtg cag ccg gcg 282Glu Ile Pro Asp Pro Leu Trp Ala Pro Pro Pro Pro Val Gln Pro Ala10 15 20gcg gcc gcc gga gta gat gac gtc ggc gcg gtg agc ggc ggc ggg ttg 330Ala Ala Ala Gly Val Asp Asp Val Gly Ala Val Ser Gly Gly Gly Leu25 30 35 40ctg gag cgg tgc ccg tcg ggg tgg aac ctc gag agg ttt ctg gag gag 378Leu Glu Arg Cys Pro Ser Gly Trp Asn Leu Glu Arg Phe Leu Glu Glu45 50 55ctc gac ggc gtc cct gca ccg gcg gcg agc ccg gac ggc gcg gcg att 426Leu Asp Gly Val Pro Ala Pro Ala Ala Ser Pro Asp Gly Ala Ala Ile60 65 70tac cct agc ccg atg ccg gcg gcg gcg gcg gag gcg gcg gcg cgc tgg 474Tyr Pro Ser Pro Met Pro Ala Ala Ala Ala Glu Ala Ala Ala Arg Trp75 80 85agt agg ggc tac ggc gat cgt gag gcg gtg ggg gtg atg ccc atg ccc 522Ser Arg Gly Tyr Gly Asp Arg Glu Ala Val Gly Val Met Pro Met Pro90 95 100gcg gcc gcg ctt ccg gcg gcg ccg gcg agc gcg gcg atg gac ccc gtg 570Ala Ala Ala Leu Pro Ala Ala Pro Ala Ser Ala Ala Met Asp Pro Val105 110 115 120gag tac aac gcg atg ctg aag cgg aag ctg gac gag gac ctc gcc acc 618Glu Tyr Asn Ala Met Leu Lys Arg Lys Leu Asp Glu Asp Leu Ala Thr125 130 135gtc gcc atg tgg agg gcc tct ggt gca ata cat tct gag agt cct cta 666Val Ala Met Trp Arg Ala Ser Gly Ala Ile His Ser Glu Ser Pro Leu140 145 150ggc aat aaa aca tca ctg agt ata gtt ggt tcc atc ctg agt tca cag 714Gly Asn Lys Thr Ser Leu Ser Ile Val Gly Ser Ile Leu Ser Ser Gln155 160 165aag tgc att gaa ggt aac ggg ata cta gtg cag acc aag tta agt cct 762Lys Cys Ile Glu Gly Asn Gly Ile Leu Val Gln Thr Lys Leu Ser Pro170 175 180ggc cca aat gga gga tca ggc cca tat gta aat caa aat aca gat gct 810Gly Pro Asn Gly Gly Ser Gly Pro Tyr Val Asn Gln Asn Thr Asp Ala185 190 195 200cat gcc aag caa gct acg agt ggt tcc tca agg gag cca tca cca tca 858His Ala Lys Gln Ala Thr Ser Gly Ser Ser Arg Glu Pro Ser Pro Ser205 210 215gag gat gat gat atg gaa gga gat gca gag gca atg gga aat atg atc 906Glu Asp Asp Asp Met Glu Gly Asp Ala Glu Ala Met Gly Asn Met Ile220 225 230ctt gat gaa gaa gat aaa gtg aag aaa agg aag gaa tcc aac cgg gag 954Leu Asp Glu Glu Asp Lys Val Lys Lys Arg Lys Glu Ser Asn Arg Glu235 240 245tca gct aga cgc tca aga agc aga aag gca gct cgc cta aaa gac ctg 1002Ser Ala Arg Arg Ser Arg Ser Arg Lys Ala Ala Arg Leu Lys Asp Leu250 255 260gag gag cag gta tca cta tta agg gtt gaa aac tct tct ctg ttg agg 1050Glu Glu Gln Val Ser Leu Leu Arg Val Glu Asn Ser Ser Leu Leu Arg265 270 275 280cgt ctt gct gat gca aat cag aag tac agt gct gct gct att gac aat 1098Arg Leu Ala Asp Ala Asn Gln Lys Tyr Ser Ala Ala Ala Ile Asp Asn285 290 295agg gta cta atg gca gac att gaa gcc cta aga gca aag gtg agg atg 1146Arg Val Leu Met Ala Asp Ile Glu Ala Leu Arg Ala Lys Val Arg Met300 305 310gca gag gag agt gtg aag atg gtt aca ggg gct aga caa ctt cac cag 1194Ala Glu Glu Ser Val Lys Met Val Thr Gly Ala Arg Gln Leu His Gln315 320 325gcc att cct gac atg caa tct ccc ctc aat gtc aac tct gat gct tct 1242Ala Ile Pro Asp Met Gln Ser Pro Leu Asn Val Asn Ser Asp Ala Ser330 335 340gtg ccg atc cag aac aac aac cca atg aac tac ttc tcc aac gct aac 1290Val Pro Ile Gln Asn Asn Asn Pro Met Asn Tyr Phe Ser Asn Ala Asn345 350 355 360aat gcc ggt gtt aac agc ttc atg cac cag gtt tct cca gcg ttc cag 1338Asn Ala Gly Val Asn Ser Phe Met His Gln Val Ser Pro Ala Phe Gln365 370 375att gtg gat tct gtc gag aag att gac cca aca gat cca gtg cag ctg 1386Ile Val Asp Ser Val Glu Lys Ile Asp Pro Thr Asp Pro Val Gln Leu380 385 390cag cag caa cag atg gcg agc ttg cag cat ctt cag aat aga gct tgt 1434Gln Gln Gln Gln Met Ala Ser Leu Gln His Leu Gln Asn Arg Ala Cys395 400 405ggt ggc ggc gca agt tcg aat gaa tat aca gca tgg gga tcg tct ctg 1482Gly Gly Gly Ala Ser Ser Asn Glu Tyr Thr Ala Trp Gly Ser Ser Leu410 415 420atg gat gca aat gag ctt gtc aac atg gag ctt cag tagtaggagc1528Met Asp Ala Asn Glu Leu Val Asn Met Glu Leu Gln425 430 435atatcctaac aacatgatga gagcatttgg aggtgcaaat ttgcaacctg caaatgctgt 1588tttgtagtag tagttgttgt cgctgttttt gtctgaaact gtagtttcta tggattttgg 1648acttgctgag gaacatctgc ggctgttgtt gtttcaaatt gagaaaatga gggacaatgg 1708gacatggtgg tctcccttaa tatagcgaaa aaatggttgg ata 1742<210>2<211>436<212>PRT<213>稻(Oryza sativa)<400>2Met Glu His Val Phe Ala Val Asp Glu Ile Pro Asp Pro Leu Trp Ala1 5 10 15Pro Pro Pro Pro Val Gln Pro Ala Ala Ala Ala Gly Val Asp Asp Val20 25 30Gly Ala Val Ser Gly Gly Gly Leu Leu Glu Arg Cys Pro Ser Gly Trp35 40 45Asn Leu Glu Arg Phe Leu Glu Glu Leu Asp Gly Val Pro Ala Pro Ala50 55 60Ala Ser Pro Asp Gly Ala Ala Ile Tyr Pro Ser Pro Met Pro Ala Ala65 70 75 80Ala Ala Glu Ala Ala Ala Arg Trp Ser Arg Gly Tyr Gly Asp Arg Glu85 90 95Ala Val Gly Val Met Pro Met Pro Ala Ala Ala Leu Pro Ala Ala Pro100 105 110Ala Ser Ala Ala Met Asp Pro Val Glu Tyr Asn Ala Met Leu Lys Arg115 120 125Lys Leu Asp Glu Asp Leu Ala Thr Val Ala Met Trp Arg Ala Ser Gly130 135 140Ala Ile His Ser Glu Ser Pro Leu Gly Asn Lys Thr Ser Leu Ser Ile145 150 155 160Val Gly Ser Ile Leu Ser Ser Gln Lys Cys Ile Glu Gly Asn Gly Ile165 170 175Leu Val Gln Thr Lys Leu Ser Pro Gly Pro Asn Gly Gly Ser Gly Pro180 185 190Tyr Val Asn Gln Asn Thr Asp Ala His Ala Lys Gln Ala Thr Ser Gly195 200 205Ser Ser Arg Glu Pro Ser Pro Ser Glu Asp Asp Asp Met Glu Gly Asp210 215 220Ala Glu Ala Met Gly Asn Met Ile Leu Asp Glu Glu Asp Lys Val Lys225 230 235 240Lys Arg Lys Glu Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Ser Arg245 250 255Lys Ala Ala Arg Leu Lys Asp Leu Glu Glu Gln Val Ser Leu Leu Arg260 265 270Val Glu Asn Ser Ser Leu Leu Arg Arg Leu Ala Asp Ala Asn Gln Lys275 280 285Tyr Ser Ala Ala Ala Ile Asp Asn Arg Val Leu Met Ala Asp Ile Glu290 295 300Ala Leu Arg Ala Lys Val Arg Met Ala Glu Glu Ser Val Lys Met Val305 310 315 320Thr Gly Ala Arg Gln Leu His Gln Ala Ile Pro Asp Met Gln Ser Pro325 330 335Leu Asn Val Asn Ser Asp Ala Ser Val Pro Ile Gln Asn Asn Asn Pro340 345 350Met Asn Tyr Phe Ser Asn Ala Asn Asn Ala Gly Val Asn Ser Phe Met355 360 365His Gln Val Ser Pro Ala Phe Gln Ile Val Asp Ser Val Glu Lys Ile370 375 380Asp Pro Thr Asp Pro Val Gln Leu Gln Gln Gln Gln Met Ala Ser Leu385 390 395 400Gln His Leu Gln Asn Arg Ala Cys Gly Gly Gly Ala Ser Ser Asn Glu405 410 415Tyr Thr Ala Trp Gly Ser Ser Leu Met Asp Ala Asn Glu Leu Val Asn420 425 430Met Glu Leu Gln435<210>3<211>6335<212>DNA<213>稻(Oryza sativa)<400>3tgctccattg cgctctcgga cgagcatata tgtatgacat gtgggcccgg aatgtcagta 60acagggaatc ctgaaaaaaa tgcagctatg tgataatttt caacgctaat gttgcagttt 120tctgaaaagt gtcgcaaagg ttgcagcaaa gtgatagttt agtcaataaa actgcagttt 180tctgaaattt actctagttt ttttacctat ctagttggtt ttatgtgtaa ctaaacctta 240catcagatca aaacaagttt ataaattcac cacgtatttc cctcagctca catctttctg 300agaacatgat aaattcatta cattgtgcta caccatatgg ggactttaga acatgttcgt 360cttctttttt tttctttttt cttttttaca ttttaccttc tcagtttaca aatacttgtt 420agctttgcct ggatatgtaa cccaacacta tgatacaaat tttgtcaatt ctctaaaatt 480tttcaagttt gaaacaaatt aagatgtatg gttgtgggtg aattaatcta cattgatagg 540aaatgcgtta aagtacatgc aaagcttatg aaattattgc aagtagtcat catgcctcag 600tgagtcagtg tgcatacttg tagtgcataa ccaaattctt tttcatatac tagaaagatt 660caaagctgca aatgtgcatg tgaggttgat gaatggaata cacaataata catgacaata 720aacacatatt aaagaattta gtgcaaaaaa attgtattgt catggtacac attttaacaa 780ttttctttac tttttataca ttgtaaatat taattaatat ctaaaacaaa atataaagta 840cgggaataaa atttaattgg ctaatgtgga aatggcatgg agctaaatgt tctatatatg 900gtcctaacgt ttaaagataa aatacatatg tgcttgtgtt actaataata tctaaaagac 960taagtagtat gtattaaata tgctagagaa cataagaaac ttaaaaactt gacgtggcaa 1020aatgggcgct taagcgacac atattgcact ttcagctgat cttattcccc cttttaaatt 1080tcatgtcccc attttgatta tcacatggaa tcaaccacat tatacctatg catccttgtg 1140atttctgaaa ttaaactcga aagcaaccaa gtaaagagga gggggagaaa aagttagcag 1200aaaacatgga tgatacatgt caataagctg ctagcataac cataagtgta gggcacgttt 1260cttaggacaa tggtataaag ttacaaactg aaatatcatt gttaggtcag tttgatataa 1320tcagtttgga ttactataga cacttgtcat agtaaataga gatggatcat ttcttaagta 1380gcatcactac tcttattcac gaatgtcttt gctacccttt ctgttatact tttcctcttt 1440ttctgtagaa agccatttgt ccttatatta tcattgtcaa attaaggatg cgtaatctac 1500accctcactc aaaaactttg ataagataaa aacaaataaa tccatgcctt tatagaacct 1560tgtcaaaatt atgctacacc tgtgctagga acaccatacc atcgtagctt acttgcacgc 1620tttctgttag ccctttttcc taataaaaac gtattcgtcc gtatcgttgt tatcgctttg 1680atcgtgtggg tttcacttta tatccgttga aacctctgtt aacacgtcca aattatttat 1740atcggtatta tcactcaaga tcgtgcgggt tgttttgctt tttacgtttc ttgaagcttc 1800taaagagggg acaaacctat ataaatagga gaggagagca ccctctcaac tcagttcaaa 1860attgaaaaaa aaaagaaaaa aaaagagaag aaaaaaaaac ccatgggttg cgtagccgta 1920gctttcccac catttccttc tctccgaagc ctcctcctct ccgcttcctc ccgcgaaacc 1980aaattccaaa gcatttgatc gaatttctcc caaacttttc cagcgttttc aatttcgccc 2040cgatttcggt tcgaaaaccc ctcgcgaatt catttcaaac tcgtccgaga gcgcaatgga 2100gcacgtgttc gccgtcgacg agatccccga cccgctgtgg gctccgccgc cgccggtgca 2160gccggcggcg gccgccggag tagatgacgt cggcgcggtg agcggcggcg ggttgctgga 2220gcggtgcccg tcggggtgga acctcgagag gtttctggag gagctcgacg gcgtccctgc 2280accggcggcg agcccggacg gcgcggcgat ttaccctagc ccgatgccgg cggcggcggc 2340ggaggcggcg gcgcgctgga gtaggggcta cggcgatcgt gaggcggtgg gggtgatgcc 2400catgcccgcg gccgcgcttc cggcggcgcc ggcgagcgcg gcgatggacc ccgtggagta 2460caacgcgatg ctgaagcgga agctggacga ggacctcgcc accgtcgcca tgtggagggt 2520actctctctc atctcgatcg ctgcttgctt tgcttgcttc atggcttgta cagttgtact 2580ggtgggttca ccatttgggg tggtggtgat gggatggctg tggcgtaatt aagtgcaatt 2640tttagggcat ttcctgtgat taactgtggc tagatggtcg caatttagca tagatgtgac 2700atatcctagc tgttactatg aatctggacc ggctctctgt ccagattcat agtactagat 2760gtgtcacatc cctctaaatc tcttatatta taaggaggga gtataaatta attttataag 2820agcacgcgtt gatgtcgata tccgcatcgt aagcccaggc actactcacg tgtgtgcttt 2880cttatccata ctttaatatt gtcagagtgg gatgagacaa actttaatat tgtcggggtg 2940tggtataata tttatattat ttccgtgtat agatttagga gtaatatgga ttaggattgc 3000atggaggtgc agagacttta tgtgacttct tggagccgtg cattgcttga gtgcaaagtt 3060aacaatttgg ttacatgttg caaaaatgat gtatagatca taggtcattg cacttatttt 3120gggtggtcct aggcggtatg attcatggaa tattttttgg aaattctgta ttttaccata 3180tttgcattac ttttcttatt attgttgttt gaaggaatta ttaggtcaca tacccttgga 3240agatgaaatt attttagtag aaaaaaagaa actgttatat tggaatctgg taaatttgga 3300cctagaaatt ctcaccagtc gattgtagat ggggaagcag agctttcttt ttagagattt 3360gctccgctcc aacaaaaagt acctcgaggt actggtacct catggtacca aatcgtttcc 3420gatcgttgga tctaacaatg cacatcctgc ctaattagat ccaacgatcg aaaatgattt 3480ggtaccgtga ggtaccggta cctcgaggta ctttttgttg gaccggagaa aatatcttct 3540ttttatgtta gttttctaag tggggtatat aatttttgca attggatatc atactttgaa 3600ctcattatgt gggttcagtt tacaaatgac tacagaacat gttgatctga gcttttgcta 3660gttgatttca gtttacaatg tgaaacggtt ccctatataa gattataatg ccattagaac 3720taattaacta tgagagtgtg tgtttagctc cgatagttat taagtccctt tgcattctga 3780cttcaatttt tggcatgtcc atccatccac aggcctctgg tgcaatacat tctgagagtc 3840ctctaggcaa taaaacatca ctgagtatag ttggttccat cctgagttca cagaagtgca 3900ttgaaggtat tctattatgc atatgtgctt agttaaatct tctcagtacc tatgagttat 3960gacttatgag taatctctaa tgttgtaagc aaatctaatt tttgcgtaat gtagttttca 4020tattatatat atctgattgg attttccccc tatttcgaca cattcaggta acgggatact 4080agtgcagacc aagttaagtc ctggcccaaa tggaggatca ggcccatatg taaatcaaaa 4140tacagatgct catgccaagc aagctacgag tggttcctca agggagccat caccatcaga 4200ggatgatgat atggaaggag atgcagaggc aatgggaaat atgatccttg atgaagaaga 4260taaagtgaag aaaaggtaat atgtattctt ttgcttgtgt atttttattt ttcaattcaa 4320cacatacaaa gagtaaacac tgagcattag cattagaaat taggggactt ttacatctat 4380tgatttcctt ttttcttaga aatagctttt aagtaatatg ctttagatta tcaagataat 4440ggatccttag tttctttcta ggtgtttcat gtttgtactg gatgtatttg attatataca 4500acattctcac ttttttctta gaaatgcttg agctaatgct tgctaggtgt ttcaatgctt 4560tatatacctg actgaatttt ggtaatgctt gttacaagct ggtgcattaa ggataattat 4620tgtttccgtg caagcagcta ttcatgcaaa aaaggaaaaa tgcaacgtgt atgattagaa 4680caatttagga ggcatttgct tcttgctttt cataacatgc tgggaatatc atgtcctgtt 4740gtgtctagtt gctttttcta catatgaaaa attgagttta tctactgtgg tctttttttc 4800cgcagcagtc agacattcat gtcgcctttt tttgtgtaat aaatacagcc ggatatttga 4860gatttgagct tgtgttcttg tccaatttca ggaaggaatc caaccgggag tcagctagac 4920gctcaagaag cagaaaggca gctcgcctaa aagacctgga ggagcaggtt ttgtgtttta 4980cactattcca tttgactgca caacaaagtt ttggaatatg taagtaacaa gtgtaattgt 5040tgctaaatca ttgcaggtat cactattaag ggttgaaaac tcttctctgt tgaggcgtct 5100tgctgatgca aatcagaagt acagtgctgc tgctattgac aatagggtac taatggcaga 5160cattgaagcc ctaagagcaa aggtatgcaa ctgtttaagt gccttttagt cctctgtatg 5220aactgaacct ctctttcaaa taggtatcca attatccatg tgcattgatt ctggtcagta 5280ttgtgcatct ttcatggtgt agaaaaccgg aatattctac atatcaaaca tataccaaat 5340tttcttggaa tgaaacgaac ttctagcatt tgttcttaaa atttggtaca ggagatattg 5400caaatgttgt cctcttgctc cattcgaagg attaagttgt ttgccatcta ttataacctg 5460caacaattag actcacttgt tttgtcttga aacaaccggg tgtaactact tttctttttc 5520ctgcaacgta ccaggtgtaa ataatcgctt gccgaatggt gataaccaat tcacacaatg 5580gatcacaatc aattttaaca aagaacctga gctacactac actactgcgg tgtcgtatct 5640tatagccata tgcttctaga ccacaactga aaattcatga accatgcgat gtgggttagc 5700taacatcttg acatgattgc aggtgaggat ggcagaggag agtgtgaaga tggttacagg 5760ggctagacaa cttcaccagg ccattcctga catgcaatct cccctcaatg tcaactctga 5820tgcttctgtg ccgatccaga acaacaaccc aatgaactac ttctccaacg ctaacaatgc 5880cggtgttaac agcttcatgc accaggtttc tccagcgttc cagattgtgg attctgtcga 5940gaagattgac ccaacagatc cagtgcagct gcagcagcaa cagatggcga gcttgcagca 6000tcttcagaat agagcttgtg gtggcggcgc aagttcgaat gaatatacag catggggatc 6060gtctctgatg gatgcaaatg agcttgtcaa catggagctt cagtagtagg agcatatcct 6120aacaacatga tgagagcatt tggaggtgca aatttgcaac ctgcaaatgc tgttttgtag 6180tagtagttgt tgtcgctgtt tttgtctgaa actgtagttt ctatggattt tggacttgct 6240gaggaacatc tgcggctgtt gttgtttcaa attgagaaaa tgagggacaa tgggacatgg 6300tggtctccct taatatagcg aaaaatggtt ggaat6335<210>4<211>1199<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(171)..(1004)<400>4ggcacgaggc gatcaacaca aaaagcttct ctttcccttc tcctcctcgg tgatctgtct 60cgccggggca tctcgaaaag catccgactc cgacgccgcc gcgcgccacc acccggccga 120tcgccgacgc cgcagccgct ggaagcagca gggacgacgg agaatcggag atg gac176Met Aspatc gag gcg ttc atc cac ggc gga agc ggg ggc ggc gac gcc gac gcc 224Ile Glu Ala Phe Ile His Gly Gly Ser Gly Gly Gly Asp Ala Asp Ala5 10 15gac cac ccg ctc ggc atc ttc tcc gcc gcc gac ctc tcc ggc ttc ggc 272Asp His Pro Leu Gly Ile Phe Ser Ala Ala Asp Leu Ser Gly Phe Gly20 25 30ttc gcg gac tcg agc acc atc aca ggg ggc att ccc aat cac ata tgg 320Phe Ala Asp Ser Ser Thr Ile Thr Gly Gly Ile Pro Asn His Ile Trp35 40 45 50ccc cag tcc cag aac ctg aac gca cgg cat cct gcg gtc tcc acg aca 368Pro Gln Ser Gln Asn Leu Asn Ala Arg His Pro Ala Val Ser Thr Thr55 60 65att gag tcg cag tca tca atc tgt gca gca gca agt ccc aca tca gct 416Ile Glu Ser Gln Ser Ser Ile Cys Ala Ala Ala Ser Pro Thr Ser Ala70 75 80acc aat ctg aac atg aag gag agc caa act ctg gga ggc aca agt ggt 464Thr Asn Leu Asn Met Lys Glu Ser Gln Thr Leu Gly Gly Thr Ser Gly85 90 95tcg gat tct gaa agt gaa tcg ctg ttg gat ata gag ggt ggt cca tgc 512Ser Asp Ser Glu Ser Glu Ser Leu Leu Asp Ile Glu Gly Gly Pro Cys100 105 110gaa caa agc acg aac ccg ttg gac gtg aag aga gtg aga agg atg gtg 560Glu Gln Ser Thr Asn Pro Leu Asp Val Lys Arg Val Arg Arg Met Val115 120 125 130tcc aat cgg gag tct gct cgg cga tcg agg aag aga aag caa gct cac 608Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Lys Arg Lys Gln Ala His135 140 145tta gct gat ctc gag tca cag gtt gac cag ctc cgg ggc gaa aac gca 656Leu Ala Asp Leu Glu Ser Gln Val Asp Gln Leu Arg Gly Glu Asn Ala150 155 160tcg ctt ttc aag cag ttg acg gat gcc aac cag caa ttc aca act tct 704Ser Leu Phe Lys Gln Leu Thr Asp Ala Asn Gln Gln Phe Thr Thr Ser
165 170 175gtc acg gac aac aga atc ctc aaa tca gac gtt gag gcc ctc cgg gtc 752Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu Arg Val180 185 190aag gtg aag atg gcg gag gac atg gtg gcg cgg ggg gcg ctg tcg tgc 800Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Gly Ala Leu Ser Cys195 200 205 210ggg ctc ggc cac ctg ggc ggg ctg tcg ccg gcg ctg aac ccc cgg cag 848Gly Leu Gly His Leu Gly Gly Leu Ser Pro Ala Leu Asn Pro Arg Gln215 220 225gcg tgc cgc gtc ccc gac gtg ctc gcc ggc ctg gac tac gcc ggc gac 896Ala Cys Arg Val Pro Asp Val Leu Ala Gly Leu Asp Tyr Ala Gly Asp230 235 240gac ccc ttc acg gcc ggg ctg tcc cag ccg gag cag ttg cag atg ccc 944Asp Pro Phe Thr Ala Gly Leu Ser Gln Pro Glu Gln Leu Gln Met Pro245 250 255ggc ggc gag gtg gtt gac gcc tgg ggc tgg gac aac cac ccc aac ggc 992Gly Gly Glu Val Val Asp Ala Trp Gly Trp Asp Asn His Pro Asn Gly260 265 270ggc atg tcc aag tgaaactact ggtcctactt ctatgtcagc tcagctacgt 1044Gly Met Ser Lys275ttgaaacgtg atgtgtccaa gtgaacggac ttgagttttt cagagtcctc gtgtcgaagt 1104gtcatgcact cttccctatt cctgtaatag aactgactag ctaagagact gaaagtctga 1164aactacgaag tataaatgtg gtggaatttg gaact1199<210>5<211>278<212>PRT<213>稻(Oryza sativa)<400>5Met Asp Ile Glu Ala Phe Ile His Gly Gly Ser Gly Gly Gly Asp Ala1 5 10 15Asp Ala Asp His Pro Leu Gly Ile Phe Ser Ala Ala Asp Leu Ser Gly20 25 30Phe Gly Phe Ala Asp Ser Ser Thr Ile Thr Gly Gly Ile Pro Asn His35 40 45Ile Trp Pro Gln Ser Gln Asn Leu Asn Ala Arg His Pro Ala Val Ser50 55 60Thr Thr Ile Glu Ser Gln Ser Ser Ile Cys Ala Ala Ala Ser Pro Thr65 70 75 80Ser Ala Thr Asn Leu Asn Met Lys Glu Ser Gln Thr Leu Gly Gly Thr85 90 95Ser Gly Ser Asp Ser Glu Ser Glu Ser Leu Leu Asp Ile Glu Gly Gly100 105 110Pro Cys Glu Gln Ser Thr Asn Pro Leu Asp Val Lys Arg Val Arg Arg115 120 125Met Val Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Lys Arg Lys Gln130 135 140Ala His Leu Ala Asp Leu Glu Ser Gln Val Asp Gln Leu Arg Gly Glu145 150 155 160Asn Ala Ser Leu Phe Lys Gln Leu Thr Asp Ala Asn Gln Gln Phe Thr165 170 175Thr Ser Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu180 185 190Arg Val Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Gly Ala Leu195 200 205Ser Cys Gly Leu Gly His Leu Gly Gly Leu Ser Pro Ala Leu Asn Pro210 215 220Arg Gln Ala Cys Arg Val Pro Asp Val Leu Ala Gly Leu Asp Tyr Ala225 230 235 240Gly Asp Asp Pro Phe Thr Ala Gly Leu Ser Gln Pro Glu Gln Leu Gln245 250 255Met Pro Gly Gly Glu Val Val Asp Ala Trp Gly Trp Asp Asn His Pro260 265 270Asn Gly Gly Met Ser Lys275<210>6<211>1362<212>DNA<213>稻(Oryza sativa)<220><221>CDS<222>(23)..(907)<400>6ggcacgaggt cggaggaagg cg atg atg aag aag tgc ccg tcg gag ctg cag 52Met Met Lys Lys Cys Pro Ser Glu Leu Gln1 5 10ctg gag gcg ttc atc cgg gag gag gcc ggc gcc ggc gac cgc aag ccc 100Leu Glu Ala Phe Ile Arg Glu Glu Ala Gly Ala Gly Asp Arg Lys Pro15 20 25ggc gtg tta tct ccc ggc gac ggc gcg cgt aag tcc ggc ctg ttc tct 148Gly Val Leu Ser Pro Gly Asp Gly Ala Arg Lys Ser Gly Leu Phe Ser30 35 40ccc ggc gac ggc gag atg tcc gtg ttg gat cag agt aca ctg gac gga 196Pro Gly Asp Gly Glu Met Ser Val Leu Asp Gln Ser Thr Leu Asp Gly45 50 55agc ggc ggc ggc cac cag ctg tgg tgg ccg gag agc gtc cgt acg ccg 244Ser Gly Gly Gly His Gln Leu Trp Trp Pro Glu Ser Val Arg Thr Pro60 65 70ccg cgc gcc gcc gcc gcc ttc tcg gcc acg gcc gac gag cgg acg ccg 292Pro Arg Ala Ala Ala Ala Phe Ser Ala Thr Ala Asp Glu Arg Thr Pro75 80 85 90gcg tcc atc tcc gat gac ccc aaa cca acc acc tca gcg aac cac gcg 340Ala Ser Ile Ser Asp Asp Pro Lys Pro Thr Thr Ser Ala Asn His Ala95 100 105cct gaa agc gac tcg gac tcc gat tgc gat tcg ctg tta gaa gca gag 388Pro Glu Ser Asp Ser Asp Ser Asp Cys Asp Ser Leu Leu Glu Ala Glu110 115 120agg agt cca cgc ctg cgt ggc acg aaa tcc aca gaa aca aag cga ata 436Arg Ser Pro Arg Leu Arg Gly Thr Lys Ser Thr Glu Thr Lys Arg Ile125 130 135aga agg atg gtg tcc aac agg gag tcc gct cga cga tcc agg agg aga 484Arg Arg Met Val Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Arg Arg140 145 150aag cag gca cag tta tct gaa ctc gaa tca cag gtc gag caa ctc aaa 532Lys Gln Ala Gln Leu Ser Glu Leu Glu Ser Gln Val Glu Gln Leu Lys155 160 165 170ggc gaa aac tca tcc ctc ttc aag cag ctc aca gag tcc agc cag cag 580Gly Glu Asn Ser Ser Leu Phe Lys Gln Leu Thr Glu Ser Ser Gln Gln175 180 185ttc aat aca gcg gtc acg gac aac agg atc ctc aaa tcg gat gta gag 628Phe Asn Thr Ala Val Thr Asp Asn Arg Ile Leu Lys Ser Asp Val Glu190 195 200gcc tta aga gtc aag gtc aag atg gct gaa gac atg gtc gcg agg gcc 676Ala Leu Arg Val Lys Val Lys Met Ala Glu Asp Met Val Ala Arg Ala205 210 215gcg atg tcg tgt ggc ctg ggc cag ctc ggg ctg gcg cca ttg ctc agc 724Ala Met Ser Cys Gly Leu Gly Gln Leu Gly Leu Ala Pro Leu Leu Ser220 225 230tcc agg aag atg tgc caa gct ttg gat atg ctc agt tta cca cgg aac 772Ser Arg Lys Met Cys Gln Ala Leu Asp Met Leu Ser Leu Pro Arg Asn235 240 245 250gat gcc tgt ggt ttc aaa ggc ttg aac ctg ggt cga cag gtt cag aac 820Asp Ala Cys Gly Phe Lys Gly Leu Asn Leu Gly Arg Gln Val Gln Asn255 260 265tca ccg gtt caa agc gct gca agc cta gag agc ctg gac aac cgg ata 868Ser Pro Val Gln Ser Ala Ala Ser Leu Glu Ser Leu Asp Asn Arg Ile270 275 280tcc agc gag gtg acc agc tgc tcg gct gat gtg tgg cct taagacactt917Ser Ser Glu Val Thr Ser Cys Ser Ala Asp Val Trp Pro285 290 295catccgtgtt cgagagagct tgagattcta agaagcagcc ggtgagaatc tgaaaaggct 977agttgttcag tttcctattt ttagtttatg tttgaattct ctggctacta atgctcaaaa 1037tctgggagag aatctaaatc gtttgggaca gataaaaaat tatgcgagaa ggtgtagctg 1097acagaaacct tcccaaacaa atctccatca gaacctatat gtaaagtaat acggtatcct 1157ctgttactag gtgcatgtgc ataactgaca agctgctaag tactaggtac tacagtctga 1217ggcaagtatt tctggtgttt tggtgctgaa gaactatgtt ttagtgcgtt tgatctgcgg 1277caatcaaggc catctgatcg aaatttgatt ggtataaatc tgatcgaaat ttgattggta 1337taagtataat agtttgattt tgatc 1362<210>7<211>295<212>PRT<213>稻(Oryza sativa)<400>7Met Met Lys Lys Cys Pro Ser Glu Leu Gln Leu Glu Ala Phe Ile Arg1 5 10 15Glu Glu Ala Gly Ala Gly Asp Arg Lys Pro Gly Val Leu Ser Pro Gly20 25 30Asp Gly Ala Arg Lys Ser Gly Leu Phe Ser Pro Gly Asp Gly Glu Met35 40 45Ser Val Leu Asp Gln Ser Thr Leu Asp Gly Ser Gly Gly Gly His Gln50 55 60Leu Trp Trp Pro Glu Ser Val Arg Thr Pro Pro Arg Ala Ala Ala Ala65 70 75 80Phe Ser Ala Thr Ala Asp Glu Arg Thr Pro Ala Ser Ile Ser Asp Asp85 90 95Pro Lys Pro Thr Thr Ser Ala Asn His Ala Pro Glu Ser Asp Ser Asp100 105 110Ser Asp Cys Asp Ser Leu Leu Glu Ala Glu Arg Ser Pro Arg Leu Arg115 120 125Gly Thr Lys Ser Thr Glu Thr Lys Arg Ile Arg Arg Met Val Ser Asn130 135 140Arg Glu Ser Ala Arg Arg Ser Arg Arg Arg Lys Gln Ala Gln Leu Ser145 150 155 160Glu Leu Glu Ser Gln Val Glu Gln Leu Lys Gly Glu Asn Ser Ser Leu165 170 175Phe Lys Gln Leu Thr Glu Ser Ser Gln Gln Phe Asn Thr Ala Val Thr180 185 190Asp Asn Arg Ile Leu Lys Ser Asp Val Glu Ala Leu Arg Val Lys Val195 200 205Lys Met Ala Glu Asp Met Val Ala Arg Ala Ala Met Ser Cys Gly Leu210 215 220Gly Gln Leu Gly Leu Ala Pro Leu Leu Ser Ser Arg Lys Met Cys Gln225 230 235 240Ala Leu Asp Met Leu Ser Leu Pro Arg Asn Asp Ala Cys Gly Phe Lys245 250 255Gly Leu Asn Leu Gly Arg Gln Val Gln Asn Ser Pro Val Gln Ser Ala260 265 270Ala Ser Leu Glu Ser Leu Asp Asn Arg Ile Ser Ser Glu Val Thr Ser275 280 285Cys Ser Ala Asp Val Trp Pro290 295<210>8<211>12<212>DNA<213>稻(Oryza sativa)<400>8gctgagtcat ga12<210>9<211>12<212>DNA<213>稻(Oryza sativa)<400>9catgagtcac tt12<210>10<211>12<212>DNA<213>稻(Oryza sativa)<400>10agtgagtcac tt12<210>11<211>12<212>DNA<213>稻(Oryza sativa)<400>11ggtgagtcat at12<210>12<211>12<212>DNA<213>稻(Oryza sativa)<400>12ggtgagtcat gt12<210>13<211>12<212>DNA<213>稻(Oryza sativa)<400>13gatgagtcat gc12<210>14<211>12<212>DNA<213>稻(Oryza sativa)<400>14aatgagtcat ca12<210>15<211>12<212>DNA<213>稻(Oryza sativa)<400>15agccacgtca ca12<210>16<211>17<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<220><223>The 9th and 15th nucleotide residues are inosines.<400>16tccaaymgng arwcngc 17<210>17<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>17gtcctcygcc atcttcacct t 21<210>18<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>18atgggttgcg tagccgtagc t 21<210>19<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>19ttgcttggca tgagcatctg t 21<210>20<211>17<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>20gaggatcagg cecatat17<210>21<211>21<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>21tcgctatatt aagggagacc a 21<210>22<211>24<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>22tgctccattg cgctctcgga cgag24<210>23<211>23<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>23atgaattcgc gaggggtttt cga 23<210>24<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>24gtttgggaga aattcgatca aatgc 25<210>25<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>25atggtatggt gttcctagca caggtgtagc 30<210>26<211>18<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>26aaaactgcag ttttctga 18<210>27<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>27aatggatccg cgaggggttt tcgaa 25<210>28<211>12<212>DNA<213>稻(Oryza sativa)<400>28gcttcctcat ga12<210>29<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>29aaccatggtg ctggagcggt gcccgt 26<210>30<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>30aaccatggcg gcggaggcgg cggcg 25<210>31<211>23<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>31ccccatggag tacaacgcga tgc23<210>32<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>32aaccatggtt ggttccatcc tgagt 25<210>33<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>33aaccatggct catgccaagc aagct 25<210>34<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>34aaccatggat gaagaagata aagtgaag 28<210>35<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>35taggatccgc tcctactact gaagct 26<210>36<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>36aaggatccaa tggagcacgt gttcgcc27<210>37<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>37aaggatccgg cggcggaggc ggcgcg 26<210>38<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>38gccggatcca gttggttcca tcctgag27<210>39<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>39aaggatcctg atgaagaaga taaagt 26<210>40<211>27<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>40aaggatccag gagtagatga cgtcggc27<210>41<211>29<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>41aaggatccag acgagatccc cgacccgct 29<210>42<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>42tagagctcta cgccgccggc atcgggct 28<210>43<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>43tagagctcta aaggatcata tttcccat 28<210>44<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>44tagagctcta ggcggccgcc gccggctg 28<210>45<211>28<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>45tagagctcta cggcggcggc ggagccca 28<210>46<211>25<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>46aaaccatgga gcacgtgttc gccgt 25<210>47<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>47taggatccgc tcctactact gaagct 26<210>48<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>48aaaccatgga gggagaagct gagacc 26<210>49<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>49aaaggatcct acatatcaga agcggcggga 30<210>50<211>26<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>50aaaccatgga tatagagggc ggtcca 26<210>51<211>30<212>DNA<213>人工序列<220><223>人工序列的描述人工合成的引物序列<400>51aaaggatcct acagcccgcc caggtggccg 30<210>52<211>21<212>DNA<213>稻(Oryza sativa)<400>52gtttgtcatg gctgagtcat g 2權(quán)利要求
1.一種選自下組的DNA(a)一種DNA,所述DNA編碼包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列的蛋白;(b)一種DNA,所述DNA包含SEQ ID NO1,3,4和6中任一項(xiàng)所示核苷酸序列的編碼區(qū);(c)一種DNA,所述DNA包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列,所述氨基酸序列中有一或多個(gè)氨基酸的取代,缺失,添加,和/或插入,并且所述DNA編碼的蛋白在功能上等價(jià)于包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列的蛋白;(d)一種DNA,所述DNA在嚴(yán)謹(jǐn)條件下與包含SEQ ID NO1,3,4和6中任一項(xiàng)所示核苷酸序列的DNA雜交,并且所述DNA編碼的蛋白在功能上等價(jià)于包含SEQ ID NO2,5和7中任一項(xiàng)所示氨基酸序列的蛋白。
2.權(quán)利要求1的DNA,所述DNA編碼與GCN4基元結(jié)合的蛋白或所述DNA激活水稻種子貯藏蛋白的表達(dá)。
3.權(quán)利要求1或2的DNA,所述DNA得自水稻植物。
4.一種編碼反義RNA的DNA,所述RNA與權(quán)利要求1到3中任一項(xiàng)的DNA的轉(zhuǎn)錄產(chǎn)物互補(bǔ)。
5.一種編碼RNA的DNA,所述RNA具有特異性裂解權(quán)利要求1到3中任一項(xiàng)的DNA的轉(zhuǎn)錄產(chǎn)物的核酶活性。
6.一種編碼RNA的DNA,所述RNA具有通過(guò)共抑制作用抑制權(quán)利要求1到3中任一項(xiàng)的DNA在植物細(xì)胞中表達(dá)的活性,并且所述RNA與權(quán)利要求1到3中任一項(xiàng)的DNA具有90%或更高的同源性。
7.一種編碼蛋白的DNA,所述蛋白具有權(quán)利要求1到3中任一項(xiàng)的DNA編碼的蛋白的顯性陰性表型,其在植物細(xì)胞中是內(nèi)源的。
8.一種載體,所述載體包含權(quán)利要求1到3中任一項(xiàng)的DNA。
9.一種轉(zhuǎn)化細(xì)胞,所述轉(zhuǎn)化細(xì)胞含有權(quán)利要求1到3中任一項(xiàng)的DNA或權(quán)利要求8的載體。
10.一種由權(quán)利要求1到3中任一項(xiàng)的DNA編碼的蛋白。
11.一種產(chǎn)生權(quán)利要求10的蛋白的方法,所述方法包含如下步驟培養(yǎng)權(quán)利要求9的轉(zhuǎn)化細(xì)胞,從所述轉(zhuǎn)化細(xì)胞或細(xì)胞培養(yǎng)上清中收集表達(dá)的蛋白。
12.一種包含權(quán)利要求4到7中任一項(xiàng)的DNA的載體。
13.一種轉(zhuǎn)化的植物細(xì)胞,所述植物細(xì)胞含有權(quán)利要求1到7中任一項(xiàng)的DNA或權(quán)利要求8或12中任一項(xiàng)的載體。
14.一種轉(zhuǎn)化植物,所述植物包含權(quán)利要求13的轉(zhuǎn)化的植物細(xì)胞。
15.一種轉(zhuǎn)化植物,所述植物是權(quán)利要求14的轉(zhuǎn)化植物的子代或克隆。
16.權(quán)利要求14或15的轉(zhuǎn)化植物的繁殖材料。
17.一種與權(quán)利要求10的蛋白結(jié)合的抗體。
18.一種植物,所述植物的基因組上具有兩種DNA構(gòu)建體,第一種DNA構(gòu)建體中權(quán)利要求1的DNA可操縱地連接到表達(dá)調(diào)控區(qū)的下游,第二種DNA構(gòu)建體中一種外源基因可操縱地連接到表達(dá)調(diào)控區(qū)的下游,所述調(diào)控區(qū)具有權(quán)利要求10的蛋白的靶序列。
19.權(quán)利要求18的植物,其中所述靶序列是包含GCN4基元的序列。
20.權(quán)利要求19的植物,其中所述GCN4基元具有的序列選自SEQ IDNO8,13和14中的任一個(gè)。
21.權(quán)利要求18的植物,其中所述靶序列是包含G/C盒的序列。
22.一種生產(chǎn)權(quán)利要求18到21中任一項(xiàng)的植物的方法,所述方法包括將在其基因組上具有一種DNA構(gòu)建體的植物與在其基因組上具有另一種DNA構(gòu)建體的植物雜交,在所述第一種DNA構(gòu)建體中權(quán)利要求1的DNA可操縱地連接到表達(dá)調(diào)控區(qū)的下游,在所述第二種DNA構(gòu)建體中一種外源基因可操縱地連接到包含權(quán)利要求10的蛋白的靶序列的表達(dá)調(diào)控區(qū)的下游。
全文摘要
從水稻種子來(lái)源的cDNA文庫(kù)中分離編碼bZIP型轉(zhuǎn)錄因子的cDNA(RISBZ1,RISBZ4,和RISBZ5)。所述cDNA編碼新的蛋白并具有與GCN4基元結(jié)合的活性。RISBZ1通過(guò)GCN4基元活化轉(zhuǎn)錄至100倍或更高。RISBZ1的表達(dá)先于種子貯藏蛋白基因的表達(dá),并只在成熟階段的種子中觀察到,這暗示RISBZ1可調(diào)控水稻種子貯藏蛋白的表達(dá)。為利于與RISBZ1轉(zhuǎn)錄因子相連,將轉(zhuǎn)錄因子的識(shí)別序列(GCN4基元)串聯(lián)連接,并將其引入特定貯藏蛋白的啟動(dòng)子中。這樣可提高如此修飾的啟動(dòng)子調(diào)控下的外源基因表達(dá)。
文檔編號(hào)C07K14/415GK1398299SQ01804789
公開(kāi)日2003年2月19日 申請(qǐng)日期2001年10月11日 優(yōu)先權(quán)日2000年10月11日
發(fā)明者高巖文雄, 小野寺康之 申請(qǐng)人:獨(dú)立行政法人農(nóng)業(yè)生物資源研究所, 生物系特定產(chǎn)業(yè)技術(shù)研究推進(jìn)機(jī)構(gòu)