專利名稱::嵌合pufa聚酮合酶系統(tǒng)及其用途的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及嵌合多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng),具體地,涉及來自裂殖壺菌屬(Schizochytrium)和破囊壺菌屬(Thraustochytrium)的嵌合PUFAPKS系統(tǒng)。更具體地,本發(fā)明涉及編碼這些PUFAPKS系統(tǒng)的核酸,這些PUFAPKS系統(tǒng),包含這些PUFAPKS系統(tǒng)的遺傳修飾生物體,和制造和使用這些本文公開的PUFAPKS系統(tǒng)的方法。
背景技術(shù):
:本領(lǐng)域公知聚酮合酶(PKS)系統(tǒng)是與脂肪酸合酶(FAS)系統(tǒng)相關(guān)的酶復(fù)合物,但它們經(jīng)常被高度修飾而產(chǎn)生通常顯示與脂肪酸幾乎沒有相似性的特化產(chǎn)物。然而現(xiàn)在已有證據(jù)顯示,PKS樣系統(tǒng)(PKS-likesystems),在本文也可互換地稱作用于產(chǎn)生PUFA的PKS系統(tǒng)、PUFA合酶系統(tǒng)或PUFAPKS系統(tǒng),存在于能夠從乙酰CoA和丙二酰CoA合成多不飽和脂肪酸(PUFA)的海洋細(xì)菌和某些真核生物中。在美國專利No.6,140,486中詳細(xì)描述了希瓦氏菌屬(Shewanella)和另一種海洋細(xì)菌海產(chǎn)弧菌(Vibriomarinus)中PUFA合成的PKS途徑。在美國專利6,566,583中詳細(xì)描述了真核破囊壺菌(Thraustochyrid)-裂殖壺菌屬(Schizochytrium)中PUFA合成的PKS途徑。在2002年12月19日公開的美國專利申請公開No.20020194641和2007年4月19日公開的美國專利申請公開20070089199中,詳細(xì)描述了真核生物例如破囊壺菌科(Thraustochytriales)成員中PUFA合成的PUFAPKS途徑,包括裂殖壺菌屬(Schizochytrium)中PUFAPKS系統(tǒng)的附加描述和破囊壺菌屬(Thraustochytrium)中PUFAPKS系統(tǒng)的鑒定,包括有關(guān)這些系統(tǒng)的使用的細(xì)節(jié)。2004年11月25日公布的美國專利申請公開No.20040235127公開了破囊壺菌屬中PUFAPKS系統(tǒng)的詳細(xì)結(jié)構(gòu)描述,以及關(guān)于使用這類系統(tǒng)產(chǎn)生二十碳五烯酸(C20:5,ω-3)(EPA)和其他PUFA的更多細(xì)節(jié)。2005年3月12日公布的美國專利申請公開No.20050100995公開了Shewanellaolleyana和日本希瓦氏菌(Shewanellajaponica)中PUFAPKS系統(tǒng)的結(jié)構(gòu)和功能描述,以及這些系統(tǒng)的用途。這些申請還公開了具有PUFAPKS途徑組成基因的生物體,包括微生物和植物,的遺傳修飾,并公開了通過這些生物體產(chǎn)生PUFA。而且,PCT專利公開No.WO05/097982描述了Ulkenia中的PUFAPKS系統(tǒng),美國專利申請公開No.20050014231描述了來自金黃破囊壺菌(Thraustochytriumaureum)的PUFAPKS基因和蛋白。本文通過援引并入上述每一個申請的全部內(nèi)容。研究人員已嘗試?yán)镁弁厦?PKS)系統(tǒng)。文獻(xiàn)中傳統(tǒng)上將聚酮合酶系統(tǒng)歸為三種基本類型之一,這三種類型通常是指1型[模塊性(modular)或重復(fù)性(iterative)],II型和III型。為清楚起見,需要指出,I型模塊性PKS系統(tǒng)以前被直接稱為“模塊性”PKS系統(tǒng),而I型重復(fù)性PKS系統(tǒng)先前也被直接稱作“I型”PKS系統(tǒng)。II型系統(tǒng)的特征是多個可以分離的(separable)蛋白質(zhì),其中各個蛋白質(zhì)執(zhí)行獨特的酶反應(yīng)。這些酶協(xié)同工作來產(chǎn)生終產(chǎn)物,并且在生產(chǎn)終產(chǎn)物的過程中,該系統(tǒng)的每一個單獨的酶通常有數(shù)次參與。這類系統(tǒng)的工作方式與在植物和細(xì)菌中發(fā)現(xiàn)的脂肪酸合酶(FAS)系統(tǒng)類似。I型重復(fù)性PKS系統(tǒng)與II型系統(tǒng)相似之處在于酶以重復(fù)的方式被使用來產(chǎn)生最終產(chǎn)物。I型重復(fù)性與II型的不同之處在于,酶活性作為較大的蛋白質(zhì)的域存在,而不是與可分離的蛋白相伴隨。該系統(tǒng)與在動物和真菌體內(nèi)發(fā)現(xiàn)的I型FAS系統(tǒng)類似。與II型系統(tǒng)相反,在I型模塊性PKS系統(tǒng)中,每個酶域在終產(chǎn)物的產(chǎn)生過程中只被使用一次。這些域存在于非常大的蛋白質(zhì)中,在PKS蛋白質(zhì)中每個反應(yīng)的產(chǎn)物被傳遞給另一個域。此外,在上述PKS系統(tǒng)中,如果終產(chǎn)物中包含碳-碳雙鍵,則碳-碳雙鍵通常是反式構(gòu)型。更近些時候發(fā)現(xiàn)了III型系統(tǒng),它屬于縮合酶(condensingenzymes)的植物查耳酮合酶家族。III型PKS與I型和II型PKS系統(tǒng)迥然不同,在重復(fù)縮合反應(yīng)中利用游離CoA底物,通常產(chǎn)生雜環(huán)終產(chǎn)物。多不飽和脂肪酸(PUFA)被認(rèn)為可用于營養(yǎng)、藥物、工業(yè)和其他用途。目前由天然資源和化學(xué)合成提供的PUFA不能滿足商業(yè)需要。PUFA的一個主要來源是海洋魚類;然而魚類資源正不斷減少,因此可能不是一個可持續(xù)的來源。此外,重金屬和有毒有機分子的污染也是一個影響海洋魚類來源的油類的嚴(yán)重問題。來源于含油種子作物的植物油價格相對低廉,并且沒有與魚油相關(guān)的污染問題。然而,在產(chǎn)業(yè)上開發(fā)的植物油中,PUFA通常僅限于亞油酸(在Δ9禾Π12位有兩個雙鍵的18碳-18:2Δ9,12)和亞麻酸(18:3Δ9,12,15)。在PUFA合成的傳統(tǒng)途徑(即“標(biāo)準(zhǔn)”途徑或“經(jīng)典”途徑)中,中等鏈長的飽和脂肪酸(脂肪酸合酶(FAS)系統(tǒng)的產(chǎn)物)經(jīng)過一系列延長和去飽和反應(yīng)被修飾。延長反應(yīng)的底物是脂肪酰-CoA(待延長的脂肪酸鏈)和丙二酸單酰-CoA(在每個延長反應(yīng)中添加的2個碳的來源)。延長酶反應(yīng)的產(chǎn)物是在直鏈中具有兩個額外碳的脂肪酰_CoA。去飽和酶通過氧依賴性的反應(yīng)除去2個氫從而在現(xiàn)有的脂肪酸鏈內(nèi)產(chǎn)生順式雙鍵。去飽和酶的底物是?;?CoA(在某些動物體內(nèi))或被酯化到磷脂(例如卵磷脂)甘油骨架上的脂肪酸。因此,因為從亞油酸和亞麻酸合成脂肪酸需要多種單獨的去飽和酶和延長酶以產(chǎn)生更不飽和的和更長鏈的PUFA,所以為了對植物宿主細(xì)胞進(jìn)行工程化以表達(dá)PUFA,例如EPA和二十二碳六烯酸(DHA),就需要表達(dá)數(shù)種單獨的酶來實現(xiàn)合成。此外,可能需要進(jìn)行進(jìn)一步的工程化工作來產(chǎn)生可用量的這類PUFA。因此,從自然產(chǎn)生這些脂肪酸的物種(例如來自PUFAPKS系統(tǒng))獲得參與PUFA生物合成的遺傳材料,并將該分離的材料在能夠被操作以產(chǎn)生產(chǎn)業(yè)量的PUFA的異源系統(tǒng)中單獨或組合地進(jìn)行表達(dá),是令人感興趣的。人們已經(jīng)進(jìn)行了努力,試圖通過修飾內(nèi)源產(chǎn)生的脂肪酸而在含油種子作物中產(chǎn)生PUFA。通過對這些具有各種單獨的脂肪酸延長酶和去飽和酶基因的植物進(jìn)行遺傳修飾,已經(jīng)產(chǎn)生了含有可測量水平的PUFA(例如EPA)并且含有顯著水平的混合短鏈和不飽和度較低的PUFA的葉子或種子(Qi等,NatureBiotech.22:739(2004);PCTPublicationNo.WO04/071467;AbbadiPlantCell161(2004));NapierandSayanova,ProceedingsoftheNutritionSociety(2005),64387-393;Robert等,F(xiàn)unctionalPlantBiology(2005)32:473_479;或美國專利申請公開2004/0172682)。提高微生物和植物的PUFA產(chǎn)量是一個非常令人向往的產(chǎn)業(yè)目標(biāo)。因此,本領(lǐng)域中仍然需要提供方法來有效地和高效地產(chǎn)生,特別是在產(chǎn)業(yè)上有用的生物體例如微生物和含油植物中有效和高效地產(chǎn)生大量富含期望PUFA的脂類(例如三?;视?TAG)和磷脂(PL)).
發(fā)明內(nèi)容本發(fā)明的一個實施方案涉及一種嵌合PUFAPKS系統(tǒng),其中來自第一PUFAPKS系統(tǒng)的FabA樣β-羥酰-ACP脫水酶(DH)域被替換為來自另一不同的第二PUFAPKS系統(tǒng)的DH域,從而產(chǎn)生嵌合的PUFAPKS系統(tǒng),其與所述第一PUFAPKS系統(tǒng)相比,產(chǎn)生不同的ω-3PUFA對ω-6PUFA比例。在一個方面中,包含來自所述第一PUFAPKS系統(tǒng)的DH域的蛋白質(zhì)被替換為包含來自所述第二PUFAPKS系統(tǒng)的DH域的同源蛋白質(zhì)。在一個方面中,來自所述第一或第二PUFAPKS系統(tǒng)的DH域?qū)?yīng)于來自裂殖壺菌屬或破囊壺菌屬的DH2域。在一個方面中,第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中第二PUFAPKS系統(tǒng)是破囊壺菌屬PUFAPKS系統(tǒng)。在一個方面中,第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC被來自不同破囊壺菌(thraustochytrid)的OrfC替換。在本實施方案的一個方面中,第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC被替換為來自破囊壺菌23B的OrfC。在一個方面中,此類來自破囊壺菌23B的OrfC由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼。示例核酸序列包括SEQIDN0:70。在另外一個方面中,來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfA被替換為來自破囊壺菌23B的OrfA。在一個方面中,此類來自破囊壺菌23B的OrfA是由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼的。示例核酸序列包括SEQIDN071。在另外一個方面中,來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfB被替換為破囊壺菌23B的OrfB。在一個方面中,此類來自破囊壺菌23B的OrfB由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼。示例核酸序列包括SEQIDN0:72。本領(lǐng)域的技術(shù)人員根據(jù)本文的公開容易想到OrfA、B和C的其它組合。在本實施方案的另一個方面中,第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC的DH2域被替換為來自破囊壺菌23B的DH2域。在一個方面中,包含來自破囊壺菌23B的DH2域的示例性核酸序列包括SEQIDNO:73。在一個方面中,所述來自破囊壺菌23B的DH2由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼。此類包含來自破囊壺菌23B的DH2域的核酸序列的實例有包含SEQIDNO75的序列。在本實施方案的另外一個方面中,該嵌合PUFAPKS系統(tǒng)包括這樣的蛋白質(zhì),所述蛋白質(zhì)的氨基酸序列與SEQIDNO:74至少95%同一。在一個方面中,該嵌合PUFAPKS系統(tǒng)包括包含SEQIDNO:74的氨基酸序列的蛋白質(zhì)。在一個方面中,該嵌合PUFAPKS系統(tǒng)包括SEQIDN0:2、SEQIDNO:4和SEQIDNO:74。在另一個方面中,該嵌合PUFAPKS系統(tǒng)包括SEQIDN039、SEQIDNO:4和SEQIDNO:62。在另一個方面中,該嵌合PUFAPKS系統(tǒng)包括SEQIDNO39,SEQIDNO:4和SEQIDNO:74。在另一個方面中,該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包括SEQIDNO=USEQIDNO:3和SEQIDNO:70。在另外一個方面中,該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包括SEQIDNO1,SEQIDNO:3和SEQIDNO:73。在另一個方面中,該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包括SEQIDNO=USEQIDNO:3和SEQIDNO75。在另一個方面中,該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包括SEQIDNO:71,SEQIDNO3禾口SEQIDNO:70。本發(fā)明的另一個實施方案涉及改變由第一PUFAPKS系統(tǒng)產(chǎn)生的多不飽和脂肪酸(PUFA)的ω-3對ω-6比例的方法,包括在生物體中表達(dá)任何上述的嵌合PUFAPKS系統(tǒng)。在一個方面中,該嵌合PUFAPKS系統(tǒng)由微生物表達(dá)。在一個方面中,該微生物是裂殖壺菌屬。在另一個方面中,該微生物是酵母。在一個方面中,該嵌合PUFAPKS系統(tǒng)由植物表達(dá)。本發(fā)明的再一個實施方案涉及遺傳修飾的微生物或植物或植物部分,其包括任何上述的PUFAPKS系統(tǒng)。本發(fā)明的另一個實施方案涉及增加第一PUFAPKS系統(tǒng)的PUFA產(chǎn)生和改變由第一PUFAPKS系統(tǒng)產(chǎn)生的多不飽和脂肪酸(PUFA)的ω-3對ω-6比例的方法。該方法包括在生物體中表達(dá)嵌合PUFAPKS系統(tǒng),該系統(tǒng)中來自第一PUFAPKS系統(tǒng)的FabA-樣β-羥酰-ACP脫水酶(DH)域被替換為來自另一不同的第二PUFAPKS系統(tǒng)的DH域,從而產(chǎn)生嵌合PUFAPKS系統(tǒng),其與所述第一PUFAPKS系統(tǒng)相比產(chǎn)生不同的(0-3PUFA對(0-6PUFA比例。來自所述第二PUFAPKS系統(tǒng)的DH域是針對該第一PUFAPKS系統(tǒng)所來源的生物體的密碼子用法優(yōu)化過的。本發(fā)明的另一個實施方案涉及編碼與SEQIDNO:74至少95%同一的嵌合OrfC蛋白的分離核酸分子。在一個方面中,該分離的核酸分子包含與SEQIDΝ0:73至少95%同一的核酸序列。在一個方面中,該核酸分子是針對表達(dá)該核酸分子的生物體的密碼子用法優(yōu)化過的。例如,該核酸分子可以是針對該嵌合蛋白一部分所來源的生物體的密碼子用法進(jìn)行過優(yōu)化的。在一個實施方案中,該核酸序列與SEQIDNO:75至少95%同一。本發(fā)明的另一個實施方案涉及包含任何上述核酸分子的重組核酸分子。本發(fā)明的另外一個實施方案涉及經(jīng)任何上述核酸分子轉(zhuǎn)染的重組宿主細(xì)胞。在一個方面中,該細(xì)胞是微生物。在一個方面中,該微生物是裂殖壺菌屬。在一個方面中,該微生物是細(xì)菌。在一個方面中,該微生物是酵母。在一個方面中,該細(xì)胞是植物細(xì)胞。本發(fā)明的另一個實施方案涉及包含任何上述重組宿主細(xì)胞的遺傳修飾植物或其部分。本發(fā)明的另一個實施方案涉及一種嵌合PUFAPKS系統(tǒng),其包括a)至少一個烯酰-ACP還原酶(ER)域;b)至少四個ACP域;c)至少兩個β-酮酯酰-ACP合酶(KS)域;d)至少一個?;D(zhuǎn)移酶(AT)域;e)至少一個β-酮酯酰-ACP還原酶(KR)域;f)至少兩個FabA樣β-羥酰-ACP脫水酶(DH)域;g)至少一個鏈長因子(CLF)域;和h)至少一個丙二酰-CoA:ACP酰基轉(zhuǎn)移酶(MAT)域。至少一個DH域來自第一PUFAPKS系統(tǒng),并且其中域(a)-(h)中其余的域來自另一不同的第二PUFAPKS系統(tǒng)。本發(fā)明的另一個實施方案涉及提高表達(dá)PUFAPKS系統(tǒng)的生物體的PUFA產(chǎn)生的方法。該方法包括針對該生物體或相關(guān)生物體的最優(yōu)密碼子用法對編碼PUFAPKS系統(tǒng)中至少一種蛋白質(zhì)的核酸分子加以修飾。在一個方面中,該生物體表達(dá)異源重組PUFAPKS系統(tǒng)。在一個方面中,該生物體是裂殖壺菌屬,并且編碼該內(nèi)源PUFAPKS系統(tǒng)中至少一種蛋白質(zhì)的核酸分子是針對裂殖壺菌屬密碼子用法優(yōu)化過的。附圖簡述圖1是裂殖壺菌屬PUFAPKS系統(tǒng)的域結(jié)構(gòu)圖示。圖2A是顯示含有編碼來自破囊壺菌23B的OrfC的核酸序列的質(zhì)粒(pThOrfCsynPS)的構(gòu)建過程的第1步以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。上述核酸序列是針對裂殖壺菌屬密碼子優(yōu)化過的合成序列。圖2B是顯示含有編碼來自破囊壺菌23B的OrfC的核酸序列的質(zhì)粒(pThOrfCsynPS)的構(gòu)建過程的第2步以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。上述核酸序列是針對裂殖壺菌屬密碼子優(yōu)化過的合成序列。圖3A是顯示編碼包含來自破囊壺菌23B的天然DH2域的裂殖壺菌屬OrfC的質(zhì)粒(PDS49)的構(gòu)建過程的步驟1-6以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。圖3B是顯示編碼包含來自破囊壺菌23B的天然DH2域的裂殖壺菌屬OrfC的質(zhì)粒(PDS49)的構(gòu)建過程的步驟7以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。圖3C是顯示編碼包含來自破囊壺菌23B的天然DH2域的裂殖壺菌屬OrfC的質(zhì)粒(PDS49)的構(gòu)建過程的步驟8-9以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。圖4A是顯示質(zhì)粒DD21的構(gòu)建以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。該質(zhì)粒DD21的構(gòu)建是編碼包含來自破囊壺菌23B并經(jīng)過裂殖壺菌屬密碼子優(yōu)化的合成DH2域的裂殖壺菌屬OrfC的質(zhì)粒(pDD24)的構(gòu)建過程的第一步。圖4B是顯示質(zhì)粒DD22的構(gòu)建以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。該質(zhì)粒DD22的構(gòu)建是編碼包含來自破囊壺菌23B并經(jīng)過裂殖壺菌屬密碼子優(yōu)化的合成DH2域的裂殖壺菌屬OrfC的質(zhì)粒(pDD24)的構(gòu)建過程的第二步。圖4C是顯示質(zhì)粒DD24的構(gòu)建以及由該過程產(chǎn)生的中間質(zhì)粒的示意圖。該質(zhì)粒DD24的構(gòu)建是編碼包含來自破囊壺菌23B并經(jīng)過裂殖壺菌屬密碼子優(yōu)化的合成DH2域的裂殖壺菌屬OrfC的質(zhì)粒(pDD24)的構(gòu)建過程的最后一步。圖5是對照酵母和表達(dá)裂殖壺菌屬OrfsA,OrfsB,OrfC和HetI的酵母的FAME■;並圖6是圖5中酵母的FAME譜(profile),經(jīng)放大以圖示目標(biāo)PUFA的產(chǎn)生。發(fā)明詳細(xì)說明本發(fā)明一般地涉及多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng),也稱作PUFA合酶系統(tǒng),包括來自破囊壺菌(thraustochytrids)(例如裂殖壺菌屬和破囊壺菌屬)、擬網(wǎng)黏菌類(Iabyrinthulids)、海洋細(xì)菌和其它含PUFAPKS的生物體的PUFAPKS系統(tǒng),和嵌合PUFAPKS蛋白及其產(chǎn)生的系統(tǒng)。本發(fā)明涉及包含這類PUFAPKS系統(tǒng)的遺傳修飾生物體,并涉及制造這些系統(tǒng)和使用這些系統(tǒng)產(chǎn)生目的產(chǎn)物,包括生物活性分子,的方法。在一個優(yōu)選實施方案中,本發(fā)明涉及一種在經(jīng)過遺傳修飾從而表達(dá)本發(fā)明的PUFAPKS系統(tǒng)的微生物或含油種子植物(oil-seedplants)或植物部分中產(chǎn)生PUFA的方法。由該微生物或植物產(chǎn)生的油含有至少一種由所述PUFAPKS系統(tǒng)產(chǎn)生的PUFA,并且在植物的場合,基本上不含混合的較短鏈和較低飽和度PUFA(它們是通過FAS系統(tǒng)產(chǎn)物的修飾而產(chǎn)生的脂肪酸產(chǎn)物)。本發(fā)明特別地包括用于修飾PKS系統(tǒng)產(chǎn)生的PUFA量以及PUFA的比例——在本發(fā)明的一個方面中,修飾ω-3PUFA對ω-6PUFA的比例或一種PUFA對另一種PUFA的比例(例如DHA對EPA的比例)——的方法,這些方法可應(yīng)用于創(chuàng)建和使用任何PUFAPKS構(gòu)建體和/或遺傳修飾的生物體,如本文例示和詳細(xì)說明的。首先,本發(fā)明人在此描述了PUFAPKS系統(tǒng)的一種結(jié)構(gòu)域,它是對PUFAPKS系統(tǒng)所產(chǎn)生的PUFA的比例(當(dāng)多于一種PUFA被產(chǎn)生時)進(jìn)行修飾的必要而充分的條件;本發(fā)明人還在此提供了新的嵌合構(gòu)建體、新的嵌合PUFAPKS系統(tǒng)、新的生物體和利用此發(fā)現(xiàn)來產(chǎn)生修飾量的PUFA的新方法。其次,本發(fā)明人在此描述了用于在異源宿主(或在內(nèi)源宿主)中優(yōu)化PUFAPKS表達(dá)以增加該生物體的PUFA生產(chǎn)的方法、修飾、以及多種嵌合PUFAPKS系統(tǒng)和構(gòu)建體。本發(fā)明包括了單獨或聯(lián)合利用這兩項發(fā)現(xiàn)來提高和指導(dǎo)生物體的PUFA生產(chǎn)的詳細(xì)說明。更具體地,關(guān)于本發(fā)明的某些實施方案,本發(fā)明人和同事的先前工作(見美國專利申請公開No.20050100995)顯示,破囊壺菌23Β(Thraustochytrium23B)orfC編碼區(qū)(本文用SEQIDNO62表示)能夠在功能上替換基因組orfC座位上的裂殖壺菌屬orfC編碼區(qū)。這一點是通過下述過程確定的。首先,精確地刪除裂殖壺菌屬orfC編碼區(qū)代之以一個抗生素抗性盒(表示為AorfC::ZE0),從而獲得生長專性需要DHA并且對Zeocin耐受的菌株(表示為B32-Z1)。然后構(gòu)建質(zhì)粒,其中破囊壺菌23BorfC編碼區(qū)被精確地克隆到裂殖壺菌屬orfC上游非編碼區(qū)和下游非編碼區(qū)之間。用該破囊壺菌23BorfC構(gòu)建體轉(zhuǎn)化所述裂殖壺菌屬AorfC:ZEO菌株,以補足所述刪除并產(chǎn)生自養(yǎng)型(不需要DHA)且Zeocin敏感的轉(zhuǎn)化體。發(fā)現(xiàn)這些轉(zhuǎn)化體來源于orfC座位的雙交叉(cross-over)重組事件,該重組事件使破囊壺菌23BorfC編碼區(qū)精確地替換來自裂殖壺菌屬的orfC編碼區(qū),即基因替換。對這些轉(zhuǎn)化體的脂肪酸含量分析顯示,DHA/DPA比例從大約2.3(在野生型裂殖壺菌屬ATCC20888中)提高到了大約8.3(接近破囊壺菌23B的比例)。該結(jié)果表明,orfC基因(在裂殖壺菌屬和破囊壺菌屬中其含有三個域DH1,DH2和ER)在PUFA產(chǎn)物的η-3/η-6(ω-3/ω-6)比例的決定中發(fā)揮主要作用。然而,含破囊壺菌23ΒorfC菌株的總PUFA產(chǎn)量,盡管相當(dāng)可觀,是低于野生型裂殖壺菌屬宿主的產(chǎn)量的(大約60%)。通過對這兩個orfC編碼區(qū)進(jìn)行檢查,本發(fā)明人認(rèn)為破囊壺菌23B基因在裂殖壺菌屬中的表達(dá)很低是由于裂殖壺菌屬和破囊壺菌屬之間的密碼子用法模式明顯不同造成的。本發(fā)明人現(xiàn)在已發(fā)現(xiàn),使用具有針對裂殖壺菌屬模式優(yōu)化過的密碼子用法的“合成”破囊壺菌23BorfC編碼區(qū)(即合成產(chǎn)生的編碼區(qū))提高了DHA產(chǎn)量,同時利用非合成破囊壺菌23BorfC時所見的n-3/n-6比例增加仍然得以保持(見實施例1和4)。本發(fā)明人先前還描述了裂殖壺菌屬和破囊壺菌屬的OrfC蛋白內(nèi)存在可識別的域脫水酶1(DHl)、脫水酶2(DH2)和烯酰還原酶(ER)(例如見美國專利申請公開No.20020194641,上文;美國專利申請公開No.20040235127,上文),并教導(dǎo)了OrfC中的一個或多個域被認(rèn)為參與控制由PUFAPKS系統(tǒng)產(chǎn)生的脂肪酸的類型和/或比例。這里,本發(fā)明人在裂殖壺菌屬、大腸桿菌(E.coli)和酵母系統(tǒng)中證明,PUFAPKS系統(tǒng)對ω-3對ω-6(η-3/η-6)脂肪酸比例的大部分或全部影響是由DH2域單獨負(fù)責(zé)的。具體地說,本發(fā)明人首先進(jìn)行實驗,使用各種破囊壺菌23ΒOrfC域來替換裂殖壺菌屬OrfC中相應(yīng)的域(數(shù)據(jù)未顯示)。本發(fā)明人發(fā)現(xiàn),用來自破囊壺菌屬的OrfC-ER域替換裂殖壺菌屬OrfC-ER域,DHA/DPA比例與野生型裂殖壺菌屬相比沒有顯著改變(歷史地,大約2.3)。然而,用來自破囊壺菌屬的相應(yīng)域替換裂殖壺菌屬的全部兩個DH域,DHA/DPA比例則與野生型破囊壺菌23Β相比顯著提高(歷史地,大約8.3-10),而且,僅用來自破囊壺菌23Β的DH2域替換裂殖壺菌屬DH2域也足以有效地實現(xiàn)相同的結(jié)果。實施例2、3、4、5和6提供了多種顯示PUFAPKS系統(tǒng)中DH2域?qū)Ζ?3對ω-6(η-3/η-6)脂肪酸比例的影響的實驗結(jié)果。本發(fā)明人還描述了使用多種PUFAPKS系統(tǒng)提高宿主生物體的PUFA生產(chǎn),并出乎意料地發(fā)現(xiàn)某些嵌合PUFAPKS的組合(例如由特定的來自裂殖壺菌屬和破囊壺菌屬的Orf組合構(gòu)成的嵌合PUFAPKS系統(tǒng))與天然生物體或其他嵌合PUFAPKS系統(tǒng)相比具有顯著更高的PUFA生產(chǎn)(在一個實例中是DHA生產(chǎn))。例如,本發(fā)明人顯示,包含來自破囊壺菌23Β的OrfA和OrfC,以及來自裂殖壺菌屬的OrfB的嵌合PUFAPKS系統(tǒng),當(dāng)在裂殖壺菌屬宿主生物體內(nèi)表達(dá)時,與天然裂殖壺菌屬或來自于這兩種生物體的其它嵌合PUFAPKS系統(tǒng)相比可產(chǎn)生顯著更多的脂肪酸,特別是顯著更多的DHA(實施例8)。因此,本發(fā)明提供了充分的指引來生產(chǎn)數(shù)種不同PUFAPKS系統(tǒng),這些系統(tǒng)與某些野生型(非嵌合)PUFA合酶相比,PUFA生產(chǎn)增加,且n-3/n-6比例改善。如本文所使用的,PUFAPKS系統(tǒng)(也可以稱作PUFA合酶系統(tǒng)、PUFA合酶或用于產(chǎn)生PUFA的PKS樣系統(tǒng))一般具有如下的識別特征(1)它產(chǎn)生PUFA,特別是長鏈PUFAJt*該系統(tǒng)的天然產(chǎn)物;和(2)包括數(shù)個組裝成復(fù)合體的多功能蛋白,該復(fù)合體既進(jìn)行脂肪酸鏈的重復(fù)性加工,又進(jìn)行非重復(fù)性加工,包括選定的循環(huán)中的順反異構(gòu)化和烯酰還原反應(yīng)。此夕卜,PUFA合酶中的ACP域需要通過輔助因子(例如4-磷酸泛酰巰基乙胺)的結(jié)合而激活。該輔助因子的結(jié)合是由磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶)執(zhí)行的。如果宿主生物體的內(nèi)源PPT酶不能激活PUFA合酶ACP域,那么就必須提供能夠執(zhí)行該功能的PPT酶。本發(fā)明人鑒定了一種念珠藍(lán)細(xì)菌(Nostocsp.)的HetI酶是用于激活PUFA合酶ACP域的合適PPT酶的實例。所稱PUFAPKS系統(tǒng)或PUFA合酶是指生物體中以復(fù)合體形式產(chǎn)生PUFA的所有基因及其編碼產(chǎn)物的總稱。因此,PUFAPKS系統(tǒng)具體地指天然產(chǎn)物是PUFA的PKS系統(tǒng)。更具體地,本文所稱的PUFAPKS系統(tǒng)產(chǎn)生多不飽和脂肪酸(PUFA),特別是長鏈PUFA,作為產(chǎn)物。例如,內(nèi)源(天然)地含有PUFAPKS系統(tǒng)的生物體使用該系統(tǒng)制造PUFA。根據(jù)本發(fā)明,PUFA是這樣的脂肪酸,其碳鏈長度至少為16個碳,更優(yōu)選至少18個碳,更優(yōu)選至少20個碳,更優(yōu)選22個或更多個碳,具有至少3個或更多個雙鍵,優(yōu)選地有4個或更多個雙鍵,更優(yōu)選地有5個或更多個雙鍵,甚至更加優(yōu)選有6個或更多個雙鍵,其中所有的雙鍵均是順式構(gòu)型。本文中稱長鏈多不飽和脂肪酸(LCPUFA)更具體地是指18個或更長碳鏈長度的脂肪酸,優(yōu)選地20個或更長碳鏈,含有3個或更多個雙鍵。ω-6系列的LCPUFA包括Y-亞麻酸(C18:3)、二-高Y-亞麻酸(C20:3n-6)、花生四烯酸(C204n_6)、腎上腺酸(也稱二十二碳四烯酸或DTA)(C22:4n-6)和二十二碳五烯酸(C22:5n_6)。ω-3系列的LCPUFA包括α-亞麻酸(C18:3)、二十碳三烯酸(C20:3n-3)、二十碳四烯酸(C20:4n-3)、二十碳五烯酸(C20:5n-3)、二十二碳五烯酸(C22:5n-3)和二十二碳六烯酸(C22:6n_3)。LCPUFA還包括具有多于22個碳和4個或更多個雙鍵的脂肪酸,包括但不限于C28:8(n-3)。第二,根據(jù)本發(fā)明的PUFAPKS系統(tǒng)包括數(shù)個多功能蛋白(也可以包括單功能蛋白,特別是對于來自海洋細(xì)菌的PUFAPKS系統(tǒng)而言),它們組裝成復(fù)合體,該復(fù)合體遍過指導(dǎo)脂肪酸鏈的重復(fù)性加工和非重復(fù)性加工,包括所選的循環(huán)內(nèi)的順反異構(gòu)化和烯?;€原反應(yīng)。這些蛋白質(zhì)在本文還可以稱作核心PUFAPKS酶復(fù)合體或核心PUFAPKS系統(tǒng)。這些蛋白質(zhì)中包含的各個域和基序的一般功能是本領(lǐng)域已知的,就來自海洋細(xì)菌和真核生物體的各種PUFAPKS系統(tǒng)有詳細(xì)描述(見例如美國專利6,140,486;美國專利No.6,566,583;Metz等,Science293:290_293(2001);美國專利申請公開No.20020194641;美國專利申請公開No.20040235127;美國專利申請公開No.20050100995和PCT公開No.WO2006/135866)。域可以作為單個蛋白存在(即該域和蛋白是同義的),或者作為單個蛋白的兩個或多個域的其中之一,如上面提到的。在一種海洋細(xì)菌內(nèi)的PUFAPKS系統(tǒng)被發(fā)現(xiàn)(見美國專利No.6,140,486)之前,并不知道PKS系統(tǒng)具有這種重復(fù)性和選擇性酶促反應(yīng)的組合,人們也不認(rèn)為它們能夠產(chǎn)生順式構(gòu)型的碳-碳雙鍵。然而,本發(fā)明描述的PUFAPKS系統(tǒng)能夠產(chǎn)牛順式雙鍵,并目.能夠改變循環(huán)中的反應(yīng)順序。本發(fā)明人提出利用PUFAPKS系統(tǒng)的這些特點來產(chǎn)生多種不能被先前描述的(I型重復(fù)型或模塊型、II型或III型)PKS系統(tǒng)產(chǎn)生的生物活性分子。這些生物活性分子包括,但不限于,多不飽和脂肪酸(PUFA)、抗生素或其它生物活性化合物,它們中的許多在下文中將有討論。例如,使用本文描述的PUFAPKS基因結(jié)構(gòu)的知識,可以使用多種方法中的任一種改變PUFAPKS基因,或者將這些基因中的一部分與其他的合成系統(tǒng)(包括其他的PKS系統(tǒng))組合,從而產(chǎn)生新的產(chǎn)物。這類系統(tǒng)的兼具進(jìn)行重復(fù)性和選擇性反應(yīng)的內(nèi)在能力使得該系統(tǒng)可以產(chǎn)生對其它類型PKS系統(tǒng)應(yīng)用類似方法時不會見到的產(chǎn)物。優(yōu)選地,本發(fā)明的PUFAPKS系統(tǒng)至少包括如下的生物活性域,它們通常包含在三種或多種蛋白上(a)至少一個烯酰基-ACP還原酶(ER)域;(b)多個酰基載體蛋白(ACP)域(例如至少1-4個,優(yōu)選地至少5個ACP域,在一些實施方案中有最多達(dá)6、7、8、9、10或超過10個ACP域);(c)至少兩個β-酮酯酰-ACP合酶(KS)域;(d)至少一個?;D(zhuǎn)移酶(AT)域;(e)至少一個β-酮酯酰-ACP還原酶(KR)域;(f)至少兩個FabA樣β-羥酰-ACP脫水酶(DH)域;(g)至少一個鏈長因子(CLF)域;(h)至少一個丙二酸單酰-CoA=ACP?;D(zhuǎn)移酶(MAT)域。在一個實施方案中,根據(jù)本發(fā)明的PUFAPKS系統(tǒng)還包括至少一個含有脫水酶(DH)保守活性位點基序的區(qū)域。在一個實施方案中,裂殖壺菌屬PUFAPKS系統(tǒng)至少包括如下的生物活性域(a)2個烯?;?ACP還原酶(ER)域;(b)4-5個至10個或更多個?;d體蛋白(ACP)域,在一個方面中為9個ACP域;(c)2個β-酮酯酰-ACP合酶(KS)域;(d)1個?;D(zhuǎn)移酶(AT)域;(e)1個β-酮酯酰-ACP還原酶(KR)域;(f)2個FabA樣β-羥酰-ACP脫水酶(DH)域;(g)1個鏈長因子(CLF)域;和(h)1個丙二酸單酰-CoA:ACP?;D(zhuǎn)移酶(MAT)域。在一個實施方案中,根據(jù)本發(fā)明的裂殖壺菌屬PUFAPKS系統(tǒng)還包括至少一個含有脫水酶(DH)保守性活性位點基序的區(qū)域或域,所述基序不是FabA樣DH域的一部分。這些域的結(jié)構(gòu)和功能特征各自在本領(lǐng)域中是普遍已知的,在下文就本發(fā)明的PUFAPS系統(tǒng)對它們有詳細(xì)描述。在另一個優(yōu)選實施方案中,破囊壺菌屬PUFAPKS至少包括如下的生物活性域(a)2個烯?;?ACP還原酶(ER)域;(b)4或5個和10個之間或更多個?;d體蛋白(ACP)域,在一個方面中為8個ACP域;(c)2個β-酮酯酰-ACP合酶(KS)域;(d)1個?;D(zhuǎn)移酶(AT)域;(e)1個β-酮酯酰-ACP還原酶(KR)域;(f)2個FabA樣β-羥酰-ACP脫水酶(DH)域;(g)1個鏈長因子(CLF)域;(h)1個丙二酸單酰-CoA=ACP?;D(zhuǎn)移酶(MAT)域。在一個實施方案中,根據(jù)本發(fā)明的破囊壺菌屬PUFAPKS系統(tǒng)還包括至少一個含有脫水酶(DH)保守性活性位點基序的區(qū)域或域,所述基序不是FabA樣DH域的一部分。這些域的結(jié)構(gòu)和功能特征各自在本領(lǐng)域中是普遍已知的,在下文關(guān)于本發(fā)明的PUFAPS系統(tǒng)中有詳細(xì)描述。PUFAPKS系統(tǒng)可以額外的包括一個或多個輔助蛋白(accessoryprotein),輔助蛋白在本文中定義為這樣的蛋白質(zhì),其不被認(rèn)為是如上所述的核心PUFAPKS系統(tǒng)一部分(即不是PUFA合酶系統(tǒng)復(fù)合體自身的部分)的,但可能是,或者確實是使用本發(fā)明的核心PUFA合酶復(fù)合體PUFA的生產(chǎn),或者至少是高效PUFA的生產(chǎn)所必需的,特別是在某些宿主生物體(例如植物)中是如此。例如,為了產(chǎn)生PUFA,PUFAPKS系統(tǒng)必須和將4’-磷酸泛酰巰基乙胺模塊從輔酶A轉(zhuǎn)移到酰基載體蛋白(ACP)域的輔助蛋白一起工作。因此,可以認(rèn)為PUFAPKS系統(tǒng)包括至少一個4’-磷酸泛酰巰基乙胺轉(zhuǎn)移酶(PPT酶)域,或者這種域可以被看作是PUFAPKS系統(tǒng)的輔助域或蛋白。當(dāng)對生物體(例如微生物或植物)進(jìn)行遺傳修飾使之表達(dá)根據(jù)本發(fā)明的PUFAPKS系統(tǒng)時,某些宿主生物體可以內(nèi)源表達(dá)PUFAPKS產(chǎn)生PUFA所需的輔助蛋白(例如PPT酶)。然而,對于某些生物體,可以用本文描述的編碼一種或多種輔助蛋白的核酸分子加以轉(zhuǎn)化,使之能夠產(chǎn)生PUFA和/或提高其PUFA生產(chǎn),即便該生物體可內(nèi)源地產(chǎn)生同源輔助蛋白(即,與宿主細(xì)胞的內(nèi)源輔助蛋白相比,某些同源輔助蛋白可以更有效地或高效地與被轉(zhuǎn)化PUFA合酶蛋白一起工作)。本發(fā)明和先前的申請?zhí)峁┝擞冒ㄝo助PPT酶的本發(fā)明PUFAPKS系統(tǒng)進(jìn)行了遺傳修飾的細(xì)菌和酵母的實例。用包含輔助PPT酶的PUFAPKS系統(tǒng)遺傳修飾過的植物已有描述(見例如美國專利申請公開No.20070089199)。PPT酶的結(jié)構(gòu)和功能特征將在下文有更詳細(xì)的描述。用于在真核生物體中合成長鏈PUFA(LCPUFA)的“標(biāo)準(zhǔn)”或“經(jīng)典”途徑涉及中長鏈飽和或單不飽和脂肪酸(例如上文描述的FAS系統(tǒng)的產(chǎn)物)的修飾。這些修飾由延長步驟和去飽和步驟組成。延長反應(yīng)的底物是脂肪酰-CoA(待延長的脂肪酸鏈)和丙二酸單酰-CoA(每次延長反應(yīng)期間添加的兩個碳的來源)。延長反應(yīng)的產(chǎn)物是直鏈中添加了2個額外碳的脂肪酰-CoA。游離脂肪酸(FFAs)通常不出現(xiàn)在該反應(yīng)循環(huán)中。去飽和酶通過在氧依賴的反應(yīng)中去除2個氫從而在預(yù)先存在的脂肪酸鏈內(nèi)產(chǎn)生順式雙鍵。去飽和酶的底物是?;?CoA(在一些動物體內(nèi))或酯化到PL(例如磷脂酰膽堿)的甘油骨架上的脂肪酸。同樣,在該反應(yīng)機制中不出現(xiàn)FFA。因此,F(xiàn)FA出現(xiàn)在“標(biāo)準(zhǔn)”或“經(jīng)典”LCPUFA合成途徑中的唯一時刻是在脂肪酸從一些FAS系統(tǒng)釋放期間。如上面討論的,這些通常是16或18碳脂肪酸,通常是飽和的或單不飽和脂肪酸,非更長鏈PUFA,例如EPA或DHA。這種長鏈PUFA產(chǎn)生方案的一個后果是經(jīng)常積累該途徑的中間產(chǎn)物,這些中間產(chǎn)物經(jīng)常占到該系統(tǒng)產(chǎn)生的新脂肪酸的大部分。因此,根據(jù)本發(fā)明,所稱用于產(chǎn)生PUFA的“標(biāo)準(zhǔn)”或“經(jīng)典”途徑是指如下的脂肪酸合成途徑,其中中等鏈長的飽和脂肪酸(例如脂肪酸合酶(FAS)系統(tǒng)的產(chǎn)物)通過一系列延長和去飽和反應(yīng)被修飾。延長反應(yīng)的底物是脂肪酰-CoA(待延長的脂肪酸鏈)和丙二酸單酰-CoA(每次延長反應(yīng)期間添加的兩個碳的來源)。延長反應(yīng)的產(chǎn)物是直鏈中添加了2個額外碳的脂肪酰_CoA。去飽和酶通過在氧依賴的反應(yīng)中去除2個氫從而在預(yù)先存在的脂肪酸鏈內(nèi)產(chǎn)生順式雙鍵。這些途徑和參與這些途徑的基因在文獻(xiàn)中是公知的。如本文所使用的,術(shù)語“脂類”包括磷脂(PL);游離脂肪酸;脂肪酸酯;三?;视?TAG);二?;视停粏熙;视?;磷脂類(phosphatides);蠟(醇和脂肪酸的酯);固醇和固醇酯;類胡蘿卜素;葉黃素(例如氧合類胡蘿卜素);烴;和其它本領(lǐng)域普通技術(shù)人員已知的脂類。術(shù)語“多不飽和脂肪酸”和“PUFA”不僅包括游離脂肪酸形式,還包括其它的形式,例如TAG形式和PL形式。對于生物體/宿主對PUFAPKS蛋白、域或系統(tǒng)的表達(dá)而言,所稱“同源”生物體或“異源”宿主是指PUFAPKS系統(tǒng)的至少一個蛋白質(zhì)、域或部分不是該生物體天然(內(nèi)源)表達(dá)的蛋白質(zhì)、域或部分,盡管PUFAPKS系統(tǒng)可能包括宿主生物體天然表達(dá)的蛋白質(zhì)、域或其部分(例如本文描述的嵌合蛋白,其包含來自宿主生物體的序列和來自其它不同生物體或其它不同蛋白質(zhì)的序列)。本文描述了某些示例性的編碼各種嵌合蛋白的核酸分子(構(gòu)建體)(見實施例)。根據(jù)本發(fā)明,“嵌合蛋白”是由如下所述的核酸序列編碼的工程化蛋白,該核酸序列是通過剪接或聯(lián)結(jié)(連接)兩個或更多個完整的或部分基因或核酸序列而產(chǎn)生的?!扒逗螾UFAPKS系統(tǒng)”是含有來自兩個或更多個不同PKS系統(tǒng)的蛋白和/或域,包括嵌合蛋白和/或域,的PUFAPKS系統(tǒng)。例如,實施例描述了一種嵌合PUFAPKS系統(tǒng),其包括裂殖壺菌屬PUFAPKSOrfA和OrfB,以及破囊壺菌屬PUFAPKSOrfC。實施例還描述了包括裂殖壺菌屬PUFAPKSOrfA,OrfB和除DH2域之外的全部OrfC的嵌合PUFAPKS系統(tǒng),而上述DH2域是來自破囊壺菌屬PUFAPKS的PUFAPKSDH2域。相應(yīng)地,所說的后一種嵌合PUFAPKS系統(tǒng)包括嵌合蛋白(嵌合OrfC蛋白)。本文還描述了使用針對裂殖壺菌屬的密碼子用法優(yōu)化過的破囊壺菌屬核酸序列的相同嵌合體,來例示可以用來改變PUFAPKS系統(tǒng)產(chǎn)生的產(chǎn)物的遺傳操作組合(見實施例)。實施例還描述了多種其他的嵌合PUFAPKS系統(tǒng)。如本文所使用的,“密碼子優(yōu)化”或其衍生語句是指對編碼給定蛋白的核酸序列的修飾(改變、變化、突變)過程,將核酸序列中的一個或多個密碼子替換為包含該核酸序列的核酸分子要在其中表達(dá)的特定生物體的核酸序列中最經(jīng)常使用的密碼子。技術(shù)人員理解密碼子偏好和普通意義上的密碼子優(yōu)化。更具體地,給定密碼子在遺傳密碼中的出現(xiàn)頻率在不同生物體之間可以有顯著變化(包括例如同一屬的種與種之間)。任何生物體在一小部分時間使用的、或者使用較同一氨基酸的另一個密碼子為少的密碼子,都會導(dǎo)致蛋白表達(dá)發(fā)生問題。因此,當(dāng)使核酸序列所用密碼子的頻率與宿主表達(dá)系統(tǒng)/生物體相匹配時(例如通過在不修飾氨基酸序列的條件下,用更近似地反映宿主系統(tǒng)天然密碼子偏好的密碼子來替換稀有或較少使用的密碼子),蛋白表達(dá)可以被顯著提高。本發(fā)明人在本文中描述了針對裂殖壺菌屬的密碼子用法來優(yōu)化核酸序列的密碼子用法的方法,但這只是本發(fā)明密碼子用法優(yōu)化的一個示例。根據(jù)本發(fā)明,可以針對要在其中表達(dá)該核酸分子的宿主細(xì)胞或生物體的最優(yōu)(優(yōu)化的)密碼子用法,或者,事實上,針對另一不同生物體的優(yōu)化密碼子用法(例如,對于用于在植物中表達(dá)的編碼破囊壺菌屬PUFAPKS蛋白的核酸分子,可以針對裂殖壺菌屬的密碼子用法加以優(yōu)化),來對編碼給定蛋白(例如PUFAPKS蛋白)的核酸分子的核苷酸序列進(jìn)行修飾(例如通過合成、突變、重組技術(shù)等)。實施例的表1舉例說明了裂殖壺菌屬的最優(yōu)密碼子用法。此外,本發(fā)明人在這里提出,對于編碼給定蛋白的核酸分子的核酸序列,其中該核酸序列衍生自、獲知自、或獲得自特定宿主,可將該核酸序列針對相同宿主進(jìn)行優(yōu)化,以便在該宿主或其它宿主中加以表達(dá)。后面的這個本發(fā)明的實施方案代表了多種多樣的“受指導(dǎo)的”或“被加速的”進(jìn)化,其中,例如,將編碼來自某一生物體的蛋白(例如來自裂殖壺菌屬的PUFAPKS蛋白)的核酸分子進(jìn)行修飾(例如通過重新合成該核酸序列并替換某些核苷酸)以提高同一生物體(在本實例中是裂殖壺菌屬)所喜好的密碼子用法(優(yōu)化密碼子用法)。然后,可以在裂殖壺菌屬中(作為重組核酸分子)或者在另一宿主細(xì)胞或生物體(例如在植物)中表達(dá)該核酸分子。在本實施方案中我們提出,來自某一生物體的給定核酸序列可能并不使用人們能夠確定的該生物體的最優(yōu)密碼子(密碼子偏好)。相應(yīng)地,可以重新合成核酸序列來提高在該生物體中的表達(dá)??捎糜诒景l(fā)明的PUFAPKS系統(tǒng)和蛋白或它們的域包括細(xì)菌和非細(xì)菌PUFAPKS系統(tǒng)。非細(xì)菌PUFAPKS系統(tǒng)是來自或源自于非細(xì)菌生物體,例如真核生物或古細(xì)菌的PUFAPKS系統(tǒng)。真核生物與原核生物的區(qū)分的基礎(chǔ)在于細(xì)胞分化的程度,真核生物分化程度比原核生物更高。一般地說,原核生物不具有核膜,在細(xì)胞分裂期間不展示有絲分裂,只有一條染色體,細(xì)胞質(zhì)中含有70S核糖體,不具有線粒體、內(nèi)質(zhì)網(wǎng)、葉綠體、溶酶體或高爾基體,且可能有鞭毛,如果有的話,鞭毛僅含單根原纖維。相反,真核生物具有核膜,在細(xì)胞分裂期間展示有絲分裂,有多條染色體,細(xì)胞質(zhì)中含有80S核糖體,具有線粒體、內(nèi)質(zhì)網(wǎng)、葉綠體(藻類中)、溶酶體和高爾基體,且可能有鞭毛,如果有的話,鞭毛含有多根原纖維。一般地說,細(xì)菌是原核生物,而藻類、真菌、原生生物(protist)、原生動物和高等植物是真核生物。根據(jù)本發(fā)明,可以產(chǎn)生這樣的遺傳修飾生物體,其整合有非細(xì)菌PUFAPKS功能域和細(xì)菌PUFAPKS功能域,以及來自其它PKS系統(tǒng)(I型重復(fù)性或模塊性,II型或III型)或FAS系統(tǒng)的PKS功能域或蛋白。根據(jù)本發(fā)明,具有3-酮酯酰-ACP合酶(KS)生物活性(功能)的域或蛋白質(zhì)被定性為執(zhí)行FAS(和PKS)延長反應(yīng)循環(huán)的初始步驟的酶。術(shù)語“β-酮酯酰-ACP合酶”可以和術(shù)語“3-酮?;?ACP合酶”(3-ketoacyl-ACPsynthase)、“β-酮?;?ACP合酶”(β-ketoacyI-ACPsynthase)和“酮-酰基ACP合酶”(keto-acylACPsynthase)以及類似的衍生詞互換使用。要被延長的酰基基團通過硫酯鍵與酶活性位點的半胱氨酸殘基連接。在多步反應(yīng)中,?;鵢酶與丙二酸單酰-ACP縮合,形成-酮?;?ACP、C02和游離酶。KS在延長循環(huán)中發(fā)揮關(guān)鍵作用,并且在許多系統(tǒng)中已經(jīng)證明它比該反應(yīng)循環(huán)中的其它酶具有更高的底物特異性。例如,大腸桿菌具有三種截然不同的KS酶——每一種都在這種生物的生理中具有自己特殊的作用(Magnuson等,Microbiol.Rev.57,522(1993))。在本文記載的海洋細(xì)菌和破囊壺菌中描述的PUFAPKS系統(tǒng)的兩個KS域,在PUFA生物合成反應(yīng)順序中可能具有截然不同的作用。作為一類酶,KS已經(jīng)獲得了良好的表征。許多已驗證的KS基因的序列是已知的,活性位點基序已經(jīng)被鑒定,數(shù)種蛋白的晶體結(jié)構(gòu)已得到確定。通過與已知KS序列的同源性可以容易地鑒定蛋白(或蛋白的域)屬于酶的KS家族。根據(jù)本發(fā)明,具有丙二酸單酰-CoA=ACP?;D(zhuǎn)移酶(MAT)生物活性(功能)的域或蛋白被定性為將丙二酸單酰模塊從丙二酸單酰-CoA轉(zhuǎn)移到ACP的酶。術(shù)語“丙二酸單酰-CoA=ACP?;D(zhuǎn)移酶(MAT)”可以和“丙二酰?;D(zhuǎn)移酶”和類似的衍生詞互換使用。除了活性位點基序(GxSxG)之外,這些酶在關(guān)鍵位置還具有一個R和Q氨基酸的擴展基序(extendedmotif),該基序使它們具有MAT酶的身份(例如,與下文描述的AT域相對)。在一些PKS系統(tǒng)(但非PUFAPKS域)中,MAT域優(yōu)先將甲基-或乙基-丙二酸(methyl-orcthyl-malonate)加載到ACP基團上(從相應(yīng)的CoA酯),從而向直碳鏈內(nèi)引入分支。MAT域可以通過它們與已知MAT序列的同源性和其擴展基序結(jié)構(gòu)來加以識別。根據(jù)本發(fā)明,具有?;d體蛋白(ACP)生物活性(功能)的域或蛋白被定性為小多肽(通常80-100個氨基酸長度),其發(fā)揮載體的作用,通過硫酯連接將生長中的脂肪酰鏈攜帶在共價結(jié)合于該蛋白的輔因子上。它們作為分離的單元或者作為較大蛋白質(zhì)內(nèi)的域出現(xiàn)。通過將CoA的磷酸泛酰巰基乙胺基團轉(zhuǎn)移到ACP高度保守的絲氨酸殘基上,使ACP從無活性的脫輔基(apo)形式變成有功能的完全(holo)形式。?;ㄟ^磷酸泛酰巰基乙胺模塊游離末端的硫酯鍵連接在ACP上。ACP可以通過用放射性泛酰巰基乙胺標(biāo)記和與已知ACP的序列同源性加以鑒定。上述基序的變異型的存在(LGIDS*)也是ACP的標(biāo)志。根據(jù)本發(fā)明,具有酮還原酶活性——也稱作3-酮酯酰-ACP還原酶(KR)生物活性(功能)——的域或蛋白被定性為催化3-酮酯酰形式的ACP發(fā)生吡啶核苷酸依賴性還原的酶。這是脂肪酸從頭生物合成延長循環(huán)中的第一個還原步驟,也是聚酮生物合成中經(jīng)常被執(zhí)行的反應(yīng)。術(shù)語“β"酮酯酰ACP還原酶”可以和術(shù)語“酮還原酶”、“3-酮酯酰-ACP還原酶”、“酮_?;鵄CP還原酶”及該術(shù)語的類似衍生詞互換使用。觀察到與烯酰基ACP還原酶(ER)的一個家族、FAS的另一種還原酶(但不是PUFAPKS系統(tǒng)中的ER家族)和短鏈醇脫氫酶家族具有顯著的序列相似性。對上面所示的PUFAPKS區(qū)域進(jìn)行的Pfam分析顯示,在核心區(qū)中與短鏈醇脫氫酶家族有同源性。對同一區(qū)域進(jìn)行的Blast分析顯示在核心區(qū)中與已知的KR酶有匹配,還顯示了一個與來自其它已表征PUFAPKS系統(tǒng)的域具有同源性的延伸區(qū)域。根據(jù)本發(fā)明,基于如下的理由,將域或蛋白稱作鏈長因子(CLF)。CLF最初被描述為是II型(解離酶(dissociatedenzymes))PKS系統(tǒng)的特征,人們猜測它對決定延長循環(huán)的數(shù)目,從而決定終產(chǎn)物的鏈長起作用。CLF氨基酸序列與KS域顯示同源性(被認(rèn)為和KS蛋白形成異源二聚體),但是它們沒有活性位點半胱氨酸。關(guān)于CLF在PKS系統(tǒng)中的作用尚有爭議。新的證據(jù)(C.Bisang等,Nature401,502(1999))提示,它在PKS系統(tǒng)的引發(fā)(提供最初的待延長?;鶊F)中起作用。人們認(rèn)為CLF域在此作用中使丙二酸(作為丙二酸酰-ACP)脫羧基,從而形成可以被轉(zhuǎn)移到KS活性位點的乙酸基(acetategroup)。因此該乙酸發(fā)揮能夠進(jìn)行最初的延長(縮合)反應(yīng)的“引發(fā)”分子的作用。II型CLF的同源物在一些模塊性PKS系統(tǒng)中已經(jīng)被鑒定為“裝載”域。在所有目前已鑒定的PUFAPKS系統(tǒng)中都找到了具有CLF的序列特征的域,并且在所有情況下,這樣的域都是作為多域蛋白的一部分存在的?!磅;D(zhuǎn)移酶”或“AT”是指可執(zhí)行多種迥異的酰基轉(zhuǎn)移反應(yīng)的一大類酶。術(shù)語“?;D(zhuǎn)移酶”(acyltransferase)可以和術(shù)語“?;D(zhuǎn)移酶”(acyltransferase)互換使用。在本文中描述的PUFAPKS系統(tǒng)中鑒定的AT域彼此之間顯示有良好的同源性,與目前已考察過的所有其它PUFAPKS系統(tǒng)中存在的域之間也顯示有良好的同源性,而與一些具體功能已被鑒定的?;D(zhuǎn)移酶(例如丙二酰-CoA=ACP?;D(zhuǎn)移酶,MAT)顯示非常微弱的同源性。盡管這種AT域與MAT有微弱的同源性,但人們并不認(rèn)為該AT域起MAT的作用,因為它不具有這類酶的特征性延伸基序結(jié)構(gòu)(見上文MAT域的描述)。為本公開的目的,所述AT域在PUFAPKS系統(tǒng)中可能擔(dān)當(dāng)?shù)墓δ馨ǖ幌抻趯⒅觉;鶊F從ORFAACP域轉(zhuǎn)移到水(即硫酯酶_以游離脂肪酸的形式釋放脂肪?;鶊F),將脂肪酰基團轉(zhuǎn)移到受體如CoA,在各個ACP域之間轉(zhuǎn)移?;鶊F,或者將脂肪酰基基團轉(zhuǎn)移到親脂性受體分子(例如到溶血磷脂酸)。根據(jù)本發(fā)明,該域具有烯酰-ACP還原酶(ER)生物活性。ER酶還原脂酰-ACP中的反式雙鍵(由DH活性引入的),結(jié)果使那些碳完全飽和。PUFA-PKS中的ER域與一類新近被描述的ER酶家族顯示同源性(Heath等,Nature406,145(2000))。Heath和Rock通過從肺炎鏈球菌(Str印tococcuspneumoniae)克隆目的基因,純化由該基因表達(dá)的一種蛋白質(zhì),并在體外測定中證明它具有ER活性,從而鑒定了這類新型ER酶。目前已考察的所有PUFAPKS系統(tǒng)均含有至少一個與裂殖壺菌屬ER域具有非常高的序列同源性的域,而所述裂殖壺菌屬ER域與肺炎鏈球菌ER蛋白顯示同源性。根據(jù)本發(fā)明,具有脫水酶或脫水酶(DH)活性的蛋白質(zhì)或域可催化脫水反應(yīng)。如本文中通用的,所稱DH活性,通常是指FabA樣β-羥酰-ACP脫水酶(DH)生物活性。FabA樣羥酰-ACP脫水酶(DH)生物活性從酮脂酰-ACP除去Η0Η,并最初在碳鏈內(nèi)產(chǎn)生反式雙鍵。術(shù)語"FabA樣β-羥酰-ACP脫水酶”(FabA-Iikeβ-hydroxyacyI-ACPdehydrase)可以和術(shù)語“FabA樣β-羥基?;?ACP脫水酶”(FabA-Iikeβ-hydroxyacyI-ACPdehydrase)、“β-羥酰-ACP脫水酶”(β-hydroxyacy1-ACPdehydrase)、“脫水酶”(dehydrase)和類似的衍生詞互換使用。PUFAPKS系統(tǒng)的DH域和細(xì)菌的FAS系統(tǒng)相關(guān)的DH酶(而不是其它PKS系統(tǒng)的DH域)顯示同源性。細(xì)菌DH的一個亞類FabA樣DH,具有順反異構(gòu)酶活性(Heath等,J.Biol.Chem.,271,27795(1996))。正是這種與FabA樣DH蛋白質(zhì)的同源性,暗示本文所述的這些DH域中的一個或全部負(fù)責(zé)在PUFAPSK產(chǎn)物中插入順式雙鍵。本發(fā)明的蛋白質(zhì)還可以具有不被定性為FabA樣(例如,上文所述的順-反活性與FabA樣活性相關(guān))的脫水酶活性,該活性在本文一般稱作非FabA樣DH活性(non-FabA-likeDHactivity),或稱非FabA樣β-羥酰-ACP脫水酶(DH)生物活性。更具體地說,在PKS系統(tǒng)的脫水酶域中發(fā)現(xiàn)了一種保守的活性位點基序(13個氨基酸長L*xxHxxxGxxxxP;*在該基序中,L也可以是I)(DonadioS,KatzL.Gene.1992Feb1;111(1):51-60)。該保守基序(在本文中也稱脫水酶(DH)保守性活性位點基序或DH基序)在迄今已有記載的所有已知PUFA-PKS序列的一個相似區(qū)域中以及本文所述的各PUFAPKS序列中均有發(fā)現(xiàn),但是相信這個基序是最近才被檢測到的。該保守的基序位于PUFA-PKS序列中的一個具有高度同源性的未定性區(qū)域內(nèi)。提出的通過PUFA-PKS的PUFA生物合成需要非FabA樣的脫水作用,而這個基序就可能負(fù)責(zé)該反應(yīng)。為舉例說明的目的,下文對某些PUFAPKS系統(tǒng)的結(jié)構(gòu)作了詳細(xì)的描述。然而,應(yīng)當(dāng)理解,本發(fā)明并不限于這些PUFAPKS系統(tǒng)的使用。例如,細(xì)菌PUFAPKS系統(tǒng)的使用可見美國專利No.6,140,486和美國專利申請公布No.20050100995,其他PUFAPKS基因或系統(tǒng)的描述可見PCT專利公布No.W005/097982和美國專利申請公布No.20050014231。裂殖壺菌屬PUFAPKS系統(tǒng)裂殖壺菌屬是破囊壺菌類(thraustochytrid)海洋微生物,可積累大量富含DHA和二十二碳五烯酸(DPA;225-6)的三?;视?;例如以干重計30%的DHA+DPA(Bare1ay等,J.App1.Phyco1.6,123(1994))。在通過延長/去飽和途徑合成20-和22-碳PUFA的真核生物中,18-、20_和22-碳中間產(chǎn)物的蓄池相對較大,因此使用[14C]_乙酸的體內(nèi)標(biāo)記實驗可以為預(yù)測的中間產(chǎn)物顯示清晰的前體-產(chǎn)物動力學(xué)(Gellerman等,Biochim.Biophys.Acta573=23(1979))而且,向這類生物體外源添加的放射性標(biāo)記的中間產(chǎn)物可被轉(zhuǎn)化為最終的PUFA產(chǎn)物。本發(fā)明人顯示,[1-14C]-乙酸被裂殖壺菌屬細(xì)胞快速攝取并摻入到脂肪酸中,但是在最短的標(biāo)記時間(lmin)條件下,DHA含有31%的從脂肪酸回收的標(biāo)記,這個百分比在10-15min的[14C]_乙酸摻入過程中以及在隨后的24小時培養(yǎng)生長中均實質(zhì)上保持不變(見美國專利申請公開No.20020194641,上文)。類似地,在整個實驗中,DPA占標(biāo)記的10%。沒有證據(jù)顯示16或18碳脂肪酸與22碳多不飽和脂肪酸之間有前體-產(chǎn)物關(guān)系。這些結(jié)果與下述是一致的DHA從[14C]_乙酸快速合成,涉及非常小的(可能結(jié)合了酶)中間產(chǎn)物蓄池。圖1是來自裂殖壺菌屬PUFAPKS系統(tǒng)的三個開放閱讀框的圖示,包括該PUFAPKS系統(tǒng)的域結(jié)構(gòu)。存在三個開放閱讀框,它們形成核心裂殖壺菌屬PUFAPKS系統(tǒng)。每個開放閱讀框的域結(jié)構(gòu)如下。裂殖壺菌屬開放閱讀框A(0rfA)OrfA的完整核苷酸序列在本文表示為SEQIDNO:l。0rfA是一條8730個核苷酸的序列(不包括終止密碼子),其編碼一條2910個氨基酸的序列,在本文表示為SEQIDN0:2。OrfA內(nèi)有12個域(a)—個3-酮酯酰-ACP合酶(KS)域;(b)—個丙二酸單酰_CoA:ACP酰基轉(zhuǎn)移酶(MAT)域;(c)9個?;d體蛋白(ACP)域;和(d)—個酮還原酶(KR)域。從裂殖壺菌屬菌種ATCC20888以及ATCC20888的一個子株(稱作裂殖壺菌屬菌株N230D)分離了編碼OrfA的基因組DNA克隆(質(zhì)粒)并進(jìn)行了測序。N230D是這樣得到的,裂殖壺菌屬ATCC20888經(jīng)過了化學(xué)誘變(NTG甲基-3-硝基-1-亞硝基胍)后,針對脂肪酸含量的變化進(jìn)行篩選,N230D就是1000個以上的隨機選擇的存活者之一。該菌株的價值在于具有更好的DHA生產(chǎn)率。一個從裂殖壺菌屬菌種ATCC20888分離的、在本文中稱作JK1126的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:1的1-8730位的核苷酸序列,并且編碼SEQIDNO:2的相應(yīng)氨基酸序列。基因組克隆pJK1126(稱作pJK1126OrfA基因組克隆,形式是含有來自裂殖壺菌屬ATCC20888的"OrfA“基因的大腸桿菌質(zhì)粒載體)于2006年6月8日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被指定ATCC登錄號PTA-7648。pJK1126OrfA基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列被本發(fā)明所涵蓋。從裂殖壺菌屬菌種N230D分離的兩個基因組克隆,在本文中稱作pJK306OrfA基因組克隆和PJK320OrfA基因組克隆,據(jù)本發(fā)明人所知,它共同(重疊克隆)包含SEQIDNO:1的核苷酸序列,并且編碼SEQIDNO:2的氨基酸序列?;蚪M克隆pJK306(稱作pJK306OrfA基因組克隆,其形式是含有來自裂殖壺菌屬菌種N230D的OrfA基因5,部分的大腸桿菌質(zhì)粒(與PJK320有2.2kB的重疊))于2006年6月8日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被指定ATCC登錄號PTA-7641。pJK306OrfA基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列被本發(fā)明所涵蓋?;蚪M克隆PJK320(稱作pJK320OrfA基因組克隆,其形式是含有來自裂殖壺菌屬菌種N230D的OrfA基因3,部分的大腸桿菌質(zhì)粒(與pJK306有2.2kB的重疊))于2006年6月8日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被指定ATCC登錄號PTA-7644。pJK320OrfA基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列被本發(fā)明所涵蓋。OrfA中的第一個域是KS域,在本文也稱作0RFA-KS,含有編碼該0RFA-KS域的序列的核苷酸序列在本文表示為SEQIDNO:7(SEQIDNO1的1-1500位)。含有0RFA-KS域的氨基酸序列在本文表示為SEQIDNO:8(SEQIDNO2的1-500位)。需要指出,0RFA-KS域含有一個活性位點基序DXA(f?;Y(jié)合位點C215)。另外,位于裂殖壺菌屬KS區(qū)末端的一個特征基序GFGG存在于SEQIDNO2的該域中,相應(yīng)地,也存在于SEQIDN08中。OrfA的第二個域是MAT域,本文也稱作0RFA-MAT,含有編碼該0RFA-MAT域的序列的核苷酸序列在本文表示為SEQIDNO:9(SEQIDN01的1723-3000位)。含有0RFA-MAT域的氨基酸序列在本文表示為SEQIDN010(SEQIDNO:2的575-1000位)。MAT域包括93位的天冬氨酸和94位的組氨酸(分別對應(yīng)于SEQIDNO2的667和668位)。需要指出,0RFA-MAT域含有一個活性位點基序GHS*XGC?;Y(jié)合位點S7(16),在本文表示為SEQIDNO:11。OrfA的域3_域11是9個串聯(lián)ACP域,在本文也稱作0RFA-ACP(序列中的第一個域是0RFA-ACP1,第二個域是0RFA-ACP2,第三個域是0RFA-ACP3,等等)。第一個ACP域,0RFA-ACP1,包含在SEQIDNO1(OrfA)大約3343位-大約3600位的核苷酸序列中。含有編碼該0RFA-ACP1域的序列的核苷酸序列在本文表示為SEQIDNO12(SEQIDNO1的3343-3600位)。含有第一個ACP域的氨基酸序列跨SEQIDNO:2的大約1115位-大約1200位。含有0RFA-ACP1域的氨基酸序列在本文表示為SEQIDN0:13(SEQIDNO2的1115-1200位)。需要指出,0RFA-ACP1域含有一個活性位點基序IGIDS^T泛酰巰基乙胺結(jié)合基序S1157),在本文表示為SEQIDNO:14。全部9個ACP域的核苷酸和氨基酸序列是高度保守的,因此在本文中不用單獨的序列標(biāo)識符來表示每個域的序列。然而,根據(jù)本文公開的信息,本領(lǐng)域的技術(shù)人員能夠容易地確定含有其它8個ACP域中每一個的序列。全部9個ACP域共同占據(jù)OrfA中從SEQIDNO1的大約3283位到大約6288位的區(qū)域,其對應(yīng)于SEQIDNO:2從大約1095到大約2096的氨基酸位置。含全部9個域的完整ACP區(qū)的核苷酸序列在本文表示為SEQIDN0:16。由SEQIDNO:16代表的區(qū)域包括各個ACP域之間的連接區(qū)段。9個域的重復(fù)間隔大約是SEQIDNO:16的每330個核苷酸(相鄰活性位點絲氨酸之間的實際氨基酸數(shù)目從104到116個氨基酸不等)。9個ACP域中的每一個均含有泛酰巰基乙胺結(jié)合基序LGIDS*(本文用SEQIDNO14表示),其中S*是泛酰巰基乙胺結(jié)合位點絲氨酸(S)。泛酰巰基乙胺結(jié)合位點絲氨酸(S)位于每個ACP域序列的中心附近。在ACP域區(qū)的每個末端和每個ACP域之間是一個高度富含脯氨酸(P)和丙氨酸(A)的區(qū)域,其被認(rèn)為是一個連接區(qū)。例如,ACP域1和域2之間的序列是APAPVKAAAPAAPVASAPAPA,本文中表示為SEQIDNO:15。9個ACP域的每一個中的活性位點絲氨酸殘基(即泛酰巰基乙胺結(jié)合位點)位置如下(參考SEQIDNO2的氨基酸序列):ACP1=S1157;ACP2=S1266;ACP3=S1377;ACP4=S1488;ACP5=S1604;ACP6=S1715;ACP7=S1819;ACP8=S1930;和ACP9=S2(134??紤]到ACP域的平均大小是大約85個氨基酸(不包括連接子),包括連接子則是大約110個氨基酸,而活性位點絲氨酸大約位于域的中心,本領(lǐng)域的技術(shù)人員可以容易地確定9個ACP域每一個在OrfA中的位置。OrfA中的域12是一個KR域,本文也稱作0RFA-KR,含有編碼0RFA-KR域的序列的核苷酸序列在本文表示為SEQIDNO17(SEQIDN01的6598-8730位)。含有0RFA-KR域的氨基酸序列在本文表示為SEQIDN018(SEQIDNO:2的2200-2910位)。KR域內(nèi)有一個與短鏈醛脫氫酶類(KR是該家族的一個成員)同源的核心區(qū)。該核心區(qū)跨越SEQIDN0:1的大約7198位-大約7500位,其對應(yīng)于SEQIDNO2的2400-2500位氨基酸。裂殖壺菌屬開放閱讀框B(OrfB)OrfB的完整核苷酸序列在本文表示為SEQIDNO:3。OrfB是一個6177個核苷酸的序列(不包括終止密碼子),其編碼一條2059個氨基酸的序列,在本文表示為SEQIDNO4。OrfB內(nèi)有4個域(a)—個-酮酯酰-ACP合酶(KS)域;(b)—個鏈長因子(CLF)域;(c)一個?;D(zhuǎn)移酶(AT)域;和(d)—個烯?;鵄CP還原酶(ER)域。已經(jīng)從裂殖壺菌屬菌種ATCC20888和ATCC20888的一個子株(稱作裂殖壺菌屬菌株N230D)分離了編碼OrfB的基因組DNA克隆(質(zhì)粒)并進(jìn)行了測序。從裂殖壺菌屬菌種ATCC20888分離的、在本文中稱作pJK1129的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:3的核苷酸序列,并且編碼SEQIDNO:4的氨基酸序列?;蚪M克隆PJK1129(稱作pJK1129OrfB基因組克隆,其形式為含有來自裂殖壺菌ATCC20888的"OrfB"基因的大腸桿菌質(zhì)粒載體)于2006年6月8日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號為PTA-7649。pJK1126OrfB基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。從裂殖壺菌屬菌種N230D分離的、在本文中稱作pJK324OrfB基因組克隆的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO3的核苷酸序列,并且編碼SEQIDNO4的氨基酸序列。基因組克隆PJK324(稱作pJK3240rfB基因組克隆,其形式為含有來自裂殖壺菌屬菌種N230D的OrfB基因的大腸桿菌質(zhì)粒)于2006年6月8日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號為No.PTA-7643。pJK324OrfB基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。OrfB的第一個域是KS域,在本文也稱作0RFB-KS,含有編碼該0RFB-KS域的序列的核苷酸序列在本文表示為SEQIDNO19(SEQIDN0:3的1-1350位)。含有0RFB-KS域的氨基酸序列在本文表示為SEQIDN020(SEQIDNO4的1-450位)。該KS域包括一個位于SEQIDNO20的371位(也稱SEQIDNO20371位)的纈氨酸。需要指出,0RFB-KS域含有一個活性位點基序DXA(f?;Y(jié)合位點C196)。另外,該KS區(qū)末端的一個特征基序,GFGG,存在于SEQIDNO:4(相應(yīng)地,SEQIDNO20)的這個域中。OrfB中的第二個域是CLF域,本文也稱作0RFB-CLF,含有編碼該0RFB-CLF域的序列的核苷酸序列在本文表示為SEQIDNO:21(SEQIDN0:3的1378-2700位)。含有所述0RFB-CLF域的氨基酸序列在本文表示為SEQIDNO22(SEQIDNO:4的460-900位)。需要指出,0RFB-CLF域含有一個KS活性位點基序,它沒有結(jié)合?;陌腚装彼?。OrfB中的第三個域是AT域,本文也稱作0RFB-AT,含有編碼該0RFB-AT域的序列的核苷酸序列在本文表示為SEQIDNO23(SEQIDN03的2701-4200位)。含有0RFB-AT域的氨基酸序列在本文表示為SEQIDN0:24(SEQIDNO:4的901-1400位)。需要指出,0RFB-AT域含有一個活性位點基序GxSlGf?;Y(jié)合位點S114(l),其是?;D(zhuǎn)移酶(AT)蛋白的特征。OrfB中的第四個域是ER域,本文也稱作0RFB-ER,含有編碼該0RFB-ER域的序列的核苷酸序列在本文表示為SEQIDNO25(SEQIDNO3的4648-6177位)。含有0RFB-ER域的氨基酸序列在本文表示為SEQIDNO26(SEQIDNO4的1550-2059位)。裂殖壺菌屬開放閱讀框C(0rfC)OrfC的完整核苷酸序列在本文表示為SEQIDNO:5。OrfC是一個4506個核苷酸的序列(不包括終止密碼子),其編碼一個1502個氨基酸的序列,在本文表示為SEQIDNO:6。OrfC內(nèi)有3個域(a)兩個Fab樣-羥酰-ACP脫水酶(DH)域;和(b)—個烯?;鵄CP-還原酶(ER)域。已經(jīng)從裂殖壺菌屬菌種ATCC20888和ATCC20888的一個子株(稱作裂殖壺菌屬菌株N230D)分離了編碼OrfB的基因組DNA克隆(質(zhì)粒)并進(jìn)行了測序。從裂殖壺菌屬菌種ATCC20888分離的、本文稱作pJK1131的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:5的核苷酸序列,并且編碼SEQIDN0:6的氨基酸序列?;蚪M克隆pJK1131(稱作pJK1131OrfC基因組克隆,其形式為含有來自裂殖壺菌屬ATCC20888的"OrfC"基因的大腸桿菌質(zhì)粒載體)于2006年6月8日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號為No.PTA-7650。pJK1131OrfC基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。從裂殖壺菌屬菌種N230D分離的、本文稱作pBR0020rfC基因組克隆的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:5的核苷酸序列,并且編碼SEQIDNO:6的氨基酸序列?;蚪M克隆PBR002(稱作pBR0020rfC基因組克隆,其形式為含有來自裂殖壺菌屬菌種N230D的OrfC基因的大腸桿菌質(zhì)粒)于2006年6月8日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號為No.PTA-7642。pBR002OrfC基因組克隆的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。OrfC的第一個域是一個DH域,在本文中也稱作0RFC-DH1。這是OrfC中兩個DH域其中之一,因此被指定為DH1。含有編碼該0RFC-DH1域的序列的核苷酸序列在本文表示為SEQIDNO27(SEQIDNO5的1-1350位)。含有0RFC-DH1域的氨基酸序列在本文表示為SEQIDNO28(SEQIDN06的1-450位)。OrfC的第二個域是一個DH域,在本文中也稱作0RFC-DH2。這是OrfC兩個DH域中的第二個,因此被指定為DH2。含有編碼該0RFC-DH2域的序列的核苷酸序列在本文表示為SEQIDNO29(SEQIDNO5的1351-2847位)。含有0RFC-DH2域的氨基酸序列在本文表示為SEQIDNO30(SEQIDNO6的451-949位)。該DH域包括位于SEQIDNO30第426-440位(SEQIDNO6的第876-890位)的氨基酸H-G-I-A-N-P-T-F-V-H-A-P-G-K-I。OrfC的第三個域是ER域,在本文中也稱作0RFC-ER,含有編碼該ORFC-ER域的序列的核苷酸序列在本文表示為SEQIDNO:31(SEQIDNO:5的2995-4506位)。含有ORFC-ER域的氨基酸序列在本文表示為SEQIDNO32(SEQIDNO6的999-1502位)。破囊壺菌屬PUFAPKS系統(tǒng)有3個開放閱讀框形成核心破囊壺菌23BPUFAPKS系統(tǒng)。它的域組織與裂殖壺菌屬相同,只是破囊壺菌23BOrfA有8個相鄰的ACP域,而裂殖壺菌屬OrfA有9個相鄰的ACP域。每個開放閱讀框的域結(jié)構(gòu)如下。破囊壺菌23B開放閱讀框A(OrfA)破囊壺菌23BOrfA的完整核苷酸序列在本文表示為SEQIDNO:38。破囊壺菌23BOrfA是一條8433個核苷酸的序列(不包括終止密碼子),其編碼一條2811個氨基酸的序列,在本文中表示為SEQIDNO:39oSEQIDNO:38編碼破囊壺菌23ΒOrfA中的如下域(a)一個β-酮酯酰-ACP合酶(KS)域;(b)—個丙二酸單酰-CoA=ACP?;D(zhuǎn)移酶(MAT)域;(c)8個酰基載體蛋白(ACP)域;和(d)—個酮還原酶(KR)域。一個從破囊壺菌23B分離的、在本文中分別稱作Th23B0rfA_pBR812.1和Th23B0rfA_pBR811(0rfA基因組克隆)的兩個基因組克隆,據(jù)本發(fā)明人所知,共同(重疊克隆)包含SEQIDNO:38的核苷酸序列,且編碼SEQIDNO:39的氨基酸序列?;蚪M克隆Th23B0rfA_pBR812.1(稱作Th23B0rfA_pBR812.1基因組克隆,其形式為含有來自破囊壺菌23B的OrfA基因的大腸桿菌質(zhì)粒載體)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號No.PTA-8232。0rfA基因組克隆Th23B0rfA_pBR812.1的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)?;蚪M克隆Th23B0rfA_pBR811(稱作Th23B0rfA_pBR811基因組克隆,其形式為含有來自破囊壺菌23B的OrfA基因的大腸桿菌質(zhì)粒載體)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號No.PTA-8231。OrfA基因組克隆Th23B0rfA_pBR811的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。破囊壺菌23BOrfA中的第一個域是KS域,本文中也稱作破囊壺菌23B0rfA_KS,包含在SEQIDNO:38中跨越第1-大約第1500位的核苷酸序列內(nèi),在本文中表示為SEQIDN0:40。含有破囊壺菌23BKS域的氨基酸序列是SEQIDNO:39中跨越第1-大約第500位的一個區(qū)域,在本文中表示為SEQIDN0:41。SEQIDNO:39的這個區(qū)域具有一個與FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越SEQIDNO39的第1至大約第450位(也是SEQIDNO41第1-大約450位)。需要指出,破囊壺菌23ΒOrfA-KS域含有一個活性位點基序DXACiT?;Y(jié)合位點C2J。另外,破囊壺菌23ΒKS區(qū)末端的一個特征基序,GFGG,存在于SEQIDNO39的453_456位(也是SEQIDNO41的453_456位)中。破囊壺菌23ΒOrfA中的第二個域是MAT域,本文中也稱作破囊壺菌23ΒOrfA-MAT,其包含在SEQIDNO38的大約1503位-大約3000位的核苷酸序列內(nèi),該序列在本文中表示為SEQIDNO:42ο含有破囊壺菌23ΒΜΑΤ域的氨基酸序列是SEQIDNO39中跨越大約501-大約1000位的一個區(qū)域,本文中表示為SEQIDNO:43。SEQIDNO:39的這個區(qū)域具有一個與FabD(丙二酸單酰-CoA:ACP?;D(zhuǎn)移酶)的Pfam匹配,其跨越SEQIDNO39的大約580-大約900位(SEQIDNO43第80-400位)。需要指出的是,破囊壺菌23BOrfA-MAT域含有一個活性位點基序GHS*XGΓ?;Y(jié)合位點S697),由SEQIDNO39的695-699位表示。破囊壺菌23ΒOrfA的第3-10個域是8個串聯(lián)的ACP域,在本文也稱作破囊壺菌23ΒOrfA-ACP(該序列中的第一個域是OrfA-ACPl,第二個域是OrfA-ACP1,第三個域是OrfA-ACPl,等等)。第一個破囊壺菌23ΒACP域,破囊壺菌23ΒOrfA-ACPl,包含在跨越SEQIDNO38(OrfA)大約3205位-大約3555位的核苷酸序列中,本文表示為SEQIDNO:44。含有第一破囊壺菌23ΒACP域的核苷酸序列是一個從SEQIDNO39大約1069位至大約1185位的區(qū)域,本文表示為SEQIDNO:45。破囊壺菌23ΒOrfA的8個ACP域彼此相鄰,并可以用磷酸泛酰巰基乙胺結(jié)合位點基序LGXDS*(用SEQIDΝ0:46表示)的存在加以識別,其中S*是磷酸泛酰巰基乙胺連接位點。,8個S*位點每一個的氨基酸位置(以SEQIDNO3為參照)為1128(ACPl)、1244(ACP2)、1360(ACP3)、1476(ACP4)、1592(ACP5)、1708(ACP6)、1824(ACP7)和1940(ACP8)。全部8個破囊壺菌23ΒACP域的核苷酸和氨基酸序列高度保守,因此本文中每個域的序列不用分別的序列標(biāo)識符表來示。然而,根據(jù)本文公開的信息,本領(lǐng)域的技術(shù)人員能夠容易地在SEQIDNO38和SEQIDNO39中確定含有其它7個ACP域中每一個的序列。全部8個破囊壺菌23ΒACP域共同占據(jù)破囊壺菌23ΒOrfA中從SEQIDNO38的大約3205位到大約5994位的一個區(qū)域,其對應(yīng)于SEQIDNO39中從大約1069位到大約1998位的氨基酸位置。含全部8個域的整個ACP區(qū)域的核苷酸序列在本文表示為SEQIDNO:47oSEQIDNO47編碼一條本文表示為SEQIDNO48的氨基酸序列。SEQIDNO48包括位于各個ACP域之間的連接區(qū)段。8個域的重復(fù)間隔大約是SEQIDΝ0:48的每116個氨基酸,并且可以認(rèn)為每個域均由以活性位點(如上文所描述的)為中心的大約116個氨基酸組成。破囊壺菌23ΒOrfA的最后一個域是KR域,本文也稱作破囊壺菌23B0rfA-KR,其包含在SEQIDNO38的大約6001位-大約8433位之間的核苷酸序列內(nèi),本文表示為SEQIDN0:49。包含所述破囊壺菌23BKR域的氨基酸序列是一個跨越SEQIDN0:39大約2001位_大約2811位的區(qū)域,本文表示為SEQIDNO:50。SEQIDNO39的這個區(qū)域具有一個與FabG(β-酮酯酰-ACP還原酶)的Pfam匹配,其跨越SEQIDNO39的約2300位-約2550位(SEQIDNO:50第3OO-55O位)。破囊壺菌23Β開放閱讀框B(OrfB)破囊壺菌23ΒOrfB的完整核苷酸序列在本文表示為SEQIDΝ0:51,其是一條5808個核苷酸的序列(不包括終止密碼子),編碼一條1935個氨基酸的序列,在本文表示為SEQIDNO:52oSEQIDNO:51編碼下列破囊壺菌23ΒOrfB的域(a)—個β-酮酯酰-ACP合酶(KS)域;(b)一個鏈長因子(CLF)域;(c)一個?;D(zhuǎn)移酶(AT)域;和(d)一個烯酰基-ACP還原酶(KR)域。一個從破囊壺菌23B分離的、本文稱作Th23B0rfB_pBR800(OrfB基因組克隆)的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:51的核苷酸序列,并且編碼SEQIDNO52的氨基酸序列?;蚪M克隆Th23B0rfB_pBR800(稱作Th23B0rfB_pBR800基因組克隆,其形式為含有來自破囊壺菌23B的OrfB基因的大腸桿菌質(zhì)粒載體)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號No.PTA-8227。OrfB基因組克隆Th23B0rfB_pBR800的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。破囊壺菌23BOrfB的第一個域是KS域,在本文也稱作破囊壺菌23B0rfB-KS,包含在SEQIDNO51(破囊壺菌23BOrfB)第1-大約第1500位的核苷酸序列內(nèi),本文表示為SEQIDNO:53ο含有破囊壺菌23ΒKS域的氨基酸序列是SEQIDNO52中跨越第1_大約500位的一個區(qū)域,本文表示為SEQIDN0:54。SEQIDNO:52的這個區(qū)域具有一個與FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越大約第1_大約450位(SEQIDNO54的第1-450位)。需要指出的是,所述破囊壺菌23ΒOrfB-KS域含有一個活性位點基序DXA(f,其中C*是?;B接位點,并且其中C*位于SEQIDNO52的第201位。另外,KS區(qū)末端的一個特征性基序,GFGG,存在于SEQIDNO52的434-437位。破囊壺菌23BOrfB的第二個域是CLF域,本文也稱作破囊壺菌23B0rfB_CLF,其包含在SEQIDNO51(OrfB)大約1501位-大約3000位的核苷酸序列內(nèi),本文表示為SEQIDNO:55ο含有CLF域的氨基酸序列是SEQIDNO52中跨越大約501-大約1000位的一個區(qū)域,本文表示為SEQIDNO:56oSEQIDNO:52的這個區(qū)域具有一個與FabB(β-酮酯酰-ACP合酶)的Pfam匹配,其跨越大約550-大約910位(SEQIDNO:56第50-410位)。盡管CLF與KS蛋白同源,但它缺少KS蛋白中作為?;B接點的活性位點半胱氨酸。破囊壺菌23ΒOrfB的第三個域是AT域,本文也稱作破囊壺菌23B0rfB-AT,其包含在跨越SEQIDNO51(破囊壺菌23BOrfB)大約3001位-大約4500位的核苷酸序列內(nèi),本文表示為SEQIDNO:58。含有破囊壺菌23BAT域的氨基酸序列是SEQIDNO:52中跨越大約1001-大約1500位的一個區(qū)域,本文表示為SEQIDNO:58。SEQIDNO52的這個區(qū)域具有一個與FabD(丙二酸單酰-CoA:ACP酰基轉(zhuǎn)移酶)的Pfam匹配,其跨越大約1100-大約1375位(SEQIDNO58第100-375位)。盡管PUFA合酶的該AT域與MAT蛋白具有同源性,但它缺少MAT的延伸基序(關(guān)鍵的精氨酸和谷氨酰胺殘基),被認(rèn)為不參與丙二酸單酰-CoA轉(zhuǎn)移。存在酰基轉(zhuǎn)移酶的GXSlG基序,其中S*是酰基連接位點,以SEQIDNO52為參照位于1123位。破囊壺菌23BOrfB的第四個域是ER域,本文也稱作破囊壺菌23B0rfB-ER,其包含在跨越SEQIDNO51(OrfB)大約4501位-大約5805位的核苷酸序列內(nèi),本文表示為SEQIDNO:59ο含有破囊壺菌23ΒER域的氨基酸序列是SEQIDNO:52中跨越大約1501-大約1935位的一個區(qū)域,本文表示為SEQIDNO60。SEQIDNO:52的這個區(qū)域具有一個與2-硝基丙烷雙加氧酶相關(guān)的雙加氧酶家族Pfam匹配,其跨越大約1501-大約1810位(SEQIDN060第1-310位)。由于該域與來自肺炎鏈球菌的一個新近表征的ER酶具有同源性,可以進(jìn)一步地預(yù)料其具有ER的功能。破囊壺菌屬23Β開放閱讀框C(OrfC)破囊壺菌23ΒOrfC的完整核苷酸序列在本文表示為SEQIDΝ0:61,其是一條4410個核苷酸的序列(不包括終止密碼子),編碼一條1470個氨基酸的序列,在本文表示為SEQIDNO:62oSEQIDNO61編碼破囊壺菌23B0rfC的如下域(a)兩個FabA樣β-酮酯酰-ACP脫水酶(DH)域,均與FabA蛋白(一種催化合成反式_2_癸烯酰-ACP并將該產(chǎn)物可逆地異構(gòu)化成順式-3-癸烯酰-ACP的酶)同源;(b)一個烯酰-ACP還原酶(ER)域,其與裂殖壺菌屬OrfB的ER域高度同源。一個從破囊壺菌23B分離的、本文稱作Th23B0rfC_pBR709A(0rfC基因組克隆)的基因組克隆,據(jù)本發(fā)明人所知,包括SEQIDNO:61的核苷酸序列,并且編碼SEQIDNO62的氨基酸序列?;蚪M克隆Th23B0rfC_pBR709A(稱作Th23B0rfC_pBR709A基因組克隆,其形式為含有來自破囊壺菌23B的OrfC基因的大腸桿菌質(zhì)粒載體)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號No.PTA_8228。0rfC基因組克隆Th23B0rfC_pBR709A的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。破囊壺菌23BOrfC的第一個域是DH域,在本文也稱作破囊壺菌23B0rfC_DHl,包含在跨越SEQIDNO:61(0rfC)大約第1-大約第1500位的核苷酸序列內(nèi),本文中表示為SEQIDNO:63。含有破囊壺菌23BDHl域的氨基酸序列是SEQIDNO62中跨越大約第1_大約第500位的一個區(qū)域,本文表示為SEQIDNO:64oSEQIDNO:62的這個區(qū)域具有一個與如上文提到的FabA的Pfam匹配,其跨越第275-大約400位(SEQIDNO64的第275-大約400位)。破囊壺菌23ΒOrfC的第二個域也是DH域,在本文亦稱作破囊壺菌23B0rfC_DH2,包含在SEQIDNO61(OrfC)中跨越大約第1501-大約3000位的核苷酸序列內(nèi),本文表示為SEQIDNO:65ο含有破囊壺菌23ΒDH2域的氨基酸序列是SEQIDNO62中跨越大約第501-大約1000位的一個區(qū)域,本文表示為SEQIDNO:66。SEQIDNO:62的這個區(qū)域具有一個與如上文提到的FabA的Pfam匹配,其跨越大約第800-大約925位(SEQIDNO66的第3OO-大約4邪位)。破囊壺菌23ΒOrfC的第三個域是ER域,在本文也稱作破囊壺菌23B0rfC-ER,包含在跨越SEQIDNO61(OrfC)大約第3001-大約4410位的核苷酸序列內(nèi),本文表示為SEQIDNO:67ο含有破囊壺菌23ΒER域的氨基酸序列是SEQIDNO:62中跨越大約第1001-大約1470位的一個區(qū)域,本文表示為SEQIDNO:68。SEQIDNO62的這個區(qū)域具有一個與如上所述的2-硝基丙烷雙加氧酶相關(guān)的雙加氧酶的Pfam匹配,其跨越大約第1025-大約1320位(SEQIDNO:68的第25-大約320位)。由于該域與來自肺炎鏈球菌的一個新近表征的ER酶具有同源性,也可以預(yù)料其具有ER的功能。合成的密碼子優(yōu)化的構(gòu)建體本發(fā)明還涵蓋本文描述的任何核酸序列的經(jīng)過重新合成的版本,它們主要具有針對異源生物體(異源宿主)優(yōu)化過的密碼子用法,而其中所編碼的氨基酸序列相對與天然、野生型、或來源氨基酸序列沒有改變。本發(fā)明人發(fā)現(xiàn),為了最優(yōu)密碼子用法而重新合成核酸序列,是提高被來自PUFAPKS系統(tǒng)的核酸分子轉(zhuǎn)化的異源宿主的PUFA生產(chǎn)的一種有效方法。在異源宿主內(nèi)實現(xiàn)最優(yōu)的表達(dá)和PUFA生產(chǎn)并不一定需要重新合成PUFAPKS系統(tǒng)中所有的核酸分子。事實上,本發(fā)明人發(fā)現(xiàn),僅重新合成其中某些核酸分子就足以提高PUFA生產(chǎn)。例如,雖然在酵母中重新合成裂殖壺菌屬OrfA和B可提高PUFA合酶的表達(dá)和PUFA產(chǎn)量,但是使用天然的裂殖壺菌屬OrfC和天然的念珠藍(lán)細(xì)菌HetIPPT酶就足夠了。而且,為了一種異源宿主中使用而對構(gòu)建體進(jìn)行的密碼子優(yōu)化,對于提高在另一不同的異源宿主中的PUFA生產(chǎn)可能也是有用的(例如為了在裂殖壺菌屬中使用而對來自破囊壺菌屬的OrfC編碼序列而進(jìn)行的密碼子用法優(yōu)化,對增強另一種異源宿主生物體例如植物中的PUFA生產(chǎn)可能也是有用的)。此外,合成的、經(jīng)密碼子優(yōu)化的構(gòu)建體的應(yīng)用,可以有助于嵌合PUFAPKS構(gòu)建體和/或嵌合PUFAPKS系統(tǒng)的生產(chǎn),所述嵌合構(gòu)建體或系統(tǒng)中來自一個PUFAPKS系統(tǒng)(例如來自第一生物體)的域或蛋白被引入到另一個PUFAPKS系統(tǒng)(例如來自第二生物體)中。在這樣的系統(tǒng)中,不僅可以操縱PUFA譜(profile)(例如通過使用所述嵌合構(gòu)建體和/或嵌合PUFAPKS系統(tǒng)),而且還可以通過使用合成的密碼子優(yōu)化的嵌合構(gòu)建體來提高PUFA生產(chǎn)。確實,將這兩個構(gòu)思(嵌合和密碼子優(yōu)化)結(jié)合起來,可以產(chǎn)生PUFA譜和/或PUFA生產(chǎn)的協(xié)同性的結(jié)果。本發(fā)明涵蓋這樣的嵌合系統(tǒng),其含有一些針對宿主經(jīng)過密碼子優(yōu)化的序列和一些對于宿主而言沒有密碼子優(yōu)化的序列。下面通過舉例描述一些經(jīng)過密碼子優(yōu)化的序列。通過該描述,其它的密碼子優(yōu)化序列對于本領(lǐng)域的技術(shù)人員而言是顯而易見的。sOrfASEQIDNO:35,以sOrfA指代,代表為酵母中的優(yōu)化密碼子用法而重新合成過的編碼來自裂殖壺菌屬的OrfA的核酸序列(SEQIDNO:1)。SEQIDNO:1和SEQIDNO:35均編碼SEQIDNO:2οsOrfBSEQIDNO:36,以sOrfB指代,代表為酵母中的優(yōu)化密碼子用法而重新合成過的編碼來自裂殖壺菌屬的OrfB(SEQIDNO3)的核酸序列。SEQIDNO:3和SEQIDN0:36均編碼SEQIDNO:4。OrfB*SEQIDNO37,以0rfB*(pJK962)指代,代表這樣的核酸序列它編碼來自裂殖壺菌屬的OrfB(SEQIDNO4)的核酸序列,在SEQIDNO:3內(nèi)的一部分(編碼SEQIDN0:4的核苷酸序列)中進(jìn)行了重新合成以在植物細(xì)胞中使用,而且它來源于一個非常相似的、最初為了大腸桿菌中的優(yōu)化密碼子用法而開發(fā)的序列,該序列也被稱作0rftf(pJK780),在下文中有描述。兩種形式的OrfB*(用于大腸桿菌的和用于植物的)與SEQIDN0:3相同,只是有一個重新合成的BspHI(SEQIDNO3的核苷酸4415)到SacII片段(SEQIDNO3中的獨特位置)[aresynthesizedBspHItoaSacIIfragment]。與orfB(SEQIDNO3)的原始基因組序列相比,這兩個版本(大腸桿菌和植物)在基因的起始位置附近均具有兩個其它的密碼子修改。第一,第四個密碼子即精氨酸(R)從基因組序列中的CGG變成了orfB*中的CGC。第二,第五個密碼子即天冬酰胺(N)從基因組序列中的AAT變成了orfB*中的AAC。為了便于將該基因克隆到植物載體以產(chǎn)生SEQIDNO:37,還將一個PstI位點(CTGCAG)工程化到大腸桿菌orfB*序列中距離基因起始處20個堿基的位置。這個變化未改變所編碼蛋白的氨基酸序列。SEQIDN0:37和SEQIDNO:3(以及對大腸桿菌的OrfB*形式,下文在SEQIDNO69中描述)均編碼SEQIDNO:4。SEPIDNO:69,以O(shè)rfBjt(PJI^SO)指代,代表這樣的核酸序列,它編碼來自裂殖壺菌屬的OrfB(SEQIDNO4),在SEQIDNO3(編碼SEQIDNO4的核苷酸序列)的一部分中進(jìn)行了重新合成,以供在大腸桿菌中使用。兩種形式(用于大腸桿菌的和用于植物的)中的OrfB*構(gòu)建體的序列均已在上文中記載。SEQIDNO69和SEQIDNO3均編碼SEQIDNO:4。本文稱作0rfB*_pJK780的質(zhì)粒,據(jù)本發(fā)明人所知,包含SEQIDNO:69的核苷酸序列,并編碼SEQIDNO:4的氨基酸序列。質(zhì)粒0rfB*_pJK780(稱為0rfB*)_pJK780克隆,以大腸桿菌質(zhì)粒載體的形式)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并給予ATCC登錄號PTA-8225。0rfB*_pJK780的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。pThOrfC-synPSSEQIDNO:70代表為了裂殖壺菌屬中的最優(yōu)密碼子用法而重新合成過的編碼破囊壺菌23BOrfC(SEQIDN0:61,編碼SEQIDNO62)的核酸序列。SEQIDNO:70的2000-6412位代表破囊壺菌23BOrfC蛋白(包括終止密碼子)的編碼區(qū)。SEQIDNO70的1-1999位和6413-8394位分別代表上游和下游裂殖壺菌屬OrfC序列(非編碼區(qū))。含有SEQIDNO70的質(zhì)粒(指定為pThOrfC-synPS)的構(gòu)建在實施例1中有詳細(xì)描述。SEQIDN0:70和SEQIDNO:61均編碼SEQIDNO:62。pThOrfC-synPS被設(shè)計為用如上所述地重新合成過的破囊壺菌23BorfC的編碼區(qū)(SEQIDNO70)精確替換裂殖壺菌屬orfC的編碼區(qū)(SEQIDNO:5)。用該構(gòu)建體轉(zhuǎn)化的生物體的產(chǎn)生和使用在下文和實施例中有詳細(xì)描述。上文描述的pThOrfC-synPS質(zhì)粒,據(jù)本發(fā)明人所知,包括SEQIDNO70的核苷酸序列,并編碼SEQIDNO:62的相應(yīng)氨基酸序列。質(zhì)粒pThOrfC-synPS(以pThOrfC-synPS指稱,形式為大腸桿菌質(zhì)粒載體,含有為了在裂殖壺菌屬或其它異源宿主中表達(dá)而優(yōu)化過的“完美銜接的”(perfectstitch)合成破囊壺菌23BPUFAPKSOrfC密碼子)于2007年3月1日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并給予ATCC登錄號PTA-8229。pThOrfC-synPS的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。pDD26SEQIDNO:71代表為了裂殖壺菌屬中的優(yōu)化密碼子用法而重新合成過的編碼破囊壺菌23BOrfA的核酸序列(SEQIDN0:38,編碼SEQIDNO:39)。SEQIDNO:71的2044-10479位代表破囊壺菌23BOrfA蛋白(包括終止密碼子)的編碼區(qū)。SEQIDNO71的1-2043位和10480-12495位分別代表上游和下游裂殖壺菌屬OrfA序列(非編碼區(qū))。含有SEQIDNO71的質(zhì)粒(命名為pDD26)的構(gòu)建在實施例8中有詳細(xì)描述。SEQIDNO71和SEQIDN0:38均編碼SEQIDNO:39。pDD26被設(shè)計來用如上所述地重新合成過的破囊壺菌23BorfC的編碼區(qū)(SEQIDNO71)精確替換裂殖壺菌屬orfA的編碼區(qū)(CDS)(SEQIDN0:1)。在下文和實施例中詳細(xì)描述了用該構(gòu)建體轉(zhuǎn)化的生物體的生產(chǎn)和使用。上文稱為pDD26的質(zhì)粒,據(jù)本發(fā)明人所知,包含SEQIDNO:71的核苷酸序列,并編碼SEQIDNO39的相應(yīng)氨基酸序列。質(zhì)粒pDD26(以pDD26指稱,其形式為大腸桿菌質(zhì)粒載體)于2007年5月8日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被給予ATCC登錄號PTA-8411。pDD26的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。pDD32SEQIDNO:72代表為了裂殖壺菌屬中的優(yōu)化密碼子用法而重新合成過的編碼破囊壺菌23BOrfB的核酸序列(SEQIDN0:51,編碼SEQIDNO:52)。SEQIDNO:72的1452-7259位代表破囊壺菌23BOrfB蛋白(包括終止密碼子)的編碼區(qū)。SEQIDNO72的1-1451位和7260-8647位分別代表上游和下游裂殖壺菌屬OrfB序列(非編碼區(qū))。含有SEQIDNO-J2的質(zhì)粒(以Pdd32指稱)的構(gòu)建在實施例8中有詳細(xì)描述。SEQIDNO72和SEQIDN0:51均編碼SEQIDNO:52。pDD32被設(shè)計為用如上所述地重新合成過的破囊壺菌23BorfC的編碼區(qū)(SEQIDNO72)精確替換裂殖壺菌屬orfB的編碼區(qū)(CDS)(SEQIDN0:3)。在下文和實施例中詳細(xì)描述了用該構(gòu)建體轉(zhuǎn)化的生物體的生產(chǎn)和使用。據(jù)本發(fā)明人所知,上文作為PDD32描述的質(zhì)粒包括SEQIDNO72的核苷酸序列,并編碼SEQIDNO:52的相應(yīng)氨基酸序列。質(zhì)粒pDD32(指定為pDD32,其形式為大腸桿菌質(zhì)粒載體)于2007年3月1日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并指定ATCC登錄號PTA-8412。pDD32的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。嵌合PUFAPKS構(gòu)津體本發(fā)明還包括嵌合構(gòu)建體,其使用兩種或多種不同PUFAPKS核酸序列的一部分,例如本文中描述的那些,來產(chǎn)生嵌合PUFAPKS蛋白。本發(fā)明人在這里用多個不同的實施例顯示,通過“混合和匹配”來自不同生物體的PUFAPKS蛋白的域或部分(即產(chǎn)生包含來自兩種或多種不同生物體的域或多肽的嵌合PUFAPKS蛋白),與天然(自然存在的)PUFAPKS系統(tǒng)相比,可以修飾由表達(dá)含有這種嵌合蛋白的PUFAPKS系統(tǒng)的生物體所產(chǎn)生的PUFA譜。例如,本發(fā)明人在這里描述了在裂殖壺菌屬蛋白的OrfC蛋白中使用來自破囊壺菌屬PUFAPKS系統(tǒng)的DH2域,所得的嵌合OrfC蛋白含有來自裂殖壺菌屬的DHl和ER域和來自破囊壺菌屬的DH2域。對該嵌合構(gòu)建體進(jìn)一步通過如下方式加以修飾在一個構(gòu)建體中使用密碼子優(yōu)化的(針對裂殖壺菌屬)破囊壺菌屬DH2域,在另一個構(gòu)建體中使用天然的破囊壺菌屬DH2域;這顯示了本文描述的各種修改方式的靈活性和效果。下文通過舉例描述了一些嵌合構(gòu)建體。本領(lǐng)域的技術(shù)人員考慮了該描述之后可以容易地想到其它的構(gòu)建體。pDS49SEQIDNO:73代表這樣一種核酸序列,其編碼一種包含裂殖壺菌屬OrfC蛋白(SEQIDNO6)的嵌合蛋白,該裂殖壺菌屬OrfC蛋白中DH2域(SEQIDNO30)被來自破囊壺菌23BOrfC(SEQIDNO62)的DH2域(包括SEQIDNO66的序列)替換。在該嵌合構(gòu)建體中,來自破囊壺菌屬的DH2編碼序列是天然(非密碼子優(yōu)化的)序列。含有SEQIDNO73的質(zhì)粒(以pDS49指稱)的構(gòu)建在實施例2中有詳細(xì)描述。pDS49中位于SEQIDNO73兩側(cè)的裂殖壺菌屬OrfC上游和下游非編碼序列與上文關(guān)于SEQIDNO70所述的相同(在SEQIDNO73中沒有表示)。SEQIDNO73編碼SEQIDNO74的氨基酸序列。參考SEQIDNO:74,該嵌合OrfC多肽的長度為1493個氨基酸殘基。DH2區(qū),規(guī)定為SEQIDNO74的氨基酸516-1041,由破囊壺菌23BOrfC蛋白的DH2區(qū)氨基酸序列,即SEQIDNO62的氨基酸491-1016所組成,其包括SEQIDNO:66的全部以及來自SEQIDNO:62的一些側(cè)翼氨基酸序列。關(guān)于該嵌合OrfC氨基酸序列的其余部分,SEQIDNO74的殘基1-515禾口1042-1493分別與SEQIDNO6的裂殖壺菌屬OrfC殘基1-515和1051-1502相同。被該構(gòu)建體轉(zhuǎn)化的生物體的產(chǎn)生和使用在下文和實施例中有詳細(xì)描述。上文描述為pDS49的質(zhì)粒,據(jù)本發(fā)明人所知,包含SEQIDNO:73的核苷酸序列,并編碼SEQIDNO:74的相應(yīng)氨基酸序列。質(zhì)粒pDS49(指稱為pDS49,其形式為大腸桿菌質(zhì)粒載體)于2007年3月1日被保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被給予ATCC登錄號PTA-8230。pDS49的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。pDD24SEQIDNO:75代表另一種編碼包含裂殖壺菌屬OrfC蛋白(SEQIDNO6)的嵌合蛋白的核酸序列,該裂殖壺菌屬OrfC蛋白中的DH2域(SEQIDNO:30)被替換為來自破囊壺菌23BOrfC(SEQIDNO62)的DH2域(包含SEQIDNO66的序列)。在該嵌合構(gòu)建體中,所述來自破囊壺菌屬的DH2編碼序列是供裂殖壺菌屬中使用的經(jīng)過密碼子優(yōu)化的序列。含有SEQIDNO75的質(zhì)粒(指稱為pDD24)的構(gòu)建在實施例3中有詳細(xì)描述。pDD24中位于SEQIDNO:75兩側(cè)的裂殖壺菌屬OrfC上游和下游非編碼序列與上文關(guān)于SEQIDNO:70所描述的相同(在SEQIDN0:75中沒有表示)。SEQIDN0:75編碼SEQIDNO74的氨基酸序列。在上文關(guān)于SEQIDNO:73(其亦編碼SEQIDNO74)的內(nèi)容中已經(jīng)詳細(xì)描述了SEQIDNO:74ο不過,在本構(gòu)建體中,如上面討論的,編碼SEQIDNO:74中氨基酸516-1041的核苷酸序列來自質(zhì)粒pThOrfC-synPS中所含的破囊壺菌屬23BOrfC的“合成基因序列”(見實施例1和SEQIDNO:70),該序列使用了裂殖壺菌屬基因表達(dá)優(yōu)選的密碼子。被該構(gòu)建體轉(zhuǎn)化的生物體的產(chǎn)生和使用在下文和實施例中有詳細(xì)描述。據(jù)本發(fā)明人所知,上文作為pDD24描述的質(zhì)粒包括SEQIDNO75的核苷酸序列,并編碼SEQIDNO74的相應(yīng)氨基酸序列。質(zhì)粒pDD24(指稱為pDD24,其形式為大腸桿菌質(zhì)粒載體)于2007年3月1日保藏于美國典型培養(yǎng)物保藏中心(ATCC),10801UniversityBoulevard,Manassas,Va.20110-2209USA,并被給予ATCC登錄號PTA-8226。pDD24的核苷酸序列和由該質(zhì)粒編碼的氨基酸序列涵蓋在本發(fā)明內(nèi)。嵌合PUFAPKS系統(tǒng)除了使用上文描述的密碼子優(yōu)化和嵌合構(gòu)建體之外,本發(fā)明還包括嵌合PUFAPKS系統(tǒng)的生產(chǎn)和應(yīng)用。嵌合PUFAPKS系統(tǒng)包括上文描述的嵌合構(gòu)建體的使用,其中生成嵌合PUFAPKS蛋白并且在PUFAPKS系統(tǒng)中使用它;不過,此類系統(tǒng)還涵蓋這樣PUFAPKS系統(tǒng),其中來自一個或多個PUFAPKS系統(tǒng)的一種或多種完整蛋白或多個蛋白被替換為或者添加到來自另一個PUFAPKS系統(tǒng)的相應(yīng)的一種或多種完整蛋白,從而所得的PUFAPKS系統(tǒng)包括來自兩個或多個不同PUFAPKS系統(tǒng)的蛋白。這些系統(tǒng)還可以包括嵌合蛋白的使用,如上文所述(例如嵌合蛋白和全蛋白替換)。例如,可以將上文描述的pTh23B_synPS構(gòu)建體(包含針對裂殖壺菌屬密碼子用法進(jìn)行了優(yōu)化的破囊壺菌23BOrfC編碼序列)替換到裂殖壺菌屬PUFAPKS中,來完美地代替天然裂殖壺菌屬OrfC編碼序列,從而產(chǎn)生嵌合PUFAPKS系統(tǒng)。另舉一例,可以將天然破囊壺菌23BOrfC編碼序列(非密碼子優(yōu)化的)替換到裂殖壺菌屬PUFAPKS系統(tǒng)中,來完美地代替天然裂殖壺菌屬OrfC編碼序列,從而產(chǎn)生另一種嵌合PUFAPKS系統(tǒng)。再舉一例,可以將天然破囊壺菌23BOrfA和OrfC編碼序列(經(jīng)密碼子優(yōu)化或者未經(jīng)優(yōu)化的)替換到裂殖壺菌屬PUFAPKS系統(tǒng)中,來分別完美地代替天然裂殖壺菌屬OrfA和OrfC編碼序列,從而產(chǎn)生再另一種嵌合PUFAPKS系統(tǒng)。下文實施例中描述了這些和其它的嵌合PUFAPKS系統(tǒng)。實施例中還包括表達(dá)包含下列組分的嵌合PUFAPKS系統(tǒng)的裂殖壺菌屬宿主(1)裂殖壺菌屬(S)OrfA、SorfB、和破囊壺菌屬(Th)OrfC;(2)SOrfA,ThOrfB和SorfC;(3)ThOrfA,SOrfB和SOrfC;(4)SOrfA,ThOrfB和ThOrfC;(5)ThOrfA,SOrfB和ThOrfC;(6)ThOrfA、ThOrfB和SorfC;和(7)ThOrfA、ThOrfB和ThOrfC。于是,基于本文提供的討論和例證性實驗,就有可能通過在各種宿主生物體中,包括在內(nèi)源地不具有用于產(chǎn)生PUFA的PUFAPKS系統(tǒng)的宿主生物體中,針對宿主的密碼子用法選擇性重新合成PUFAPKS核酸分子,和/或使用嵌合PUFAPKS構(gòu)建體和/或嵌合PUFAPKS系統(tǒng),來改善和/或修飾PUFA生產(chǎn)。磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶)根據(jù)本發(fā)明,用于在異源宿主中產(chǎn)生和/或積累PUFA或者提高內(nèi)源宿主中PUFA的產(chǎn)生和/或積累的PUFAPKS系統(tǒng)可使用各種輔助蛋白,輔助蛋白在本文中定義為這樣的蛋白,它們不被認(rèn)為是如上文所討論的核心PUFAPKS系統(tǒng)的一部分(即不是PUFA合酶復(fù)合體本身的一部分),但是對于使用本發(fā)明的核心PUFA合酶復(fù)合體來產(chǎn)生PUFA,或者至少高效地產(chǎn)生PUFA而言,它們可能是必需的。為了產(chǎn)生PUFA,PUFAPKS系統(tǒng)必須與將4’-磷酸泛酰巰基乙胺基從輔酶A轉(zhuǎn)移到?;d體蛋白(ACP)域的輔助蛋白一起工作。因此,PUFAPKS系統(tǒng)可以考慮包括至少一個4’-磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶)域,或者這種域可以被看作是PUFAPKS系統(tǒng)的輔助域或蛋白。PPT酶的結(jié)構(gòu)和功能特征已經(jīng)在例如下列文獻(xiàn)中有詳細(xì)描述美國專利申請公開No.20020194641、美國專利申請公開No.20040235127和美國專利申請公開No.20050100995ο根據(jù)本發(fā)明,具有4’_磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶)生物活性(功能)的域或蛋白的特征是將4’-磷酸泛酰巰基乙胺模塊從輔酶A轉(zhuǎn)移到?;d體蛋白(ACP)的酶。這種針對ACP的不變(invariant)絲氨酸殘基的轉(zhuǎn)移將ACP從無活性脫輔基(apo)形式激活成完全(holo)形式。在聚酮和脂肪酸合成中,磷酸泛酰巰基乙胺基與伸長中的?;溞纬蓭€酯。PPT酶是一個酶家族,其中的酶已經(jīng)在脂肪酸合成、聚酮合成和非核糖體肽合成中得到良好表征。許多PPT酶的序列是已知的,晶體結(jié)構(gòu)已經(jīng)確定(例如ReuterK,MofidMR,MarahielMA,FicnerR."Crystalstructureofthesurfactinsynthetase-activatingenzymesfp-.aprototypeofthe4'—phosphopantetheinyltransferasesuperfamily,,EMBOJ.1999Dec1;18(23)6823-31),并且對于活性重要的氨基酸殘基也已進(jìn)行了突變分析(MofidMR,FinkingR,EssenL0,MarahielMA."Structure-basedmutationalanalysisofthe4'-phosphopantetheinyltransferasesSfpfromBacillussubtilis:carrierproteinrecognitionandreactionmechanism"Biochemistry.2004Apr13;43(14):4128_36)。PPT酶中的這些不變且高度保守的氨基酸包含在上述兩種希瓦氏菌(Shewanella)菌株的pfaEORF中。一種先前已經(jīng)被證明可以識別本文所述OrfAACP域作為底物的異源PPT酶是念珠藍(lán)細(xì)菌PCC7120(原名魚腥藍(lán)細(xì)菌(Anabaenasp.)PCC7120)的HetI蛋白。HetI存在于念珠藍(lán)細(xì)菌的一個基因簇中,已知該基因簇負(fù)責(zé)長鏈羥基脂肪酸的合成,這些長鏈羥基脂肪酸是存在于該生物體異形胞中的糖脂層的組分(BlackandWolk,1994,J.Bacteriol.176,2282-2292;Campbell等,1997,Arch.Microbiol.167,251-258)。HetI有可能激活位于該基因簇中的一種蛋白HglE的ACP域。HglE的兩個ACP域與在裂殖壺菌屬OrfA發(fā)現(xiàn)的ACP域具有高度的序列同源性。SEQIDNO:34代表念珠藍(lán)細(xì)菌HetI蛋白的氨基酸序列,它是一種功能性PPT酶,可以和本文所述PUFAPKS系統(tǒng),包括來自裂殖壺菌屬和破囊壺菌屬的PUFAPKS系統(tǒng),一同使用。SEQIDNO34由SEQIDN0:33編碼。HetI的內(nèi)源起始密碼子還沒有被鑒定(在推定蛋白中不存在甲硫氨酸)。在開放閱讀框5’端附近存在數(shù)個潛在的可選擇起始密碼子(例如TTG和ATT)。序列中不存在甲硫氨酸密碼子(ATG)。然而,借助PCR用甲硫氨酸密碼子(ATGJtSNdeI限制性酶識別位點的一部分)替換最遠(yuǎn)端的5’潛在可選擇起始密碼子(TTG),并在編碼序列的3’端引入一個XhoI位點,構(gòu)建完成了一種HetI表達(dá)構(gòu)建體,并且其編碼的PPT酶(SEQIDNO34)已顯示具有功能。另一種先前已經(jīng)被顯示可識別本文所述OrfAACP域作為底物的異源PPT酶是來源于枯草芽孢桿菌(Bacillussubtilis)的sfp。Sfp已經(jīng)獲得良好表征,并且因為它識別底物的范圍廣泛而被普遍使用。根據(jù)已公開的序列信息(Nakana等,1992,MolecularandGeneralGenetics232:313_321),先前已經(jīng)制造了一種sfp的表達(dá)載體,其是通過把編碼區(qū)和確定的上下游側(cè)翼DNA序列一起克隆到pACYC-184克隆載體內(nèi)而制成的。該構(gòu)建體編碼功能性的PPT酶,表現(xiàn)為其能夠在合適的條件下與裂殖壺菌屬OrfA、B*和C在大腸桿菌中共表達(dá),導(dǎo)致這些細(xì)胞中積累DHA(見美國專利申請公開No.20040235127)。當(dāng)對生物體(例如微生物或植物)進(jìn)行遺傳修飾以表達(dá)根據(jù)本發(fā)明的PUFAPKS系統(tǒng)時,一些宿主生物體可能內(nèi)源地表達(dá)輔助蛋白(例如PPT酶),PUFAPKS系統(tǒng)需要與這樣的蛋白一起工作來產(chǎn)生PUFA。不過,對于一些生物體,可以用編碼一種或多種本文所述輔助蛋白的核酸分子加以轉(zhuǎn)化來能化(enable)和/或增強(enhance)該生物體的PUFA生產(chǎn),即使該生物體可內(nèi)源產(chǎn)生同源輔助蛋白(即,某些異源輔助蛋白可能比宿主細(xì)胞的內(nèi)源輔助蛋白更為有效而高效地與被轉(zhuǎn)化PUFA合酶蛋白一起工作)。在一個實施方案中,這樣的輔助蛋白包括輔助PPT酶(accessoryPPTase)。本發(fā)明的一個實施方案涉及一種分離的核酸分子,所述分子包含來自PUFAPKS系統(tǒng)的核酸序列、其同源物、其片段、和/或與任意這些核酸序列互補的核酸序列。在一個方面中,本發(fā)明涉及一種分離的核酸分子,其包含從下組選出的核酸序列(a)編碼選自SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:39,SEQIDNO:52,SEQIDNO62的氨基酸序列及其生物活性片段的核酸序列;(b)編碼選自SEQIDN0:8、SEQIDN0:10,SEQIDN013、SEQIDNO18,SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:41、SEQIDNO:43、SEQIDNO45、SEQIDNO:48、SEQIDNO:50、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:64、SEQIDNO66和SEQIDNO68的氨基酸序列及其生物活性片段的核酸序列;(c)編碼與(a)中的任一氨基酸序列中的至少500個連續(xù)氨基酸至少大約60%同一的氨基酸序列的核酸序列,其中該氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng)中的至少一個、兩個、三個或多個域的生物活性;(d)編碼與(b)的任何氨基酸序列至少大約60%同一的氨基酸序列的核酸序列,其中所述氨基酸序列具有多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng)中的至少一個域的生物活性;或(e)與(a)、(b)、(c)或(d)的核酸序列完全互補的核酸序列。在一個進(jìn)一步的實施方案中,本發(fā)明涵蓋這樣的核酸序列,它包含本說明書上文中針對數(shù)種PUFAPKS域說明過的活性位點域或其它功能基序的編碼核酸序列。本發(fā)明特別優(yōu)選的實施方案包括分離的核酸分子,其編碼在如本文所述的PUFAPKS系統(tǒng)中有用的嵌合蛋白。本發(fā)明還包括將由來于或衍生自一種PUFAPKS系統(tǒng)的域或者蛋白在由來于或衍生自另一種PUFAPKS系統(tǒng)的域中使用,和/或與由來于或衍生自另一種PUFAPKS系統(tǒng)的蛋白一起使用,以產(chǎn)生具有獨特品質(zhì)的新型PUFAPKS系統(tǒng)。例如,本發(fā)明的一個實施方案涉及使用來自一個PUFAPKS系統(tǒng)的DH2域來修飾包括來自另一不同生物體的蛋白/域的PUFAPKS系統(tǒng),其中該DH2域的引入(例如在一個實施方案中,通過替換宿主的內(nèi)源DH2域或相似的域)可修飾由該系統(tǒng)產(chǎn)生的PUFA的比例,特別是該系統(tǒng)產(chǎn)生的《-3PUFA對ω-ePUFA的比例。該實施方案將在下文中描述。一些優(yōu)選的核酸分子包括編碼SEQIDNO:74的氨基酸序列及其生物活性片段的核酸序列,編碼與SEQIDNO:74至少大約60%同一并且具有多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng)至少一個、兩個、三個或更多個域的生物活性的氨基酸序列的核酸序列,或者與上述核酸序列完全互補的核酸序列。在一個實施方案中,所述核酸分子包括選自SEQIDN0:73和SEQIDN0:75的核酸序列。在一個實施方案中,所述核酸分子包括編碼由選自PDS49和pDD24的質(zhì)粒編碼的氨基酸序列的核酸序列。在一個實施方案中,所述核酸分子包括選自PDS49和pDD24的質(zhì)粒的編碼嵌合OrfC蛋白的核酸序列。其它優(yōu)選的實施方案包括如下的核酸分子,其包含編碼來自一種PUFAPKS系統(tǒng)的PUFAPKS蛋白或域或其同源物的核酸序列,其中該核酸序列針對另一種不同生物體(例如要在其中表達(dá)該核酸序列的宿主)的密碼子用法進(jìn)行了優(yōu)化。這類核酸序列的實例在本文中有描述,包括但不限于,SEQIDNO:70、SEQIDN0:71禾口SEQIDNO72以及SEQIDNO75所表示的核酸序列。編碼任何PUFAPKS蛋白或域(特別是任何本文所述氨基酸序列)的密碼子優(yōu)化核酸序列包含在本發(fā)明之內(nèi)。在一個實施方案中,這種核酸分子包括編碼如下氨基酸序列的核酸序列,所述氨基酸序列由選自pTh0rfC-synPS、pDD26、pDD32或pDD24的質(zhì)粒編碼。在一個實施方案中,所述核酸分子包括從pThOrfC-synPS、pDD26、pDD32或pDD24選擇的質(zhì)粒的編碼可在PUFAPKS系統(tǒng)中使用的蛋白或嵌合蛋白的核酸序列。根據(jù)本發(fā)明,具有PUFAPKS系統(tǒng)至少一個域的生物活性的氨基酸序列是如下的氨基酸序列,其具有本文詳細(xì)描述的PUFAPKS系統(tǒng)至少一個域的生物活性,所述生物活性的實例有裂殖壺菌屬和破囊壺菌屬PUFAPKS系統(tǒng),進(jìn)一步的實例見下列文獻(xiàn)中描述的任何PUFAPKS系統(tǒng)的任意蛋白和域的生物活性美國專利No.6,140,486、美國專利No.6,566,583、美國專利申請公開No.20020194641、美國專利申請公開No.20070089199、美國專利申請公開No.20040235127、美國專利申請公開No.20050100995、PCT專利公布WO05/097982或美國專利申請公開No.20050014231,見上文。因此,本發(fā)明的分離核酸分子能夠編碼任何PUFAPKS開放閱讀框的翻譯產(chǎn)物、PUFAPKS域、其生物活性片段、或天然存在的PUFAPKS開放閱讀框的任何具有生物活性的同源物或域。給定蛋白或域的同源物是如下所述的蛋白或多肽,其具有與天然存在的參考氨基酸序列(即參考蛋白或域)不同的氨基酸序列,所述不同在于至少有一個或少數(shù)幾個氨基酸,但不限于一個或少數(shù)幾個氨基酸被刪除(例如蛋白的截短形式,例如肽或片段)、插入、倒置、替換和/或衍生化(例如通過糖基化、磷酸化、乙?;?、豆蔻酰化、異戊烯化、棕櫚酸化、酰胺化和/或添加糖基磷脂酰肌醇)。PUFAPKS蛋白和域的優(yōu)選同源物在下文有詳細(xì)描述。需要注意,同源物可以包括合成產(chǎn)生的同源物,給定蛋白或域的天然存在的等位變異體,或來自與參考序列所來源的生物體不同的生物體的同源序列。一般地,蛋白或域的生物活性或生物作用是指在體內(nèi)(即蛋白的自然生理環(huán)境)或體外(即在是實驗室條件下)測量或觀察到的、由所述蛋白或域顯示或執(zhí)行的、可歸因于該蛋白或域的天然存在形式的任何功能。PUFAPKS系統(tǒng)的生物活性和構(gòu)成PUFAPKS系統(tǒng)的各個蛋白/域的生物活性在本文其它部分有詳細(xì)描述。蛋白或域的修飾,例如在同源物或模擬物中(下文中討論)的修飾,可導(dǎo)致蛋白或域具有與天然存在蛋白或域的相同生物功能,或者可導(dǎo)致蛋白或域具有相對于天然存在蛋白或域降低或增加的生物活性。導(dǎo)致蛋白或域的表達(dá)降低或活性降低的修飾可以稱作蛋白或域的失活(完全或部分)、下調(diào)或作用降低。類似地,導(dǎo)致蛋白或域的表達(dá)增加或活性增加的修飾可以稱作蛋白或域的擴增、過表達(dá)、激活、增強、上調(diào)或作用提高。PUFAPKS系統(tǒng)的功能域是能夠執(zhí)行生物功能(S卩,具有生物活性)的域(即該域可以是蛋白的一部分)。根據(jù)本發(fā)明,分離的核酸分子是被從其天然環(huán)境中移出(即,經(jīng)過了人為操作)的核酸分子,其中所述天然環(huán)境是自然界中該核酸分子所在的基因組或染色體。因此,“分離的”不一定反映核酸分子已被純化的程度,而是表示該分子不包括自然界中該核酸分子所在的整個基因組或整個染色體。分離的核酸分子可以包括基因。包括某基因的分離的核酸分子并不是包括該基因的染色體片段,而是包括與該基因有關(guān)的編碼區(qū)和調(diào)節(jié)區(qū),但是通常不包括相同染色體上天然存在的其它基因,盡管某些核酸分子可能包括不是PUFAPKS基因或系統(tǒng)必需部分的鄰近/連鎖基因。分離的核酸分子還可以包括如下所述的特定核酸序列,該特異核酸序列的側(cè)翼(即在該序列的5’和/或3’末端)具有自然界中正常情況下不位于其側(cè)翼的額外核酸(即異源序列)。分離的核酸分子可以包括DNA、RNA(例如mRNA)或DNA或RNA的衍生物(例如cDNA)。盡管詞組“核酸分子”主要是指物理的核酸分子,而詞組“核酸序列”主要是指核酸分子上的核苷酸的序列,但這兩個詞組可以互換使用,特別是就能夠編碼蛋白或蛋白的域的核酸分子或核酸序列而言。優(yōu)選地,本發(fā)明的分離核酸分子用重組DNA技術(shù)(例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴增、克隆)或化學(xué)合成來產(chǎn)生。分離的核酸分子包括天然核酸分子和其同源物,包括但不限于天然等位變異體以及經(jīng)修飾的核酸分子,在后者中以這樣的方式插入、刪除、替換和/或倒置了核苷酸,使得該修飾對本文所述的PUFAPKS系統(tǒng)的生物活性提供期望的影響。蛋白同源物(例如,由核酸同源物編碼的蛋白)在上文中已有詳細(xì)討論。核酸分子同源物可以用多種本領(lǐng)域技術(shù)人員已知的方法產(chǎn)生(見例如,Sambrook等,MolecularCloning,ALaboratoryManual,ColdSpringHarborLabsPress,1989)。例如,核酸分子可以用多種技術(shù)進(jìn)行修飾,包括但不限于,經(jīng)典的突變技術(shù)和重組DNA技術(shù),例如定點誘變,對核酸分子進(jìn)行化學(xué)處理以誘發(fā)突變,核酸片段的限制性酶切,核酸片段的連接,對核酸序列中選定區(qū)域加以PCR擴增和/或誘變,合成寡核苷酸混合物及連接混合物群體以“構(gòu)建”核酸分子的混合物,和其組合。通過針對由該核酸編碼的蛋白質(zhì)的功能進(jìn)行篩選和/或通過與野生型基因雜交,可以將核酸分子同源物從修飾核酸的混合物中選擇出來。本發(fā)明核酸分子的最小尺寸是足以形成探針或寡核苷酸引物的尺寸,該探針或引物能夠與可用于本發(fā)明的核酸分子的互補序列形成穩(wěn)定的雜交體(例如在中、高或非常高度嚴(yán)緊的條件下),或者該最小尺寸是足以編碼具有本發(fā)明PUFAPKS系統(tǒng)至少一個域的生物活性的氨基酸序列的尺寸。因此,編碼這樣的蛋白質(zhì)的核酸分子的尺寸可能取決于核酸組成,核酸分子與互補序列之間的百分比同源性或同一性,以及雜交條件本身(例如溫度、鹽濃度和甲酰胺濃度)。用作寡核苷酸引物或探針的核酸分子的最小尺寸,如果所述核酸分子是富含GC的,則典型地為至少大約12-大約15個核苷酸長;如果是富含AT的,則典型地為至少大約15-大約18個堿基長。除了實踐的限制之外,本發(fā)明核酸分子的最大尺寸沒有限制核酸分子可以包含足以編碼PUFAPKS系統(tǒng)的域的生物活性片段、PUFAPKS系統(tǒng)的完整域、PUFAPKS系統(tǒng)開放閱讀框(Orf)內(nèi)的數(shù)個域、PUFAPKS系統(tǒng)的完整Orf、或PUFAPKS系統(tǒng)的超過一個Orf的序列。在本發(fā)明的一個實施方案中,分離的核酸分子包含,基本上組成為,或者組成為編碼從下組選出的氨基酸序列的核酸序列SEQIDNO2,SEQIDN0:4、SEQIDN0:6、SEQIDN0:8、SEQIDNO10,SEQIDNO13,SEQIDNO18,SEQIDNO:20、SEQIDNO:22、SEQIDNO24,SEQIDNO26,SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO39,SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、或SEQIDNO:74,或其生物活性片段。在一個方面中,核酸分子選自下組SEQIDNO1,SEQIDN0:3、SEQIDNO5,SEQIDNO:7、SEQIDN0:9、SEQIDN0:12、SEQIDNO17,SEQIDNO19,SEQIDNO:21、SEQIDNO:23、SEQIDNO25,SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:34、SEQIDNO36,SEQIDNO:37、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO59,SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO70,SEQIDN0:71、SEQIDNO:72、SEQIDNO:73或SEQIDNO:75。在本發(fā)明的一個實施方案中,任何上述PUFAPKS氨基酸序列以及此類序列的同源物在產(chǎn)生時,可以在給定氨基酸序列的C和/或N末端的側(cè)翼各帶有從至少1個到最多大約20個額外的異源氨基酸。最終的蛋白和多肽可以稱作“基本上組成為”所述給定的氨基酸序列。根據(jù)本發(fā)明,異源氨基酸是這樣的一系列氨基酸它們不是天然存在于(即非天然出現(xiàn)于體內(nèi))給定氨基酸序列兩側(cè),或者它們不會被給定氨基酸序列的天然編碼核酸序列在基因中出現(xiàn)時位于其側(cè)翼的核苷酸所編碼,如果使用該給定氨基酸序列所來源的生物體的標(biāo)準(zhǔn)密碼子用法對天然序列中的這些核苷酸進(jìn)行翻譯的話。類似地,詞組“基本上組成為”,當(dāng)在本文中用于核酸序列時,是指如下的編碼給定氨基酸序列的核酸序列,其在編碼該給定氨基酸序列的核酸序列5’和/或3’的任一端的側(cè)翼可以分別存在至少1個到多達(dá)大約60個額外的異源核苷酸。當(dāng)編碼該給定氨基酸序列的核酸序列出現(xiàn)在異源核苷酸是在天然基因中不是天然存在于(即,在體內(nèi)是非天然的)的兩側(cè)。本發(fā)明還包括分離的核酸分子,其包括編碼具有PUFAPKS系統(tǒng)至少一個域的生物活性的氨基酸序列的核酸序列。在一個方面中,這種核酸序列編碼上述任何PUFAPKS蛋白或域的同源物,其中該同源物具有本文在前面描述的PUFAPKS系統(tǒng)的至少一個(或者兩個、三個、四個或更多個)域的生物活性。在本發(fā)明的一個方面中,本發(fā)明涵蓋的PUFAPKS蛋白或域的同源物,包括與從下組選出的氨基酸序列的至少500個連續(xù)氨基酸具有至少大約60%同一性的氨基酸序列SEQIDN0:2、SEQIDN0:4、SEQIDNO:6、SEQIDNO39,SEQIDNO52,SEQIDNO:62或SEQIDNO:74;其中所述氨基酸序列具有PUFAPKS系統(tǒng)的至少一個域的生物活性。在一個進(jìn)一步的方面中,同源物的氨基酸序列與SEQIDN0:2、SEQIDN0:4、SEQIDN0:6、SEQIDNO39,SEQIDNO:52、SEQIDN0:62或SEQIDNO:74中任一個序列的至少大約600個連續(xù)氨基酸,更優(yōu)選地至少大約700個連續(xù)氨基酸,更優(yōu)選地至少大約800個連續(xù)氨基酸,更優(yōu)選地至少大約900個連續(xù)氨基酸,更優(yōu)選地至少大約1000個連續(xù)氨基酸,更優(yōu)選地至少大約1100個連續(xù)氨基酸,更優(yōu)選地至少大約1200個連續(xù)氨基酸,更優(yōu)選地至少大約1300個連續(xù)氨基酸,更優(yōu)選地至少大約1400個連續(xù)氨基酸,更優(yōu)選地至少大約1500個連續(xù)氨基酸,或者與SEQIDN0:6、SEQIDNO62或SEQIDNO:74的全長至少大約60%同一。在一個進(jìn)一步的方面中,同源物的氨基酸序列與SEQIDN0:2、SEQIDNO:4、SEQIDNO:39或SEQIDNO:52中任一個序列的至少大約1600個連續(xù)氨基酸,更優(yōu)選地至少大約1700個連續(xù)氨基酸,更優(yōu)選地至少大約1800個連續(xù)氨基酸,更優(yōu)選地至少大約1900個連續(xù)氨基酸,更優(yōu)選地至少大約2000個連續(xù)氨基酸,或者與SEQIDNO4或SEQIDNO52的全長至少大約60%同一。在一個進(jìn)一步的方面中,同源物的氨基酸序列與SEQIDNO:2或SEQIDNO39中任一個序列的至少大約2100個連續(xù)氨基酸,更優(yōu)選地至少大約2200個連續(xù)氨基酸,更優(yōu)選地至少大約2300個連續(xù)氨基酸,更優(yōu)選地至少大約2400個連續(xù)氨基酸,更優(yōu)選地至少大約25000個連續(xù)氨基酸,更優(yōu)選地至少大約2600個連續(xù)氨基酸,更優(yōu)選地至少大約2700個連續(xù)氨基酸,更優(yōu)選地至少大約2800個連續(xù)氨基酸,甚至更優(yōu)選地與其全長至少大約60%。在另一個方面中,本發(fā)明涵蓋的PUFAPKS蛋白或域的同源物包含這樣的氨基酸序列,該序列在上文各段中描述的任何連續(xù)氨基酸長度上與任一上文描述的氨基酸序列具有至少大約65%的同一性,更優(yōu)選地具有至少大約70%的同一性,更優(yōu)選地具有至少大約80%的同一性,更優(yōu)選地具有至少大約85%的同一性,更優(yōu)選地具有至少大約90%的同一性,更優(yōu)選地具有至少大約95%的同一性,更優(yōu)選地具有至少大約96%的同一性,更優(yōu)選地具有至少大約97%的同一性,更優(yōu)選地具有至少大約98%的同一性,更優(yōu)選地具有至少大約99%的同一性,其中該氨基酸序列具有PUFAPKS系統(tǒng)的至少一個域的生物活性。在一個方面中,本發(fā)明涵蓋的PUFAPKS蛋白或域的同源物包含這樣的氨基酸序列,所述序列與從下組選出的氨基酸序列具有至少大約60%的同一性SEQIDNO:8、SEQIDNO:10、SEQIDNO:13、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:48、SEQIDNO:50、SEQIDNO:54、SEQIDNO56,SEQIDNO58,SEQIDNO60,SEQIDNO64,SEQIDNO66,SEQIDN0:68,或包括這些氨基酸序列任一個的組合的氨基酸序列,其中所述氨基酸序列具有PUFAPKS系統(tǒng)的至少一個域或其輔助蛋白的生物活性。在一個進(jìn)一步的方面中,同源物的氨基酸序列與上述任一氨基酸序列具有至少大約65%的同一性,更優(yōu)選地具有至少大約70%的同一性,更優(yōu)選地具有至少大約80%的同一性,更優(yōu)選地具有至少大約85%的同一性,更優(yōu)選地具有至少大約90%的同一性,更優(yōu)選地具有至少大約95%的同一性,更優(yōu)選地具有至少大約96%的同一性,更優(yōu)選地具有至少大約97%的同一性,更優(yōu)選地具有至少大約98%的同一性,更優(yōu)選地具有至少大約99%的同一性,其中該氨基酸序列具有PUFAPKS系統(tǒng)的至少一個域或其輔助蛋白的生物活性。根據(jù)本發(fā)明,在指示本文所述的核算或氨基酸序列時,術(shù)語“毗鄰的,,或“連續(xù)的,,的意思是連接形成不間斷的序列。例如,所謂第一序列包含第二序列的30個毗鄰(或連續(xù))氨基酸,是指第一序列包括30個氨基酸殘基的不間斷序列,該序列與第二序列中30個氨基酸殘基的不間斷序列具有100%的同一性。類似地,關(guān)于與第二序列具有“100%同一性”的第一序列,是指第一序列與第二序列精確匹配,在核苷酸或氨基酸之間無缺口。如本文所使用的,除非特別指出,所稱百分比(%)同一性是指對用如下方法執(zhí)行的同源性估計=(I)BLAST2.0BasicBLAST同源性搜索,其中使用blastp進(jìn)行氨基酸搜索,使用blastn進(jìn)行核酸搜索,及使用blastX進(jìn)行核酸搜索和所有6個開放閱讀框中被翻譯氨基酸的搜索,均使用標(biāo)準(zhǔn)默認(rèn)參數(shù),其中默認(rèn)對查詢序列進(jìn)行低復(fù)雜性區(qū)(lowcomplexityregions)過濾(在下列文獻(xiàn)中有說明Altschul,S.F.,Madden,Τ.L.,Schaaffer,Α·Α.,Zhang,J.,Zhang,Ζ.,Miller,W.&Lipman,D.J.(1997)“GappedBLASTandPSI-BLAST-.anewgenerationofproteindatabasesearchprograms."NucleicAcidsRes.25:3389-3402,本文援引并入其全部內(nèi)容);(2)BLAST2比對(使用下文所述的參數(shù));(3)和/或PSI-BLAST,使用標(biāo)準(zhǔn)默認(rèn)參數(shù)(位置特異性迭代BLAST)。需要注意,由于BLAST2.OBasicBLAST和BLAST2之間標(biāo)準(zhǔn)參數(shù)存在一些差異,有可能在使用BLAST2程序時兩個具體的序列具有顯著同源性,而在BLAST2.0BasicBLAST中用其中一個序列作為質(zhì)詢序列進(jìn)行搜索時第二個序列可能不會被識別為高匹配。此外,PSI-BLAST提供一種自動、易用的“譜”搜索,這是一種靈敏的尋找序列同源物的方法。該程序首先執(zhí)行一個帶缺口的BLAST數(shù)據(jù)庫搜索。PSI-BLAST程序使用來自返回的任何顯著性比對(significantalignments)的信息來構(gòu)建位置特異性評分矩陣(position-specificscorematrix),用其取代查詢序列用于下一輪數(shù)據(jù)庫搜索。因此,應(yīng)當(dāng)理解,百分比同一性可使用這些程序中的任何一種來確定。兩個具體的序列可以用BLAST2序列相互比對,見TatusovaandMadden,(1999),“Blast2sequences_anewtoolforcomparingproteinandnucleotidesequences“,F(xiàn)EMSMicrobiolLett.174:247_250,本文援引并入其全部內(nèi)容。BLAST2序列比對在blastp或blastn中進(jìn)行,使用BLAST2.0算法在兩個序列之間執(zhí)行帶缺口的BLAST搜索(GappedBlastSearch)(BLAST2.0),其中允許在所得的比對中引入缺口(刪除和插入)。這里為了清楚起見,使用如下的標(biāo)準(zhǔn)默認(rèn)參數(shù)執(zhí)行BLAST2序列比對。對于blastn,使用0BL0SUM62矩陣匹配加分[rewardformatch]=1錯配罰分[penaltyformismatch]=_2開放缺口[opengap](5)和延伸缺口[extensiongap](2)罰分缺口x_脫落[gapx_dropoff](50)期望「expectl(10)字長[wordsize](11)過濾[filter](開)對于blastp使用0BL0SUM62矩陣開放缺口(11)和延伸缺口(1)罰分缺口x_脫落(50)期望(10)字長⑶過濾(開)。在本發(fā)明的另一個實施方案中,具有本發(fā)明PUFAPKS系統(tǒng)的至少一個域的生物活性的氨基酸序列包括如下所述的氨基酸序列,其與天然PUFAPKS蛋白質(zhì)或多肽足夠相似,以至于編碼該氨基酸序列的核酸序列能夠在中等、高或非常高嚴(yán)緊度的條件(如下所述)下與編碼天然PUFAPKS蛋白質(zhì)或多肽的核酸分子(即,與編碼天然PUFAPKS蛋白質(zhì)或多肽的核酸分子(即,與編碼天然PUFAPKS蛋白質(zhì)或多肽的核酸的核酸鏈的互補物)雜交。優(yōu)選地,具有本發(fā)明PUFAPKS系統(tǒng)的至少一個域的生物活性的氨基酸序列由這樣的核酸序列編碼,該核酸序列可在中、高或非常高嚴(yán)緊度條件下與編碼下述蛋白質(zhì)的核酸序列的互補物雜交,所述蛋白質(zhì)如本文所述的任何氨基酸序列所代表的氨基酸序列。在本發(fā)明的另一個實施方案中,本發(fā)明的核苷酸序列是這樣的核苷酸序列,其是從裂殖壺菌屬的核苷酸序列分離的(能夠從其獲得的)、與其相同的、或是其同源物,其中所述來自裂殖壺菌屬的核苷酸序列(包括來自裂殖壺菌屬的DNA分子的任一鏈)可在中、高或非常高度嚴(yán)緊的條件下與編碼任一如下氨基酸序列的核苷酸序列雜交SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:13、SEQIDNO:18、SEQIDNO20,SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30或SEQIDN0:32。在一個實施方案中,裂殖壺菌屬是裂殖壺菌屬ATCC20888。在另一個實施方案中,裂殖壺菌屬是裂殖壺菌屬20888的子菌株,包括其突變菌株(例如N230D)。在一個實施方案中,核酸分子可在中、高或非常高嚴(yán)緊度的條件下與從下選出的核苷酸序列雜交SEQIDN0:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:12、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO27、SEQIDN0:29或SEQIDNO:31。在本發(fā)明的另一個實施方案中,本發(fā)明的核苷酸序列是這樣的核苷酸序列,其是從破囊壺菌屬的核苷酸序列分離的(能夠從其獲得的)、與其相同的、或是其同源物,其中所述來自破囊壺菌屬的核苷酸序列(包括來自破囊壺菌屬DNA分子的任一鏈)可以在中、高或非常高度嚴(yán)緊的條件下與編碼任一如下氨基酸序列的核苷酸序列雜交SEQIDN039,SEQIDN0:41、SEQIDNO43、SEQIDNO45、SEQIDNO:48、SEQIDNO:50、SEQIDNO52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO64,SEQIDNO:66、SEQIDNO:68。在一個實施方案中,裂殖壺菌屬是破囊壺菌23B(ATCC20892)。在一個實施方案中,核酸分子可在中、高或非常高嚴(yán)緊度的條件下與選自下組的核苷酸序列雜交:SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO59,SEQIDN0:61、SEQIDNO63,SEQIDNO:65或SEQIDNO:67。在另外一個實施方案中,本發(fā)明的核苷酸序列是這樣的核苷酸序列,其是從真核生物體(例如破囊壺菌或網(wǎng)粘菌(Iabyrinthulid))或海洋細(xì)菌的核苷酸序列分離的(能夠從其獲得的)、與其相同的、或是其同源物,其中所述核苷酸序列能夠在中、高或非常高度嚴(yán)緊的條件下與編碼本文任一氨基酸序列的核苷酸序列雜交。在另一個實施方案中,本發(fā)明的核苷酸序列是這樣的核苷酸序列,其是從任何編碼本文所述輔助蛋白的核苷酸序列分離的(能夠從其獲得的)、與其相同的、或是其同源物,其中,在一個實施方案中,該核苷酸序列可在中、高或非常高度嚴(yán)緊的條件下與編碼SEQIDNO:34所代表的氨基酸序列的核苷酸序列雜交。在一個實施方案中,核酸序列可在中、高或非常高度嚴(yán)緊的條件下與SEQIDNO:33所代表的核苷酸序列雜交。在另一個實施方案中,本發(fā)明的核苷酸序列是這樣的核苷酸序列,其是從本文所述的任何密碼子優(yōu)化或嵌合核苷酸序列(包括DNA分子的任一鏈)分離的(能夠從其獲得的)、與其相同的、或是其同源物,其中,在一個實施方案中,該核苷酸序列能夠在中、高或非常高度嚴(yán)緊的條件下與編碼SEQIDNO:74所代表的氨基酸序列的核苷酸序列雜交。在一個實施方案中,核酸序列能夠在中、高或非常高度嚴(yán)緊的條件下與從下組選出的核苷酸序列雜交SEQIDNO35,SEQIDNO36,SEQIDNO37,SEQIDNO69,SEQIDNO70,SEQIDN0:71、SEQIDNO72、SEQIDNO73或SEQIDNO:75。推定互補序列的方法是本領(lǐng)域技術(shù)人員已知的。應(yīng)當(dāng)注意,因為氨基酸序列和核酸序列技術(shù)并非完全不出錯,所以本文提供的序列,最多代表本發(fā)明PUFAPKS域和蛋白、或編碼這些氨基酸序列的核苷酸序列的表觀序列。如本文所使用的,雜交條件是指標(biāo)準(zhǔn)雜交條件,在該條件下使用核酸分子鑒定相似的核酸分子。這些標(biāo)準(zhǔn)條件在下列文獻(xiàn)中公開Sambrook等,MolecularCloning=ALaboratoryManual,ColdSpringHarborLabsPress(1989)。本文弓|用Sambrook等如上的文獻(xiàn)全部內(nèi)容作為參考(具體見第9.31-9.62頁)。此外,在例如Meinkoth等,Anal.Biochem.138,267(1984)中公開了計算的合適雜交和洗滌條件,以實現(xiàn)允許不同程度的核苷酸錯配的雜交的公式;本文援引并入Meinkoth等的上述論文的全部內(nèi)容。更具體地,本文涉及的中等嚴(yán)緊度的雜交和沖洗條件是指如下條件,其允許與用于探測雜交反應(yīng)的核酸分子具有至少大約70%的核酸序列同一性的核酸分子的分離(也就是說,允許大約30%或更少核苷酸錯配的條件)。本文涉及的高嚴(yán)緊度的雜交和洗滌條件是指如下條件其允許與用于探測雜交反應(yīng)的核酸分子具有至少大約80%的核酸序列同一性的核酸分子的分離(也就是說,允許大約20%或更少的核苷酸錯配的條件)。本文涉及的非常高嚴(yán)緊度的雜交和洗滌條件是指如下條件其允許與用于探測雜交反應(yīng)的核酸分子具有至少大約90%的核酸序列同一性的核酸分子的分離(也就是說,允許大約10%或更少的核苷酸錯配的條件)。如上面討論的,本領(lǐng)域技術(shù)人員可以使用Meinkoth等(同上)中的公式計算合適的雜交和洗滌條件,以實現(xiàn)這些特定的核苷酸錯配水平。這些條件會根據(jù)所形成的是DNARNA還是DNADNA雜交體而變化。DNADNA雜交體算得的熔點比DNARNA雜交體低10°C。在特定的實施方案中,對于DNA:DNA雜交體的嚴(yán)緊雜交條件包括在大約20°C到大約35°C之間(低嚴(yán)緊度),更優(yōu)選在大約28°C到大約40°C之間(更嚴(yán)緊的),更優(yōu)選在大約35°C到大約45°C之間(更嚴(yán)緊的)的溫度條件下,在6XSSC(0.9MNa+)的離子強度下進(jìn)行雜交,以及合適的洗滌條件。在具體的實施方案中,對于DNA:RNA雜交體的嚴(yán)緊雜交條件包括在大約30°C到大約45°C之間,更優(yōu)選在大約38°C到大約50°C之間,更優(yōu)選在大約45°C到大約55°C之間的溫度條件下,在6XSSC(0.9MNa+)的離子強度下進(jìn)行雜交,以及相似的嚴(yán)緊洗滌條件。這些值是基于大于約100個核苷酸的分子、0%甲酰胺、及大約40%的G+C含量的熔點的計算結(jié)果?;蛘?,Tm可以根據(jù)Sambrook等,如上,第9.31-9.62頁中提出的那樣經(jīng)驗地計算。一般地,洗滌條件應(yīng)盡可能嚴(yán)緊,并應(yīng)適合于所選的雜交條件。例如,雜交條件可包括特定雜交體的計算Tm低大約20-25°C的鹽和溫度條件的組合,洗滌條件通常包括比特定雜交體的計算Tm低大約12-20°C的鹽和溫度條件的組合。適合于DNA:DNA雜交體使用的雜交條件的一個實例包括在大約42°C條件下在6XSSC(50%甲酰胺)中雜交2-24小時,隨后進(jìn)行洗滌步驟,其包括在室溫下在大約2XSSC中洗滌1次或多次,隨后在更高溫度和更低離子強度下進(jìn)行進(jìn)一步的洗滌(例如,在大約37°C和大約0.1X-0.5XSSC中進(jìn)行至少一次洗滌,隨后在大約68°C和大約0.1X-0.5XSSC中進(jìn)行至少一次洗滌)。本發(fā)明的再另外一個實施方案包括如下的核酸分子,其包含、基本上組成為、或組成為這樣的核酸序列,該核酸序列與從下面選出的質(zhì)粒的核酸序列相同或是其同源物(如上文定義的):pJKl126(ATCC登錄號PTA-7648)、ρJKl129(ATCC登錄號ΡΤΑ-7649)、pJKl131(ATCC登錄號PTA-7650)、pJK306(ATCC登錄號PTA-7641)、pJK320(ATCC登錄號pTA-7644)、pJK324(ATCC登錄號PTA-7643)、pBR002(ATCC登錄號PTA-7642)、Th23B0rfA_pBR812.1(ATCC登錄號PTA-8232)Th23B0rfA_pBR811(ATCC登錄號PTA-8231)、Th23B0rfB_pBR800(ATCC登錄號PTA-8227)或Th23B0rfC_pBR709A(ATCC登錄號PTA-8228)。在另一個實施方案中,本發(fā)明包括如下的核酸分子,其包含、基本上組成為、或組成為這樣的核酸序列,該核酸序列與從下組選出的質(zhì)粒的核酸序列相同或是其同源物(如上文定義的)pThOrfC-synPS(ATCC登錄號PTA-8229)、pDS49(ATCC登錄號TA-8230)、pDD24(ATCC登錄號PTA-8226)、pDD26(ATCC登錄號PTA-8411)、pDD32(ATCC登錄號PTA-8412)或0rfB*_pJK780(ATCC登錄號PTA-8225)。本發(fā)明的再一個實施方案包括如下的核酸分子,其包含、基本上組成為、或組成為這樣的核酸序列,該核酸序列編碼與由下面選出的質(zhì)粒編碼的氨基酸序列相同或是其同源物(如上文定義)的氨基酸序列pJKl126(ATCC登錄號PTA-7648),pJKl129(ATCC登錄號PTA-7649),pJK1131(ATCC登錄號PTA-7650),pJK306(ATCC登錄號PTA-7641),PJK320(ATCC登錄號PTA-7644),pJK324(ATCC登錄號PTA-7643),pBR002(ATCC登錄號PTA-7642),Th23B0rfA_pBR812.1(ATCC登錄號PTA-8232)Th23B0rfA_pBR811(ATCC登錄號PTA-8231),Th23B0rfB_pBR800(ATCC登錄號PTA-8227)或Th23B0rfC_pBR709A(ATCC登錄號PTA-8228)。在另一個實施方案中,本發(fā)明包括包括如下的核酸分子,其包含、基本上組成為、或組成為這樣的核酸序列,該核酸序列編碼與由下面選出的質(zhì)粒編碼的氨基酸序列相同或是其同源物(如上文定義)的氨基酸序列pThOrfC-synPS(ATCC登錄號PTA-8229)、pDS49(ATCC登錄號PTA-8230)、pDD24(ATCC登錄號PTA-8226)、pDD26(ATCC登錄號PTA-8411)、pDD32(ATCC登錄號PTA-8412)、or0rfB*_pJK780(ATCC登錄號PTA-8225)。本發(fā)明的另一個實施方案包括一種重組核酸分子,其包括重組載體和包含編碼氨基酸序列的核酸序列的核酸分子,所述氨基酸序列具有如本文所述PUFAPKS系統(tǒng)的至少一個域或蛋白的生物活性。這類核酸序列、域或蛋白在上文中有詳細(xì)描述。根據(jù)本發(fā)明,重組載體是一種工程化(即,人工產(chǎn)生)的核酸分子,其作為工具用于操縱選擇的核酸序列并將這種核酸序列引入到宿主細(xì)胞內(nèi)。因此,重組載體適用于對所選核酸序列進(jìn)行克隆、測序和/或操縱,例如通過將所選核酸序列表達(dá)和/或傳遞到宿主細(xì)胞內(nèi),形成重組細(xì)胞。這種載體通常含有異源核酸序列,即天然不存在于要克隆或遞送的核酸序列鄰近的核酸序列,盡管載體還可以含有天然存在于本發(fā)明的核酸分子鄰近的或者可用于表達(dá)本發(fā)明的核酸分子的調(diào)控核酸序列(將在下文詳細(xì)討論)(例如啟動子、非翻譯區(qū))。載體可以是RNA或DNA,原核或真核,且通常是質(zhì)粒。載體可以作為染色體外元件(例如質(zhì)粒)被保持,或者可以整合到重組生物體(例如微生物或植物)的染色體中。整個載體可以在宿主細(xì)胞內(nèi)保持在原位,或者,在某些條件下,質(zhì)粒DNA可以被缺失,留下本發(fā)明的核酸分子。整合的核酸分子可以受染色體啟動子的控制,受天然或質(zhì)粒啟動子的控制,或者受多個啟動子的組合的控制??梢杂袉蝹€拷貝或多個拷貝的核酸分子整合到染色體內(nèi)。本發(fā)明的重組載體可含有至少一個可選擇標(biāo)記。在一個實施方案中,本發(fā)明重組核酸分子中使用的重組載體是表達(dá)載體。如本文所使用的,詞組“表達(dá)載體”用來指適合于產(chǎn)生編碼產(chǎn)物(例如目的蛋白質(zhì))的載體。在本實施方案中,編碼待生產(chǎn)產(chǎn)物(例如PUFAPKS域或蛋白質(zhì))的核酸序列被插入到重組載體中而產(chǎn)生重組核酸分子。編碼待生產(chǎn)蛋白的核酸序列以這樣的方式插入到載體中,使得載體中核酸分子與調(diào)控序列可操作地連接,從而使核酸序列能夠在重組宿主細(xì)胞內(nèi)進(jìn)行轉(zhuǎn)錄和翻譯。在另一個實施方案中,本發(fā)明的重組核酸分子中使用的重組載體是靶向載體(targetingvactor)。如本文所使用的,詞組“靶向載體”用來指用于將特定核酸分子遞送到重組宿主細(xì)胞內(nèi)的載體,其中該核酸分子被用來刪除、失活或取代宿主細(xì)胞或微生物內(nèi)的內(nèi)源基因或基因的一部分(即,用于靶向性基因破壞(targetedgenedisruption)或敲除技術(shù))。這種載體在本領(lǐng)域也被稱作“敲除”載體。在本實施方案的一個方面中,載體的一部分,但更典型的是插入載體內(nèi)的核酸分子(即,插入序列),具有這樣的核酸序列,其與宿主細(xì)胞內(nèi)的靶基因(即,刪除和失活的目標(biāo)基因)的核酸序列同源。載體插入序列的核酸序列被設(shè)計成可與靶基因結(jié)合,使得靶基因和插入序列可進(jìn)行同源重組,借此使內(nèi)源靶基因缺失、失活、衰減(即通過內(nèi)源靶基因的至少一部分的突變或缺失)。通常,重組核酸分子包括本發(fā)明的至少一個核酸分子,其與一個或多個轉(zhuǎn)錄控制序列可操作連接。如本文所使用的,詞組“重組分子”或“重組核酸分子”主要是指與轉(zhuǎn)錄控制序列可操作連接的核酸分子或核酸序列,但是當(dāng)這種核酸分子是如本文所討論的重組分子時,其可與詞組“核酸分子”互換使用。根據(jù)本發(fā)明,詞組“可操作連接”是指將核酸分子與轉(zhuǎn)錄控制序列以這樣的方式相連接,使得該分子可以在被轉(zhuǎn)化(即轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、轉(zhuǎn)染、接合或引導(dǎo)(conduce))進(jìn)入宿主細(xì)胞時表達(dá)。轉(zhuǎn)錄控制序列是控制轉(zhuǎn)錄起始、延長或終止的序列。特別重要的轉(zhuǎn)錄控制序列是控制轉(zhuǎn)錄起始的序列,例如啟動子、增強子、操縱基因或阻遏蛋白序列。合適的轉(zhuǎn)錄控制序列包括任何能夠在該重組核酸分子所導(dǎo)入的宿主細(xì)胞或生物體中行使功能的轉(zhuǎn)錄控制序列。本發(fā)明的重組核酸分子還可包含其它調(diào)控序列,例如翻譯調(diào)控序列、復(fù)制起點和其它與所述重組細(xì)胞相容的調(diào)控序列。在一個實施方案中,本發(fā)明的重組分子,包括整合到宿主細(xì)胞染色體內(nèi)的重組分子,還含有分泌信號(也就是信號區(qū)段核酸序列),使被表達(dá)的蛋白能夠從產(chǎn)生該蛋白質(zhì)的細(xì)胞分泌出去。合適的信號區(qū)段包括與待表達(dá)的蛋白天然相關(guān)的信號區(qū)段,或者任何能夠指導(dǎo)根據(jù)本發(fā)明蛋白分泌的異源信號區(qū)段。在另一個實施方案中,本發(fā)明的重組分子包括前導(dǎo)序列,以使被表達(dá)的蛋白能夠被遞送并插入到宿主細(xì)胞的膜內(nèi)。合適的前導(dǎo)序列包括與蛋白質(zhì)天然相關(guān)的前導(dǎo)序列,或者任何能夠指導(dǎo)蛋白質(zhì)遞送到并插入細(xì)胞膜的異源前導(dǎo)序列。本發(fā)明人發(fā)現(xiàn)裂殖壺菌屬和破囊壺菌屬PUFAPKSOrfA和OrfB在基因組中緊密連鎖,并且這兩個Orf之間的區(qū)域已經(jīng)被測序。在裂殖壺菌屬中,這兩個Orf的方向相反(orientedinoppositedirection),兩個起始密碼子(ATG)之間相隔4244個堿基對(即它們被如下排列3,0rfA5,-4244bp-5,0rfB3')。對4244bp的基因間區(qū)域進(jìn)行檢查沒有發(fā)現(xiàn)任何明顯的Orf(BlastX搜索中沒有發(fā)現(xiàn)顯著性匹配)。OrfsA和B均在裂殖壺菌屬中高表達(dá),至少在產(chǎn)油期間是如此,提示在該基因間區(qū)域內(nèi)含有活性啟動子元件。這些遺傳元件被認(rèn)為可以用作雙向(bi-directional)啟動子序列,用于轉(zhuǎn)基因應(yīng)用。例如,在優(yōu)選實施方案中,可以克隆該區(qū)域,在每個末端放置任何目的基因,并將該構(gòu)建體引入到裂殖壺菌屬(或者該啟動子可以顯示功能的其它宿主)中。我們預(yù)測,在合適的條件下,該調(diào)節(jié)元件可以幫助兩個導(dǎo)入基因協(xié)調(diào)地高水平表達(dá)。含有裂殖壺菌屬PUFAPKS調(diào)節(jié)元件(例如啟動子)的調(diào)節(jié)區(qū)域的完整核苷酸序列在本文中用SEQIDN0:76表示。按照相似的方式,OrfC在產(chǎn)油期間在裂殖壺菌屬中高表達(dá),預(yù)期在其起始密碼子的上游區(qū)域有調(diào)節(jié)元件存在。OrfC上游的一個基因組DNA區(qū)域已經(jīng)被克隆和測序,在本文中用SEQIDN0:77表示。該序列含有直接位于OrfC起始密碼子的上游的3886nt。對該區(qū)域進(jìn)行檢查沒有發(fā)現(xiàn)任何明顯的Orf(BP,BlastX搜索中沒有發(fā)現(xiàn)顯著性匹配)。據(jù)信,該區(qū)域中所包含的調(diào)節(jié)元件在合適的條件下有助于定位于其后方的基因的高表達(dá)。因此,在合適的條件下,表達(dá)水平可能與受A-B基因間區(qū)域(SEQIDNO76)控制的基因相協(xié)調(diào)。因此,在一個實施方案中,如本文公開的可用于本發(fā)明的重組核酸分子可以包括SEQIDN0:76和/或SEQIDNO77中所含的PUFAPKS調(diào)節(jié)區(qū)域。這種調(diào)節(jié)區(qū)域可以包括SEQIDNO76和/或SEQIDNO77的至少具有基礎(chǔ)水平的PUFAPKS轉(zhuǎn)錄活性(至少基礎(chǔ)水平的啟動子活性)的任何部分(片段)??梢杂帽景l(fā)明的一個或多個重組分子產(chǎn)生本發(fā)明的編碼產(chǎn)物(例如PUFAPKS域、蛋白或系統(tǒng))。在一個實施方案中,通過在可有效產(chǎn)生所述蛋白質(zhì)的條件下表達(dá)本文所述的核酸分子來產(chǎn)生編碼產(chǎn)物。產(chǎn)生編碼蛋白質(zhì)的一種優(yōu)選方法是用一個或多個重組分子轉(zhuǎn)染宿主細(xì)胞,從而形成重組細(xì)胞。供轉(zhuǎn)染的合適的宿主細(xì)胞包括,但不限于,任何可被轉(zhuǎn)染的細(xì)菌、真菌(例如酵母)、昆蟲、植物或動物細(xì)胞。宿主細(xì)胞可以是未轉(zhuǎn)染的細(xì)胞或者已經(jīng)用至少一種其它重組核酸分子轉(zhuǎn)染的細(xì)胞。根據(jù)本發(fā)明,術(shù)語“轉(zhuǎn)染”用于指任何可將外源核酸分子(即重組核酸分子)插入細(xì)胞的方法。當(dāng)術(shù)語“轉(zhuǎn)化”用來指將核酸分子導(dǎo)入微生物細(xì)胞,例如藻類、細(xì)菌和酵母,或?qū)胫参锛?xì)胞時,其可與術(shù)語“轉(zhuǎn)染”互換使用。在微生物系統(tǒng)中,術(shù)語“轉(zhuǎn)化”用于描述由于微生物或植物獲得了外源核酸而承繼(inherited)的改變,與術(shù)語“轉(zhuǎn)染”基本上同義。然而,在動物細(xì)胞中,轉(zhuǎn)化具有第二種意思,其可以指例如培養(yǎng)中的細(xì)胞在癌化之后生長性質(zhì)的改變。因此,為了避免混淆,對于外源核酸導(dǎo)入動物細(xì)胞優(yōu)選使用術(shù)語“轉(zhuǎn)染”,并且,在這些術(shù)語與將外源核酸導(dǎo)入細(xì)胞相關(guān)的范圍內(nèi),本文將使用術(shù)語“轉(zhuǎn)染”來概括性地涵蓋動物細(xì)胞的轉(zhuǎn)染以及微生物細(xì)胞或植物細(xì)胞的轉(zhuǎn)化。因此,轉(zhuǎn)染技術(shù)包括,但不限于,轉(zhuǎn)化、粒子轟擊、電穿孔、顯微注射、脂質(zhì)轉(zhuǎn)染、吸附、感染和原生質(zhì)體融合。本領(lǐng)域技術(shù)人員將認(rèn)識到,使用重組DNA技術(shù),可以通過操縱例如宿主細(xì)胞內(nèi)核酸分子的拷貝數(shù)、那些核酸分子轉(zhuǎn)錄的效率、所得轉(zhuǎn)錄物翻譯的效率和翻譯后修飾效率等,來改善對被轉(zhuǎn)染的核酸分子表達(dá)的控制。此外,可以對啟動子序列進(jìn)行基因工程操作,以提高與天然啟動子相比的表達(dá)水平??捎糜诳刂坪怂岱肿颖磉_(dá)的重組技術(shù)包括,但不限于,將核酸分子整合到一條或多條宿主細(xì)胞染色體內(nèi)、向質(zhì)粒添加載體穩(wěn)定性序列、置換或修飾轉(zhuǎn)錄控制信號(例如啟動子、操縱基因、增強子)、置換或修飾翻譯控制信號(例如,核糖體結(jié)合位點、Shine-Dalgarno序列)、修飾核酸分子以符合宿主細(xì)胞的密碼子用法、和刪除使轉(zhuǎn)錄物不穩(wěn)定的序列。上面關(guān)于重組核酸分子和轉(zhuǎn)染宿主細(xì)胞的一般性論述可適用于本文所討論的任何核酸分子,包括編碼任何具有來自PUFAPKS系統(tǒng)的至少一個域的生物活性的氨基酸序列的核酸分子,編碼來自其它PKS系統(tǒng)的氨基酸序列的核酸分子,和編碼其它蛋白質(zhì)或域的核酸分子。本發(fā)明還涉及來自除本文具體描述的微生物之外的微生物,并且在結(jié)構(gòu)、域組織和/或功能上與本文描述的任何PUFAPKS系統(tǒng)(及其蛋白或域)同源的PUFAPKS系統(tǒng)(及其蛋白或域)。此外,本發(fā)明涉及在各種應(yīng)用中使用這些微生物和來自這些微生物的PUFAPKS系統(tǒng)或其組件(例如DH2域),用作根據(jù)本發(fā)明的PUFAPKS系統(tǒng)(例如遺傳修飾的生物體和產(chǎn)生生物活性分子的方法)。用于鑒定包含PUFAPKS系統(tǒng)的微生物的篩選過程在美國專利申請公開No.20020194641,見上文,中有詳細(xì)描述。本文所述的有關(guān)PUFAPKS蛋白和域的結(jié)構(gòu)和功能以及編碼它們的核苷酸序列的知識,是鑒定、確認(rèn)和/或分離這類蛋白或多核苷酸的有用工具。根據(jù)本發(fā)明,術(shù)語“破囊壺菌”(thraustochytrid)是指破囊壺菌目(Thraustochytriales)的7[壬{可@員,胃^llf舌石■H胃禾斗(Thraustochytriaceae)?!熬W(wǎng)粘菌(labyrinthulid)”是指網(wǎng)粘菌目(Labyrinthulales)的任何成員,包括網(wǎng)粘菌科(Labyrinthulaceae)。網(wǎng)粘菌科的成員從前曾被認(rèn)為是破囊壺菌目的成員,但是在此類生物體的分類法的修訂版本中,該科現(xiàn)在被認(rèn)為屬于網(wǎng)粘菌目,而網(wǎng)粘菌目和破囊壺菌目均被認(rèn)為屬于網(wǎng)粘菌門(Labyrinthulomycota)。破囊壺菌和網(wǎng)粘菌的分類隨著發(fā)展而經(jīng)常被修訂。然而,分類學(xué)理論現(xiàn)在已經(jīng)普遍將兩個群的微生物與原生藻菌(Stramenopile)世系中的水藻或類水藻原生生物放在一起。破囊壺菌和網(wǎng)粘菌當(dāng)前的分類學(xué)地位可以簡述如下界原生藻菌(Stramenopila)(Chromista)門網(wǎng)粘菌綱網(wǎng)粘菌目網(wǎng)粘菌科網(wǎng)粘菌目破囊壺菌科破囊壺菌然而,由于仍然存在分類的不確定性,對于本發(fā)明的目的而言,最好認(rèn)為本發(fā)明作為破囊壺菌描述的菌株包括如下生物體目破囊壺菌目;科破囊壺菌科;屬破囊壺菌屬(禾中arudimentale,aureum,benthicola,globosum,kinnei,motivum,multirudimentale,pachydermum,proliferum,roseum,striatum)、Ulkenia屬(禾中amoeboidea,kerguelensis,minuta,profunda,radiata,sailens,sarkariana,schizochytrops,visurgensis,yorkensis)、裂殖壺菌屬(禾中aggregatum,limnaceum,mangrovei,minutum,octosporum),Japonochytrium(禾中marinum)、Aplanochytrium屬(禾中:haliotidis,kerguelensis,profunda,stocchinoi)、Althornia(禾中:crouchii)屬、或Elina屬(種marisalba,sinorifica)。需要注意,Ulkenia屬的原始描述沒有發(fā)表在經(jīng)過同行評議的雜志上,因此關(guān)于該屬及其中物種的有效性仍然存在一些題。出于本發(fā)明的目的,Ulkenia中的物種將被看作是破囊壺菌屬的成員。本發(fā)明作為網(wǎng)粘菌描述的菌株包括如下的生物體目網(wǎng)粘菌,科網(wǎng)粘菌,屬網(wǎng)粘菌屬(禾中algeriensis,coenocystis,chattonii,macrocystis,macrocystisatlantica,macrocystismacrocystis,marina,minuta,roscoffensis,valkanovii,vitellina,vitellinapacifica,vitellinavitellina,zopfii),Labyrinthuloides屬(禾中:haliotidis,yorkensis),Labyrinthomyxa(禾中:marina),Diplophrys屬(禾中:archeri),Pyrrhosorus(禾中:marinus),Sorodiplophrys屬(禾中stercorea)或Chlamydomyxa屬(禾中l(wèi)abyrinthuloides,montana)(盡管關(guān)于Pyrrhosorus>Sorodiplophrys或Chlamydomyxa的精確分類學(xué)地位目前尚沒有達(dá)成一致)。為了用本發(fā)明的PUFAPKS系統(tǒng)產(chǎn)生顯著高產(chǎn)率的各種生物活性分子,可以對生物體,優(yōu)選微生物或植物或植物部分(例如植物細(xì)胞),進(jìn)行遺傳修飾,以影響PUFAPKS系統(tǒng)的活性。在一個方面中,這種生物體可內(nèi)源含有并表達(dá)PUFAPKS系統(tǒng),遺傳修飾可以是對該內(nèi)源PUFAPKS系統(tǒng)的一個或多個功能域的遺傳修飾,該修飾對PUFAPKS系統(tǒng)的活性具有一定影響。在另一個方面中,這種生物體可內(nèi)源含有并表達(dá)PUFAPKS系統(tǒng),且遺傳修飾可以是引入至少一個外源核酸序列(例如重組核酸分子),其中該外源核酸序列編碼來自同一或另一PKS系統(tǒng)和/或蛋白的至少一種可影響所述PUFAPKS系統(tǒng)的活性生物活性域或蛋白(例如磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶),下文討論)。在另外一個方面中,生物體不一定內(nèi)源(天然)地含有PUFAPKS系統(tǒng),而是被遺傳修飾而引入至少一種編碼具有PUFAPKS系統(tǒng)至少一個域的生物活性的氨基酸序列的重組核酸分子。在這個方面中,PUFAPKS活性受到生物體中PUFAPKS活性的引入或提高的影響。這些方面各自的相關(guān)實施方案將在下文有詳細(xì)討論。因此,根據(jù)本發(fā)明,一個實施方案涉及遺傳修飾的生物體,其中該生物體表達(dá)這樣的PKS系統(tǒng),其包括多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng)的至少一個生物活性域。所述PUFAPKS系統(tǒng)的至少一個域由如本文所述的核酸序列編碼。遺傳修飾影響所述PKS系統(tǒng)在所述生物體中的活性。遺傳修飾的生物體可以包括任何一個或多個上文指出的核酸序列,和/或任何在上文中詳細(xì)描述的PUFAPKSORF或域的其它同源物。如這里所使用的,遺傳修飾的微生物可以包括遺傳修飾的細(xì)菌、原生生物、微藻、真菌或其它微生物,并且特別地,屬于本文所述的破囊壺菌目中的屬的任何生物(例如破囊壺菌)。這種遺傳修飾的微生物的基因組相對于其正常(即,野生型或天然)的形式被修飾(即,突變或改變),從而獲得期望的結(jié)果(即,提高或改變PUFAPKS活性和/或使用PUFAPKS系統(tǒng)或其組分生產(chǎn)期望的產(chǎn)物)。微生物的遺傳修飾可以用經(jīng)典菌株開發(fā)和/或分子遺傳技術(shù)實現(xiàn)。這些技術(shù)是本領(lǐng)域已知的,并且在例如Sambrook等,1989,MolecularCloning:ALaboratoryManual,ColdSpringHarborLabsPress.中一般性地公開了用于微生物的這些技術(shù)。本文引用上述Sambrook等的文獻(xiàn)的全部內(nèi)容作為參考。遺傳修飾的微生物可以包括這樣的微生物,其中核酸分子被插入、刪除或修飾(即突變,例如通過核苷酸的插入、刪除、替換和/或倒置),從而在微生物體內(nèi)產(chǎn)生期望的效果。用來根據(jù)本發(fā)明加以修飾的優(yōu)選微生物宿主細(xì)胞包括,但不僅限于,任何細(xì)菌、原生生物、微藻、真菌或原生動物。在一個方面中,優(yōu)選的用于遺傳修飾的微生物包括,但不限于,任何破囊壺菌目的微生物或任何網(wǎng)粘菌目的微生物。用于本發(fā)明的特別優(yōu)選的宿主細(xì)胞包括來自如下屬的微生物,包括但不限于破囊壺菌屬、Ulkenia屬、裂殖壺菌屬、Japonochytrium屬、Aplanochytrium屬、Althornia屬、Elina屬、網(wǎng)豐占菌屬、Labyrinthuloides屬、Labyrinthomyxa屬、Diplophrys屬、Pyrrhosorus屬、Sorodiplophrys屬或Chlamydomyxa屬。用于遺傳修飾的合適宿主微生物的其它實例包括,但不限于,酵母,包括釀酒酵母(Saccharomycescerevisiae),卡爾酵母(Saccharomycescarlsbergensis),或其它酵母,例如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces),或其它真菌,例如絲狀真菌如曲霉屬(Aspergillus)、脈孢菌屬(Neurospora)、青霉屬(Penicillium)等。細(xì)菌細(xì)胞也可用作宿主。它們包括大腸桿菌(Escherichiacoli),其可用在發(fā)酵過程中?;蛘撸缛闂U菌屬菌種或芽孢桿菌屬菌種等宿主也可以用作宿主。本發(fā)明的另一個實施方案涉及遺傳修飾的植物或植物部分(例如,其中該植物已被遺傳修飾從而表達(dá)如本文所述的PUFAPKS系統(tǒng)),其至少包括核心PUFAPKS酶復(fù)合體,并且在一個實施方案中,包括至少一種PUFAPKS輔助蛋白(例如PPT酶),使得該植物產(chǎn)生PUFA。優(yōu)選地,植物是含油種子植物(oilseedplant),其中產(chǎn)油種子或產(chǎn)油種子中的油含有所述PUFAPKS系統(tǒng)所產(chǎn)生的PUFA。這些油含有可檢測量的至少一種目的PUFA或主要PUFA,它是PUFAPKS系統(tǒng)的產(chǎn)物。植物尚未知內(nèi)源含有PUFAPKS系統(tǒng),因此,本發(fā)明的PUFAPKS系統(tǒng)為人們提供了產(chǎn)生具有獨特脂肪酸生產(chǎn)能力的植物的機會。本發(fā)明特別優(yōu)選的實施例是對植物進(jìn)行遺傳工程化,從而在相同植物中產(chǎn)生一種或多種PUFA,包括EPA、DHA,DPA(n-3and/orn-6)、ARA、GLA、SDA及其它。本發(fā)明使得人們能夠制作比例不同、形式各異的各種“定制油”(designeroil)。植物遺傳工程化的方法是本領(lǐng)域已知的。例如,大量植物轉(zhuǎn)化方法已經(jīng)開發(fā)出來,包括生物和物理轉(zhuǎn)化方法。見例如Miki等,“ProceduresforlntroducingForeignDNAintoPlants"inMethodsinPlantMolecularBiologyandBiotechnology,Glick,B.R.andThompson,J.E.Eds.(CRCPress,Inc.,BocaRaton,1993)第67-88頁。此夕卜,可以獲得用于植物細(xì)胞或組織轉(zhuǎn)化和植物再生的載體和體外培養(yǎng)方法。見例如Gruber等,“VectorsforPlantTransformation"inMethodsinPlantMolecularBiologyandBiotechnology,Glick,B.R.andThompson,J.E.Eds.(CRCPress,Inc.,BocaRaton,1993)第89-119頁。用于將表達(dá)載體引入到植物內(nèi)的最廣泛使用的方法是基于土壤桿菌自然轉(zhuǎn)化系統(tǒng)。見例如Horsch等,Science227:1229(1985)。根瘤土壤桿菌(A.Tumefaciens)和發(fā)根土壤桿菌(A.rhizogenes)是可遺傳轉(zhuǎn)化植物細(xì)胞的植物致病土壤細(xì)菌。根瘤土壤桿菌和發(fā)根土壤桿菌的Ti和Ri質(zhì)粒分別攜帶負(fù)責(zé)植物遺傳轉(zhuǎn)化的基因。見例如Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。土壤桿菌載體系統(tǒng)和用于土壤桿菌介導(dǎo)的基因轉(zhuǎn)化方法的描述在大量參考文獻(xiàn)中有提供,包括Gruber等,同上,Miki等,同上,Moloney等,PlantCellReports8:238(1989),和美國專利4,940,838和5,464,763。另一種可通用的植物轉(zhuǎn)化方法是微粒介導(dǎo)的轉(zhuǎn)化(microproiectile-mediatedtransformation),其中DNA被攜載在微粒的表面上。通過基因槍(biolistic)設(shè)備將表達(dá)載體引入到植物組織中,其中基因槍將微粒加速到足以透過植物細(xì)胞壁和膜的速度。Sanford等,Part.Sci.Technol.527(1987),Sanford,J.C.,TrendsBiotech.6299(1988),Sanford,J.C.,Physiol.Plant79206(1990),Klein等,Biotechnology10268(1992)。另一種用于物理輸送DNA到植物的方法是靶細(xì)胞的超聲波降解法。Zhang等,Bio/Technology9:996(1991)。或者,脂質(zhì)體或原生質(zhì)體融合已經(jīng)用于將表達(dá)載體引入到植物中。Deshayes等,EMBOJ.,42731(1985),Christou等,ProcNatl.Acad.Sci.USA843962(1987)。利用CaC12沉淀、聚乙烯?;蚓?L-鳥氨酸直接將DNA吸收進(jìn)入原生質(zhì)體也已有報道。Hain等,Mol.Gen.Genet.199161(1985),和Draper等,PlantCellPhysiol.23451(1982)。還有人說明了對原生質(zhì)體和整個細(xì)胞和組織的電穿孔。Dorm等,InAbstractsofVIIthInternationalCongressonPlantCellandTissueCultureIAPTC,A2-38,p.53(1990);D'Halluin等,PlantCell4:1495-1505(1992)和Spencer等,PlantMol.Biol.2451-61(1994)。在將基因構(gòu)建體引入到植物細(xì)胞內(nèi)之后,使植物細(xì)胞生長,并且在分化組織(例如芽和根)出現(xiàn)時,即生成成熟植株。典型地產(chǎn)生多個植株。用于再生植株的方法學(xué)是本領(lǐng)域技術(shù)人員公知的,并可以在下列文獻(xiàn)中找到PlantCellandTissueCulture,1994,VasilandThorpeEds.KluwerAcademicPublishersandin:PlantCellCultureProtocols(MethodsinMolecularBiologylll,1999HallEdsHumanaPress)。如本文所使用的,遺傳修飾的植物可以包括任何遺傳修飾的植物,包括高等植物,特別地,任何可供消費的植物或可用于產(chǎn)生期望的本發(fā)明生物活性分子的植物。如本文所使用的,“植物部分”包括植物的任何部分,包括但不僅限于,種子(未成熟的或成熟的)、油、花粉、胚、花、果實、芽(shoots)、葉、根、莖、外植體等。遺傳修飾植物具有相對其正常(即野生型或天然)形式被修飾(即突變或改變)了的基因組,從而獲得期望的結(jié)果(例如PUFAPKS活性和PUFA的產(chǎn)生)。植物遺傳修飾可利用經(jīng)典的株系開發(fā)和/或分子遺傳技術(shù)來實現(xiàn)。產(chǎn)生基因組中納入了編碼所需氨基酸序列的重組核酸分子的轉(zhuǎn)基因植物的方法在本領(lǐng)域是已知的。根據(jù)本發(fā)明用于遺傳修飾的優(yōu)選植物優(yōu)選地是適于動物包括人類消耗的植物。根據(jù)本發(fā)明用于遺傳修飾的優(yōu)選植物(即植物宿主細(xì)胞)包括,但不限于,任何高等植物,包括雙子葉和單子葉植物,特別是可消耗植物,包括作物植物,特別是油用植物。這樣的植物可以包括,但不限于,例如油菜(canola)、大豆、蕓苔(rapeseed)、亞麻籽(linseed)、玉米、紅花、向日葵和煙草。因此,可以選擇任何植物物種或植物細(xì)胞。本文使用的并且從其生長或衍生出植物的特定細(xì)胞包括,但不僅限于,可以從如下植物獲得的細(xì)胞油菜(BrassicarapaL.);大豆(Glycinemax);蕓苔(Brassicaspp.);亞麻籽/亞麻(Linumusitatissimum);玉米(玉蜀黍)(Zeamays);紅花(Carthamustinctorius);向曰葵(Helianthusannuus);煙草(Nicotianatabacum);擬南芥(Arabidopsisthaliana),巴西堅果(Betholettiaexcelsa);蓖麻(Riccinuscommunis);椰子(Cocusnucifera);芫荽(Coriandrumsativum);棉花(Gossypiumspp.);落花生(Arachishypogaea);力口州希蒙得木(jojoba)(Simmondsiachinensis);芥末(Brassicaspp.禾口Sinapisalba);_胃(Elaeisguineeis);^iH(Oleaeurpaea);/JCfS(Oryzasativa);/R(Cucurbitamaxima);大麥(Hordeumvulgare);小麥(Traeticumaestivum);禾口浮萍(Lemnaceaesp.)。應(yīng)當(dāng)注意,依照本文所述,一種植物物種內(nèi)的遺傳背景可以不同。其它優(yōu)選的植物包括已知可產(chǎn)生用作藥劑、香味劑、營養(yǎng)添加劑、功能食品成分或化妝活性劑的植物,或者被遺傳修飾從而產(chǎn)生這些化合物/作用劑的植物。在一個進(jìn)一步的實施方案中,可以依照本發(fā)明使用植物細(xì)胞培養(yǎng)物。在這類實施方案中,不是使植物細(xì)胞生長成分化的植物和使用普通的農(nóng)業(yè)實踐方法進(jìn)行培養(yǎng),而是使其在液體培養(yǎng)基中生長和維持。根據(jù)本發(fā)明,遺傳修飾的微生物或植物包括用重組技術(shù)修飾的微生物或植物。如本文使用的,對于導(dǎo)致基因表達(dá)、基因功能或基因產(chǎn)物(即由該基因編碼的蛋白)功能的降低的遺傳修飾,可以稱作基因的失活(inactivation)(完全或部分)、缺失(deletion)、遮斷(interruption)、阻斷(blockage)或下調(diào)(down-regulation)。例如導(dǎo)致基因編碼蛋白的功能降低的基因遺傳修飾可以是下列因素造成的基因的完全缺失(即基因不存在,故蛋白質(zhì)不存在)、基因突變導(dǎo)致蛋白質(zhì)翻譯不完全或者不翻譯(例如,蛋白質(zhì)不表達(dá))、或者基因突變降低或完全破壞蛋白質(zhì)的自然功能(例如所表達(dá)的蛋白質(zhì)具有降低的或者沒有酶活性或作用)。導(dǎo)致基因表達(dá)或功能增加的遺傳修飾可以稱作基因的擴增(amplification)、過生產(chǎn)(overproduction)、過表達(dá)(overexpression)、活化(activation)、±曾強(enhancement)、±曾力口(addition)或上調(diào)(up-regulation)。根據(jù)本發(fā)明對微生物或植物的遺傳修飾,優(yōu)選可影響微生物或植物所表達(dá)的PKS系統(tǒng)的活性,不管該PKS系統(tǒng)是內(nèi)源性并被遺傳修飾,還是內(nèi)源性并具有引入到生物體中的重組核酸分子(可選擇修飾或者不修飾內(nèi)源系統(tǒng)),還是完全由重組技術(shù)提供的。根據(jù)本發(fā)明,“影響PKS系統(tǒng)的活性”包括任何這樣的遺傳修飾,與不存在該遺傳修飾相比,其導(dǎo)致該生物體表達(dá)的PKS系統(tǒng)產(chǎn)生任何可檢測的或可測量的變化或修飾。PKS系統(tǒng)的可檢測的變化或修飾包括,但不限于引入PKS系統(tǒng)活性到生物體中,從而使生物體具有可測量/可檢測的PKS系統(tǒng)活性(即生物體在所述遺傳修飾之前不含有PKS系統(tǒng)),向生物體引入來自與該生物體內(nèi)源表達(dá)的PKS系統(tǒng)不同的PKS系統(tǒng)的功能域,從而使PKS系統(tǒng)活性被修飾(例如,將來自一個PUFAPKS系統(tǒng)的DH2域引入到不同生物體的PUFAPKS系統(tǒng)中);改變PKS系統(tǒng)產(chǎn)生的生物活性分子的量(例如與未經(jīng)遺傳修飾相比,系統(tǒng)產(chǎn)生更多(增加的量)或者更少(降低的量)的給定產(chǎn)物);改變PKS系統(tǒng)產(chǎn)生的生物活性分子的類型(例如系統(tǒng)產(chǎn)生新的或不同的產(chǎn)物,或者產(chǎn)生該系統(tǒng)自然產(chǎn)生的PUFA或其它產(chǎn)物的變體);和/或改變PKS系統(tǒng)產(chǎn)生的多種生物活性分子的比例(例如系統(tǒng)產(chǎn)生的一種PUFA對另一種PUFA的比例不同,產(chǎn)生的脂質(zhì)譜與未經(jīng)遺傳修飾相比完全不同,或者將各種PUFA置于甘油三酯的相對天然構(gòu)型的不同位置)。這種遺傳修飾包括任何類型的遺傳修飾,并且尤其包括通過重組技術(shù)和/或通過經(jīng)典誘變造成的修飾。應(yīng)當(dāng)注意,稱“增加PUFAPKS系統(tǒng)中功能域或蛋白質(zhì)的活性”是指在包含該域或蛋白質(zhì)(或要引入該域或蛋白質(zhì))的生物體中進(jìn)行的任何導(dǎo)致所述域或蛋白質(zhì)系統(tǒng)的功能性(functionality)增加的遺傳修飾;可以包括域或蛋白質(zhì)的活性(例如比活性或體內(nèi)酶活性)的增加,域或蛋白質(zhì)系統(tǒng)所受的抑制或降解的減少,和域或蛋白質(zhì)的過表達(dá)。例如,可以增加基因拷貝數(shù),通過使用提供比天然啟動子更高的表達(dá)水平的啟動子來增加表達(dá)水平,或者通過可以通過基因工程操作或經(jīng)典誘變來改變基因,以增加該基因編碼的域或蛋白質(zhì)的活性。類似地,稱“降低PUFAPKS系統(tǒng)中功能域或蛋白質(zhì)的活性”是指在包含該域或蛋白質(zhì)(或者要引入該域或蛋白質(zhì))的生物體中進(jìn)行的任何導(dǎo)致域或蛋白質(zhì)系統(tǒng)的功能性降低的遺傳修飾,包括域或蛋白質(zhì)的活性的減少,域或蛋白質(zhì)系統(tǒng)所受的抑制或降解的增加,和域或蛋白質(zhì)的表達(dá)的降低或消除。例如,本發(fā)明域或蛋白質(zhì)作用的降低,可通過阻斷或降低該域或蛋白質(zhì)的產(chǎn)生,“敲除”編碼域或蛋白質(zhì)的基因或其部分,降低域或蛋白質(zhì)的活性,或者抑制域或蛋白質(zhì)的活性來實現(xiàn)。域或蛋白質(zhì)的產(chǎn)生的阻斷或降低可以包括將編碼該域或蛋白質(zhì)的基因置于需要在生長培養(yǎng)基中存在誘導(dǎo)化合物的啟動子的控制之下。通過建立使培養(yǎng)基中誘導(dǎo)物耗盡的條件,可以關(guān)閉編碼所述域或蛋白質(zhì)的基因的表達(dá)(從而關(guān)閉蛋白質(zhì)的合成)。域或蛋白質(zhì)的活性的阻斷或降低還可包括使用與美國專利4,743,546(本文援引并入該專利的內(nèi)容)中描述的方法相似的切除手段。為了使用該手段,將編碼感興趣的蛋白的基因克隆到特定基因序列之間,從而使該基因能夠被特異地、可控地從基因組中切除。切除的引發(fā)可以通過例如培養(yǎng)物的培養(yǎng)溫度的改變(例如在美國專利No.4,743,546中那樣)或者通過其它一些物理信號或營養(yǎng)信號來實現(xiàn)。在本發(fā)明的一個實施方案中,遺傳修飾包括對內(nèi)源(天然)表達(dá)型PUFAPKS系統(tǒng)的編碼核酸序列的修飾,其中通過例如經(jīng)典誘變和選擇技術(shù)和/或分子遺傳技術(shù),包括基因工程技術(shù),對天然含有這種系統(tǒng)的微生物進(jìn)行遺傳修飾?;蚬こ碳夹g(shù)可包括,例如,使用靶向重組載體來刪除內(nèi)源基因的一部分,或者用異源序列替換內(nèi)源基因的一部分??梢詫?dǎo)入宿主基因組中的異源序列的實例包括編碼來自另一PUFAPKS系統(tǒng)的至少一個功能性域的序列,所述另一個PKS系統(tǒng)包括例如不同的PUFAPKS系統(tǒng)(細(xì)菌或非細(xì)菌)、I型PKS系統(tǒng)(重復(fù)性或模塊性)、II型PKS系統(tǒng)或III型PKS系統(tǒng)。其它可導(dǎo)入宿主基因組的異源序列包括編碼這樣的蛋白或域的序列該蛋白或域本身不是核心PKS系統(tǒng)的域,但會影響內(nèi)源PKS系統(tǒng)的活性。例如可以將編碼磷酸泛酰巰基乙胺基轉(zhuǎn)移酶的核酸分子導(dǎo)入宿主基因組(下文中討論)。下文中詳細(xì)討論了可對內(nèi)源PUFAPKS系統(tǒng)進(jìn)行的特定修飾。在本發(fā)明的這個實施方案的另一個方面中,遺傳修飾包括(1)向同源或異源宿主細(xì)胞或生物體中導(dǎo)入編碼具有PUFAPKS系統(tǒng)至少一個域的生物活性的氨基酸序列的重組核酸分子;和/或(2)向宿主細(xì)胞或生物體中導(dǎo)入編碼影響PUFAPKS系統(tǒng)活性的蛋白質(zhì)或功能域的重組核酸分子。宿主可以包括(1)不表達(dá)任何用于產(chǎn)生PUFA的PKS系統(tǒng)的宿主細(xì)胞或生物,其中將PKS系統(tǒng)的所有功能域?qū)氲皆撍拗骷?xì)胞中;(2)表達(dá)用于產(chǎn)生PUFA的PKS系統(tǒng)(內(nèi)源的或重組)的宿主細(xì)胞,將至少一個額外的PUFAPKS域或蛋白引入到該細(xì)胞或生物體中。換言之,本發(fā)明意圖涵蓋任何這樣的遺傳修飾細(xì)胞或生物體(例如微生物或植物),其中該生物體包括至少一個本文所述的PUFAPKS域或蛋白,或者被遺傳修飾從而產(chǎn)生如本文所述的再合成和/或嵌合PUFAPKS域或蛋白。因此,利用本文提供的指導(dǎo),以及本文描述的和在本發(fā)明之前已知的關(guān)于PUFAPKS系統(tǒng)的描述,可以通過基因混合(或核酸分子的混合)來擴展表達(dá)PUFAPKS系統(tǒng)的生物體的PUFA產(chǎn)物的范圍、PUFA產(chǎn)物的比例及其生產(chǎn)水平;其中所述基因混合可以通過例如產(chǎn)生如本文詳述的嵌合蛋白和/或嵌合PUFAPKS系統(tǒng)來實現(xiàn)。例如,本文的教導(dǎo)可以用于提高PUFA的產(chǎn)量,改變某一種PUFA對另一種PUFA的比例,包括ω-3對ω-6PUFA的比例,和將PUFAPKS產(chǎn)物的范圍擴展到包括EPA、DPA(n-3或n_6)、DHA、ARA、GLA、SDA等,以及產(chǎn)生多種多樣的生物活性分子,包括抗生素、其它藥物化合物和其它期望的產(chǎn)物。獲得這些改進(jìn)的方法不僅包括混合來自各種生物體的基因,還包括各種遺傳修飾本文所述PUFAPKS基因和核酸分子的方法。有關(guān)本發(fā)明的細(xì)菌PUFAPKS系統(tǒng)的遺傳基礎(chǔ)和域結(jié)構(gòu)的知識為人們設(shè)計新型遺傳修飾生物體提供了基礎(chǔ)。舉例而言,下列文獻(xiàn)中就遺傳修飾和生物活性分子的問題討論了PUFAPKS系統(tǒng)的各種可能操作方式美國專利申請公開No.20020194641,美國專利申請公開No.20040235127,和美國專利申請公開No.20050100995,同上。不過,本發(fā)明提供了關(guān)于操縱宿主生物體的PUFA生產(chǎn)水平和操縱由宿主生物體產(chǎn)生的PUFA比例的新實施方案。因此,本發(fā)明涵蓋通過如下手段遺傳修飾微生物或植物細(xì)胞的方法遺傳修飾生物體內(nèi)的至少一種核酸分子和/或表達(dá)至少一個重組核酸分子,其中所述核酸分子編碼具有根據(jù)本發(fā)明的PUFAPKS系統(tǒng)的至少一個功能域的生物活性的氨基酸序列,所述重組核酸分子包含編碼這樣的氨基酸序列的核酸序列。這些序列、遺傳修飾生物體的方法、和具體修飾的各種實施方案在上文已詳細(xì)描述。典型地,利用該方法來生產(chǎn)特定的、可產(chǎn)生一種或多種特定生物活性分子的遺傳修飾生物體。在本發(fā)明的一個實施方案中,設(shè)想可以把誘變程序與選擇性篩選程序結(jié)合起來以獲得目標(biāo)生物活性分子。這包括搜索多種生物活性化合物的方法。這種搜索不限于具有順式雙鍵的分子的產(chǎn)生。突變方法可以包括,但不限于化學(xué)誘變、基因改組(shuffling)、切換(switching)編碼特定酶域的基因的區(qū)域或者限于這些基因特定區(qū)域的誘變,以及其它的方法。例如,可使用高通量誘變方法來影響或優(yōu)化期望生物活性分子的生產(chǎn)。一旦開發(fā)出有效的模型系統(tǒng),就可以高通量方式修飾這些基因。設(shè)想可以在兩個水平上利用這些技術(shù)。首先,如果能夠設(shè)計針對目標(biāo)產(chǎn)物(例如ARA)的生產(chǎn)具有足夠的選擇性的篩選方法,則可使用其來嘗試改變該系統(tǒng)來產(chǎn)生該產(chǎn)物(例如代替或者結(jié)合其它策略,例如上面討論的策略)。此外,如果上面列舉的策略得到了一系列確實產(chǎn)生目標(biāo)PUFA譜的基因,則可使用高通量技術(shù)優(yōu)化該系統(tǒng)。例如,如果引入的域僅在相對較低的溫度下起作用,則可設(shè)計允許除去該限制的選擇方法。人們知道,有很多種可能被導(dǎo)入固有(內(nèi)源的、天然的)PUFAPKS系統(tǒng)中的遺傳改變,不管是隨機的或是定向的,會導(dǎo)致酶功能失活。本發(fā)明的一個優(yōu)選實施方案包括一種系統(tǒng),用于只選擇那些不阻斷PUFAPKS系統(tǒng)產(chǎn)生產(chǎn)物的能力的修飾。例如,大腸桿菌的FabB菌株不能合成不飽和脂肪酸,需要在培養(yǎng)基中補充可替代其正常不飽和脂肪酸的脂肪酸方能生長(見Metz等(2001),同上)。然而,當(dāng)用一種功能性PUFA-PKS系統(tǒng)(即可在大腸桿菌宿主中產(chǎn)生PUFA產(chǎn)物的PUFA-PKS系統(tǒng)——見Metz等.(2001),同上,圖2A)轉(zhuǎn)化該菌株時,可以消除這種需要(對培養(yǎng)基進(jìn)行補充的需要)。此時,被轉(zhuǎn)化的FabB菌株需要功能性PUFA-PKS系統(tǒng)(來產(chǎn)生不飽和脂肪酸)以在沒有補充的條件下生長。該示例中的關(guān)鍵要素是多種不飽和脂肪酸的生產(chǎn)要充足(乃至不飽和脂肪酸替代物,例如分枝鏈脂肪酸)。因此,在本發(fā)明的另一個優(yōu)選實施方案中,人們可以在一個或多個本文所公開的PUFAPKS基因中生成大量突變,然后轉(zhuǎn)化適當(dāng)修飾的FabB菌株(例如在含ER域的表達(dá)構(gòu)建體中產(chǎn)生突變,并轉(zhuǎn)化FabB菌株,該菌株在不同質(zhì)粒上具有其它必需的域,或者這些域整合在該菌株的染色體中),并僅選擇可在無補充的培養(yǎng)基上生長(即仍然具有產(chǎn)生可補償FabB缺陷的分子的能力)的轉(zhuǎn)化體。可以開發(fā)進(jìn)一步的篩選方法來在活性PKS系統(tǒng)的這個選擇性子集中尋找被產(chǎn)生的特定化合物(例如使用GC尋找脂肪酸)。人們可以設(shè)想很多相似的用于目標(biāo)生物活性分子的選擇性篩選方法。在本發(fā)明的一個實施方案中,遺傳修飾的生物體具有這樣的修飾與野生型生物體相比,所述修飾可改變由內(nèi)源PKS系統(tǒng)產(chǎn)生的至少一個產(chǎn)物。用于產(chǎn)生這種修飾生物體的新構(gòu)建體以及用這種構(gòu)建體產(chǎn)生的蛋白和生物體,和與此類修飾相關(guān)的方法,都包含在本發(fā)明之內(nèi)。在一個優(yōu)選實施方案中,遺傳修飾的生物體表達(dá)這樣的PUFAPKS系統(tǒng),其在對應(yīng)于裂殖壺菌屬或破囊壺菌屬DH2域的-羥酰-ACP脫水酶(DH)域中包含遺傳修飾,其中與沒有該修飾相比,該修飾改變了該PUFAPKS系統(tǒng)所產(chǎn)生的長鏈脂肪酸的比例,特別是ω-3與ω-6長鏈脂肪酸的比例。在本實施方案的一個方面中,所述修飾選自刪除域的全部或部分,用來自不同生物體(例如天然地產(chǎn)生其它不同比例和/或量的PUFA的不同生物體)的同源域或其部分替換域的全部或部分,和使域發(fā)生突變。更具體地,如本文例示的,裂殖壺菌屬和破囊壺菌屬PUFAPKS結(jié)構(gòu)(域組織)與其它PUFAPKS系統(tǒng)結(jié)構(gòu)進(jìn)行比較,闡明了自然界改變域次序以及加入新的域從而產(chǎn)生新的終產(chǎn)物,或者例如改變終產(chǎn)物比例,的能力。此外,現(xiàn)在可以在實驗室內(nèi)對這些基因進(jìn)行操縱從而產(chǎn)生新的產(chǎn)物,如實施例中描述的。本發(fā)明人已經(jīng)證明,可以利用這種能力來產(chǎn)生具有新PUFA譜和產(chǎn)量的新生物體。本文描述了以定向或隨機方式操縱PUFAPKS系統(tǒng)以影響終產(chǎn)物。例如,在一個優(yōu)選實施方案中,用第一PUFAPKS系統(tǒng)的DH(FabA樣)域或其生物活性部分,具體地說用本文描述的DH2域,來替換不同的第二PUFAPKS系統(tǒng)中的同源DH域或其生物活性部分,來改變由第二PUFAPKS系統(tǒng)產(chǎn)生的PUFA的比例,尤其是操縱由第二PUFAPKS系統(tǒng)產(chǎn)生的ω-3與ω-6脂肪酸的比例。用來自第一PUFAPKS系統(tǒng)的含有這種DH2域的完整蛋白或其任意生物活性部分(例如來自破囊壺菌23Β的OrfC)替換第二PUFAPKS系統(tǒng)中的同源蛋白或其部分,可以獲得類似的結(jié)果。盡管本文描述的實施例采用的是來自裂殖壺菌屬和破囊壺菌屬的PUFAPKS系統(tǒng),但是通過修飾DH2蛋白或DH2樣域?qū)θ魏斡糜诋a(chǎn)生PUFA的PKS或DH2樣系統(tǒng)進(jìn)行的相似操作都包含在本發(fā)明之內(nèi)。這種修飾可以單獨進(jìn)行或者與其它對PUFAPKS系統(tǒng)的修飾聯(lián)合使用。因此,本發(fā)明的一個實施方案包括一種嵌合PUFAPKS系統(tǒng)和表達(dá)這種嵌合PUFAPKS系統(tǒng)的生物體。在一個方面中,嵌合PUFAPKS系統(tǒng)包括第一PUFAPKS系統(tǒng),其中該第一PUFAPKS系統(tǒng)的對應(yīng)于DH2域或其生物活性部分的域或蛋白(例如來自本文所述的裂殖壺菌屬或破囊壺菌屬的)已被修飾,或者已被替換為來自第二不同PUFAPKS系統(tǒng)的DH2域或蛋白或其生物活性部分?!安煌琍UFAPKS系統(tǒng)”的意思是,來自不同株、種、屬或生物體的PUFAPKS系統(tǒng),或者甚至是天然或野生型PUFAPKS系統(tǒng)的同源物。產(chǎn)生該嵌合蛋白的目的是改變由該PUFAPKS系統(tǒng)產(chǎn)生的PUFA的比例,特別是ω-3與(0-6PUFA的比例。因此,對所述不同PUFAPKS系統(tǒng)的選擇,應(yīng)當(dāng)基于對可產(chǎn)生與第一PUFAPKS系統(tǒng)相比不同的,或期望的,PUFA比例的第二系統(tǒng)的選擇。在本發(fā)明的一個方面中,這種嵌合PUFAPKS系統(tǒng)包括本文所述的裂殖壺菌屬OrfA(SEQIDNO2)和0rfB(SEQIDNO4)蛋白,和本文所述的破囊壺菌屬OrfC(SEQIDNO62)蛋白。除了表達(dá)這種嵌合PUFAPKS系統(tǒng)的植物和植物部分之外,表達(dá)這種嵌合PUFAPKS系統(tǒng)的裂殖壺菌屬、大腸桿菌和酵母在實施例中有描述,并且也包含在本發(fā)明之內(nèi)。在實施例中舉例說明的其它實施方案中,產(chǎn)生了包含裂殖壺菌屬和破囊壺菌屬OrfA、B、C之所有組合的嵌合PUFAPKS系統(tǒng)。在本發(fā)明的另一個方面中,嵌合PUFAPKS系統(tǒng)包含如本文所述的裂殖壺菌屬OrfA(SEQIDNO2)和OrfB(SEQIDNO4)蛋白,以及嵌合OrfC蛋白(有本文中用SEQIDNO:74表示的核酸序列編碼,由SEQIDNO:73編碼)。該嵌合OrfC多肽的氨基酸長度為1493個氨基酸殘基。DH2區(qū),定義為SEQIDNO:74的氨基酸516-1041,由破囊壺菌23BOrfC蛋白DH2區(qū)的氨基酸序列,即SEQIDNO62的氨基酸491-1016組成,其包括SEQIDNO66的全部和一些來自SEQIDNO62的側(cè)翼氨基酸序列。至于嵌合OrfC氨基酸序列的其余序列,SEQIDNO:74的殘基1-515和1042-1493分別與裂殖壺菌屬OrfC殘基SEQIDNO6的1-515和1051-1502相同。在本發(fā)明的另一個實施方案中,遺傳修飾的細(xì)胞或生物體已被修飾而表達(dá)這樣的PUFAPKS系統(tǒng)或其部分,包括嵌合PUFAPKS系統(tǒng)其中編碼該PUFAPKS系統(tǒng)或其部分的核酸序列被完全或部分優(yōu)化而使用宿主細(xì)胞或生物體的優(yōu)選密碼子用法。下文中舉例了說明本實施方案,示明了如何通過制造這種修飾而提高生物活性分子Hf^nPUFA)的產(chǎn)生。本實施方案可以和本文描述的其它遺傳修飾(例如嵌合PUFAPKS和蛋白實施方案)一起使用,以改善宿主生物體內(nèi)生物活性分子的生產(chǎn)。在本實施方案的一個方面中,嵌合PUFAPKS系統(tǒng)包含如本文所述的裂殖壺菌屬OrfA(SEQIDNO2)和0rfB(SEQIDNO4)蛋白,以及如本文所述的破囊壺菌屬OrfC(SEQIDNO62)蛋白,其中編碼SEQIDNO:62的核酸序列針對宿主密碼子用法是經(jīng)優(yōu)化的。實施例中描述了這種為了在裂殖壺菌屬中表達(dá)而被優(yōu)化的分子的一個實例,其中編碼破囊壺菌屬OrfC(合成或密碼子優(yōu)化的OrfC)的核酸序列本文用SEQIDNO70表示。在另一個實施方案中,破囊壺菌屬OrfA(SEQIDNO39)和/或破囊壺菌屬OrfB(SEQIDNO52)可以和裂殖壺菌屬OrfA、B和/或C中的任何一個或多個組合,和/或與破囊壺菌屬OrfC組合,用于在裂殖壺菌屬中表達(dá)。同樣,在本實例中,編碼破囊壺菌屬OrfA和/或破囊壺菌屬OrfB的核酸分子可以是針對宿主密碼子用法被優(yōu)化的。這種為了在裂殖壺菌屬中表達(dá)而被優(yōu)化的分子的示例在實施例中有描述,其中編碼破囊壺菌屬OrfA(合成的或密碼子優(yōu)化的OrfA)的核酸序列在本文用SEQIDNO71表示,編碼破囊壺菌屬OrfB(合成的或密碼子優(yōu)化的OrfB)的核酸序列在本文用SEQIDNO72表示。在本實施方案的另一個方面中,嵌合PUFAPKS系統(tǒng)包括本文所述的裂殖壺菌屬OrfA(SEQIDNO2)和OrfB(SEQIDNO:4)蛋白,以及嵌合的且經(jīng)過部分密碼子優(yōu)化的OrfC蛋白(由本文中用SEQIDNO75表示的核酸序列編碼)。由SEQIDNO75編碼的蛋白也用SEQIDNO:74表示,在上文關(guān)于SEQIDNO:73內(nèi)容中對其有描述。然而,在這種情況下,編碼SEQIDNO66(DH2域)的核酸的一部分——其來自于破囊壺菌屬——被優(yōu)化用于在裂殖壺菌屬中表達(dá),如實施例中所述。其它用于在大腸桿菌、酵母和植物中使用的經(jīng)密碼子優(yōu)化的核酸序列在上文和下文的實施例中有描述。在另一個實施方案中,遺傳修飾的生物體已通過用編碼可調(diào)節(jié)由PUFAPKS系統(tǒng)產(chǎn)生的脂肪酸的鏈長的蛋白的重組核酸分子對生物體進(jìn)行轉(zhuǎn)染而被修飾。例如,可調(diào)節(jié)由PUFAPKS系統(tǒng)產(chǎn)生的脂肪酸的鏈長的蛋白可以是能指導(dǎo)C20單位和/或C22單位的合成的鏈長因子。在另一個實施方案中,遺傳修飾的生物體表達(dá)這樣的PUFAPKS系統(tǒng),其在烯酰-ACP還原酶(ER)域中包括修飾,其中與不存在該修飾相比該修飾導(dǎo)致另一不同的化合物的產(chǎn)生。在本實施方案的一個方面中,修飾選自下組刪除全部或部分的ER域,用來自不同生物體的ER域替換該ER域,和使ER域突變。在本發(fā)明的一個實施方案中,遺傳修飾的生物體產(chǎn)生與無遺傳修飾的天然生物體不同的多不飽和脂肪酸(PUFA)譜。根據(jù)本公開,可用于產(chǎn)生生物活性分子的許多其它遺傳修飾對本領(lǐng)域技術(shù)人員而言是顯而易見的,并且各種其它的修飾在本文前面已經(jīng)有討論。本發(fā)明設(shè)想任何與本文所述PUFAPKS系統(tǒng)相關(guān)的、導(dǎo)致產(chǎn)生期望的生物活性分子的遺傳修飾。如上文所述,在本發(fā)明的一個實施方案中,遺傳修飾的生物體,例如遺傳修飾的微生物或植物,包括具有增強的合成期望生物活性分子(產(chǎn)物)的能力或者具有新引入的合成特定產(chǎn)物(例如合成PUFA,合成不同的PUFA譜,或合成特定抗生素)的能力的生物體。根據(jù)本發(fā)明,“增強的某產(chǎn)物合成能力”是指與合成該產(chǎn)物相關(guān)的途徑的任何增強或上調(diào),使得與在相同條件下培養(yǎng)或種植的野生型微生物或植物相比,該微生物或植物產(chǎn)生增加量的產(chǎn)物(包括產(chǎn)生之前沒有的產(chǎn)物)。產(chǎn)生這種遺傳修飾生物體的方法在上文已經(jīng)有詳細(xì)描述。在一個優(yōu)選實施方案中,本發(fā)明涉及遺傳修飾的植物或植物部分(例如,其中該植物被遺傳修飾從而表達(dá)PUFAPKS系統(tǒng),包括本文所述的嵌合PUFAPKS系統(tǒng)),其包括至少核心PUFAPKS酶復(fù)合體,以及,在一個實施方案中,至少一種PUFAPKS輔助蛋白(例如PPT酶),使得該植物可產(chǎn)生PUFA。優(yōu)選地,該植物是含油種子植物,其中該含油種子或含油種子中的油含有該PUFAPKS系統(tǒng)產(chǎn)生的PUFA。這種油含有作為所述PUFAPKS系統(tǒng)的產(chǎn)物的可檢測量的至少一種目標(biāo)PUFA或主要PUFA。本發(fā)明人已經(jīng)證實了表達(dá)編碼來自裂殖壺菌屬的PUFAPKS系統(tǒng)和PUFAPKS輔助酶4’-磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶)的基因的遺傳修飾植物體內(nèi)的PUFA產(chǎn)生(例如,見美國專利申請公開No.20070089199,如前)。由這些植物產(chǎn)生的油含有顯著量的DHA(二十二碳六烯酸(C22:6,n-3))和DPA(二十二碳五烯酸(C225,n_6),它們是該PUFAPKS基因所來源的裂殖壺菌屬產(chǎn)生的主要PUFA(主要PUFA)。引人注目的是,來自用PUFAPKS途徑產(chǎn)生PUFA的植物的油,與通過上述的“標(biāo)準(zhǔn)”途徑產(chǎn)生相同PUFA的遺傳工程化植物相比,具有不同的脂肪酸譜。特別地,來自通過PUFAPKS途徑產(chǎn)生特定PUFA的遺傳工程化植物的油基本上沒有使用標(biāo)準(zhǔn)PUFA合成途徑產(chǎn)生的油中會積累的各種中間產(chǎn)物和副產(chǎn)物。這個特點在下文會詳細(xì)討論。更具體地,通過“標(biāo)準(zhǔn)”途徑(上文所述)在植物體內(nèi)產(chǎn)生長鏈PUFA的工作使用的是相同的基本手段,這是由該合成途徑?jīng)Q定的。這些工作依賴通過導(dǎo)入各種延長酶和去飽和酶來修飾植物的內(nèi)源脂肪酸。植物通常通過其質(zhì)體內(nèi)的II型脂肪酸合酶(FAS)產(chǎn)生18碳脂肪酸(例如油酸、亞油酸、亞麻酸)。很多時候,當(dāng)脂肪酸連接到ACP上時形成單個雙鍵,然后通過酰基-ACP巰酯酶的作用從ACP切下油酸(18:1)。游離脂肪酸從質(zhì)體輸出,并被轉(zhuǎn)變成?;?CoA。18:1可以被酯化到卵磷脂(PC)上,并可以添加最多兩個額外的順式雙鍵。新引入的延長酶可以利用酰基CoA池內(nèi)的底物以每次兩個碳的增加量添加碳。新引入的去飽和酶可以利用酯化到PC上的脂肪酸或?;鵆oA池內(nèi)的脂肪酸,這取決于酶的來源。然而,用這種機制產(chǎn)生長鏈PUFA的一個后果是會積累途徑中的中間產(chǎn)物或副產(chǎn)物,而不是目標(biāo)長鏈PUFA,這些中間產(chǎn)物或副產(chǎn)物往往占到植物油中的新脂肪酸的大部分。例如,使用如上所述的標(biāo)準(zhǔn)或經(jīng)典途徑,當(dāng)目標(biāo)PUFA產(chǎn)物(即人們追求、嘗試、力圖利用該標(biāo)準(zhǔn)途徑產(chǎn)生的PUFA產(chǎn)物)是例如DHA或EPA(如利用可從FAS系統(tǒng)的產(chǎn)物產(chǎn)生DHA或EPA的延長酶和去飽和酶所產(chǎn)生的)時,除了該DHA或EPA之外,還會產(chǎn)生多種中間產(chǎn)物和副產(chǎn)物,并且這些中間產(chǎn)物或副產(chǎn)物經(jīng)常占通過該途徑產(chǎn)生的產(chǎn)物的大多數(shù),或者至少在生產(chǎn)者生物體的脂質(zhì)中以顯著量存在。這些中間產(chǎn)物和副產(chǎn)物包括但不限于具有比目標(biāo)或主要PUFA更少的碳和/或更少的雙鍵的脂肪酸,并可包括這樣的罕見脂肪酸副產(chǎn)物,其可能具有與目標(biāo)或主要PUFA相同數(shù)目的碳,但在可能罕見位置具有雙鍵。舉例而言,在使用標(biāo)準(zhǔn)途徑的EPA生產(chǎn)中(例如,見美國專利申請公開2004/0172682),盡管途徑的目標(biāo)PUFA是EPA(S卩,由于使用了特異作用于FAS系統(tǒng)產(chǎn)物以產(chǎn)生EPA的延長酶和去飽和酶),該系統(tǒng)產(chǎn)生的油包括多種中間產(chǎn)物和副產(chǎn)物,包括Y-亞麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-Y-亞麻酸(dihomo-gamma-linolenicacid)(DGLA或HGLA;20:3,n-6);花生四烯酸(ARA,C20:4,n_6);二十碳三烯酸(ETA;20:3,n_9)和各種其它的中間產(chǎn)物或副產(chǎn)物,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(meadacid)(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。該系統(tǒng)的中間物還可以包括不是遺傳修飾目標(biāo)的長鏈PUFA(例如,用于產(chǎn)生DHA的標(biāo)準(zhǔn)途徑酶系可以實際上產(chǎn)生比DHA更多的EPA作為中間產(chǎn)物)。對比地,本發(fā)明的PUFAPKS合酶不利用FAS系統(tǒng)的脂肪酸產(chǎn)物。相反,它從與FAS和延長酶所用相同的小前體分子(丙二酸單酰-CoA)產(chǎn)生最終的PUFA產(chǎn)物。因此,合成循環(huán)的中間產(chǎn)物不會以任何顯著的量被釋放,而PUFA產(chǎn)物(本文也稱作主要PUFA產(chǎn)物)被高效轉(zhuǎn)移到磷脂(PL)和脂質(zhì)的三酯酰甘油(TAG)部分。實際上,PUFAPKS系統(tǒng)有可能產(chǎn)生兩種目標(biāo)或主要PUFA產(chǎn)物(例如來自裂殖壺菌屬的PUFAPKS系統(tǒng)即產(chǎn)生DHA和DPAn_6二者作為主要產(chǎn)物),但是DPA不是DHA產(chǎn)生途徑中的中間產(chǎn)物。在一定程度上,每一種產(chǎn)物都是同一PUFAPKS系統(tǒng)的單獨產(chǎn)物。因此,本發(fā)明的PUFAPKS基因是一種非常優(yōu)異的工具,用于在異源宿主,例如植物內(nèi)產(chǎn)生含PUFA特別是LCPUFA的油,其中所述油基本上沒有(如下文定義)會污染由“標(biāo)準(zhǔn)”PUFA途徑產(chǎn)生的油的中間產(chǎn)物和副產(chǎn)物。因此,本發(fā)明的一個目的是,通過如本文所述進(jìn)行植物的遺傳操作,來產(chǎn)生多不飽和脂肪酸以及,進(jìn)一步地,從這些植物獲得的(例如從這些植物的含油種子中獲得)、包含這些PUFA的油??梢酝ㄟ^本發(fā)明產(chǎn)生的PUFA的實例包括但不限于,DHA(二十二碳六烯酸(C22:6,n-3))、ARA(二十碳四烯酸或花生四烯酸(C204,n_6))、DPA(二十二碳五烯酸(C22:5,n-6或n-3))、和EPA(二十碳五烯酸(C20:5,n_3))。本發(fā)明人利用本發(fā)明的可產(chǎn)生PUFA的聚酮合酶系統(tǒng)或其組分開發(fā)了遺傳修飾植物,藉此本發(fā)明為生產(chǎn)有商業(yè)價值的、富含一種或多種期望(目標(biāo)或主要)PUFA的脂質(zhì)提供了條件。根據(jù)本發(fā)明,所稱“主要PUFA”、“目標(biāo)PUFA”、“意圖PUFA”或“期望PUFA”,是指特定的一種或多種PUFA,其是使用產(chǎn)生所述PUFA的酶途徑的意圖或目標(biāo)產(chǎn)物。例如,當(dāng)使用延長酶和去飽和酶修飾FAS系統(tǒng)的產(chǎn)物時,可以選擇延長酶和去飽和酶的特定組合,它們在一起使用時可產(chǎn)生目標(biāo)或期望的PUFA(例如DHA或EPA)。如上文討論的,由于形成的中間產(chǎn)物和副產(chǎn)物可能實際上占到該系統(tǒng)產(chǎn)物量的大部分,由標(biāo)準(zhǔn)途徑產(chǎn)生的這些目標(biāo)或期望PUFAj^PUFA占由該系統(tǒng)產(chǎn)生的總脂肪酸的百分比而言,可能實際上不是“主要”的PUFA。然而,即使在這種情況下,仍然可以使用術(shù)語“主要PUFA”來指代該系統(tǒng)使用的延長酶和去飽和酶所產(chǎn)生的目標(biāo)或意圖PUFA產(chǎn)物。當(dāng)使用本發(fā)明的優(yōu)選PUFAPKS系統(tǒng)時,來自特定生物體的給定PUFAPKS系統(tǒng)可產(chǎn)生特定的PUFA,從而來自特定生物體的PUFAPKS系統(tǒng)的選擇將導(dǎo)致特定的目標(biāo)或主要PUFA的產(chǎn)生。例如,使用來自裂殖壺菌屬的PUFAPKS系統(tǒng)將產(chǎn)生DHA和DPAn_6作為目標(biāo)或主要PUFA。另一方面,使用來自各種希瓦氏菌種的PUFAPKS系統(tǒng),將產(chǎn)生EPA作為目標(biāo)或主要PUFA。需要注意,主要或目標(biāo)PUFA的比例可以根據(jù)特定PUFAPKS系統(tǒng)的選擇以及該系統(tǒng)如何響應(yīng)它的具體表達(dá)條件而不同。例如,使用來自破囊壺菌23B(ATCCNo.20892)的PUFAPKS系統(tǒng)也將產(chǎn)生DHA和DPAn-6作為目標(biāo)或主要PUFA;然而,在破囊壺菌23B的情況下,DHA對DPAn-6的比例為大約10:1(范圍可以從8:1到40:1),而在裂殖壺菌屬中,該比例通常為2.5:1。因此,與裂殖壺菌屬相比,即使靶PUFA相同,使用破囊壺菌屬PUFAPKS系統(tǒng)或蛋白或域可以改變生物體產(chǎn)生的PUFA的比例。然而,如上文詳細(xì)描述的,具有來自其它PUFAPKS系統(tǒng)或其它PKS系統(tǒng)(可產(chǎn)生除PUFA之外的生物活性分子的)的蛋白和域的各種蛋白和域的使用可以組合(“混合和匹配”)起來,而產(chǎn)生嵌合蛋白和/或嵌合PUFAPKS系統(tǒng)(如上所述),導(dǎo)致產(chǎn)生不同的PUFA譜,包括不同的PUFA類型、量和/或一種PUFA對另一種PUFA的比例。當(dāng)使用本發(fā)明的PUFAPKS系統(tǒng)時,生物體(例如植物)產(chǎn)生的油中基本上沒有如下所述的中間產(chǎn)物或副產(chǎn)物它們不是目標(biāo)或主要PUFA產(chǎn)物,M它們不是由野生型生物體中內(nèi)源FAS系統(tǒng)天然產(chǎn)生的(例如,野生型植物通過FAS系統(tǒng)產(chǎn)生一些較短鏈或中等鏈長的PUFAJf^n18碳PUFA,但是在用PUFAPKS系統(tǒng)進(jìn)行遺傳修飾后的植物內(nèi)會產(chǎn)生新的或額外的脂肪酸)。換言之,與來自野生型植物(非遺傳修飾的)或用作所說的遺傳修飾的受體的親本植物的總脂肪酸譜相比,在用本發(fā)明PUFAPKS系統(tǒng)(或其部分)遺傳修飾的植物產(chǎn)生的總脂肪酸譜中,大多數(shù)的附加(additional)脂肪酸包含PUFAPKS系統(tǒng)的目標(biāo)或意圖PUFA產(chǎn)物(即,在由遺傳修飾植物產(chǎn)生的總脂肪酸中,附加脂肪酸的大多數(shù)是目標(biāo)PUFA)。根據(jù)本發(fā)明,用于產(chǎn)生PUFA的酶系統(tǒng)的“中間產(chǎn)物”或“副產(chǎn)物”是指任何如下所述的產(chǎn)物,尤其是脂肪酸產(chǎn)物其是作為酶系統(tǒng)產(chǎn)生目標(biāo)或主要PUFA的結(jié)果由該系統(tǒng)產(chǎn)生的,但不是主要或目標(biāo)PUFA。在一個實施方案中,中間產(chǎn)物和副產(chǎn)物可以包括如下所述的非目標(biāo)脂肪酸,它們是由野生型植物或作為所述遺傳修飾受體的親本植物自然產(chǎn)生的,但現(xiàn)在被歸類為中間產(chǎn)物或副產(chǎn)物,因為由與野生型植物或作為所述遺傳修飾受體的母本植物產(chǎn)生的水平相比,它們由于所述遺傳修飾而以更高的水平產(chǎn)生。中間產(chǎn)物和副產(chǎn)物在PUFA合成的標(biāo)準(zhǔn)途徑中是特別顯著的,而在PUFAPKS途徑中則遠(yuǎn)不那么顯著,如上面討論的。需要注意,一個酶系統(tǒng)的主要或目標(biāo)PUFA可能是以不同PUFA作為主要或目標(biāo)產(chǎn)物的另一酶系統(tǒng)的中間產(chǎn)物,對于PUFA產(chǎn)生的標(biāo)準(zhǔn)途徑的產(chǎn)物而言尤為如此,因為PUFAPKS系統(tǒng)實質(zhì)上避免了中間產(chǎn)物的生成。例如,當(dāng)利用標(biāo)準(zhǔn)途徑產(chǎn)生EPA時,脂肪酸,例如GLA,DGLA和SDA,作為中間產(chǎn)物以顯著的量產(chǎn)生(例如,美國專利申請公開2004/0172682例證了這一點)。相似地,同樣如美國專利申請公開2004/0172682所示,在使用標(biāo)準(zhǔn)途徑產(chǎn)生DHA時,除了上述脂肪酸之外,ETA和EPA(注意,它們是上面第一個實例的目標(biāo)PUFA)以顯著的量產(chǎn)生,而且實際上,相對于總脂肪酸產(chǎn)物,它們可能以顯著高于目標(biāo)PUFA本身的量存在。后面一點也可從美國專利申請公開2004/0172682中看出,其中通過標(biāo)準(zhǔn)途徑產(chǎn)生DHA的工程化植物所產(chǎn)生的EPA占總脂肪酸的百分比高于目標(biāo)DHA。而且,稱“基本上沒有”用于合成PUFA的系統(tǒng)的中間產(chǎn)物或副產(chǎn)物,或者不存在顯著量的中間產(chǎn)物或副產(chǎn)物,意思是指在遺傳修飾的植物(和/或植物部分和/或種子油部分)中,作為用于產(chǎn)生PUFA的酶系統(tǒng)的引入或存在的結(jié)果而產(chǎn)生的(即,不是由該野生型植物或所述遺傳修飾的受體親本植物產(chǎn)生的)任何中間產(chǎn)物或副產(chǎn)物脂肪酸(非目標(biāo)PUFA)的存在量少于由該植物產(chǎn)生的總脂肪酸重量的大約10%,更優(yōu)選地少于大約9%,更優(yōu)選地少于大約8%,更優(yōu)選地少于大約7%,更優(yōu)選地少于大約6%,更優(yōu)選地少于大約5%,更優(yōu)選地少于大約4%,更優(yōu)選地少于大約3%,更優(yōu)選地少于大約2%,更優(yōu)選地少于大約1%,更優(yōu)選地少于由該植物產(chǎn)生的總脂肪酸重量的大約0.5%。在一個優(yōu)選實施方案中,稱“基本上沒有”用于合成PUFA的系統(tǒng)的中間產(chǎn)物或副產(chǎn)物,或者不存在顯著量的中間產(chǎn)物或副產(chǎn)物,意思是指在遺傳修飾的植物(和/或植物部分和/或種子油部分)中作為用于產(chǎn)生PUFAS的酶系統(tǒng)的結(jié)果而產(chǎn)生的(即,不是由該野生型植物或所述為了產(chǎn)生目標(biāo)PUFA的遺傳修飾的受體親本植物產(chǎn)生的)任何中間產(chǎn)物或副產(chǎn)物脂肪酸的存在量少于由該植物產(chǎn)生的總附加脂肪酸重量的大約10%(附加脂肪酸定義為這樣的脂肪酸或脂肪酸的水平,其不是由所述野生型植物或所述為了產(chǎn)生目標(biāo)PUFA的遺傳修飾的受體親本植物所天然產(chǎn)生的),更優(yōu)選地少于有該植物產(chǎn)生的總附加脂肪酸的大約9%,更優(yōu)選地少于大約8%,更優(yōu)選地少于大約7%,更優(yōu)選地少于大約6%,更優(yōu)選地少于大約5%,更優(yōu)選地少于大約4%,更優(yōu)選地少于大約3%,更優(yōu)選地少于大約2%,更優(yōu)選地少于大約1%。因此,與通過標(biāo)準(zhǔn)途徑產(chǎn)生PUFA的遺傳修飾植物的脂肪酸譜相反,用PUFAPKS系統(tǒng)進(jìn)行遺傳修飾而產(chǎn)生的脂肪酸產(chǎn)物中的大多數(shù)將是目標(biāo)或意圖的脂肪酸產(chǎn)物。當(dāng)PUFAPKS系統(tǒng)的目標(biāo)產(chǎn)物是長鏈PUFA,例如由本文所述本發(fā)明的PUFAPKS系統(tǒng)所產(chǎn)生的DHA或DPA(n-6或n_3)時,在用這種PUFAPKS遺傳修飾的植物的總脂質(zhì)中不以顯著量存在的中間產(chǎn)物和副產(chǎn)物可以包括,但不限于Y-亞麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n_3);二高-Y-亞麻酸(DGLA或HGLA;203,n_6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各種其它中間產(chǎn)物或副產(chǎn)物,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);202(Δ11,14);203(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或204(Δ5,1,14,17)。此外,當(dāng)目標(biāo)產(chǎn)物是特定PUFA,例如DHA時,在遺傳修飾的植物的總脂質(zhì)中不以顯著量存在的中間產(chǎn)物和副產(chǎn)物還包括其它PUFA,包括作為另一不同PUFAPKS系統(tǒng)的天然產(chǎn)物的其它PUFA,例如本實例中的ΕΡΑ。在一些系統(tǒng)中,PUFAPKS系統(tǒng)可能產(chǎn)生超過一種PUFA,例如C22和C20PUFA,PUFA的這種組合可能代表目標(biāo)產(chǎn)物,而其它的PUFA可能代表中間產(chǎn)物或副產(chǎn)物。應(yīng)當(dāng)注意,如果期望的話,本發(fā)明的PUFAPKS系統(tǒng)還可以用于產(chǎn)生可包括GLA、SDA或DGLA的PUFA(aPUFAthatcanincludedGLA,SDAorDGLA)作為目標(biāo)PUFA(參考本文所述的使用PUFAPKS系統(tǒng)的組分來生產(chǎn)油的實施方案)。本發(fā)明人利用本文所述的PUFAPKS系統(tǒng)的遺傳學(xué)基礎(chǔ)和域結(jié)構(gòu)的知識,設(shè)計和制造了編碼這樣的PUFAPKS系統(tǒng)的構(gòu)建體,并成功制造了表達(dá)該PUFAPKS系統(tǒng)的轉(zhuǎn)基因植物。這些轉(zhuǎn)基因植物產(chǎn)生含有PUFA的油,這樣的油基本上沒有在標(biāo)準(zhǔn)PUFA途徑中積累的中間產(chǎn)物(見美國專利中請公開No.20070089199,上文)。本發(fā)明人還顯示了在大腸桿菌以及在另一種真核生物——酵母中使用該構(gòu)建體產(chǎn)生PUFA,作為產(chǎn)生該轉(zhuǎn)基因植物之前的構(gòu)思驗證實驗(見美國專利申請公開No.20070089199,上文)。這些實例顯示,用產(chǎn)生DHA和DPAn-6作為目標(biāo)PUFA的PUFAPKS系統(tǒng)對酵母和植物進(jìn)行轉(zhuǎn)化后,這些PUFA均作為植物和酵母中總脂肪酸中的主要附加脂肪酸(即,減去野生型植物中產(chǎn)生的脂肪酸)產(chǎn)生,而且進(jìn)一步地,任何不存在于野生型植物脂肪酸中的其它脂肪酸都實際上檢測不到。本發(fā)明遺傳修飾的植物及其部分和油的具體特征在本文其它部分有詳細(xì)描述。因此,本發(fā)明的一個實施方案是一種通過種植或培養(yǎng)本發(fā)明的遺傳修飾微生物或遺傳修飾植物(上文中詳述的)來產(chǎn)生期望的生物活性分子(也稱作產(chǎn)物或化合物)的方法。這種方法包括分別在生長或發(fā)酵培養(yǎng)基中培養(yǎng)或在合適環(huán)境下(例如土壤中)種植具有如前文所述且與本發(fā)明一致的遺傳修飾的微生物或植物。在優(yōu)選實施方案中,本發(fā)明的產(chǎn)生生物活性分子的方法包括在可有效產(chǎn)生該生物活性分子的條件下培養(yǎng)表達(dá)如下所述的PKS系統(tǒng)的遺傳修飾生物體的步驟,該PKS系統(tǒng)包含至少一種如本文所述的多不飽和脂肪酸(PUFA)聚酮合酶(PKS)系統(tǒng)的生物活性域。在本發(fā)明期望生物活性化合物的生產(chǎn)方法中,在合適的培養(yǎng)基中在有效產(chǎn)生該生物化學(xué)化合物的條件下培養(yǎng)或種植遺傳修飾的微生物。合適的、或者有效的培養(yǎng)基是指任何這樣的培養(yǎng)基,本發(fā)明的遺傳修飾微生物在其中培養(yǎng)時能夠產(chǎn)生期望的產(chǎn)物。這種培養(yǎng)基典型地是水性培養(yǎng)基,包括可同化的碳、氮和磷源。這種培養(yǎng)基還可以包括合適的鹽、礦物質(zhì)、金屬和其它營養(yǎng)物。本發(fā)明的微生物能夠在常規(guī)的發(fā)酵生物反應(yīng)器中培養(yǎng)。微生物可以通過任何發(fā)酵過程培養(yǎng),其包括,但不僅限于,分批發(fā)酵、補料_分批發(fā)酵、細(xì)胞回收和連續(xù)發(fā)酵。根據(jù)本發(fā)明的用于潛在宿主微生物的優(yōu)選生長條件在本領(lǐng)域是眾所周知的。由遺傳修飾微生物產(chǎn)生的期望生物活性分子可以用常規(guī)的分離和純化技術(shù)從發(fā)酵培養(yǎng)基回收。例如,可以過濾或離心發(fā)酵培養(yǎng)基以除去微生物、細(xì)胞碎片和其它顆粒物質(zhì),產(chǎn)物可以通過常規(guī)方法,例如離子交換、色譜、萃取、溶劑萃取、膜分離、電滲析、反向滲透、蒸餾、化學(xué)衍生化和結(jié)晶等,從無細(xì)胞上清液回收?;蛘?,產(chǎn)生期望化合物、提取物或其各種組分的微生物可以即行使用,而不用從產(chǎn)物除去微生物組分。在本發(fā)明用于產(chǎn)生期望的生物活性化合物的方法中,遺傳修飾的植物或植物部分(包括植物細(xì)胞)在生長培養(yǎng)基中培養(yǎng)或視情況在合適培養(yǎng)基(例如土壤)中培養(yǎng)。合適的或有效的生長基質(zhì)或培養(yǎng)基已經(jīng)在上文詳細(xì)討論。用于高等植物的合適生長基質(zhì)包括任何用于植物的生長基質(zhì),包括但不限于,土壤、沙子、任何其它支持根生長的顆粒介質(zhì)(例如蛭石、珍珠巖等)或水培培養(yǎng)基,以及優(yōu)化高等植物生長的合適的光、水及營養(yǎng)補充。本發(fā)明的遺傳修飾植物被工程化,從而藉由根據(jù)本發(fā)明遺傳修飾的PUFAPKS系統(tǒng)的活性產(chǎn)生顯著量的期望產(chǎn)物?;衔锟梢酝ㄟ^純化處理從植物提取化合物加以回收。在優(yōu)選實施方案中,該化合物通過收獲植物加以回收。在特別優(yōu)選的實施方案中,通過從植物或植物部分(例如從含油種子)收獲油來回收PUFA。在本實施方案中,植物可以其自然狀態(tài)消費,或者被進(jìn)一步加工成可供消費的產(chǎn)物。根據(jù)本發(fā)明,生物活性分子包括任何具有生物活性的分子(化合物、產(chǎn)物等),其能夠被包含具有如本文所述的非細(xì)菌PUFAPKS系統(tǒng)的至少一個功能域的生物活性的至少一種氨基酸序列的PKS系統(tǒng)產(chǎn)生。這樣的生物活性分子可以包括,但不限于多不飽和脂肪酸(PUFA)、抗炎制劑、化療劑、活性賦形劑、骨質(zhì)疏松藥物、抗抑郁藥、抗驚厥藥、抗幽門螺桿菌(Heliobacterpylori)藥物、治療神經(jīng)變性疾病的藥物、治療退行性肝病的藥物、抗生素、和降膽固醇制劑。本發(fā)明的非細(xì)菌PUFAPKS系統(tǒng)的一個優(yōu)勢是這種系統(tǒng)能夠引入順式構(gòu)型的碳-碳雙鍵,和每三個碳含有一個雙鍵的分子。可以利用這種能力來產(chǎn)生多種化合物。關(guān)于微生物,優(yōu)選地,遺傳修飾微生物產(chǎn)生的目標(biāo)生物活性化合物的量大于該微生物干重的大約0.05%,優(yōu)選地大于大約0.1%,更優(yōu)選地大于大約0.25%,更優(yōu)選地大于大約0.5%,更優(yōu)選地大于大約0.75%,更優(yōu)選地大于大約1%,更優(yōu)選地大于大約2.5%,更優(yōu)選地大于大約5%,更優(yōu)選地大于大約10%,更優(yōu)選地大于大約15%,更優(yōu)選地大于大約20%。對于脂質(zhì)化合物,優(yōu)選地,這類化合物的生產(chǎn)量大于該微生物干重的大約5%。對于其它的生物活性化合物,例如抗生素或合成量更小的化合物,其產(chǎn)量可以是本領(lǐng)域技術(shù)人員已知的量,并且將具有這類化合物的株系定性為“可預(yù)見地含有”(predictablycontaining)本文所述類型的新PKS系統(tǒng)。在一些實施方案中,特定生物活性分子(化合物)被微生物分泌,而非積累在細(xì)胞中。因此,這種生物活性分子一般地從培養(yǎng)基回收,并且所產(chǎn)生分子的濃度將根據(jù)微生物和培養(yǎng)物的規(guī)模而變化,可并以用g/L,而非干細(xì)胞重量,來加以量度。優(yōu)選地,本發(fā)明的遺傳修飾的生物體(例如微生物或植物)產(chǎn)生一種或多種多不飽和脂肪酸,包括但不限于,EPA(C20:5,n-3),DHA(C22:6,n_3),DPA(C22:5,n_6或n_3),ARA(C20:4,n-6),GLA(C18:3,n_6),ALA(C18:3,n-3),和/或SDA(C18:4,n-3)),更優(yōu)選地,一種或多種長鏈脂肪酸(LCPUFA),包括但不限于EPA(C20:5,n-3),DHA(C22:6,n-3),DPA(C225,n-6或n_3)或DTA(C224,n_6)。在特別優(yōu)選的實施方案中,本發(fā)明的遺傳修飾生物體產(chǎn)生一種或多種多不飽和脂肪酸,包括但不限于EPA(C20:5,n-3),DHA(C22:6,n-3)和/或DPA(C225,n-6或n_3)。優(yōu)選地,本發(fā)明遺傳修飾的生物體產(chǎn)生至少一種PUFA(目標(biāo)PUFA),其中生物體(或生物體中積累PUFA的部分,例如成熟種子或來自這些種子的油,如果生物體是含油種子植物的話)中的總脂肪酸譜,包含可檢測量的這種或這些PUFA。優(yōu)選地,所述PUFA是至少20個碳的PUFA,并包括至少3個雙鍵,更優(yōu)選地至少4個雙鍵,更加優(yōu)選地至少5個雙鍵。在一個實施方案中,該PUFA是不被該生物體以可檢測的或顯著的量天然產(chǎn)生的PUFA(例如,沒有遺傳修飾的野生型生物體,或者用作所述遺傳修飾的受體的親本生物體)。優(yōu)選地,生物體(或生物體中積累PUFA的部分)中的總脂肪酸譜包含占總脂肪酸重量至少0.1%的目標(biāo)PUFA,更優(yōu)選包含占總脂肪酸重量至少大約0.2%,更優(yōu)選至少大約0.3%,更優(yōu)選至少大約0.4%,更優(yōu)選至少大約0.5%,更優(yōu)選至少大約1%,更優(yōu)選至少大約2%,更優(yōu)選至少大約3%,更優(yōu)選至少大約4%,更優(yōu)選至少大約5%,更優(yōu)選至少大約10%,更優(yōu)選至少大約20%,更優(yōu)選至少大約25%,更優(yōu)選至少大約30%,更優(yōu)選至少大約35%,更優(yōu)選至少大約40%,更優(yōu)選至少大約45%,更優(yōu)選至少大約50%,更優(yōu)選至少大約55%,更優(yōu)選至少大約60%,更優(yōu)選至少大約65%,更優(yōu)選至少大約70%,更優(yōu)選至少大約75%,更優(yōu)選大于75%的至少一種多不飽和脂肪酸(目標(biāo)PUFA),或者包含從0.至75%,或大于75%(直到100%或大約100%),以0.為增量的任何百分比的目標(biāo)PUFA。如本文中通用的,稱PUFA百分比的生產(chǎn)量是占該生物體產(chǎn)生的總脂肪酸的重量,除非另外指出(例如,在一些情況下,重量百分比是相對于由酶復(fù)合體,例如PUFAPKS系統(tǒng),產(chǎn)生的總脂肪酸)。在一個實施方案中,由植物產(chǎn)生的總脂肪酸用作為通過對脂肪酸甲酯(FAME)制備物的氣相色譜(GC)分析確定的重量百分比表示。如上文描述的,上文描述的植物(和/或植物的部分或種子油部分)所產(chǎn)生的總脂肪酸的一個額外特征是,由該植物產(chǎn)生的這些總脂肪酸中,除了由產(chǎn)生目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生的目標(biāo)PUFA之外的任何脂肪酸的含量以重量計少于(或者不多于)大約10%。優(yōu)選地,由產(chǎn)生目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生(例如作為用產(chǎn)生目標(biāo)PUFA的酶或酶復(fù)合體遺傳修飾植物的結(jié)果)的、除目標(biāo)PUFA之外任何脂肪酸,占由該植物產(chǎn)生的總脂肪酸重量的少于大約9%,更優(yōu)選地少于大約8%,更優(yōu)選地少于大約7%,更優(yōu)選地少于大約6%,更優(yōu)選地少于大約5%,更優(yōu)選地少于大約4%,更優(yōu)選地少于大約3%,更優(yōu)選地少于大約2%,更優(yōu)選地少于大約1%。在另一個實施方案中,由所述產(chǎn)生目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生的、除目標(biāo)PUFA之外任何脂肪酸,占植物中由所述產(chǎn)生目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生的總脂肪酸重量(即該量度僅限于由所述產(chǎn)生目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生的總脂肪酸)的少于(或含有不多于)大約10%,更優(yōu)選地少于大約9%,更優(yōu)選地少于大約8%,更優(yōu)選地少于大約7%,更優(yōu)選地少于大約6%,更優(yōu)選地少于大約5%,更優(yōu)選地少于大約4%,更優(yōu)選地少于大約3%,更優(yōu)選地少于大約2%,更優(yōu)選地少于總脂肪酸重量的大約1%,更優(yōu)選地少于植物中由所述產(chǎn)生該目標(biāo)PUFA的酶復(fù)合體所產(chǎn)生的總脂肪酸重量的大約0.5%。在本發(fā)明這個實施方案的另一個方面中,由植物(和/或植物的部分或種子油組分)產(chǎn)生的總脂肪酸中含有少于(或含有不超過)占由該植物產(chǎn)生的總脂肪酸重量的10%的具有18個或更多個碳的PUFA,但目標(biāo)PUFA或者在野生型植物(沒有遺傳修飾的)中或用作所述(初始的或順序的)遺傳修飾的受體的親本植物中存在的PUFA除外。在進(jìn)一步的方面中,由植物(和/或植物的部分或種子油部分)產(chǎn)生的總脂肪酸中含有少于占由該植物產(chǎn)生的總脂肪酸重量的9%的具有18個或更多個碳的PUFA,或者少于8%的具有18個碳或更多個碳的PUFA,或者少于7%的具有18個碳或更多個碳的PUFA,或者少于6%的具有18個碳或更多個碳的PUFA,或者少于5%的具有18個碳或更多個碳的PUFA,或者少于4%的具有18個碳或更多個碳的PUFA,或者少于3%的具有18個碳或更多個碳的PUFA,或者少于2%的具有18個碳或更多個碳的PUFA,或者少于的具有18個碳或更多個碳的PUFA,但目標(biāo)PUFA或者在野生型植物(沒有遺傳修飾的)中或用作所述遺傳修飾的受體的親本植物中存在的PUFA除外。在本發(fā)明這個實施方案的另一個方面中,由植物(和/或植物的部分或種子油部分)產(chǎn)生的總脂肪酸中含有少于(或含有不超過)占由該植物產(chǎn)生的總脂肪酸重量的10%的具有20個或更多個碳的PUFA,但目標(biāo)PUFA或者在野生型植物(沒有遺傳修飾的)中或用作所述(初始的或順序的)遺傳修飾的受體的親本植物中存在的PUFA除外。在進(jìn)一步的方面中,由植物(和/或植物的部分或種子油部分)產(chǎn)生的總脂肪酸含有少于占由該植物產(chǎn)生的總脂肪酸重量的9%的具有20個或更多個碳的PUFA,或者少于8%的具有20個碳或更多個碳的PUFA,或者少于7%的具有20個碳或更多個碳的PUFA,或者少于6%的具有20個碳或更多個碳的PUFA,或者少于5%的具有20個碳或更多個碳的PUFA,或者少于4%的具有20個碳或更多個碳的PUFA,或者少于3%的具有20個碳或更多個碳的PUFA,或者少于2%的具有20個碳或更多個碳的PUFA,或者少于1%的具有20個碳或更多個碳的PUFA,但目標(biāo)PUFA或在野生型植物(沒有遺傳修飾的)中或用作所述遺傳修飾的受體的親本植物中存在的PUFA除外。在一個實施方案中,植物(和/或植物的部分或種子油部分)中的總脂肪酸含有少于占由該植物產(chǎn)生的總脂肪酸重量的10%,更優(yōu)選地少于大約9%,更優(yōu)選地少于大約8%,更優(yōu)選地少于大約7%,更優(yōu)選地少于大約6%,更優(yōu)選地少于大約5%,更優(yōu)選地少于大約4%,更優(yōu)選地少于大約3%,更優(yōu)選地少于大約2%,更優(yōu)選地少于大約的選自下列物質(zhì)的一種或多種脂肪酸Y-亞麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-Y-亞麻酸(DGLA或HGLA;20:3,n_6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各種其它脂肪酸,例如200;201(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);203(Δ5,11,14);203(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。在另一個實施方案中,由在植物內(nèi)產(chǎn)生長鏈PUFA的酶系統(tǒng)所產(chǎn)生的脂肪酸含有重量少于大約10%的選自下組的脂肪酸,作為由該植物產(chǎn)生的總脂肪酸的百分比Y-亞麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;184,n_3);二高-Y-亞麻酸(DGLA或HGLA;20:3,n-6),花生四烯酸(ARA,C204,n-6);二十碳三烯酸(ETA;20:3,n-9)和各種其它脂肪酸,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);202(Δ11,14);20:3(Δ5,11,14);20:3(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或204(Δ5,1,14,17);更優(yōu)選包含小于大約9%,更優(yōu)選小于大約8%,更優(yōu)選小于大約7%,更優(yōu)選小于大約6%,更優(yōu)選小于大約5%,更優(yōu)選小于大約4%,更優(yōu)選小于大約3%,更優(yōu)選小于大約2%,更優(yōu)選小于大約的從下選出的脂肪酸Y-亞麻酸(GLA;18:3,n-6);十八碳四烯酸(STA或SDA;18:4,n-3);二高-Y-亞麻酸(DGLA或HGLA;20:3,n_6),花生四烯酸(ARA,C20:4,n-6);二十碳三烯酸(ETA;20:3,n-9)和各種其它脂肪酸,例如20:0;20:1(Δ5);20:1(Δ11);20:2(Δ8,11);20:2(Δ11,14);203(Δ5,11,14);203(Δ11,14,17);蜂蜜酸(20:3;Δ5,8,11);或20:4(Δ5,1,14,17)。在另一個實施方案中,由在植物內(nèi)產(chǎn)生長鏈PUFA的酶系統(tǒng)產(chǎn)生的脂肪酸含有以重量計少于大約10%的下列所有PUFA,作為由該植物產(chǎn)生的總脂肪酸的百分比Y-亞麻酸(GLA;18:3,n-6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳-碳雙鍵的PUFA,以及具有22個碳和2個或3個碳-碳雙鍵的PUFA;更優(yōu)選少于大約9%,更優(yōu)選少于大約8%,更優(yōu)選小于大約7%,更優(yōu)選小于大約6%,更優(yōu)選小于大約5%,更優(yōu)選小于大約4%,更優(yōu)選小于大約3%,更優(yōu)選小于大約2%,更優(yōu)選小于大約1%的下列所有PUFAY-亞麻酸(GLA;18:3,n-6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳_碳雙鍵的PUFA,以及具有22個碳和2個或3個碳-碳雙鍵的PUFA。在另一個實施方案中,由在植物內(nèi)產(chǎn)生長鏈PUFA的酶系統(tǒng)產(chǎn)生的脂肪酸含有以重量計少于大約10%的下列每一種PUFA,作為由該植物產(chǎn)生的總脂肪酸的百分比Y-亞麻酸(GLA;18:3,n-6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳-碳雙鍵的PUFA,以及具有22個碳和2個或3個碳-碳雙鍵的PUFA;更優(yōu)選少于大約9%,更優(yōu)選少于大約8%,更優(yōu)選小于大約7%,更優(yōu)選小于大約6%,更優(yōu)選小于大約5%,更優(yōu)選小于大約4%,更優(yōu)選小于大約3%,更優(yōu)選小于大約2%,更優(yōu)選小于大約的下列每一種PUFAγ-亞麻酸(GLA;18:3,n_6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳-碳雙鍵的PUFA,以及具有22個碳和2個或3個碳-碳雙鍵的PUFA。在另一個實施方案中,由在植物中產(chǎn)生長鏈PUFA的酶系統(tǒng)產(chǎn)生的脂肪酸含有以重量計少于大約10%的任何一種或多種下列PUFA,作為由該植物產(chǎn)生的總脂肪酸的百分比Y-亞麻酸(GLA;183,n-6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳_碳雙鍵的PUFA,具有22個碳和2個或3個碳-碳雙鍵的PUFA;更優(yōu)選少于大約9%,更優(yōu)選少于大約8%,更優(yōu)選小于大約7%,更優(yōu)選小于大約6%,更優(yōu)選小于大約5%,更優(yōu)選小于大約4%,更優(yōu)選小于大約3%,更優(yōu)選小于大約2%,更優(yōu)選小于大約1%的下列任何一種或多種PUFAγ-亞麻酸(GLA;18:3,n-6),具有18個碳和4個碳-碳雙鍵的PUFA,具有20個碳和3個碳-碳雙鍵的PUFA,具有22個碳和2個或3個碳-碳雙鍵的PUFA。在本實施方案的一個方面中,植物產(chǎn)生至少兩種目標(biāo)PUFA,并且該植物或該植物的積累PUFA的部分(包括來自含油種子的油)中的總脂肪酸譜,包括可檢測量的這些PUFA。在一個實施方案中,PUFA優(yōu)選地每一個均是至少20碳PUFA,包括至少3個雙鍵,更優(yōu)選至少4個雙鍵,再優(yōu)選地至少5個雙鍵。這些PUFA最優(yōu)選地從DHA,DPAn-6和EPA中選擇。在一個方面中,植物產(chǎn)生DHA和DPAn-6,并且DHA對DPAn_6的比例為從大約110到大約101或者更大,包括之間的任何比例。在一個實施方案中,DHA對DPAn-6的比例從大約11到大約31,在另一個實施方案中,為大約2.51.在一個實施方案中,植物產(chǎn)生DHA和EPA。本發(fā)明進(jìn)一步包括由上述植物產(chǎn)生的任何種子,以及任何植物部分,由該植物產(chǎn)生的油或由該植物產(chǎn)生的種子。本發(fā)明還包括用本文描述的植物、植物部分、種子或油產(chǎn)生的任何產(chǎn)物。本發(fā)明的一個實施方案涉及一種修飾含有至少一種脂肪酸的終產(chǎn)物的方法,包括向所述終產(chǎn)物添加由重組宿主細(xì)胞產(chǎn)生的油,其中所述重組宿主細(xì)胞表達(dá)至少一種重組核酸分子,所述重組核酸分子包括編碼本文所述PUFAPKS系統(tǒng)至少一個生物活性域的核酸序列。優(yōu)選地,終產(chǎn)物選自下組食物、膳食補充劑、藥物制劑、人源化動物奶(humanizedanimalmilk)和嬰兒配方食品。合適的藥物制劑包括,但不限于,抗炎制劑、化療劑、活性賦形劑(activeexcipient)、骨質(zhì)疏松藥物、抗抑郁藥、抗驚厥藥、抗幽門螺桿菌藥、用于治療神經(jīng)變性疾病的藥物、用于治療退行性肝病的藥物、抗生素和降膽固醇制劑。在一個實施方案中,終產(chǎn)物用于治療選自下組的病癥慢性炎癥、急性炎癥、胃腸道病癥、癌癥、惡病質(zhì)、心臟再狹窄、神經(jīng)變性疾病、肝退行性病癥、血脂紊亂、骨質(zhì)疏松、骨關(guān)節(jié)炎、自身免疫性疾病、先兆子癇、早產(chǎn)、老化相關(guān)的黃斑病變、肺部疾病和過氧化物酶體異常。合適的食品包括,但不限于,烤制點心(finebakerywares)、面包和面包卷(breadandrolls)、早餐麥片(breakfastcereals)、加工的和未加工的奶酪、調(diào)味品(番茄醬、蛋黃醬等)、乳制品(奶、酸奶)、布丁和膠質(zhì)甜品(gelatinedesserts)、碳酸飲料、茶類飲料(teas)、粉末飲料混合物(powderedbeveragemixes)、經(jīng)過加工的魚制品、基于水果的飲料、口香糖、硬糖果、冷凍乳制品、經(jīng)過加工的肉制品、堅果和基于堅果的涂抹料(nut-basedspreads)、面食、經(jīng)過加工的禽肉制品、肉汁和醬汁、馬鈴薯片和其它片(chip)或脆馬鈴薯片(crisps)、巧克力和其它糖果、湯和制湯料(soupmix)、基于大豆的產(chǎn)品(奶、飲料、奶油、增白劑(whiteners))、基于植物油的涂抹料(vegetableoil-basedspreads)、和基于蔬菜的飲料。本發(fā)明的再一個實施方案涉及產(chǎn)生人源化動物奶的方法。該方法包括用至少一種重組核酸分子對產(chǎn)奶動物的產(chǎn)奶細(xì)胞進(jìn)行遺傳修飾的步驟,該重組核酸分子包括編碼如本文所述PUFAPKS系統(tǒng)至少一個生物活性域的核酸序列。遺傳修飾宿主細(xì)胞以產(chǎn)生遺傳修飾的非人產(chǎn)奶動物的方法是本領(lǐng)域已知的。可修飾的宿主動物的實例包括牛、羊、豬、羊、牦牛等,它們適于進(jìn)行遺傳操作和克隆,用于快速擴增轉(zhuǎn)基因表達(dá)群體。對于動物,可以通過對基因調(diào)節(jié)區(qū)域的修飾使PKS樣轉(zhuǎn)基因在目標(biāo)細(xì)胞器、組織和體液中表達(dá)。特別感興趣的是在宿主動物母乳中產(chǎn)生PUFA。本申請援引并入本文中引用的每一篇出版物或參考文獻(xiàn)的全部內(nèi)容。提供下列實施例的目的是為了舉例,不意圖限制本發(fā)明的范圍。實施例實施例1下面的實施例描述了用于在裂殖壺菌屬中使用的合成裂殖壺菌23B0rfC克隆載體的構(gòu)建。將關(guān)于來自裂殖壺菌屬(例如ATCC20888或裂殖壺菌屬N230D)的四個大基因的密碼子用法數(shù)據(jù)(orfA,orfB,orfCJPFAS;如美國專利申請公開No.20020194641、美國專利申請公開No.20070089199或美國專利申請公開No.20050191679所述)組合在一起。因為裂殖壺菌屬ATCC20888可產(chǎn)生高水平的脂肪酸,預(yù)期這些基因是高表達(dá)的。除去(給定氨基酸的諸密碼子中)代表度(representation)小于3%的密碼子,并調(diào)節(jié)其余密碼子的相對使用率。表1顯示了裂殖壺菌屬密碼子用法、經(jīng)過調(diào)節(jié)的用法和用于非合成裂殖壺菌23BorfC的密碼子用法。使用DNA2.0(MenloPark,CA)對這些密碼子用法數(shù)據(jù)進(jìn)行分析,以設(shè)計和合成破囊壺菌23BorfC的編碼區(qū)。在編碼區(qū)的兩端添加核苷酸,以編碼限制酶識別位點便于隨后的合成基因操作。對少量密碼子進(jìn)行調(diào)節(jié)(不改變被編碼的氨基酸SEQIDNO62)以消除或添加某些限制酶識別序列(例如見下文)。最終的合成序列通過DNA2.0在一個質(zhì)粒載體內(nèi)開發(fā),并在圖2B中顯示為“pThOrfCsynth”。表1顯示了合成編碼區(qū)的密碼子用法。表1.裂殖壺菌屬A,B經(jīng)調(diào)節(jié)的/破囊壺菌23B合成的破囊壺氨基酸密碼子&C加FAS目標(biāo)用法orfC菌23BorfC數(shù)目分?jǐn)?shù)數(shù)目分?jǐn)?shù)數(shù)目分?jǐn)?shù)ArgCGG70.0130130.1800ArgCGA60.0110130.1800ArgCGT940.1730.21170.24110.15ArgCGC4360.8030.79170.24610.85ArgAGG00.0000.0090.1300ArgAGA00.0000.0030.0400SerTCG2440.3270.34190.19320.33SerTCA100.0130.00160.1600SerTCT640.0860.10120.12100.10SerTCC2300.3080.29190.19320.33SerAGT190.0250.00120.1200SerAGC1790.2400.27200.20240.24LeuCTG1110.1230.13360.28130.10LeuCTA20.0020.0070.0500LeuCTT1480.1640.18330.26330.26LeuCTC6230.6900.69270.21820.64LeuTTG180.0200.00210.1600LeuTTA10.0010.0040.0300GlyGGG70.0090.00210.1800GlyGGA380.0470.04330.2950.04GlyGGT1740.2160.25170.15350.30GlyGGC5850.7280.71440.38750.65ValGTG1980.2420.29440.38290.25ValGTA40.0050.00140.1200ValGTT1030.1260.13340.29180.16ValGTC5120.6270.58240.21690.59AlaGCG2140.1590.17210.18200.17AlaGCA410.0310.00360.3100AlaGCT2360.1760.21330.28250.22裂殖壺菌屬A,B經(jīng)調(diào)節(jié)的/破囊壺菌23B合成的破囊壺氨基酸密碼子&C加FAs目標(biāo)用法orfC菌23BorfC數(shù)目分?jǐn)?shù)數(shù)目分?jǐn)?shù)數(shù)目分?jǐn)?shù)AlaGCC8530.6350.62260.22710.61ThrACG1560.2970.28190.30210.33ThrACA130.0250.0080.1300ThrACT710.1350.22160.25100.16ThrACC2850.5430.50200.32320.51ProCCG1950.3400.32190.24270.35ProCCA120.0210.00170.2200ProCCT1160.2020.27290.37190.24ProCCC2500.4360.41130.17320.41lieATA00.0000.0020.0300lieATT1360.2980.28400.57160.23lieATC3200.7020.72280.40540.77GluGAG6830.9120.90470.56770.92GluGAA660.0880.10370.4470.08AspGAT1430.2370.26330.37220.24AspGAC4600.7630.74570.63680.76LysAAG5510.9600.90400.48730.88LysAAA230.0400.10430.52100.12AsnAAT220.0620.11120.2160.10AsnAAC3310.9380.89460.79520.90CysTGT70.0500.06120.3640.12CysTGC1340.9500.94210.64290.88TyrTAT130.0570.39150.34140.32TyrTAC2140.9430.61290.66300.68PheTTT1600.4510.47440.62280.39PheTTC1950.5490.43270.38430.61GlnCAG3060.9240.90260.47500.91GlnCAA250.0760.10290.5350.09HisCAT290.1730.15100.3270.23HisCAC1390.8270.85210.68240.77MetATG2911.001461461TrpTGG1041.001191191如上所述,本發(fā)明人和同事的先前工作(見美國專利申請公開No.20050100995的實施例8)創(chuàng)建了一種質(zhì)粒,其中(非合成的)破囊壺菌23BorfC編碼區(qū)被克隆在裂殖壺菌屬orfC上游和下游非編碼區(qū)之間,從而形成與破囊壺菌23B編碼區(qū)的“完美銜接”(perfectstitch)。該過程中的中間質(zhì)??梢杂糜诳寺『铣善颇覊鼐?3BorfC編碼區(qū)(見圖2A和2B)。為了最容易使用其中一個這些中間構(gòu)建體,本發(fā)明人設(shè)計并通過DNA2.0合成了一個283bp核苷酸序列,以便產(chǎn)生“完美銜接”連接和利用裂殖壺菌屬orfC上游/下游區(qū)內(nèi)的限制位點,并設(shè)計到合成破囊壺菌23BorfC基因內(nèi),用于隨后的克隆反應(yīng)。這個短DNA序列被指稱為“Th23BsynthorfCINT”,包含在質(zhì)?!皃ThOrfCstitchINT”中。283bp"Th23BsynthorfCINT”由5個區(qū)段組成。第一個區(qū)段包括裂殖壺菌屬orfC上游(非編碼)區(qū)的最后102bp,從裂殖壺菌屬orfC的SpeI位點起到但不包括ATG密碼子止(見SEQIDN0:77)。第二個區(qū)段由合成的破囊壺菌23BorfC編碼區(qū)(SEQIDNO61)的最先9bp構(gòu)成,并包含與設(shè)計的SanDI位點(GGGTCCC)有重疊的起始ATC。這些片段生成上游“完美銜接”連接。第三個區(qū)段是一個6bpBamHI限制位點(GGATCC),其發(fā)揮間隔序列(spacer)的作用。第四個區(qū)段由破囊壺菌23BorfC編碼區(qū)(SEQIDNO61)的最后45bp構(gòu)成,從設(shè)計的ClaI位點起到TAA終止密碼子止。第五個區(qū)段包括裂殖壺菌屬orfC(非編碼)下游區(qū)的最先121bp(不包括終止密碼子),直到“反向"BsmI位點?!癟h23BsynthorfCINT”片段沿“正向”的最后6個核苷酸是5'>GCATTC>3'。反向互補序列5'>GAATGC>3'是BsmI的識別序列。第四和第五個區(qū)段形成下游“完美銜接”連接。合成破囊壺菌23BorfC編碼序列的“完美銜接”版本的構(gòu)建細(xì)節(jié)在下文中給出(另見圖2A和2B)。步驟1(圖2A)。用SpeI和BsmI限制酶消化從pThOrfCstitchINT移出“Th23BsynthorfCINT”片段,并通過瓊脂糖凝膠電泳(GeneCleanTurbokit,QBioGene)純化該片段。類似地,獲得來自pREZ22(見美國專利申請公開No.20050100995)的Spel/BsmI載體片段,其含有分別大約2000bp的裂殖壺菌屬orfC上游和下游區(qū),二者被一個BamHI識別位點間隔序列所隔開,克隆在pBlueScriptllSK(+)中。將這兩個片段連接并轉(zhuǎn)化到大腸桿菌XL-IBlue(Stratagene,LaJolla,CA)中。通過限制性消化和部分DNA測序了鑒定含有期望質(zhì)粒“pREZ22orfCINT”的克隆。該質(zhì)粒含有分別與合成orfC編碼區(qū)的5,和3,區(qū)完美銜接的裂殖壺菌屬orfC上游和下游區(qū),但是沒有編碼區(qū)的主體。步驟2(圖2B).通過用SanDI和ClaI限制酶消化并純化期望DNA片段(見上文)從”PThOrfCsynth”獲得合成破囊壺菌23BorfC編碼區(qū)的主體。將該片段連接到以類似方式從PREZ22orfCINT獲得的載體片段內(nèi),并克隆到大腸桿菌中(如上文)。所得的質(zhì)?!皃ThOrfC-synPS”含有與裂殖壺菌屬orfC基因的上游和下游區(qū)完美銜接的全長合成破囊壺菌23BorfC編碼區(qū)。pThOrfC-synPS的編碼區(qū)核苷酸序列在本文用SEQIDN0:70表示。SEQIDNO:70編碼SEQIDNO:62。pTh0rfC_synPS已經(jīng)保藏于ATCC,保藏號為No.PTA-8229,如本文前面所述。實施例2下面的實施例描述了如下構(gòu)建體的產(chǎn)生,其編碼裂殖壺菌屬OrfC,該裂殖壺菌屬OrfC包含來自破囊壺菌23B的DH2域。利用基于PCR的重疊延長("SplicingbyOverlapExtension”或"S0Eing"(Horton,R.Μ.,(1993)InVitroRecombinationandMutagenesisofDNA.SOEingtogethertailor-madegenes.MethodsinmolecularBiology第15卷PCRProtocolsCurrentMethodsandApplications第25章251-266頁(B.A.White,Ed.)HumanaPress,Totawa,NJ)和限制性克隆相結(jié)合,將裂殖壺菌屬ATCC20888OrfC的DH2域(SEQIDN0:30)在特異的5,和3,交換點(crossoverpoint)用來自破囊壺菌23BATCC20892的DH2域(SEQIDNO66)替換。更具體地說,在本實施例中,發(fā)明人構(gòu)建了一種核酸分子,其編碼一種雜合(嵌合)型OrfC多肽(本文用SEQIDNO74表示的氨基酸序列),長度為1493個氨基酸殘基,其中DH2區(qū)——定義為該雜合體的氨基酸516-1041——由破囊壺菌23BOrfC蛋白DH2區(qū)的氨基酸序列,即SEQIDNO:62的氨基酸491-1016組成,包括全部的SEQIDN0:66(本文稱作破囊壺菌23B的DH2域)。雜合體OrfC氨基酸序列的其余部分,即SEQIDNO74的殘基1-515和1042-1493,分別與SEQIDNO6的裂殖壺菌屬OrfC殘基1-515和1051-1502相同。編碼該嵌合蛋白的質(zhì)粒的構(gòu)建如圖3A-3C所示。步驟1使用引物prREZ197(SEQIDNO78)和prREZ198(SEQIDNO79)用未修飾的裂殖壺菌屬orfC基因作為模板擴增DH2區(qū)上游的裂殖壺菌屬orfC閱讀框的大約1.5KbprREZ197CATATGGCGCTCCGTGTCAAprREZ198GCCAGGAAGCTTTGACATGGGGTGCCAGGACATCT弓丨物prREZ197在起始ATG密碼子處生成一個NdeI位點(下劃線標(biāo)記)。反向引物prREZ198(35聚體)含有5,交換點,其是由與裂殖壺菌屬OrfC同源的20bp序列(粗體)和與破囊壺菌23BOrfC同源的15bp序列形成的。PCR條件50μL反應(yīng)物,1μLPfuUltra聚合酶(Stratagene)和IXPfuUltra緩沖液,2%DMSO,每種dNTP各0.5μM,prRZ197禾口prRZ198各0.4μM,IOng模板(克隆的裂殖壺菌屬orfC編碼區(qū)),94°CImin初始變性,20個循環(huán)的94°C變性lmin,52°C退火lmin,72°C延伸90sec,和最后延伸lOmin。瓊脂糖凝膠電泳之后,用QIAquickGelExtractionKit(Qiagen,Valencia,CA)純化PCR產(chǎn)物。步驟2使用引物prREZ199(SEQIDNO80)和prREZ200(SEQIDNO81)以破囊壺菌23BorfC基因作為模板擴增破囊壺菌23BDH2區(qū)(大約1.5Kb)。prREZ199TCCTGGCACCCCATGTCAAAGCTTCCTGGCAACCCTAprREZ200AGTATACAGAGGTGCTGACA引物prREZ199(37聚體)含有5,交換點,其是由與破囊壺菌23BorfC(DH2)序列同源的22bp序列和與裂殖壺菌屬orfC序列同源的15bp序列(粗體)生成的。后面的15bp還提供了與prREZ198(因此與步驟1的PCR產(chǎn)物)的重疊。反向引物prREZ200在3,交換點含有一個破囊壺菌23BorfC中的天然BstZ17I位點(下劃線標(biāo)注)。PCR條件和片段純化與上文相同,只是使用引物prREZ199和prREZ200和以IOng克隆的破囊壺菌23BorfC編碼區(qū)作為模板。步驟3.利用重疊延伸來產(chǎn)生裂殖壺菌屬orfC編碼區(qū)5’端和破囊壺菌23BDH2區(qū)之間的全長融合。用步驟l(prREZ197xprREZ198)和步驟2(prREZ199xprREZ200)的產(chǎn)物作為模板,prREZ197和prREZ200為外側(cè)(outside)引物進(jìn)行PCR0PCR條件:50μL反應(yīng)物,1μLPfuUltra聚合酶(Stratagene)和IXPfuUltra緩沖液,2%DMSO,每種dNTP各0.5μM,prRZ197和prRZ200各0.4μM,步驟1和2的PCR產(chǎn)物各50ng,94°CImin初始變性,20個循環(huán)的94°C變性lmin,52°C退火lmin,72°C延伸3.5min,和最后延伸IOmin0PCR產(chǎn)物如步驟1所述進(jìn)行純化。步驟4用制造商推薦的條件將步驟3的PCR產(chǎn)物克隆到pCR-BluntlΙ-Τ0Ρ0(Invitrogen)內(nèi),并轉(zhuǎn)化進(jìn)入TOP10大腸桿菌(Invitrogen)中,從而產(chǎn)生pREZ171。確認(rèn)了插入DNA的序列與設(shè)計的一致。步驟5利用各個載體序列中的限制位點,將PREZ171中的克隆DNA作為Xbal/Spel片段轉(zhuǎn)移到載體pBCKS(+)(Stratagene),從而產(chǎn)生pREZ175。步驟6將質(zhì)粒pREZ175用BstZ17I消化(線性化),然后用NdeI部分消化。將代表融合的裂殖壺菌屬orfC5’區(qū)和破囊壺菌23BDH2區(qū)的一個大約6Kb的片段克隆到pREZ172NdeI/BstZ17I載體片段內(nèi),產(chǎn)生pREZ177。質(zhì)粒pREZ172包含克隆到大腸桿菌表達(dá)載體pColADuet-1(Novagen)內(nèi)的完整裂殖壺菌屬orfC編碼區(qū),使得起始ATG密碼子包含一個NdeI位點。該質(zhì)粒衍生自pREZlOl(見實施例5),并經(jīng)過定點誘變(QuikChangekit,Stratagene)jftrp,^3'^^^^itAT-(aminoacid-neutral)BstZ17I位點。具體地說,1051位氨基酸的TAC酪氨酸密碼子被修改成TAT。步驟7在通過DNA測序?qū)REZ177進(jìn)行分析時,發(fā)現(xiàn)BstZ17I位點中的一個單堿基對被刪除。具體地說,預(yù)期的<GTATAC>變成了<GTAAC>。為了修正這個錯誤,使用來自PDS26的含有正確BstZ17I交換點的PciI限制片段替換pREZ177中的缺陷PciI片段。質(zhì)粒pDS26包含一個先前為其它目的而產(chǎn)生的雜合orfC編碼區(qū)。因此所得的質(zhì)粒pREZ179含有一個完整orfC編碼區(qū),其主要來自裂殖壺菌屬,但是DH2區(qū)被精確地替換成來自破囊壺菌23B的DH2區(qū)(本文用SEQIDNO74表示的氨基酸序列)。質(zhì)粒pREZ179進(jìn)一步可以作為一種獨特的工具用于研究該雜合基因在大腸桿菌中的功能,并為開發(fā)用于其它生物體的表達(dá)載體提供了起點。下面的額外步驟(見圖3C)描述了將來自PREZ179的雜合基因轉(zhuǎn)移到一個用于在裂殖壺菌屬中進(jìn)行基因替換的載體中。步驟8從pBR002(orfC基因組區(qū)的一個克隆)中以Nhel/BspEI片段的形式分離出(未修飾的)裂殖壺菌屬orfC編碼區(qū)加上小部分的上游和下游側(cè)翼序列。然后將該片段克隆到用Nhel/BspEI消化的pREZ31(功能上等價于在美國專利申請公開No.20050100995實施例8中描述的pREZ33)的載體部分內(nèi)。由此所得的質(zhì)粒,pDS48,包含(未修飾的)裂殖壺菌屬orfC編碼區(qū)加上與用于驅(qū)動orfC座位基因交換的相同的上游和下游序列。步驟9以Pstl/PflMI片段的形式從pREZ179分離出雜合orfC閱讀框中含有整個經(jīng)交換的破囊壺菌23BDH2區(qū)的部分。將該片段克隆到用Pstl/PflMI消化的pDS48的載體部分中,產(chǎn)生PDS49。結(jié)果,質(zhì)粒pDS49將該雜合orfC包含在與pREZ33相同的環(huán)境中(全長破囊壺菌23BorfC編碼區(qū)作為“完美銜接”的基因替換;見專利申請公開No.20050100995實施例8)。pDS49編碼區(qū)的核苷酸序列在本文用SEQIDN0:73表示。SEQIDN0:73編碼SEQIDNO:74ο質(zhì)粒pDS49已經(jīng)保藏于ATCC,保藏號為PTA-8230,如本文前面詳述。實施例3下面的實施例描述了一種編碼裂殖壺菌屬OrfC的構(gòu)建體的構(gòu)建,該裂殖壺菌屬OrfC包含來自破囊壺菌23B的DH2域,其中該DH2域被重新合成,以針對裂殖壺菌屬的密碼子用法進(jìn)行優(yōu)化。在本實施例中,發(fā)明人構(gòu)建了一種核酸分子,其編碼雜合體OrfC多肽(SEQIDN074),長度為1493個氨基酸殘基,其中的DH2區(qū),定義為該雜合體的氨基酸516-1041,由破囊壺菌23BOrfC蛋白DH2區(qū)的氨基酸序列,即SEQIDNO62的氨基酸491-1016組成,其包括整個SEQIDN0:66(本文稱作破囊壺菌23B的DH2域)。雜合OrfC氨基酸序列的其余部分,SEQIDNO74的殘基1-515和1042-1493,分別與SEQIDNO6的裂殖壺菌屬OrfC殘基1-515和1051-1502相同。而且,在該構(gòu)建體中,編碼氨基酸516-1041的DNA序列衍生自質(zhì)粒pThOrfCsynth和PTh0rfC_synPS中所含的破囊壺菌23BOrfC的“合成基因序列”(見實施例1和SEQIDNO:70),并且采用了裂殖壺菌屬中的基因表達(dá)優(yōu)選的密碼子。該構(gòu)建的細(xì)節(jié)如圖4A-4C所示,并在下文中描述。通過PCR(Rxn59/60)從pThOrfCsynth擴增編碼T23BOrfC多肽DH2域的DNA序列,使用寡核苷酸引物dhd59(5>GCACCCCATGAGCAAGCTCCCCGGCAAC>3;SEQIDNO82)和dhd60(5>GT4TACAGAGGCGCAGACACGTTGTAAG>3;SEQIDNO:83)?!罢颉被蛴辛x鏈引物dhd59與編碼破囊壺菌23BOrfC蛋白氨基酸殘基491-501(WHPMSKLPGNP;SEQIDNO:62的位置491-501)的DNA序列重疊?!胺聪颉被蚍戳x鏈引物dhd60與編碼破囊壺菌23BOrfC蛋白氨基酸殘基1008-1017(TYNVSAPLYT;SEQIDNO:62的位置1008-1017)的DNA序列重疊。引物dhd60包含兩個與pThOrfCsynth序列的錯配,其在上面的dhd60序列中用畫框殘基表示。這些改變產(chǎn)生了一個BstZ17I限制內(nèi)切酶位點,在上面的dhd60序列中用雙下劃線部分表示,以便于隨后的克隆步驟,另外在雜合蛋白的編碼序列中引入了兩個“沉默突變”:CTT(L)變?yōu)镃TG(L)和TAC(Y)變?yōu)門AT(Y)。該擴增在反應(yīng)體積為40μ1的IXPfuUltraHF反應(yīng)緩沖液(Stratagene,LaJolla,CA)中進(jìn)行,該體系含有dhd59和dhd60各0·5μΜ,200μΜdNTPs,2單位PfuUltra高保真DNA聚合酶(Stratagene,LaJolla,CA),和IngpThOrfCsynthDNA。循環(huán)參數(shù)為lX[lmin94°C],28X[(lmin94°C),(0.5min60°C),(1.5min72°C)],1Χ[8·5min72°C],和保持于4°C。反應(yīng)在PerkinElmerGeneAmpPCRSystem2400thermocycler(AppliedBiosystems,FosterCity,CA)中進(jìn)行。通過PCR(Rxn57/58)從pREZ179擴增由pREZ179編碼的雜合OrfC蛋白的氨基酸殘基331-522的編碼DNA序列,使用寡核苷酸引物dhd57(5>CTGCAGCCAGATGCTCAAGATGTACATG>3;SEQIDNO84)和dhd58(5>GGAGCTTGCTCATGGGGTGCCAGGACATCTC>3;SEQIDNO85)?!罢颉被蛴辛x鏈引物dhd57與由pREZ179編碼的雜合OrfC蛋白的氨基酸殘基330-339(GCSQMLKMYM;SEQIDNO:74的位置330-339)的編碼DNA序列重疊。“反向”或反義鏈引物dhd58與雜合OrfC蛋白氨基酸殘基513-523(EMSWHPMSKLP;SEQIDNO74的位置513-523)的編碼DNA序列重疊。正向引物dhd57的5,端與pREZ179所含雜合OrfC編碼序列中存在的PstI位點重疊。該擴增在反應(yīng)體積為40μ1的IXPfuUltraHF反應(yīng)緩沖液(Stratagene,LaJolla,CA)中進(jìn)行,該體系含有dhd57和dhd58各0.5μM,200μMdNTPs,2單位PfuUltra高保真DNA聚合酶(Stratagene,LaJolla,CA),和IngpThOrfCsynthDNA。循環(huán)參數(shù)為lX[lmin94°C],28X[(lmin94°C),(0.5min60°C),(1.5min72°C)],1Χ[8·5min72°C],和保持于4°C。反應(yīng)在PerkinElmerGeneAmpPCRSystem2400thermocycler(AppliedBiosystems,FosterCity,CA)中進(jìn)行。57/58和59/60反應(yīng)產(chǎn)物各取4微升跑1.2%瓊脂糖凝膠。每種情況下都觀察到了與預(yù)期產(chǎn)物大小一致的DNA條帶57/58產(chǎn)物為578bp,59/60產(chǎn)物為1578bp。將這些條帶從凝膠切離,并用QIAquickGelExtractionKit(QIAGEN,Inc.Valencia,CA)根據(jù)制造商規(guī)程從凝膠片段回收DNA。PCR產(chǎn)物回收在40μ1洗脫緩沖液中。反向引物dhd58的5,20個核苷酸(上文用下劃線標(biāo)注)包括dhd59的5,20個核苷酸(也用下劃線標(biāo)注)的反向互補序列。結(jié)果,Rxn57/58產(chǎn)物3’端與Rxn59/60產(chǎn)物5’端之間存在一個20bp的相同的重疊,并且該重疊允許隨后通過PCR“重疊延伸剪接(SplicingbyOverlapExtension)”或“S0E”技術(shù)[Horton,R.Μ·,(1993)InVitroRecombinationandMutagenesisofDNA.SOEingtogethertailor-madegenes.MethodsinmolecularBiologyVol.15:PCRProtocolsCurrentMethodsandApplicationsChapter25pp251-266(B.A.White,Ed.)HumanaPress,Totawa,NJ]對這兩個產(chǎn)物進(jìn)行PCR剪接(splicing)。那樣,該剪接的片段在其末端(BstZ17I&PstI)或接近(BsiWI)其末端含有有用的限制位點。PCR剪接反應(yīng)(Rxn57/60)如下進(jìn)行。反應(yīng)體積為40μ1的lXPfuUltraHF反應(yīng)緩沖液(Stratagene,LaJolla,CA),其含有dhd57和dhd60各0.5μM,200μMdNTPs,2單位PfuUltra高保真DNA聚合酶(Stratagene,Lajolla,CA),和50倍稀釋的每種凝膠純化PCR產(chǎn)物57/58和59/60各0.8μ1。進(jìn)行一系列的PCR剪接反應(yīng),其中退火溫度在66_70°C之間以1°C遞增變化。其它的循環(huán)參數(shù)保持恒定lX[lmin98°C],33X[(lmin98°C),(Imin66-70°C),(2.5min72°C)],IX[7.5min72°C],和保持于6°C。反應(yīng)在RoboCyclerTemperatureCycler(Stratagene,Lajolla,CA)上進(jìn)行。將這些反應(yīng)產(chǎn)物的等量樣品跑1%瓊脂糖凝膠,觀察到所有的反應(yīng)物均含有一個與預(yù)期產(chǎn)物(2136bp)大小一致的產(chǎn)物,但是在所有的退火溫度下也觀察到了其它的條帶。因此,將在67、68和69°C退火的3個反應(yīng)產(chǎn)物合并,跑1%瓊脂糖凝膠,切割大約2.Ikb的目的條帶,并用QIAquickGelExtractionKit(QIAGEN,Inc.Valencia,CA)根據(jù)制造商規(guī)程回收DNA片段。洗脫的DNA收集于30μ1洗脫緩沖液中,并用ZeroBluntTOPOPCRCloningKit(InvitrogenCorp.,Carlsbad,CA)根據(jù)制造商的規(guī)程克隆到PCR片段克隆載體pCR-BluntIITQPO(InvitrogenCorp.,Carlsbad,CA)中。使用TOPO克隆反應(yīng)的產(chǎn)物根據(jù)制造商規(guī)程轉(zhuǎn)化ShotT0P10化學(xué)感受態(tài)大腸桿菌(Invitrogen)。將8個所得的轉(zhuǎn)化體過夜培養(yǎng),通過限制酶消化和瓊脂糖凝膠電泳制備和分析質(zhì)粒DNA。8個中的7個被發(fā)現(xiàn)含有克隆的2.IkbPCR產(chǎn)物57/60。對一個分離物的克隆PCR57/60產(chǎn)物進(jìn)行測序,并顯示與預(yù)期序列完全匹配。DNA測序在康奈爾大學(xué)生物技術(shù)資源中心(Ithaca,NewYork)付費進(jìn)行,使用AppliedBiosystemsAutomated3730DNAAnalyzer,并使用BigDyeTerminatorchemistry禾口AmpliTaq-FSDNA聚合酶(AppliedBiosystems,F(xiàn)osterCity,CA)。含有確認(rèn)插入序列的質(zhì)粒被指稱為PDD21,并用于進(jìn)一步的構(gòu)建步驟,如下文所述。將編碼破囊壺菌23BDH2域并針對裂殖壺菌屬密碼子用法優(yōu)化過的DNA片段從pDD21切離,并克隆到pREZ179中(見實施例2),使之替換該構(gòu)建體中存在的天然破囊壺菌23BDH2域編碼序列。所得質(zhì)粒,PDD22,的構(gòu)建如下。用BsiWI和BstZ171(NewEnglandBioLabs,BeverlyΜΑ)根據(jù)制造商規(guī)程消化純化的pDD21DNA。隨后用QIAquickSpinPurificationProcedureandQIAquickPCRPurificationKit(QIAGENInc.,Valencia,CA)根據(jù)制造商規(guī)程對反應(yīng)產(chǎn)物進(jìn)行處理。純化的消化產(chǎn)物跑瓊脂糖凝膠,并切離1940bpBsiWI-BstZ17I片段,并用QIAEXIIGelExtractionKit(QIAGENInc.,Valencia,CA)根據(jù)制造商規(guī)程從瓊脂糖洗脫。純化的pREZ179DNA同樣用BsiWI和BstZ17I消化,并隨后用Antarctic磷酸酶(NewEnglandBioLabs,Beverly,MA)根據(jù)制造商規(guī)程進(jìn)行處理。磷酸酶消化產(chǎn)物也用如上所述的QUIquick規(guī)程處理,并跑0.7%瓊脂糖凝膠。從凝膠切離6.1KbBsiWI-BstZ17I載體片段,用QIAEXIIGelExtractionKit如上所述地從瓊脂糖洗脫。在IXT4連接酶反應(yīng)緩沖液中用T4連接酶連接這兩個片段,緩沖液和酶均來自NewEnglandBioLabs(Beverly,ΜΑ)0連接產(chǎn)物用于根據(jù)制造商規(guī)程轉(zhuǎn)化OneShotT0P10化學(xué)感受態(tài)大腸桿菌(Invitrogen)。通過限制內(nèi)切酶消化和瓊脂糖凝膠電泳對來自三個所得轉(zhuǎn)化體的質(zhì)粒DNA進(jìn)行分析,發(fā)現(xiàn)三個轉(zhuǎn)化體均具有預(yù)期重組體的結(jié)構(gòu)。將一個質(zhì)粒命名為PDD22,并用于進(jìn)一步的構(gòu)建。為了便于將編碼雜合OrfC(其含有用裂殖壺菌屬優(yōu)選密碼子編碼的破囊壺菌23BDH2區(qū))的DNA引入到裂殖壺菌屬基因組中,從pDD22切離一個跨越DH2區(qū)編碼序列的PstI-PflMIDNA區(qū)段,并把它克隆到被設(shè)計用于在裂殖壺菌屬orfC基因座位的序列處進(jìn)行基因替換的載體PDS48中(見實施例2)。所得的質(zhì)粒pDD24用于隨后的基因替換,其構(gòu)建方法如下。從pDD22切離編碼T23BDH2域并具有優(yōu)化密碼子用法的DNA片段,并把它克隆到pDS48中,使之代替該構(gòu)建體中存在的天然裂殖壺菌屬DH2域編碼序列。根據(jù)制造商規(guī)程用PstI,PflMI和ClaI(NewEnglandBioLabs,BeverlyΜΑ)消化純化的pDD22DNA。用ClaI消化切開一個PflMI-PflMI片段,該片段本身可遷移到接近目的PflMI-PflMI3.2Kb片段的位置附近。隨后利用QIAquickSpinPurificationProcedure和QIAquickPCRPurificationKit(QIAGENInc.,Valencia,CA)根據(jù)制造商規(guī)程對反應(yīng)物進(jìn)行處理。純化的消化產(chǎn)物跑0.7%瓊脂糖凝膠,并切離感興趣的3.2Kb的PstI-PflMI片段,用QIAEXIIGelExtractionKit(QIAGENInc.,Valencia,CA)根據(jù)制造商規(guī)程從瓊脂糖中洗脫出來。純化的PDS48DNA類似地用PflMI和PstI消化,進(jìn)行如上所述的QIAquick處理,并跑0.7%瓊脂糖凝膠。從凝膠切離8.OKbPstI-PflMI載體片段,并用QIAEXIIGelExtractionKit如上所述地從瓊脂糖洗脫出來。將這兩個片段在IXT4連接酶緩沖液中用T41連接酶連接起來,兩種試劑均來自NewEnglandBioLabs(Beverly,ΜΑ)根據(jù)制造商規(guī)程,用連接產(chǎn)物轉(zhuǎn)化OneShotTOPlO化學(xué)感受態(tài)大腸桿菌(Invitrogen)。所得的轉(zhuǎn)化體在含有ΙΟΟμg/ml氨芐青霉素的液體培養(yǎng)基中30°C過夜生長。這些轉(zhuǎn)化體在37°C液體培養(yǎng)基中的增殖導(dǎo)致質(zhì)粒在一些環(huán)境下不穩(wěn)定。通過限制內(nèi)切酶消化和瓊脂糖凝膠電泳對來自其中三個所得轉(zhuǎn)化體的質(zhì)粒DNA進(jìn)行分析,發(fā)現(xiàn)全部三個均具有預(yù)期重組體的結(jié)構(gòu)。將一個質(zhì)粒命名為PDD24并進(jìn)行進(jìn)一步的內(nèi)切酶分析,在裂殖壺菌屬中的基因替換實驗中使用了該質(zhì)粒(見實施例4)。pDD24編碼區(qū)的核苷酸序列在本文用SEQIDN0:75表示。SEQIDNO75編碼SEQIDNO:74。質(zhì)粒pDD24已經(jīng)保藏于ATCC,保藏號為No.PTA-8226,如本文前面所述。實施例4下面的實施例描述了上面在實施例1-3中描述的各種破囊壺菌23BorfC構(gòu)建體在裂殖壺菌屬中的表達(dá),和對由這些生物體產(chǎn)生的PUFA進(jìn)行的分析。變異體破囊壺菌23BorfC基因在裂殖壺菌屬中的表汰使用前人所描述的技術(shù)(見美國專利申請公開No.2003/0166207),通過離子轟擊用質(zhì)粒pThOrfC-synPS(全長合成的破囊壺菌23BorfC;見實施例1),pDS49(非合成破囊壺菌23BDH2區(qū);見實施例2),和pDD24(合成的破囊壺菌23BDH2區(qū);見實施例3)轉(zhuǎn)化裂殖壺菌屬菌株B32-Z1(見上文及美國專利申請公開No.20050100995的實施例8),其是在裂殖壺菌屬orfC編碼區(qū)具有一個精確缺失的裂殖壺菌屬。獲得了自養(yǎng)型Zeocin-敏感轉(zhuǎn)化體。通過所選菌株的Southern印跡和/或PCR確認(rèn),這種轉(zhuǎn)化體是通過雙交換基因替換事件產(chǎn)生的。簡而言之,離子轟擊使用BioRad(Hercules,CA)BiolisticPDS-1000/He粒子輸送系統(tǒng)。用于轉(zhuǎn)化的裂殖壺菌屬菌株在回轉(zhuǎn)平臺(200rpm)上于M2B培養(yǎng)基(視情況加DHA)中29-30°C生長至0D600=1-2.5(BioPhotometer,Eppendorf)。通過離心(3000rpm,5min)收集細(xì)胞,并重新懸浮于無菌7.5g/LNa2S04中,使0D600=30。將150μL體積的懸浮細(xì)胞在含有Μ2Β瓊脂糖(無DHA)的Petri平皿上鋪散成圓形片(直徑6cm)。為了PUFA營養(yǎng)缺陷型的生長,利用溶于40%(w/v)隨機甲基化β-環(huán)糊精(CTDInc,HighSprings,FL.)的25mMDHA儲液向M2B補充DHA至0.25mM。當(dāng)為了補足DHA營養(yǎng)缺陷型進(jìn)行轟擊時,瓊脂糖培養(yǎng)基中不加DHA。轟擊在層流潔凈室中執(zhí)行,使用IlOOpsi爆破圓盤(rupturediscs),圓盤固定巾冒(discretainingcap)與大載體蓋(macrocarriercoverlid)之間縫隙為0.25in,停止屏支座處于中間位置。目標(biāo)架(targetshelf)置于L2(6cm)位置。將含有經(jīng)轟擊的DHA營養(yǎng)缺陷型裂殖壺菌屬菌株的Petri平皿溫育在29_30°C,直到(預(yù)期自養(yǎng)型)菌落出現(xiàn)(3-5天)。隨機選擇的菌落在M2B瓊脂平板上劃線。生長后,將數(shù)個分離良好的克隆轉(zhuǎn)移到含有或不含Zeocin(50yg/mL)的M2B平板上。選擇Zeocin敏感性DHA自養(yǎng)型(提示有基因替換事件)用于進(jìn)一步的研究。用于脂肪酸分析的裂殖壺菌屬的培養(yǎng)在含有50mLM50-20培養(yǎng)基的錐形瓶(250mL)中接種一個指定菌株冷凍小瓶中的內(nèi)容物(lmL)。錐形瓶在旋轉(zhuǎn)搖床上在29-30°C下以200rpm溫育72小時。在含有SSFM培養(yǎng)基的相似錐形瓶中接種0.5mLM50-20培養(yǎng)物,并如上所述地溫育5天。用等體積的70%異丙醇稀釋培養(yǎng)液之后,通過離心(4000g,5min)收集細(xì)胞。將所得的細(xì)胞離心沉淀懸浮在原體積的35%異丙醇水溶液中,并再次離心。將清洗過的細(xì)胞離心沉淀直接冷凍在-70°C,隨后凍干。用酸性甲醇制備脂肪酸甲酯(FAME),將它們萃取到己烷中,再通過氣-液色譜進(jìn)行分析,來確定干燥后生物質(zhì)的脂肪酸含量。M50-20培養(yǎng)基每升M50-20培養(yǎng)基的組分如下12.5gNaCl、2.5gMgS047H20、0.5gKCl、0.05gCaCl2、20.Og葡萄糖、20.OgNa_谷氨酸、0.4gKH2P04、1.Og酵母提取物、0.4gNaHC03、5mlPII痕量金屬(200XPII痕量金屬溶液含有(每升)6.OgNa2EDTA、0.29gFeCl36H20、6.84gH3B03、0.86gMnCl24H20、60mgZnCl2、26mgCoCl26H20、52mgNiS046H20、2mgCuS045H20、和5mgNaMo042H20、pH8.0)、lmlPII維生素混合物(1000XPII微生物混合物含有(每升):100mg硫胺素、0.5mg生物素、和0.5mg維生素B12),pH7.0。SSFM培養(yǎng)基每升SSFM培養(yǎng)基的組分如下13.62gNa2S04、0.72gK2S04、0.56gKC1、2.27gMgS047H20、0.19gCaCl2、0.0565gKH2P04、0.57g(NH4)2S04、0.13gNa_谷氨酸、lOOmMMES(4-嗎啉乙磺酸)pH6.0,50.Og葡萄糖、0.16mg維生素B12、9.75mg硫胺素、3.33mg泛酸鈣、10.3mgFeS047H20、3.lmgMnCl24H20、1.93mgZnS047H20、0.04mgCoCl26H20、0.04mgNaMo042H20、2.07mgCuS045H20、2.07mgNiS046H20、2.Omg檸檬酸。M2B培養(yǎng)基每升M2B培養(yǎng)基的組分如下葡萄糖10g、(NH4)2S040.8g、Na2S045.0g、MgS047H202.0g、KH2P040.5g、KCl0.5g、CaCl2.2H200.lg、維生素B120.05mg、硫胺素.HC1、0.2mg、泛酸鈣0.2mg、FeS047H203.0mg、MnCl24H201.0mg、ZnS047H200.8mg、CoCl26H200.02mg、Na2Mo042H200.01mg、CuS045H200.6mg、NiS046H200.8mg、MES緩沖液0.lM、pH6.0(用NaOH調(diào)節(jié))。表2顯示了裂殖壺菌屬ATCC20888和衍生菌株的總脂肪酸、DHA和DPAn_6含量(表示為FAME(脂肪酸甲酯)),在上述衍生菌株中,天然的orfC編碼區(qū)被破囊壺菌23B的orfC編碼區(qū)的全部或其一部分替換(在實施例1-3中描述)。整個裂殖壺菌屬ATCC20888orfC編碼區(qū)被來自破囊壺菌23B(菌株B34-1)的orfC編碼區(qū)替換導(dǎo)致DHA/PAn_6比例升高(接近破囊壺菌23B的比例),但總PUFA含量降低。密碼子優(yōu)化(合成)的破囊壺菌23BorfC編碼區(qū)的使用(例如在pTh0rfC_syn_PS轉(zhuǎn)化的菌株B67-5中)——其中PUFA產(chǎn)生相對于野生型水平增加,但仍然保持提高的DHA/DPAn-6比例——證明了蛋白表達(dá)可能是總PUFA含量較低的原因。當(dāng)僅將裂殖壺菌屬DH2區(qū)替換為破囊壺菌屬的DH2域時,表現(xiàn)出類似的情況。具有密碼子優(yōu)化的破囊壺菌23BDH2區(qū)的菌株(B69-2;用pDD24轉(zhuǎn)化)可產(chǎn)生比具有非優(yōu)化DH2區(qū)的菌株(B105-1A1;用pDS49轉(zhuǎn)化)更高的PUFA。然而,菌株B105-1A1(非優(yōu)化DH2區(qū))中的DHA/DPA比例顯著較高。有趣的是,菌株B69-6可產(chǎn)生高水平的DHA和相對高的DHA/DPA比例。該菌株與菌株B69-2同樣是用質(zhì)粒pDD24轉(zhuǎn)化菌株B32-Z1而獲得的。但是,菌株B69-6不具有修飾orfC編碼區(qū)的正確整合/基因替換(如PCR分析確定的),盡管該差異的確切性質(zhì)尚不知曉。給定這些數(shù)據(jù),可以使用菌株B69-2開發(fā)工業(yè)生產(chǎn)規(guī)模的發(fā)酵,以實現(xiàn)最大的DHA產(chǎn)量;或者,如果追求最大的DHA/DPA比例,可以使用菌株B69-6或B105-1A1。表2.orfC變異體概覽Dew干細(xì)胞重量FAME脂肪酸甲酯Th.23B破囊壺菌23B;ATCC20892實施例5下面的實施例描述了利用多質(zhì)粒系統(tǒng)在大腸桿菌中產(chǎn)生DHA和DPA,并進(jìn)一步示例說明了PUFAPKS系統(tǒng)的DH2域可控制由系統(tǒng)產(chǎn)生的脂肪酸的比例。發(fā)明人在先前已經(jīng)演示了通過使用T7誘導(dǎo)型系統(tǒng)表達(dá)來自裂殖壺菌屬的OrfA、OrfB*.OrfC和來自念珠藍(lán)細(xì)菌的Hetl在大腸桿菌中產(chǎn)生DHA和DPA(美國專利申請公開No.20050100995實施例3第41頁)。在這個先前的實例中,OrfA,OrfB*和OrfC包含在一個單一的質(zhì)粒上。為了產(chǎn)生更容易進(jìn)行遺傳操作的系統(tǒng),將各個來自裂殖壺菌屬的編碼區(qū)克隆在一系列相容表達(dá)質(zhì)粒上,這些質(zhì)粒被設(shè)計用于共表達(dá)多個靶基因。這些靶基因的表達(dá)同樣也是被這些Duet系列質(zhì)粒(Novagen)上的誘導(dǎo)型T7啟動子驅(qū)動的。將裂殖壺菌屬orfA以Ndel-Xbal片段的形式從pBR115Ll克隆到表達(dá)載體pETDuet_l中,生成PREZ91(美國專利申請公開No.20050100995中實施例3第41頁的最終表達(dá)質(zhì)粒的生成中提及了PBR115L1)。將裂殖壺菌屬orfB*以Ndel-Xbal片段的形式從pJK780克隆到表達(dá)載體pCDFDuet-1中,生成pREZ96(美國專利申請公開No.20050100995中實施例3第41頁的最終表達(dá)質(zhì)粒的生成中提及了PJK780)。將裂殖壺菌屬orfC以Ndel-Xbal片段的形式從PJK510克隆到表達(dá)載體pColADuet-1中,生成pREZlOl(pJK510參考美國專利申請公開No.20050100995中實施例3第41頁的最終表達(dá)質(zhì)粒的產(chǎn)生)。必需的輔助基因hetl,其編碼磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(PPT酶),由基于pACYC184的質(zhì)粒PJK737來提供,如先前所述(美國專利申請公開No.20050100995中實施例3第41頁)。將分別包含在質(zhì)粒pREZ91、pREZ96、pREZ101和pJK737中的OrfA、OrfB*、OrfC和hetl轉(zhuǎn)化到大腸桿菌菌株BLR(DE3)(Novagen)中,后者含有誘導(dǎo)型T7RNA聚合酶。使用這些多質(zhì)粒菌株在LuriaBroth(LB)中25°C和30°C下培養(yǎng)大腸桿菌細(xì)胞,檢測大腸桿菌細(xì)胞中的DHA和DPA的產(chǎn)生(見下面的表3)。將單個菌落接種在含有抗生素的LB培養(yǎng)液中,以使得每種質(zhì)粒保持在給定菌株內(nèi),在期望溫度(25°C或30°C)下過夜培養(yǎng)。然后,將300yL體積的這樣的培養(yǎng)物接種在含有合適抗生素的30mLLB主培養(yǎng)物中。主培養(yǎng)物在指定溫度下培養(yǎng),直到0D600(BioPhotometer,Eppendorf)到0.45-0.55,此時用終濃度為ImM的IPTG對培養(yǎng)物進(jìn)行誘導(dǎo)。然后,將培養(yǎng)物在這些表達(dá)條件下保持24小時,之后通過離心收集和制備細(xì)胞用于FAME分析。對于攜帶裂殖壺菌屬orfC的菌株,在30°C產(chǎn)生的PUFA的典型水平(以總FAME的百分比計)為10%DHA和6%DPA(16%總PUFA)。DHA/DPA的比例為1.7,其接近在裂殖壺菌屬中所見(見下面的表2)。大腸桿菌中產(chǎn)生DHA和DPA所必需的裂殖壺菌屬基因在不同質(zhì)粒上的表達(dá),使本發(fā)明人能夠更容易地研究和操作PUFA生物合成基因。如美國專利申請公開No.2005/0100995實施例8所述,已經(jīng)證明,在裂殖壺菌屬中,將orfC替換為來自破囊壺菌23B的同源基因可改變PUFA譜,使DHA對DPA的比例發(fā)生偏移。用上述的大腸桿菌多質(zhì)粒表達(dá)系統(tǒng)進(jìn)行了類似的實驗,其中裂殖壺菌屬orfC表達(dá)質(zhì)粒(pREZlOl)被替換為相似的破囊壺菌23BorfC表達(dá)質(zhì)粒(pREZ142)。為了生成pREZ142,將來自pREZ31的破囊壺菌23BorfC編碼區(qū)以Ncol/Sall片段的形式克隆到Duet載體pColADuet-1中。質(zhì)粒pREZ31是pREZ33的一種變異體,后者是“完美銜接”的基因替換載體(如在上文實施例1和美國專利申請公開No.2005/0100995的實施例8中所描述的),其中在起始密碼子ATG(下文中的小寫字母)的緊鄰上游處工程化設(shè)置一個BamHI限制位點(下文中的下劃線)。該工程化恰好在pREZ31中產(chǎn)生了一個包含起始ATG在內(nèi)的Ncol限制位點(下文中的斜體),其包括所述BamHI位點的最后2個堿基和破囊壺菌23BorfC編碼區(qū)的最初4個堿基GGATCCatgG(SE0IDNO86)在該克隆中使用的Sail限制位點是裂殖壺菌屬orfC下游區(qū)固有的,位于TAA終止密碼子下游大約250bp。這種在大腸桿菌表達(dá)系統(tǒng)中用破囊壺菌23BorfC代替裂殖壺菌屬orfC的替換,導(dǎo)致菌株在25°C生長并誘導(dǎo)時的PUFA譜發(fā)生改變,DHA與DPA比例從1.5變?yōu)?.8,DHA+DPA的總量從10%降至4%。產(chǎn)生雜合orfC編碼區(qū),以確定用于控制DHA與DPA比例的基因的區(qū)或域。表達(dá)質(zhì)粒pREZ179中的雜合orfC含有來自破囊壺菌23BorfC的中央DH2區(qū),兩側(cè)是裂殖壺菌屬orfC序列的上游和下游(見實施例2)。當(dāng)在上述系統(tǒng)中表達(dá)pREZ179替代pREZlOl時,當(dāng)在25°C表達(dá)和誘導(dǎo)時,可見DHA與DPA的比例為6.5,而總PUFA量為9%(見下表)。這種在大腸桿菌模型表達(dá)中的DHA與DPA比例的遷移和生產(chǎn)的保持,表明orfC的中央DH2區(qū)控制PUFA生物合成中大部分或全部的DHA與DPA的比例。當(dāng)隨后用額外的側(cè)翼DNA對該構(gòu)建體進(jìn)行修飾,并轉(zhuǎn)化進(jìn)裂殖壺菌屬中替換天然orfC時,可見到DHA與DPA比例的相似遷移,并且沒有生產(chǎn)下降(見實施例4)。類似地,在酵母系統(tǒng)中表達(dá)雜合orfC,可再次見到DHA與DPA比例的遷移(見實施例6)。表3上面的實施例使用大腸桿菌和酵母多質(zhì)粒表達(dá)模型系統(tǒng)闡釋了orfC尤其是DH2區(qū)在控制PUFA生物合成中DHA與DPA比例中的作用,顯示了這些異源系統(tǒng)的功用。在orfC來源對DHA/DPA比的相對影響這一點上,大腸桿菌和酵母中所見的結(jié)果與裂殖壺菌屬中所見的結(jié)果相似(parallel)。按照相似的方式,本文描述了大腸桿菌和酵母中的多質(zhì)粒表達(dá)模型系統(tǒng),用于研究和工程化PUFA生物合成的其它方面,包括PUFA鏈長、脂肪酸飽和度和雙鍵位置。這些系統(tǒng)還有助于容易地表達(dá)參與其它類型脂肪酸修飾,例如羥基化和糖基化,的基因。按照相似的方式,可以把來自單個生物體(例如美國專利申請公開No.2005/0100995實施例2中描述的針對Shewanellajaponica基因簇進(jìn)行的克隆)或兩個以上生物體的其它PUFA生物合成基因克隆到該大腸桿菌系統(tǒng)中,以便于研究。實施例6下面的實施例描述了在酵母中表達(dá)裂殖壺菌屬PUFA合酶亞基A、B和C和念珠藍(lán)細(xì)菌(N0St0C)hetI的方法,并進(jìn)一步例證了PUFAPKS系統(tǒng)的DH2域可控制該系統(tǒng)的脂肪酸生產(chǎn)的比例。部分A先期表達(dá)實驗表明可以使用天然編碼區(qū)在酵母中以全長蛋白的形式產(chǎn)生裂殖壺菌屬OrfC和HetI。相反,裂殖壺菌屬OrfsA和B的天然編碼區(qū)的表達(dá)沒有產(chǎn)生可檢測量的預(yù)期蛋白。這個問題似乎與mRNA的翻譯有關(guān)(Northern印跡顯示存在正確大小的mRNA)。因此,為了提高這兩個編碼區(qū)在酵母中的表達(dá),制造了這兩個編碼區(qū)的合成版本。由這些合成基因編碼的蛋白的氨基酸序列與由天然基因編碼的蛋白的氨基酸序列相同(即,SEQIDN0:2和SEQIDNO:4)。orfA和orfB的最初基因設(shè)計和完全基因合成由BlueHeronBiotechnology,Inc.(Bothell,WA)進(jìn)行。密碼子優(yōu)化考慮了釀酒酵母(S.cerevisiae)的密碼子偏好。合成編碼區(qū)的完整序列(指稱為sOrfA和sOrfB)如SEQIDNO:35(s0rfA)和SEQIDNO:36(sOrfB)所示。每個合成編碼區(qū)附加如下的DNA,以便于在酵母轉(zhuǎn)化載體中進(jìn)行克隆上游序列(SEQIDNO87)AAGCTTGTGCAGTCAAGTGCGCAAAACCATG下游序列(SEQIDNO:88)TAACCCGGGTCTAGA.起始和終止密碼子位置用下劃線標(biāo)注,Hindlll(上游)和Xbal(下游)限制酶的限制位點用粗體顯示。使用釀酒酵母菌株InvSCl(MATahis3_Al,leu2,trpl-289,ura3_52)(Invitrogen,Carlsbad,CA)進(jìn)行這些實驗。該菌株的保存和轉(zhuǎn)化按照供應(yīng)商的推薦。根據(jù)制造商(Invitrogen)的使用說明,用葡萄糖固體培養(yǎng)基、棉籽糖培養(yǎng)液和半乳糖誘導(dǎo)培養(yǎng)基培養(yǎng)轉(zhuǎn)化體。所有的酵母培養(yǎng)基組分均從Q-BIOgene(Carlsbad,CA)購得。將裂殖壺菌屬PUFA合酶基因和hetl克隆到如下的轉(zhuǎn)化載體中pYES-Leu*(sOrfA;SEQIDNO35),pYES3-Tryp(sOrfB;SEQIDNO36),pYES2/CT(OrfC;SEQIDNO:5)和pYES-His*(hetI;SEQIDNO:33)。這些載體的產(chǎn)生在下文有詳細(xì)描述。對一些載體和基因進(jìn)行修飾以滿足特定的克隆和表達(dá)需要(在下文詳述)。根據(jù)具體的實驗使用合適的選擇培養(yǎng)基。在所有情況下,將這些基因克隆在GAL1啟動子的后面,并根據(jù)Invitrogen提供的指導(dǎo),通過將經(jīng)過清洗的細(xì)胞重新懸浮在含有半乳糖的培養(yǎng)基中來誘導(dǎo)表達(dá)。30°C培養(yǎng)細(xì)胞,并在轉(zhuǎn)移到誘導(dǎo)培養(yǎng)基上指定時間后(通過離心)收集。將細(xì)胞離73心沉淀凍干,用酸性甲醇制備FAME,萃取到己烷中,并通過GC進(jìn)行分析。sOrfA表達(dá)構(gòu)建體將sOrfA克隆到定制的載體pYES-Leu/CT中,該載體構(gòu)建如下。對PYES6/CT載體(Invitrogen)進(jìn)行修飾,用含有l(wèi)eu2基因(用于利用缺少亮氨酸的培養(yǎng)基進(jìn)行篩選)的DNA片段替換其含有殺稻瘟素耐受基因的DNA區(qū)域。用Bglll和Nhel消化PYES6/CT并凝膠純化最終的4913bp載體片段,從而除去殺稻瘟素基因。leu2基因從酵母載體pRS425(ATCC77106,GenBank#U03452)獲得。在PCR反應(yīng)中使用引物P0_Leu5'(SEQIDNO89)和P0-Leu3‘(SEQIDNO90),并使用pRS425作為模板,生成一個含有l(wèi)eu2基因的1812bpDNA片段(pRS425的bp664-2475)。P0-Leu5‘GACTGCTAGCTTAAGCAAGGATTTTCTTAACP0-Leu3'GACTGGATCCTCCTGATGCGGTATTTTCTCC在引物中引入限制酶識別位點,以便于克隆(5'Nheland3'BamHI加了下劃線標(biāo)記)。用BamHI和Nhel消化PCR片段,并連接到從PYES6/CTBglII/NheI消化物獲得的4913bp載體片段上,形成pYES6-Leu。用Hindlll和Xbal消化該載體,以備插入sOrfA。來自BlueHeron的、含有sOrfA和合適側(cè)翼DNA的質(zhì)粒用Hindlll和Xbal消化。將具有完整sOrfA的8.8kb片段用凝膠純化,并連接到已制備好的pYES6-Leu載體上,形成pBR882(pYES6-LeusOrfA)。sORfB表達(dá)構(gòu)建體本發(fā)明人希望將sOrfB克隆到具有色氨酸選擇標(biāo)記的pYES3酵母表達(dá)載體中。因為PYES3載體還含有一個Xbal限制位點(該第二個位點在trpl基因內(nèi)),所以該限制酶不能方便地用于引入sOrfBDNA片段。對sOrfB下游含有Xbal位點的區(qū)域進(jìn)行如下修飾,以引入一個唯一的NotI位點(在pYES3中其也可作為基因插入克隆位點使用)。含有來自BlueHeron的sOrfB片段的質(zhì)粒用Hindlll和Xbal消化,將所得的6.2kb的感興趣片段用凝膠純化。將該片段連接到已經(jīng)用相同的酶切割過的PYES2/CT(Invitrogen)中,產(chǎn)生質(zhì)粒pBR879。通過在唯一的Xbal位點進(jìn)行切割打開該質(zhì)粒。使用自身互補的寡核苷酸接頭5,-CTAGGCGGCCGC-3,(SEQIDN091)產(chǎn)生一個唯一的NotI位點(下劃線標(biāo)注的;它還消除了Xbal位點)。這產(chǎn)生了質(zhì)粒PJK894。將該構(gòu)建體用Hindlll和NotI消化,并將所得的6.2kb感興趣片段用凝膠純化。將該片段連接進(jìn)入已經(jīng)用相同的酶切割過的pYES3/CT(Invitrogen)中,形成pJK908(pYES3sOrfB)。OrfC表達(dá)構(gòu)建體天然orfC先前已經(jīng)被克隆在一個細(xì)菌表達(dá)載體中,把該細(xì)菌表達(dá)載體作為酵母表達(dá)用基因的來源。該細(xì)菌載體是pBluescriptIIKS(Stratagene);編碼區(qū)連同側(cè)翼DNA被克隆到了該載體的EcoRI(5')和Xbal(3')位點中。該插入DNA包括一個作為ATG起始密碼子的一部分的Ndel限制位點;TAA終止密碼子恰好在Xbal位點之前。在EcoRI位點和Ndel位點之間含有起始密碼子的區(qū)域中包含有一個細(xì)菌核糖體結(jié)合位點序列。在克隆到酵母載體之前,將核糖體結(jié)合位點DNA除去,并用適于在酵母系統(tǒng)中表達(dá)的DNA代替。用EcoRI和Ndel消化含有orfC的pBluescript質(zhì)粒,并將它與寡核苷酸接頭FL5‘(AATTCAA)和FL3‘(TATTG)連接。所得的質(zhì)粒(稱為pKCFL)用HindiII(恰好在pBluescriptKS多接頭(polylinker)中EcoRI位點的上游)和Xbal消化,以釋放一個4526bp片段。將該片段連接到Hindlll/Xbal-消化的pYES2/CT,以產(chǎn)生pYES2/ORFCwt(pYES2:0rfC)。Hetl構(gòu)建體將來自念珠藍(lán)細(xì)菌的編碼PPT酶的hetl基因克隆到定制的載體pYES6-His/CT中。pYES6_His/CT的構(gòu)建如下。對pYES6/CT載體(Invitrogen)進(jìn)行修飾,用含有his3基因(用于用缺少組氨酸的培養(yǎng)基進(jìn)行篩選)的DNA片段替換其含有殺稻瘟素耐受基因的DNA區(qū)域。用Bglll和Nhel消化pYES6/CT并凝膠純化最終的4913bp載體片段,從而除去殺稻瘟素基因。用引物P0-His5'(SEQIDNO:92)和P0-His3(SEQIDNO93)從酵母載體pRS423(ATCC77104,GenBank#U03454)擴增his3基因。P0-His5'GACTACTAGTCTAAGAAACCATTATTATCATP0-His3'GACTGGATCCAGCTTTAAATAATCGGTGTCA這產(chǎn)生了pRS423質(zhì)粒的一個含有his3基因的1251bp的區(qū)域。引物中含有限制酶識別位點以便于克隆(5‘Spel,和3‘BamHI,下劃線標(biāo)注)。用Spel和BamHI消化PCR片段,連接到從PYES6/CT獲得的4913bp載體片段上,形成pYES6_His。將這個載體用BamHI和Xbal消化,準(zhǔn)備插入hetl基因。hetl基因先前已經(jīng)被克隆,并與裂殖壺菌屬PUFA合酶基因一起用于在大腸桿菌中產(chǎn)生PUFA(美國專利申請公開No.20040235127實施例2)。如該申請中指出的,在開放閱讀框中沒有甲硫氨酸密碼子,但在5’端附近有數(shù)個潛在的可選起始密碼子(TTG和ATT)(Blackandffolk,1994,JBC176,2282-2292)。使用PCR從念珠藍(lán)細(xì)菌基因組DNA擴增Orf。設(shè)計5’引物,使最外側(cè)5’TTG密碼子的第一個T用A代替,從而產(chǎn)生一個甲硫氨酸密碼子(ATG)。3,引物包含TGA終止密碼子。擴增區(qū)域的范圍從作為GenBank#L22883登錄的念珠藍(lán)細(xì)菌核苷酸序列的bp3994到3282(核苷酸3994,即TTG密碼子中的第二個T被改變,從而形成ATG密碼子)。將該擴增的hetlOrf與用于在大腸桿菌中表達(dá)的側(cè)翼調(diào)節(jié)元件一起克隆到PACYC184載體中。用hetlOrf的這個克隆作為模板DNA以擴增基因,準(zhǔn)備克隆到pYES6-His中。使用引物Hetl5'(SEQIDNO94)和Hetl3'(SEQIDNO95)產(chǎn)生一個含有hetlOrf的740bp片段。Hetl5'GACTGGATCCGCCACCATGTTGCAGCATACTTGGCTACCAAAACCCHetI3'GACTTCTAGATCAATAATGCCAGAATTTTGGCTGC引物中加入了限制酶識別位點以便于克隆(5'BamHI和3'Xbal,下劃線標(biāo)注)。ATG甲硫氨酸起始密碼子(5’弓丨物)和TGA終止密碼子(顯示為3’引物中倒置的TCA三聯(lián)體)用粗體顯示。PCR產(chǎn)物用BamHI和Xbal消化,并連接到先前制備的pYES6_His載體中,形成pYES-His/Het/CT(pYES6-His:HetI)。在酵母中表達(dá)pYES6-Leu:s0rfA,pYES3:s0rfB,pYES2:0rfC和pYES6_His:HetI的結(jié)果圖7顯示了來自表達(dá)裂殖壺菌屬PUFA合酶系統(tǒng)(sOrfA、s0rfB、0rfC和hetl)的酵母細(xì)胞的FAME的GC譜與來自對照細(xì)胞(缺少sOrfA基因)的FAMEGC譜的比較,這兩種酵母菌株在本文分別表示為菌株BRY4.5*BRY3.3。細(xì)胞在誘導(dǎo)20h后收集。可以看到,在表達(dá)完整PUFA合酶系統(tǒng)的菌株的譜中出現(xiàn)了兩個新的FAME峰。通過與真正標(biāo)準(zhǔn)品的洗脫時間進(jìn)行比較和隨后的MS分析,這兩個峰被鑒定為DPAn-6和DHA。正如從我們對裂殖壺菌屬PUFA合酶的表征中推測的那樣,除了DPAn-6和DHA之外,譜中沒有明顯的其它的新峰。圖8顯示了圖8GC色譜圖中包含PUFAFAME的區(qū)域。對照細(xì)胞和表達(dá)PUFA合酶的細(xì)胞均含有一個在DHAFMAE附近洗脫的峰。這個峰已經(jīng)被鑒定為C260FAME(通過質(zhì)譜分析),很可能來自鞘脂類。盡管它在DHA峰附近洗脫,但分辨率足以使其不對DHA的定量產(chǎn)生影響。DPAn-6峰與FAME譜中的其它內(nèi)源酵母脂類良好分離。在這個菌株BRY4.5的特定實例中,表達(dá)裂殖壺菌屬PUFA合酶系統(tǒng)的細(xì)胞積累了2.4%DHA和2.0%DPAn-6(占總FAME的百分比;見下面的表4)。DHA和DPAn-6的總量占細(xì)胞中被測量脂肪酸的4.4%。細(xì)胞中觀察到的DHA與DPAn-6的比例為1.21。上面提供的顯示裂殖壺菌屬PUFA合酶在酵母中的表達(dá)的結(jié)果,為先前申請中提出的途徑以及針對酵母及植物中可能發(fā)生的脂肪酸譜改變的預(yù)測提供了驗證。部分B裂殖壺菌屬PUFA合酶OrfsA、B和念珠藍(lán)細(xì)菌HetI與編碼含有來自破囊壺菌23BorfC同源物的DH2區(qū)的OrfC的雜合基因的組合在酵母中的表達(dá),以及對這些細(xì)胞中產(chǎn)生的PUFA的影響裂殖壺菌屬/破囊壺菌23BOrfC雜合基因在酵母中的表達(dá)如在本申請其它部分中描述的,本發(fā)明人發(fā)現(xiàn),PUFA合酶n-3與n-6PUFA產(chǎn)物比例的主要決定因素在于OrfC蛋白,更具體地說,在于該蛋白的DH2區(qū)。使用來自破囊壺菌23B的OrfC同源物與來自裂殖壺菌屬的PUFA合酶基因的組合在大腸桿菌和裂殖壺菌屬中進(jìn)行基因替換實驗,均導(dǎo)致由這些混合系統(tǒng)產(chǎn)生的DHA與DPAn-6比例發(fā)生改變。在大腸桿菌中,PUFA系統(tǒng)的產(chǎn)物作為游離脂肪酸積累,而且可以推測它們不會影響宿主生物體脂質(zhì)合成酶類對該酶的主要產(chǎn)物的積累。在裂殖壺菌屬中,PUFA產(chǎn)物積累在酯化的脂質(zhì)中,不過內(nèi)源的脂質(zhì)合成酶類應(yīng)當(dāng)能夠容易地處理DHA和DPAn-6,因為它們是未修飾宿主的脂質(zhì)部分的主要組分。混合PUFA合酶系統(tǒng)在酵母中的表達(dá)可提供異源真核宿主(例如植物)的模型。在酵母中表達(dá)非合成或全合成破囊壺菌23BorfC基因的嘗試并不成功,因為沒有檢測到預(yù)期的蛋白。相反,雜合orfC構(gòu)建體(下文中描述)的表達(dá)產(chǎn)生了活性蛋白。pYES2中的雜合裂殖壺菌屬/破囊壺菌23BOrfCs將含有天然裂殖壺菌屬orfC的質(zhì)粒pYES2:0rfC(上文中討論的)用BsiWI和Pmll消化,以除去編碼DH2區(qū)的DNA區(qū)段和一些側(cè)翼DNA。除去的區(qū)域為裂殖壺菌屬orfC序列(SEQIDNO5)的1179bp(BsiWI位點)到3256bp(Pmll位點)。所得的8.4kb片段(包含該載體以及orfC的5,和3,部分)進(jìn)行凝膠純化。將一個先前描述的(見實施例2)含有雜合裂殖壺菌屬/破囊壺菌23BorfC的質(zhì)粒(pREZ179=pColADUET-Schizo.orfC-破囊壺菌23BDH2雜合)用BsiWI和Pmll消化,并對含有破囊壺菌23BDH2區(qū)和側(cè)翼裂殖壺菌屬DNA的2kb片段進(jìn)行凝膠純化。將兩個純化的片段連接在一起,形成pYES2:0rfC-23BDH2o使用相似的策略產(chǎn)生pYES2:0rfC-s23BDH2。在這里,用作合成破囊壺菌23BDH2區(qū)的來源的質(zhì)粒(PDD22;見實施例3)是雜合orfC,其中編碼破囊壺菌23BDH2域的DNA來自一個合成編碼區(qū),該編碼區(qū)中的密碼子被修飾從而更加符合裂殖壺菌屬的偏好(見實施例3)。在酵母中表達(dá)pYES6-Leu:s0rfA,pYES3:s0rfB,pYES6_His:HetI和pYES20rfC-23BDH2或pYES2:0rfC_s23BDH2的結(jié)果表4顯示了在表達(dá)雜合OrfC構(gòu)建體與裂殖壺菌屬亞基A和B以及念珠藍(lán)細(xì)菌Hetl的組合的酵母中產(chǎn)生的PUFA。如在上文部分A中觀察到的,這些酵母樣品中檢測到的新峰只有DHA和DPAn-6。生長條件和樣品制備如上所述。僅顯示了相關(guān)的PUFA數(shù)據(jù)(以面積%表示FAME)。標(biāo)記為BRY4.21的樣品包含具有天然破囊壺菌23BDH2區(qū)的雜合orfC,而標(biāo)記為BRY4.23的樣品包含具有來自合成基因的破囊壺菌23BDH2區(qū)的雜合orfC。對BRY4.21菌株測試了兩個樣品(a和b,來自獨立的分離物),而對BRY4.23菌株測試了一個分離物。相對于表達(dá)裂殖壺菌屬orfC的細(xì)胞,表達(dá)兩種雜合orfC形式中任一種的細(xì)胞都具有更高的DHA/DPAn-6比例(具有天然破囊壺菌23BDH2的樣品的平均值為2.6,而具有合成破囊壺菌23BDH2的樣品的值為2.9)。雜合orfC基因在酵母中的表達(dá)明顯導(dǎo)致DHA與DPAn-6的比例相對于表達(dá)天然裂殖壺菌屬orfC基因的酵母增高。破囊壺菌23B細(xì)胞或表達(dá)雜合orfC的裂殖壺菌屬中DHA/DPAn-6比例大大增高(8-10)的事實表明,有其它的因素在對DHA相對于DPAn-6的優(yōu)先積累起貢獻(xiàn)。酵母中該比例確實增加的觀察結(jié)果表明,該構(gòu)建體是用于在異源真核宿主(例如酵母或植物)中表達(dá)PUFA合酶系統(tǒng)的有用模型。表4實施例7下面的實施例顯示了用實施例4中所述的各種遺傳修飾裂殖壺菌屬菌株以發(fā)酵規(guī)模生產(chǎn)PUFA的實驗。實驗1用2升發(fā)酵罐在典型的發(fā)酵條件下,接種兩種野生型裂殖壺菌屬(ATCC20888)培養(yǎng)物和兩種轉(zhuǎn)基因裂殖壺菌屬(B67-5,用密碼子優(yōu)化的(合成)破囊壺菌23BorfC編碼區(qū)代替天然裂殖壺菌屬orfC編碼區(qū);見實施例4)培養(yǎng)物,以比較脂肪酸譜。每種菌株在含有碳、氮、磷、鹽、痕量金屬和維生素的培養(yǎng)基中發(fā)酵。每個發(fā)酵罐接種典型的種子培養(yǎng)物,然后培養(yǎng)80小時,在培養(yǎng)期間補充碳源和氮源。氮源僅在生長期中補充和消耗,而碳源在整個發(fā)酵期間補充和消耗。80小時后,對來自每個發(fā)酵罐的樣品進(jìn)行離心、冷凍干燥,并通過氣相色譜對脂肪酸含量進(jìn)行分析。典型的發(fā)酵條件溫度28-30°CpH5.0-7.5攪拌100-300cps氣流0.25-2.Ovvm葡萄糖5-35g/L(濃度)接種物7.5%-15%結(jié)果如下面的表5所示:表577如表5所示,含有取代了天然裂殖壺菌屬編碼區(qū)的合成破囊壺菌23BorfC編碼區(qū)的菌株B67-5產(chǎn)生比野生型裂殖壺菌屬菌株更多的DHA和更大的DHA對DPAn_6比值。實驗2用10升發(fā)酵罐在典型的發(fā)酵條件下,接種一種野生型裂殖壺菌屬(ATCC20888)培養(yǎng)物和一種轉(zhuǎn)基因裂殖壺菌屬(B105-1A1;含有取代了天然裂殖壺菌屬DH2編碼區(qū)的非密碼子優(yōu)化的(破囊壺菌屬固有的)破囊壺菌23BDH2編碼區(qū);見實施例4)培養(yǎng)物,以比較脂肪酸譜。每種菌株在含有碳、氮、磷、鹽、痕量金屬和維生素的培養(yǎng)基中發(fā)酵。每個發(fā)酵罐接種典型的種子培養(yǎng)物,然后培養(yǎng)72小時,在培養(yǎng)期間補加碳源和氮源。氮源僅在生長相期間補加和消耗,而碳源在整個發(fā)酵期間補加和消耗。72小時后,對來自每個發(fā)酵罐的樣品進(jìn)行離心、冷凍干燥,并通過氣相色譜對脂肪酸含量進(jìn)行分析。典型的發(fā)酵條件溫度28-30°CpH5.0-7.5攪拌100-300cps氣、流0.25-2.Ovvm葡萄糖5_35g/L(濃度)接種物7.5%-15%結(jié)果如下面的表6所示表6表6顯示,含有取代了裂殖壺菌屬DH2區(qū)的合成破囊壺菌23BDH2編碼區(qū)的菌株具有高得多的DHA/DPAn-6比值,再次證明了可以通過使用本文所述的嵌合PUFAPKS系統(tǒng)實現(xiàn)DHA比例的改善。實施例8本實施例描述了在裂殖壺菌屬中表達(dá)的合成密碼子優(yōu)化破囊壺菌23BorfA、orfB和orfC編碼區(qū)所有組合的構(gòu)建和評估。上面(實施例1和4)已經(jīng)給出了用破囊壺菌23B合成密碼子優(yōu)化型orfC編碼區(qū)精確替換裂殖壺菌屬orfC編碼區(qū)的方法的詳細(xì)說明。本領(lǐng)域的技術(shù)人員會認(rèn)識到,該技術(shù)可一般性地應(yīng)用于大多數(shù)感興趣的基因。本領(lǐng)域技術(shù)人員會進(jìn)一步認(rèn)識到,這些基因設(shè)計和替換能夠通過這些方法或所有其它方法的改變形式加以實現(xiàn)。例如,多個基因/編碼區(qū)可以被同時刪除和同時被替換。在裂殖壺菌屬中,orfA和ofB基因被發(fā)現(xiàn)在基因組中靠得很近(“連鎖的”(linked)),隔著一個基因間區(qū)域(包括SEQIDNO:76)。對于這兩個編碼區(qū)(連同基因間區(qū)域),可以依照與前人記載的關(guān)于orfC的方法(美國專利申請公開No.20050100995)相似的方法將它們同時刪除。然后可以使用與實施例1和4中描述的方法相似的方法,將合成的、經(jīng)密碼子優(yōu)化的破囊壺菌23BorfA和orfB編碼區(qū)(包括整個裂殖壺菌屬基因間區(qū)域)以“完美銜接”的方式替換到裂殖壺菌屬orfA/orfB座位中。B80-1和B80-20(表7)等菌株就是這樣產(chǎn)生的。在另一個實例中,編碼區(qū)缺失可以通過“兩步”法實現(xiàn),其中,首先,攜帶被標(biāo)記的缺失結(jié)構(gòu)加上第二可篩選標(biāo)記的質(zhì)粒通過一個單交換事件而整體重組到目標(biāo)座位中。然后,該整合體結(jié)構(gòu)通過在該缺失結(jié)構(gòu)的相對側(cè)上的某個位點上發(fā)生單交換事件而“解體(resolve)”,從而使第二可篩選標(biāo)記丟失,而該缺失結(jié)構(gòu)仍保留替換原始的基因結(jié)構(gòu)(RothsteinR.,"Targeting,Disruption,Replacement,andAlleleRescue:IntegrativeDNATransformationinYeast",MethodsinEnzymology,vol.194(1991)第281-301M,Elsevier/AcademicPress,Amsterdam)。菌株B71_l(表7)的前體就是用這種方法產(chǎn)生的。通過這里概述的方法,產(chǎn)生了一系列裂殖壺菌屬菌株,這些菌株中用合成的(密碼子優(yōu)化的)破囊壺菌23BorfA、orfB、和orfC編碼區(qū)的所有組合替換了同源的裂殖壺菌屬編碼區(qū)。這個系列中不含破囊壺菌23B基因的成員是野生型裂殖壺菌屬ATCC20888;僅含有(全長)合成的、密碼子優(yōu)化的破囊壺菌23BorfC編碼區(qū)的成員,B67-5,在上文實施例4和表1中有描述。如實施例4所述的那樣對這一系列8個菌株在SSFM培養(yǎng)基中生長期間的脂肪酸生產(chǎn)進(jìn)行評估,數(shù)據(jù)在表7中給出。質(zhì)粒pDD26包含全長的合成破囊壺菌23BorfA編碼區(qū),其與裂殖壺菌屬orfA基因的上游和下游區(qū)完美銜接。PDD26編碼區(qū)的核苷酸序列在本文用SEQIDNO:71表示。SEQIDN0:71編碼SEQIDNO:39。pDD26已經(jīng)作為ATCC保藏號No.PTA-8411保藏,如本文前面所述。質(zhì)粒pDD32包含全長的合成破囊壺菌23BorfB編碼區(qū),其與裂殖壺菌屬orfB基因的上游和下游區(qū)完美銜接。PDD32編碼區(qū)的核苷酸序列在本文用SEQIDN0:72表示。SEQIDNO72編碼SEQIDNO:52。pDD32已經(jīng)作為ATCC保藏號No.PTA-8412保藏,如本文前面所述。所有三個經(jīng)密碼子優(yōu)化的合成破囊壺菌23Borf編碼區(qū)的蛋白產(chǎn)物在裂殖壺菌屬中都可發(fā)揮功能,并成功地與其它PUFA合酶組分(無論其來源如何)相互作用。破囊壺菌23BOrfC蛋白(菌株B67-5)的表達(dá)導(dǎo)致DHA/DPA比例增加到接近天然破囊壺菌23B菌株的水平,這個結(jié)果前面在實施例4中已演示過。這個現(xiàn)象在所有表達(dá)破囊壺菌23BOrfC蛋白的組合(B67-5,B79-11,B79-1和B80-20)中均可見到。令人驚訝的是,密碼子優(yōu)化的合成破囊壺菌23BorfC加上密碼子優(yōu)化的合成破囊壺菌23BorfA編碼區(qū)的組合(菌株B79-1)導(dǎo)致最高水平的DHA產(chǎn)生,同時維持高DHA/DPA比例。這種裂殖壺菌屬菌株中DHA生產(chǎn)增加似乎是由如下兩點因素導(dǎo)致的由破囊壺菌23BOrfC導(dǎo)致的n-3/n-6比例增加,和由破囊壺菌23BOrfA與破囊壺菌23B0rfC相互作用導(dǎo)致的總PUFA生產(chǎn)增加。這些數(shù)據(jù)顯示,來自不同生物體的PUFA合酶復(fù)合體的組分可以成功地共同發(fā)揮功能,并能夠賦予新宿主以來源生物體的特定特征。而且,通過對來源和PUFA合酶組分的表達(dá)水平進(jìn)行操作,可以的產(chǎn)生新的目標(biāo)脂肪酸譜,提高其產(chǎn)率,降低其成本。表7本文通過這里參引的每一篇參考文獻(xiàn)的全文作為參考。盡管已經(jīng)對本發(fā)明的各種實施方案進(jìn)行了詳細(xì)描述,但是顯然,本領(lǐng)域的技術(shù)人員可以想到對這些實施方案進(jìn)行修改和調(diào)適。然而應(yīng)當(dāng)容易理解,這些修改和調(diào)適處于本發(fā)明的范圍之內(nèi),本發(fā)明的范圍由下面的權(quán)利要求提出。權(quán)利要求一種嵌合PUFAPKS系統(tǒng),其中來自第一PUFAPKS系統(tǒng)的FabA樣β-羥酰-ACP脫水酶(DH)域被替換為來自不同的第二PUFAPKS系統(tǒng)的DH域從而產(chǎn)生嵌合的PUFAPKS系統(tǒng),該系統(tǒng)與所述第一PUFAPKS系統(tǒng)相比,產(chǎn)生不同的ω-3PUFA對ω-6PUFA比例。2.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中包含來自所述第一PUFAPKS系統(tǒng)的DH域的蛋白質(zhì)被替換為包含來自所述第二PUFAPKS系統(tǒng)的DH域的同源蛋白質(zhì)。3.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中來自所述第一或第二PUFAPKS系統(tǒng)的DH域?qū)?yīng)于來自裂殖壺菌屬或破囊壺菌屬的DH2域。4.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中所述第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中所述第二PUFAPKS系統(tǒng)是破囊壺菌屬PUFAPKS系統(tǒng)。5.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中所述第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自所述裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC被來自不同的破囊壺菌的OrfC替換。6.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中所述第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自所述裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC被替換為來自破囊壺菌23Β的OrfC。7.權(quán)利要求6的嵌合PUFAPKS系統(tǒng),其中來自破囊壺菌23Β的OrfC是由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼的。8.權(quán)利要求7的嵌合PUFAPKS系統(tǒng),其中核酸序列包括SEQIDNO:70。9.權(quán)利要求6的嵌合PUFAPKS系統(tǒng),其中來自所述裂殖壺菌屬PUFAPKS系統(tǒng)的OrfA被替換為來自破囊壺菌23B的OrfA。10.權(quán)利要求9的嵌合PUFAPKS系統(tǒng),其中所述來自破囊壺菌23B的OrfA是由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼的。11.權(quán)利要求10的嵌合PUFAPKS系統(tǒng),其中所述核酸序列包含SEQIDNO-Jl012.權(quán)利要求6的嵌合PUFAPKS系統(tǒng),其中來自所述裂殖壺菌屬PUFAPKS系統(tǒng)的OrfB被替換為來自破囊壺菌23B的OrfB。13.權(quán)利要求12的嵌合PUFAPKS系統(tǒng),其中來自破囊壺菌23B的OrfB是由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼的。14.權(quán)利要求13的嵌合PUFAPKS系統(tǒng),其中該核酸序列包含SEQIDNO-J2。15.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中所述第一PUFAPKS系統(tǒng)是裂殖壺菌屬PUFAPKS系統(tǒng),并且其中來自裂殖壺菌屬PUFAPKS系統(tǒng)的OrfC的DH2域被來自破囊壺菌23B的DH2域替換。16.權(quán)利要求15的嵌合PUFAPKS系統(tǒng),其中所述包含來自破囊壺菌23B的DH2域的核酸序列包含SEQIDNO:73ο17.權(quán)利要求15的嵌合PUFAPKS系統(tǒng),其中所述來自破囊壺菌23B的DH2是由針對裂殖壺菌屬密碼子用法優(yōu)化過的核酸序列編碼的。18.權(quán)利要求17的嵌合PUFAPKS系統(tǒng),其中所述包含來自破囊壺菌23B的DH2域的核酸序列包含SEQIDNO:75ο19.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)包含這樣的蛋白質(zhì),所述蛋白質(zhì)包含與SEQIDNO74至少95%同一的氨基酸序列。20.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)包含這樣的蛋白質(zhì),所述蛋白質(zhì)包含SEQIDNO:74的氨基酸序列。21.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)包含SEQIDNO:2、SEQIDNO:4和SEQIDNO:74。22.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)包含SEQIDNO:39、SEQIDNO4和SEQIDNO:62。23.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)包含SEQIDNO:39、SEQIDNO4和SEQIDNO:74。24.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包含SEQIDNO=USEQIDNO3和SEQIDNO:70。25.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包含SEQIDNO=USEQIDNO3和SEQIDNO:73。26.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包含SEQIDNO=USEQIDNO3和SEQIDNO:75。27.權(quán)利要求1的嵌合PUFAPKS系統(tǒng),其中該嵌合PUFAPKS系統(tǒng)由如下核酸分子編碼,所述核酸分子包含SEQIDNO:71、SEQIDNO3和SEQIDNO:70。28.一種用于改變由第一PUFAPKS系統(tǒng)產(chǎn)生的多不飽和脂肪酸(PUFA)的ω-3對ω-6比例的方法,所述方法包括在生物體中表達(dá)權(quán)利要求1的嵌合PUFAPKS系統(tǒng)。29.權(quán)利要求28的方法,其中所述PUFAPSK系統(tǒng)是由微生物表達(dá)的。30.權(quán)利要求29的方法,其中所述微生物是裂殖壺菌屬。31.權(quán)利要求29的方法,其中所述微生物是酵母。32.權(quán)利要求28的方法,其中該嵌合PUFAPKS系統(tǒng)是由植物表達(dá)的。33.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求1的嵌合PUFAPKS系統(tǒng)。34.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求19的嵌合PUFAPKS系統(tǒng)。35.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求21的嵌合PUFAPKS系統(tǒng)。36.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求22的嵌合PUFAPKS系統(tǒng)。37.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求23的嵌合PUFAPKS系統(tǒng)。38.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求24的嵌合PUFAPKS系統(tǒng)。39.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求25的嵌合PUFAPKS系統(tǒng)。40.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求26的嵌合PUFAPKS系統(tǒng)。41.一種經(jīng)過遺傳修飾的微生物或植物或植物部分,其包含權(quán)利要求27的嵌合PUFAPKS系統(tǒng)。42.一種用于增加第一PUFAPKS系統(tǒng)的PUFA產(chǎn)生以及改變第一PUFAPKS系統(tǒng)產(chǎn)生的多不飽和脂肪酸(PUFA)的ω-3對ω-6比例的方法,所述方法包括在生物體中表達(dá)嵌合PUFAPKS系統(tǒng),其中來自第一PUFAPKS系統(tǒng)的FabA樣β-羥酰-ACP脫水酶(DH)域被替換為來自不同的第二PUFAPKS系統(tǒng)的DH域,從而產(chǎn)生嵌合PUFAPKS系統(tǒng),該系統(tǒng)與所述第一PUFAPKS系統(tǒng)相比,產(chǎn)生不同的(0-3PUFA對ω-6PUFA比例,并且其中來自所述第二PUFAPKS系統(tǒng)的DH域是針對該第一PUFAPKS系統(tǒng)所來源的生物體的密碼子用法優(yōu)化過的。43.一種分離的核酸分子,其編碼與SEQIDNO:74至少95%同一的嵌合OrfC蛋白。44.權(quán)利要求43的分離核酸分子,其中該分離的核酸分子包含與SEQIDNO73至少95%同一的核酸序列。45.權(quán)利要求43的分離核酸分子,其中該核酸序列是針對要在其中表達(dá)該核酸分子的生物體的密碼子用法優(yōu)化過的。46.權(quán)利要求43的分離核酸分子,其中該核酸序列是針對該嵌合蛋白的一部分所來源的生物體的密碼子用法優(yōu)化過的。47.權(quán)利要求43的分離核酸分子,其中該核酸序列與SEQIDNO75至少95%同一。48.一種重組核酸分子,其包含權(quán)利要求43的核酸分子。49.一種重組宿主細(xì)胞,其已被權(quán)利要求43的核酸分子轉(zhuǎn)染。50.權(quán)利要求49的重組宿主細(xì)胞,其中該細(xì)胞是微生物。51.權(quán)利要求50的重組宿主細(xì)胞,其中該微生物是裂殖壺菌屬。52.權(quán)利要求50的重組宿主細(xì)胞,其中該微生物是細(xì)菌。53.權(quán)利要求50的重組宿主細(xì)胞,其中該微生物是酵母。54.權(quán)利要求49的重組宿主細(xì)胞,其中該細(xì)胞是植物細(xì)胞。55.一種經(jīng)遺傳修飾的植物或其部分,其包含權(quán)利要求54的重組宿主細(xì)胞。56.一種嵌合PUFAPKS系統(tǒng),包含a)至少一個烯酰-ACP還原酶(ER)域;b)至少四個ACP域;c)至少兩個β-酮酯酰-ACP合酶(KS)域;d)至少一個?;D(zhuǎn)移酶(AT)域;e)至少一個β-酮酯酰-ACP還原酶(KR)域;f)至少兩個FabA樣β-羥酰-ACP脫水酶(DH)域;g)至少一個鏈長因子(CLF)域;和h)至少一個丙二酰-CoA:ACP?;D(zhuǎn)移酶(MAT)域;其中所述DH域中的至少一個來自第一PUFAPKS系統(tǒng),并且其中其余(a)-(h)的域來自不同的第二PUFAPKS系統(tǒng)。57.一種用于增加表達(dá)PUFAPKS系統(tǒng)的生物體的PUFA產(chǎn)生的方法,包括針對該生物體或相關(guān)生物體的優(yōu)化密碼子用法修飾編碼PUFAPKS系統(tǒng)中至少一個蛋白質(zhì)的核酸分子。58.權(quán)利要求57的方法,其中該生物體表達(dá)異源重組PUFAPKS系統(tǒng)。59.權(quán)利要求57的方法,其中該生物體是裂殖壺菌屬,并且其中編碼該內(nèi)源PUFAPKS系統(tǒng)中的至少一個蛋白質(zhì)的核酸分子是針對裂殖壺菌屬的密碼子用法優(yōu)化過的。全文摘要本文公開了嵌合多不飽和脂肪酸(PUFA)聚酮合酶(PKS)蛋白和嵌合PUFAPKS系統(tǒng),包括裂殖壺菌屬(Schizochytrium)和破囊壺菌屬(Thraustochytrium)來源的嵌合PUFAPKS蛋白和系統(tǒng)。還公開了編碼這些嵌合PUFAPKS蛋白和系統(tǒng)的核酸和蛋白、經(jīng)過遺傳修飾的包含這些嵌合PUFAPKS蛋白和系統(tǒng)的生物體和制造和使用這類嵌合PUFAPKS蛋白和系統(tǒng)的方法。文檔編號A61P15/06GK101849014SQ200880024785公開日2010年9月29日申請日期2008年5月16日優(yōu)先權(quán)日2007年5月16日發(fā)明者丹尼爾·H·多爾蒂,克雷格·A·韋弗,羅斯·澤克爾,詹姆斯·G·梅茨申請人:馬泰克生物科學(xué)公司