高等植物基因主要由4个结构区域组成:①5’上游区;②5’非翻译区;③编码区;④3’非翻译区。
(1)5’上游区:转录起点5’端上游一段很长的区域,包含启动子在内的与基因表达起始和表达调控有关的许多元件。该区域结构特点是:
①基因启动区序列中,在转录起点附近有致序列:CTCATCA,其中的一个A为转录起始核苷酸,此A编为+1,转录本中为正数,此A的上游用负数表示。-NNNNNNCTCATCANNN-
②在上游–327有一段TCACTATATAG一致顺序:简称:TATAbox。该序列是RNA聚合酶II起始转录所必需的。在–75附近处常有GC(T/C)CAATCT一致序列,简称CAATbox,确定RNA聚合酶结合部位,具有增强基因转录的作用。GCbox:-110附近的GGGCGG保守序列,确定RNA聚合酶结合部位。
③在5’远上游区,存在对基因表达有增强或抑制作用、决定基因表达特定时空顺序以及对激素和外界胁迫起应答作用的序列——顺式作用元件
(2)5’非翻译区:转录起点到翻译起始密码子之间的序列。该序列5’端是前体mRNA加帽位点。
(3)编码区:起始密码到终止密码之间的序列。有时专指外显子部分。
①多数植物基因转录本5’有一个起始密码AUG,少数植物5’有4个AUG。翻译起点的共有序列:植物:C(G)AANNATGG动物:A(G)NNATGG
②外显子中4种碱基比例:单子叶植物:AT含量43%;双子叶植物:AT含量54%;
③编码区中常有数目不等的内含子。外显子与内含子交界处共有序列是:外显子•••AGGTAAGT•••内含子•••TCNAGG•••外显子。
(4)3’非翻译区:终止密码后的序列,也有一些调控序列,对mRNA的稳定性和翻译效率起调节作用。3’末端有转录本mRNA的加尾信号:AATAAA。