|
沈 律[1,2]
(1.皖南医学院,芜湖,241002;2.中国管理科学研究院,北京,100036)
摘 要:生物遗传基因概率分布定律揭示了生物种系与个体多基因遗传的规律性。它具体地阐述了生物可以通过不同种系与个体遗传基因的相互交叉和重组、相互分离和组合、相互连锁和互换等等方式产生丰富的遗传性与变异性,而这一切正是导致生物种系与个体遗传与变异现象发生的根本原因,也是生物界形成丰富多彩的生态物种根本所在。通过对生物种系与个体遗传基因占总体遗传基因比例的分析,就可以确定生物演化与生物发育的程度。如果种系与个体遗传基因所占比率越大,说明生物进化的层次越高;反之则越低。因此,这个定律通过对种系与个体遗传基因在生物基因组中概率分布的分析,为遗传学研究提供生物统计学模型,用这个模型可以解决生物遗传规律问题。
关键词:生物;种系遗传基因;个体遗传基因;概率分布;定律
中图分类号:Q551 文献标识码:A
The probability distribution law of biological genetic genes
-Statistical analysis of vertical and horizontal bidirectional characteristics of biological genome genes
SHEN Lu [1,2](1 Wan nan Medical College, Wuhu, Anhui ,241002;2. Chinese Academy of Management Sciences, Beijing ,100036)
Abstract: The probability distribution law of biological genetic genes reveals the laws of multi-gene inheritance of biological species and individuals. It concretely expounds the creature can through different species and individual genetic restructuring and cross each other, mutual separation and combination, chain and exchange each other, and so on way to produce abundant genetic and variability, and all this is genetic and biological species and individual variation the root cause of the phenomenon, is also a biological form rich and colorful ecological species. The degree of biological evolution and development can be determined by analyzing the proportion of genetic genes in the whole species and individual. If the proportion of genes between germline and individual is larger, it indicates the higher level of biological evolution. The lower it is. Therefore, this law provides a biostatistical model for genetic research through the analysis of the probability distribution of germline and individual genetic genes in the biological genome, which can be used to solve the problem of biological genetic law.
Key words: biology; Germline genetic gene; Individual genetic genes; Probability distribution; law
1引 言
现代生命科学发现,一个受精卵之所以能够按照严格的顺序发育成生物个体,其根据就是受精卵中有一个完整的基因组图谱,发育程序可和一个建筑物的蓝图相比拟。发育的过程是通过遗传基因信息(纵向基因信息、种系基因)与横向基因信息(横向基因、个体基因)有秩序表达而使蓝图逐步实现的过程。生物的生命周期过程可以看成是生物遗传基因组的复制与表达过程。由于我们人类生命周期过程是整个生物进化的一个短暂而迅速的重演,因此我们认为揭示了人类的生命周期过程的基本规律,也就可以揭示整个生命系统的演化的基本规律过程。这是我们通过对人类基因组的复制与表达过程的动力学分析得出的科学结论。
2基因、基因组、人类基因组计划
1953年美国生物学沃森与英国生物学克里克发现DNA双螺旋结构,证明DNA是遗传信息的载体,揭示的生物遗传的本质,成为现代生物学一个划时代意义的事件。基因是具有遗传效应的DNA片段部分病毒如烟草花叶病毒、HIV的遗传物质是RNA。生物体的生长、老衰、疾病、死亡等一切生命现象都与基因有关。基因组是指存储于细胞内所有遗传信息,这种遗传信息以核苷酸序列形式存储。生物体中一套完整的单倍体的遗传物质(DNA或RNA)的总和称为基因组。基因组就好比一本本“生命之书”,记录了每种生物物种的全部生命遗传信息。在分子生物学和分子遗传学领域,基因组指生物体所有遗传物质的总和。这些遗传物质包括DNA或RNA(病毒RNA)。基因组DNA包括编码DNA和非编码DNA、线粒体DNA和叶绿体DNA。基因组这个术语由德国汉堡大学植物学教授Hans Winkler于1920年创建。研究基因组的科学称为基因组学。基因组是有关特定生物全部染色体的遗传物质的总和,DNA 碱基对总数来表示。对单倍体而言,基因组表示这种生物的总DNA; 对于二倍体的高等生物,其配子的DNA总和即为一组基因组。二倍体有两份同源的基因组,真核生物细胞中有几个染色体,故有几个基因组。细菌的基因组是惟一的染色体。基因组指自主复制的所有多位所应有的一套基因,因而有"质粒基因组"和"病毒基因组"的名称,这和"质粒和病毒的不可染色体"一词相同。基因组中不同区域具有不同的功能,有些是属于编码蛋白质的结构基因、有些属于参与结构基因的复制、转录及其蛋白质表达调控的调节基因,有些功能目前还尚不清楚。人类基因组,又称人类基因体,是智人的基因组,由23对染色体组成,其中包括22对体染色体、1条X染色体和1条Y染色体。人类基因组含有约30亿个DNA碱基对,碱基对是以氢键相结合的两个含氮碱基,以胸腺嘧啶(T)、腺嘌呤(A)、胞嘧啶(C)和鸟嘌呤(G)四种碱基排列成碱基序列,其中A与T之间由两个氢键连接,G与C之间由三个氢键连接,碱基对的排列在DNA中也只能是A对T,G对C。"人类基因组计划"在研究人类过程中建立起来的策略、思想与技术,可以用于研究微生物、植物及其他动物。是人类科学史上的又一个伟大工程,被誉为生命科学的"登月计划"。被认为是人类基因组计划成功的里程碑。
3生物基因组的形成及其遗传基因信息的双向性
生物的生命遗传信息全部存储于基因组核酸(DNA或RNA)结构序列之中,基因组图谱在作者看来是这样形成的。从纵向看,基因组是从生物一步一步进化而来,是生物进化的产物;但从横向看,基因组则是亲代配子(父亲和母亲)遗传基因杂交的产物。这一纵一横绘成了我们今天基因组图谱。因此,我们基因组图谱中应该包含两方面的生命遗传信息,一方面种系纵向生命遗传信息,这些基因信息主要存储在非编码基因序列(这个序列基因与进化有关,其在人类胚胎时期进行表达,表达的蛋白质不具有很强的抗原性)之中,因此该基因又叫非编码基因;另一方面个体横向生命遗传信息,这些基因信息主要存储在编码基因序列(这个序列基因与进化无关,其在人类生长发育时期进行表达,表达的蛋白质具有很强的抗原性)之中,该基因又叫编码基因。生物遗传基因信息的双向性是导致生物遗传基因概率分布定律和生物遗传基因矩阵分布定律发现的根本原因,它决定了人类生命周期过程遵循双S曲线规律。
生物基因组纵向生命遗传信息和生物基因组横向生命遗传信息表示如下:
X表示生物基因组内纵向生命遗传信息,从低级到高级形成一组序列;
Y表示生物基因组内横向生命遗传信息,从简单到复杂形成另一组序列;
4生物遗传基因概率分布
生物基因组生物遗传基因在生物遗传与生物表达过程中是有选择性的,这种选择性决定了生物基因组遗传基因的概率分布。生物遗传基因具有代表性的主要有二种类型,X纵向生物遗传基因(种系生物遗传基因、一般生物遗传基因、非编码基因)、Y横向生物遗传基因(个体生物遗传基因、特殊生物遗传基因、编码基因),但随着生物的不断进化,生物的结构层次就越来越复杂,越来越增加,这样其生物遗传基因(纵向遗传基因与横向遗传基因)的数量也将形成一个集合序列随着生物不断增加,使得生物遗传基因在生物体系的内部不断地自由分离与组合。从而导致各种各样生物个体的形成。按照生物遗传基因的自由分离与自由组合规律,2对生物遗传基因的可能组合方式为4,其组合数为16。3对生物遗传基因的可能组合方式为8,其组合数为64;4对生物遗传基因的可能组合方式为16,其组合数为256;n对生物遗传基因的可能组合方式为n2,其组合数为n4。由于自然界生物遗传基因的数目是很多很多的,而且又大都为杂合型,而且所含数量又有差别,各种生物遗传基因分布频率又不一致。因此,在演化过程中其生物遗传基因的重组就会产生多种多样,千变万化,丰富多彩的新生物基因组,从而导致各种新生物的产生。我们把这个定律称为生物遗传基因概率分布定律(如表1所示)。生物遗传基因概率分布定律具体地阐述了不同生物之间可以通过生物遗传基因的相互作用和交叉等等方式产生丰富的遗传性与变异性。也是生物界形成丰富多彩的物种生态系统的根本之所在,它是生物演化与生物发育的发生根本动因。因此,生物遗传基因概率分布定律揭示了生物的(种系与个体)多基因遗传的规律性。
表1 2对(X1X2Y1Y2)生物遗传基因概率分布表
X1X2Y1Y2 | X1X2 | X2Y1 | X1Y2 | Y1Y2 |
X1X2 | X1X2X1X2 | X1X2X2Y1 | X1X2X1Y2 | X1X2Y1Y2 |
X2Y1 | X2Y1X1X2 | X2Y1X2Y1 | X2Y1X1Y2 | X2Y1Y1Y2 |
X1Y2 | X1Y2X1X2 | X1Y2X2Y1 | X1Y2X1Y2 | X1Y2Y1Y2 |
Y1Y2 | X2Y2X1X2 | X2Y2X2Y1 | X2Y2X1Y2 | Y1Y2Y1Y2 |
如果把纵向遗传基因(一般共同基因、种系遗传基因、非编码基因)看成是隐性基因,把横向遗传基因(特殊差异基因、个体遗传基因、编码基因)看成是显性基因,那么就会看出他们的组合数比例是:9:3:3:1。如果是多个基因,那么纵向遗传基因(种系生物遗传基因、一般生物遗传基因、非编码基因)与横向遗传基因(个体生物遗传基因、特殊生物遗传基因、编码基因)其组合是数n2n。通常纵向遗传基因表达在前,在孕育时期表达,不具有特异性,属于隐性;横向遗传基因表达在后,在出生时期表达,具有很强特异性,属于显性。一般来说每个基因同时具有纵向性和横向性,这是生物遗传基因双向性所决定的。由隐性到显性呈两头小,中间大,中间大都是杂合型,其概率分布由浅灰到深灰呈正态分布(如1,图2所示)。
图1生物基因组多个杂交基因概率密度正态分布曲线示意图
正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。正态分布函数密度曲线可以表示为:
称x服从正态分布,记为X~N(m,s2),其中μ为均值,s为标准差,X∈(-∞,+ ∞ )。标准正态分布另正态分布的μ为0,s为1。
图2 多生物基因组杂交基因概率密度正态分布曲线示意图
a.正态分布符号定义若随机变量X服从一个数学期望为μ、方差为的高斯分布,记为N(μ,)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。正态分布有两个参数,即均数(μ)和标准差(σ)。μ是位置参数,当σ固定不变时, μ越大,曲线沿横轴,越向右移动;反之, μ越小,则曲线沿横轴,越向左移动。是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线越尖峭。通常用表示标准正态分布。 b.正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~。其中μ、σ2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ2对应不同的正态分布。正态曲线两头低,中间高,左右对称,曲线与横轴间的面积总等于1。 c.正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。集中性:正态曲线的高峰位于正中央,即均数所在的位置。对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。
由于每个生物基因组是独特的,其生物遗传基因(纵向遗传基因与横向遗传基因)概率分布也是独特的。由此我们不难看出,生物之所以发生遗传现象,是因为生物在形成与发展过程中,新生物是从旧生物中分裂出来,但在其生物规范中仍然保留了旧生物规范中的生物遗传基因(纵向和横向),旧生物遗传基因(纵向和横向)仍然在不同程度上参与了新生物规范的组合,这就是导致生物遗传现象发生的主要原因。而变异现象的发生,则是由于在环境因素的作用下,导致生物遗传基因(纵向和横向)无论在质上还是在量上,都发生了很大的变化。使得参与组合新生物规范的生物遗传基因(纵向和横向)不是原来意义上的回归重现,这样就自然导致生物体系的变异。生物的遗传现象与变异现象之所以发生,一方面取决于生物体系内部新旧纵向和横向生物遗传基因的自由分离与自由组合,另一方面取决于生物体系外部环境的变化与选择,这种选择是随机的,是遵守一定的统计规律的。它是生物体系内外两方面因素作用的结果。生物遗传基因自由分离与自由组织将导致大量的生物的产生,同时也将导致多种多样,千变万化,丰富多彩的生物群体的产生。为什么生物基因具有上述分离与组合、连锁与交换、突变与重组等等特性,那是由基因的纵横二向性所决定的,每个基因都是一方面表现为纵向性,另一方面又表现为横向性,是这两种性质的对立统一体。基因的纵横二向性使基因在时间与空间上表现出不同的拓扑结构,使转座基因或称跳跃基因等等功能基因得以出现,从而促进生物的不断进化发展。生物在进化发展的过程中,由于种系遗传基因(纵向遗传基因、非编码基因)和个体遗传基因(横向遗传基因、编码基因)在比率上的差别,导致生物遗传性状出现差异。由此形成生物多样性遗传,产生多种多样生物物种。形成什么物种就看种系遗传基因(纵向遗传基因、非编码基因)与个体遗传基因(横向遗传基因、编码基因)在生物基因组中所占比例,这种差异呈概率分布,具有一定统计学意义。各种生物遗传基因概率分布计算公式:
式中:是表示物种基因概率(该组频率);
是物种基因总数(数据总数);
是(种系和个体)基因组纵横杂交基因总数(频数)。 生物基因组具有一定的结构与功能,并且这种结构与功能的出现意味着一种生物物种的形成。任何一个生物都具有自己的特定结构与功能,都具有自己的特定生物规范。种系生物系统有种系生物的生物规范,个体生物系统有个体生物的生物规范。各种生物的生物规范都具有本质上的区别与联系。而生物的规范则又是由生物基因所决定的。所以生物基因组遗传基因的分离与组合,连锁与交换,突变与重组是导致生物遗传现象与变异现象发生的根本原因。而生物遗传基因概率分布定律则揭示了生物的种系与个体多基因遗传的规律性,它用概率论与数理统计的方式用来分析研究基因在生物遗传与变异上的选择。在确定选择什么基因或选择多少基因进行复制与表达上具有决定性意义。因此,生物遗传基因概率分布定律在生物遗传与变异、生物进化与发育过程中将起发挥一定的生物作用,具有非常重要的生物统计学价值。
5结 论
我们通过对生物遗传基因种系遗传基因(纵向遗传基因、非编码遗传基因)和个体遗传基因(横向遗传基因、编码遗传基因)概率分布的数理统计分析研究,发现生物遗传基因概率分布定律。将概率论与数理统计引入遗传学分析是对生物学的一大创新,就像统计学引入量子力学之后导致学科的一系列变化一样,它也会导致遗传学的一系列分析方式的变化。使得遗传学分析从确定性走向不确定性,从清晰走向模糊,使得人们对遗传的认识有一个范围度的把握。它将改变人们对遗传与变异过程的传统看法。生物遗传基因概率分布定律是揭示了生物的(种 系与个体)多基因遗传的规律性一个非常重要的定律。生物遗传基因概率分布定律就是对生物(种系与个体)遗传基因杂交的基础上,提出的一个统计分析定律。它具体地阐述了生物可以通过不同生物遗传基因的相互作用和交叉、相互转换和重组、相互连锁和交换等等方式产生丰富的遗传性与变异性。而这一切正是导致生物遗传与变异现象发生的根本原因,也是生物界形成丰富多彩的物种生态系的根本所在,它更是生物演化与发育的根本动因。因此,对这个定律具有非常重要的生物学价值和意义。
参考文献
[1]沈律.生物遗传基因概率分布定律(https://www.doc88.com/p-73447985883871.html
[1]沈律.2017.关于生命科学若干数学问题的研究报告——对生命的本质及其发展规律的生物计量学分析.http://blog.sciencenet.cn/blog-38450-1067806.htm.
[2]沈律.2022.生物演化的自然均衡选择理论——对生物演化的自然均衡选择过程的生物计量学分析[J].中国科技信息.(1):1-13.
[3]沈律.2000.论生物进化与生物发育的基本规律——对人类基因组的形成及其复制与表达过程的系统研究[M].叶鑫生等主编.干细胞与发育生物学.北京:军事医学科学出版社.217-229.
[4]陈阅增等主编.1997.普通生物学.北京:高等教育出版社.
[5]杨荣武主编.2007.分子生物学.南京:南京大学出版社.
[6]李春喜等.2005.生物统计学.北京:科学出版社.
[7]刘凌云等主编.2009.普通动物学.北京:高等教育出版社.
[8]徐克学 著. 1999.生物数学.北京:科学出版社.
[9]赵斌 著. 2015.生物数学简史.北京:中国科学技术出版社.
[10]袁荫棠 编. 1985.概率论与数理统计.北京:中国人民大学出版社.
[11]C.达尔文著. 1972.物种起源.北京:科学出版社.
[12]N·海克尔著. 1974.宇宙之谜.上海:上海人民出版社.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-6-7 16:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社