首席网期刊频道
您所在位置: 首页 > 期刊 > 过刊浏览 > 中西医结合> 《中华中西医杂志》> 2005年3月6卷6期>病例报告> 文章详情

基因碱基序列分布的余弦拟合法

首席医学网      2005年05月10日 08:48:04 Tuesday  
 

作者:邓 宇 邓 非 邓 海 陈 蕾 葛建新 李丽玖

  加入收藏夹   向本刊在线投稿

【关键词】  基因

    从我们揭示了基因的碱基序列具有周期正弦波规律(将发表)后,碱基是否还有余弦波的规律?答案是肯定的。基因序列在4个基本碱基之间的周期振荡交叠的曲线、波动轨迹,若用常规数理统计的线性、非线性的数字拟合,直线、指数、乘幂、对数、二次方程,多项式等的渐进线拟合方法,几乎是不可能的,其相关程度很离谱,乱七八糟,当然相关就根本不可能了。当我们用三角函数的正弦拟合时,却得到了意外的成功:可以达到完美相关,R=1。影响正弦SIN理论预测与实验值误差或精准度的关键不是理论方程SIN本身,而是SIN中的周期变量π取值的有效位数,或小数点后数字的位数。正弦函数能够做到,余弦函数怎样?这就是本文要探询和揭示的基因序列深藏的秘密。“基因四进制”与信息守恒律。

    1 材料与方法

    1.1 基因序列的来源 AY644963下载自EMBL的EMBL-Bank,该基因有378个碱基:ATTCAGCAGCCTTTTTCTCATGCAGACTTGTAAATCTGGGAGTCTGTCAGTCAGTCAGTCAGCCAGTCAACTTTTCTGTTGGAAAGTCCGTCTTCATAAAGCCAGCATGTCTCTTGGGGAACCTGGCATTTTGTTAAAATAACAAGTGTTTAATTTTTCAGGGGAAATCCTGAAACAATGTATTCCTTTTTACCCGCCTCATGATGTCTGCACAGAGGCAGTTCAGCTGAGCTGCAAGCCCAGGCAGGCTGCTGGAAGTTCAGTCAGCTCCAGCATCCCCATGTTGTGCCTCCATCTGGATACTTCTGCAGCACCTGGCTTGGGCCAGAAATGGAGCAAATGGTTCCTCACATGTGTGTGGAAGGCCCTG GTCAGATC。

    1.2 方法

    1.2.1 实验基因碱基序列的符号坐标系方法 以基因碱基序列的排序号1,2,3,...,378,为X轴的横坐标x=1,2,3,...,378,碱基的四个基本组元A,G,T,C(基因四进制的个位)为Y轴的纵坐标y=A,G,T,C。

     1.2.2 碱基符号的数字化 由于符号化的碱基,目前暂时还没有相应的数学的处理方法,为研究方便起见,先将A,G,T,C碱基数字化,令A=1,G=2,T=3,C=4(用其它数也可以,用自然数比较自然方便直观),此后,这“斜黑体”的“1,2,3,4”就表示碱基的”A,G,T,C”符号。用数字代表示“基因四进制”,如其中的A=1,G=2,T=3,C=4。以坐标(X,Y)的数符对(1,A),(2,T),(3,T),....,(378,C),在X-Y坐标系上点点,做图。

    1.2.3 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值 弧度 cos =acos(y)=x  cos ,或弧度 sin =asin(y)=x  sin ,生成了余弦函数或正弦函数的“初相位”φ,见表1,图1。

    图1纵轴的反余弦函数acos(y)=φ与横轴的关系图

    表1 求标化数字碱基的反余弦、反正弦值,即碱基的弧度、角度值(略)

    1.2.4 理论预测 重构基因余弦(正弦)序列。y  cos =cos(x)×1.5+2.5。

    1.2.5 恢复数字碱基原值 y  cos =1.5cos(x)+2.5,计算制图,还原。并进行相关分析。

    2 结果和讨论

    基因的碱基分布有周期特性,具有三角函数的分布特征。三角函数值与实际值完全相关,相关系数R=1,图2,图3。基因由4个基本碱基组成,其周期规律性应极为强烈。距其最接近的就是三角函数样的周期运动。通过我们对AY644963基因的分析,揭示、发现了这个周期循环的规律,给出了AY644963基因的正弦波动和余弦波规律的内在机制。通过这项探索研究和演绎,充分显示了基因的特质和数理规律:三角函数的特点。为理论基因组的研究开辟了 新路。

    图2 弧度值与序号,数字碱基关系

    基因可以用三角函数解析基因碱基的数学奥秘。依据每个碱基在(单位)圆上的投影角度―――弧度值,计算出基因碱基的正弦分布波谱。各位碱基分布的弧度值。图1, 图2曲线方向相反头,n≤100比较。

    图3 π取值对基因余弦序列拟合优度的影响
   
    预测值的精度,与π的取值小数位有关,取π=3.14时,相关系数R=0.9306,80位,及到108位后的预测值与实际值全都因为误差而错乱。π=3.141,R=0.9918;π=3.1415,R=0.9998;π=3.14159,R=1。π=3.1415926535.离谱π=3,R=0.0387不相关了明显。Y 3.14

    (编辑秋 实)

    作者单位:100016北京清华大学第一附属医院
    北京八一中学
    北京将台中学

  订阅登记:

请您在下面输入常用的Email地址、职业以便我们定期通过邮箱发送给您最新的相关医学信息,感谢您浏览首席医学网!

邮箱:    职业: