meizaikexue的个人博客分享 http://blog.sciencenet.cn/u/meizaikexue

博文

关于基因语的思考(上)

已有 1026 次阅读 2022-7-5 13:44 |系统分类:科研笔记

        众所周知基因是指包含在生物体DNA(部分病毒是RNA)中的全部遗传信息,包括基因和非编码DNA。而人类基因组里有30亿个碱基对,有4种不同类型的碱基:A、T、C、G,从信息学的角度来看,其实就是一种四进制编码。

        我们知道计算机采用的是二进制,因此在标准ASCII码中需要使用7位二进制数组来表示大小写字母、数字、标点符号和一些特殊控制字符。因此基因组的四进制编码无疑更高效,即如果把生命体看成是一台计算机的话,生物计算机无疑比电子计算机更加高效快捷,这能够解释为什么生物体可以有条不紊的实现各种复杂的生物过程,而同时还能具有较好的鲁棒性。

        计算机要想运行必须有一套计算机能够识别的语言,从机器语言、汇编语言到高级语言,使得计算机可以准确的捕捉到人类的想法。因此生物体这台计算机要想有序高效的运行,其中也必然依赖一套合乎逻辑、能够消除歧义的语言,毕竟这个世界的很大一部分还是服从因果律。从另一个方面看,很多生物学功能是由多个基因共同作用的,之间可能并不是简单的关联关系,而是有更深层次的逻辑。

        因此如何找到基因组中看似杂乱无章编码背后的这套语言——基因语,可能是未来基因科学研究的课题。目前我们主要是从单个或几个基因入手,研究由其表达的特定功能的蛋白质,这很像语言学习中的认字或记忆单词。如果能像破解古文字一样破解基因组的语法、句法乃至整个语言体系,无疑对基因科学未来的发展会带来很大的促进作用。



https://blog.sciencenet.cn/blog-3523670-1345962.html

上一篇:本科数学专业代数与几何课程体系初探
下一篇:关于基因语的思考(下)
收藏 IP: 124.129.57.*| 热度|

1 张学文

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 08:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部