当前位置:94677奇闻网 > 未解之谜 > 手机访问:m.94677.net
来源:www.94677.net时间:2012-09-07 17:17:54奇闻指数:编辑: 手机版
从二进制到碱基对编码
DNA是生物数据库,它的主要功能就是存储包含各种指令的生物信息。DNA有G(鸟嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四种碱基,共同构成了相互缠绕的双链阶梯状的螺旋结构。通过这四种碱基不同顺序的编码,存储了生物所有的遗传信息。
现代计算机技术奠基者之一冯·诺依曼曾在 1948 年提出“自动复制机器”的设想:一个能够自我繁殖的系统,不仅能够构建某个组成元素,结构和自己一致的下一代,也能够把对自身的描述传递给下一代,如此往复。后来随着生物遗传的奥妙被发现,人们意识到,DNA 双螺旋结构正是冯·诺依曼描述的自动复制机器。
DNA里的四种碱基,两两互补成对。一个最短的DNA分子也有 4000个碱基对,可能的排列方式就有44000种。碱基对排列顺序千变万化,从而能够存储大量的遗传信息。
向活体DNA里写入数据,有诸多困难,细胞会死亡、分裂、变异,数据内容就会发生改变。
在本文开头提到的那项实验中,科学家们没有采用活细胞的基因组,而是采用了人工合成的DNA片段。他们用很多短的DNA序列而非长DNA序列来编码数据,这类似于硬盘写入的原理,在硬盘中,数据是被写入称为扇区的小硬盘块,这样能够降低写入和读取数据的困难和成本。科学家们将这种片段用喷墨打印机嵌入到微阵列芯片表面。接着,他们把计划写入 DNA的书里包含的信息:图片、文字、程序转化为HTML格式的文件,并将这些文件编译为由 0和1组成的电脑能够读懂的2进制数据。然后,他们将2进制数据转为四种碱基,把0转为A或 C,把1转成G或者T,并建立DNA链来维系这些编码的顺序和位置。每一个DNA片段还包含一个数字“条码”,记录它在原始文件中的位置,每个片段被合成多个拷贝以便有助于校正错误。编码完成后,这些芯片会在4摄氏度下保持三个月。
测序就是读取数据的过程:启用DNA测序装置,将所有DNA片断中的编码按照标记顺序排列,再还原成 2 进制格式的数据。每个 DNA 片断的每一个拷贝被测序高达3000次以便校对。利用这种方式,他们将5.27兆数据中的错误降低到只有12个。这种尺寸微小的存储设备,存储密度远远高于DVD、硬盘等介质,效果也毫不逊色。
推荐文章:北纬30 中国未解之谜 海洋动物 广西柳州食人鱼
90后女毒枭叶乔,身世凄惨疑
世界第一女海盗王,郑一嫂
美国黄道十二宫杀手,FBI追查
民国军统艳谍向影心,为行刺
不丹国王旺楚克,迎娶不丹王
美国安吉拉·哈里斯,疯狂约
重庆女黑社会老大王婉宁,强
杀人狂魔成瑞龙,抢劫强奸杀
帕斯卡拉干尸新娘真相,毛发
加拿大湖怪奥古布古,体长
揭开重庆鬼洞尸骨之谜,白莲
南极哥斯拉竟真实存在,藏在
埃及图坦卡蒙的诅咒,杀人于
世界上真的有美人鱼吗,美人
日本最诡异的笑脸男事件,日
探索重庆鬼洞之谜,白莲教众
【图】史上最全苍井空的a片
【图】世界十大太阳镜品牌排
【图】世界上最便宜的旅馆,
【图】约翰·凯奇无声音乐
【图】世界上最大的双壳贝,
【图】世界上最大最凶残的鳄
【图】世界上最危险的人,
【图】最美英语老师肖珠,佟