全局序列比对

science

lzhengning

人类与黑猩猩在进化树上的距离非常近

        然而,考虑到染色体变异导致的一大段基因的整体移动,出现以下情况还适合用全局的序列比较方法吗?

        由于基因突变的频率低,所以对于同一段来源相同的基因,大多数内容相同,仅有少数位置上有差异。

DNA序列

为什么进行序列比对?

序列决定结构,结构决定功能    A        B

判别同源性,推测序列之间的进化关系

A           B

        编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

例如将kitten一字转成sitting:     1.    sitten (k→s)     2.    sittin  (e→i)      3.    sitting(→g)编辑距离    3

人类与黑猩猩基因相似度99%

长为7的核苷酸序列    S:    C    T    G    A    A    G    C    T:    G    G    C    T    A    A    A

一种方式:    S:    _     _     C    T    G    A    A    G    C    T:    G    G    C    T     _    A    A     _    _

另一种方式:    S:    _     _     C    T    G    A    A    G    C    T:    G    G    C    T    A    A    A     _     _

序列比对

每个碱基对的状态        匹配方法        匹配                    不变        碱基替换             字符替换        碱基插入删除       空白字符占位

1.    两个序列长度相近,内容相似,仅有少数位置有差异,这种差异出现的频率低,需要都找出来2.    两条序列,现在希望确定一条序列的前缀是否和另一条序列的后缀相似3.两条序列长度差别比较大,确定较短的序列是否和另一条长序列的一个片段相似4.    两条序列较长,找出其中是否各有一片段,它们之间较为相似

四个基本问题

Dynamic Programming &    Pairwise Sequence Alignment 

参考文献        生物信息学导论  : 面向高性能计算的算法与应用 / 王勇献, 王正华编著        生物信息学算法导论 N. C. 琼斯, P. A. 帕夫纳著 王翼飞等译               计算生物学导论: 图谱、序列和基因组 M.S.Waterman著; 黄国泰, 王天明译              生物信息学基础 孙啸, 陆祖宏, 谢建明编著

生物序列

        生物序列一般指DNA、RNA或者蛋白质序列,比较不同类型的生物体序列的相互关系是生物序列分析的核心问题。        今天我们讨论的核心问题是DNA序列

替换        —ACTTAG—        —ACGTAG—缺失        —ACTTAG—        —ACTAG—插入        —ACTTAG—        —ACTGTAG—

比对方式    ——    编辑距离

序列比对

基因突变的方式

        这就是序列        This is sequence        010100101001        ACGTGCATTA

什么是序列

序列

NEX

重播 分享 评论
×
×

iPresst

版本:1.0

Copyright © iPresst.com. All Rights Reserved.

创作者:TAT.Aishen, TAT.CG, TAT.DM, TAT.Jarvis, TAT.Kinvix, TAT.Weber, TAT.Yussica