DNA编码约束
DNA編碼約束及分析
1 基于漢明距離的編碼約束
設(shè)DNA序列X和Y分別為:X=5`-x1x2......x3-3`,Y=5`-y1y2......y3-3`
(1)漢明距離約束:
l??任意兩個碼字之間對應(yīng)位上碼元取值不同的位的數(shù)目定義為這兩個碼字之間的漢明距離,如:10100和11101,漢明距離為2。
l??在DNA計算中指任意兩個DNA鏈序列的所有對應(yīng)位置字符不同的總數(shù)。
漢明距離H(X,Y):
(2)相似度約束:描述兩個DNA序列X和Y堿基組成的相似程度。
相似度Similarity(X,Y):H(*,*)表示漢明距離,當k>0時,表示右移;當k<0時,表示左移;k表示移動位數(shù)。若漢明距離減小,Similarity也隨之減小。Similarity值較小時序列X和Y就非常相似,序列X和YC之間互補的堿基則多,容易出現(xiàn)非特異性雜交;Similarity值較大時序列X和YC之間互補的堿基則少,不會出現(xiàn)非特異性雜交。
(3)?H-measure約束
H(X,Y)表示漢明距離,當k>0時,表示右移;當k<0時,表示左移;k表示移動位數(shù)。YC表示DNA序列Y的補鏈。H-measure大表示不會雜交,有效避免非特異性雜交等錯誤。
反補漢明距離約束:DNA實驗中單鏈DNA分子在溶液中任意擴散,因此X可能和Y的反向序列YR發(fā)生雜交。反補漢明距離H(X,YRC)用來描述X和YRC之間的相似程度。H(X,YRC)越大,說明X和YRC不同堿基個數(shù)越多,那么X和YR互補對就越少,因此不容易出現(xiàn)非特異性雜交。反之,H(X,YRC)越小,說明X和YRC不同堿基個數(shù)越少,那么X和YR越易出現(xiàn)非特異性雜交。
2 DNA化學特性約束
(1)?解鏈溫度約束
解鏈溫度(Tm)是雙鏈DNA分子在加溫變性過程中,有50%的DNA分子打開雙鏈編程單鏈時的溫度。Tm是評價DNA分子化學熱力學穩(wěn)定性的一個重要參數(shù)。DNA計算要求DNA分子具有一致的解鏈溫度。
根據(jù)Wallace法則,計算公式:Tm=(A+T)*2oC+(C+G)*4oC (<20bp)
根據(jù)GC百分含量,計算公式:Tm=81.5+16.6*log[Na+]+41(G+C)-500/|x|
根據(jù)Nearest-Neighbors熱力學模型,計算公式:
是相鄰堿基的總焓;是相鄰堿基的總焓;R為摩爾氣體常量(1.987cal/kmol);C為DNA分子濃度。根據(jù)上面三個Tm值計算式可以看出,GC含量高,Tm值大;DNA分子濃度大,Tm值大;溶液pH值大,Tm值大。
(2)?化學自由能約束
任意兩個DNA分子X和Y的雜交反應(yīng)的化學方程式表示:
X+Y<=>YX
X+Y-||=>YX,單鏈DNA分子X、Y釋放能量,形成一條雙鏈。
X+Y=>YX+||,雙鏈DNA分子X、Y吸收能量,分成兩條單鏈。
其中YX代表雜交后的雙鏈。有化學熱力學可知,雜交反應(yīng)的方向為自由能減小的方向。自由能是參加化學反應(yīng)的單鏈DNA分子從高能狀態(tài)自發(fā)地向低能量狀態(tài)的雙鏈分子變遷所釋放的能量。
自由能()的變化通常為負值,即<0。是DNA雙鏈穩(wěn)定性的度量,其絕對值越高,DNA雙鏈越穩(wěn)定,已發(fā)生特異性雜交。給定最小自由能變化閾值,使DNA解集C中的任意兩個DNA分子發(fā)生特異性雜交的都大于該閾值,從而不能形成穩(wěn)定的雙鏈DNA結(jié)構(gòu),阻止非特異性雜交的發(fā)生。
表示近堿基對的自由能;ni表示個數(shù);表示起始位置GC配對的修正值;表示起始位置AT配對的修正值;表示自補DNA序列的修正值。
在進行編寫序列時發(fā)生特異性雜交GT幾乎與AT一樣穩(wěn)定,而GC百分比含量滿足一定的要求,選擇C而不選擇G。
總結(jié)
- 上一篇: 数字IC设计——跨时钟域篇1(时钟域)
- 下一篇: 【XJTUSE软件项目管理复习笔记】 第