生活随笔
收集整理的這篇文章主要介紹了
三核苷酸
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Description
三核苷酸是組成DNA序列的基本片段。具體來(lái)說(shuō),核苷酸一共有4種,分別用’A’,’G’,’C’,’T’來(lái)表示。而三核苷酸就是由3個(gè)核苷酸排列而成的DNA片段。三核苷酸一共有64種,分別是’AAA’,’AAG’,…,’GGG’。給定一個(gè)長(zhǎng)度為L(zhǎng)的DNA序列,一共可以分辨出(L-2)個(gè)三核苷酸。現(xiàn)在我們想用一些統(tǒng)計(jì)學(xué)的方法來(lái)進(jìn)行一些分析,步驟如下:
1.對(duì)于這(L-2)個(gè)三核苷酸,我們從左到右給予編號(hào),分別為1到L-2。
2.從這(L-2)個(gè)三核苷酸挑選一對(duì)出來(lái),一共有(L-2)*(L-3)/2種可能。如果某一對(duì)三核苷酸是一樣的,我們就記錄他們之間的距離。他們之間的距離定義為他們的編號(hào)之差。
3.根據(jù)我們所記錄的“樣本數(shù)據(jù)”,我們現(xiàn)在需要計(jì)算樣本數(shù)據(jù)的方差。方差的計(jì)算公式是S2=[(x1-X) 2+(x2-X) 2+…+(xn-X)2]/n, X=(x1+x2+…+xn)/n。如果樣本的大小n=0,那么我們認(rèn)為S2=X=0。
例如,我們要統(tǒng)計(jì)DNA序列’ATATATA’:
為三核苷酸編號(hào). L1: ATA, L2:TAT, L3:ATA, L4:TAT, L5:ATA.(L1,L3)=2, (L1,L5)=4, (L3,L5)=2, (L2,L4)=2. 所以樣本數(shù)據(jù)是2,4,2,2.樣本數(shù)據(jù)平均值X=(2+4+2+2)/4=2.5.
方差S2=[(2-2.5)2+(4-2.5) 2+(2-2.5)2+(2-2.5)2]/4=0.75.
給定一個(gè)DNA序列,請(qǐng)你計(jì)算出它的方差。Input
輸入包含多組測(cè)試數(shù)據(jù)。第一行包含一個(gè)正整數(shù)T,表示測(cè)試數(shù)據(jù)數(shù)目。每組數(shù)據(jù)包含一個(gè)由’A’,’G’,’C’,’T’組成的字符串,代表要統(tǒng)計(jì)的DNA序列。DNA序列的長(zhǎng)度大于等于3且不會(huì)超過(guò)100000。
Output
對(duì)每組測(cè)試數(shù)據(jù),輸出一行答案,為一個(gè)保留6位精度的實(shí)數(shù),代表S2的值。如果你的答案和標(biāo)準(zhǔn)答案的“相對(duì)誤差”小于1e-8,你的答案會(huì)被視為正確的答案。
Sample Input
1
ATATATA
Sample Output
0.750000
.
.
.
.
.
.
程序:
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;int main()
{freopen("tri.in","r",stdin);freopen("tri.out","w",stdout);int t; scanf("%d",&t);while (t--){int a[100005],b[100005];char c[100005];long long s[505],sum[505],cnt[505],s1[505],s2[505];scanf("%s",c+1);int n=strlen(c+1);for (int i=111;i<=444;i++)s[i]=sum[i]=s1[i]=s2[i]=cnt[i]=0;for (int i=1;i<=n;i++){if (c[i]=='A') a[i]=1; elseif (c[i]=='G') a[i]=2; elseif (c[i]=='C') a[i]=3; else a[i]=4;}for (int i=1;i<=n-2;i++)b[i]=a[i]*100+a[i+1]*10+a[i+2];for (int i=1;i<=n-2;i++){s[b[i]]+=cnt[b[i]]*i*i+s1[b[i]]-s2[b[i]]*i*2;sum[b[i]]+=cnt[b[i]]*i-s2[b[i]];s1[b[i]]+=(long long)i*i;s2[b[i]]+=i;cnt[b[i]]++;}long long ans1=0,w=0,x=0;double ans=0;for (int i=111;i<=444;i++){ans1+=s[i];w+=sum[i];x+=cnt[i]*(cnt[i]-1)/2;}if (x==0) ans=0; else ans=1.0*ans1/x-(1.0*w/x)*(1.0*w/x);printf("%.6f\n",ans);}fclose(stdin);fclose(stdout);return 0;
}
轉(zhuǎn)載于:https://www.cnblogs.com/YYC-0304/p/11094935.html
總結(jié)
以上是生活随笔為你收集整理的三核苷酸的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。