日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

综合评价法之秩和比法(RSR)

發(fā)布時間:2023/12/14 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 综合评价法之秩和比法(RSR) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在編制指標(biāo)體系和數(shù)據(jù)分析時,需要從多個維度對多個評價對象進(jìn)行綜合評價時,可以考慮使用秩和比法。從實(shí)驗(yàn)數(shù)據(jù)來看,當(dāng)評價對象較多時,結(jié)果會呈現(xiàn)較好的正態(tài)分布特征。

文章目錄

  • 1. 背景介紹
  • 2. 設(shè)計思想
    • 2.1 優(yōu)點(diǎn)
    • 2.1 缺點(diǎn)
  • 3. 計算步驟
    • 3.1 編秩
      • 3.1.1 整次秩和比法
      • 3.1.1 非整次秩和比法
    • 3.2 計算RSR
    • 3.3 評價對象分級
      • 3.3.1 確定RSR分布
      • 3.3.2 計算回歸方程
      • 3.3.3 計算校正RSR值
      • 3.3.4 根據(jù)校正RSR分級
  • 4. 相關(guān)代碼Python

1. 背景介紹

秩和比法(Rank-sum ratio,簡稱RSR法),是我國學(xué)者、原中國預(yù)防醫(yī)學(xué)科學(xué)院田鳳調(diào)教授于1988年提出的,集古典參數(shù)統(tǒng)計與近代非參數(shù)統(tǒng)計各自優(yōu)點(diǎn)于一體的統(tǒng)計分析方法。

它不僅適用于四格表資料的綜合評價,也適用于行×列表資料的綜合評價,同時也適用于計量資料和分類資料的綜合評價。

RSR法現(xiàn)在廣泛地應(yīng)用于醫(yī)療衛(wèi)生、科技、經(jīng)濟(jì)等鄰域的多指標(biāo)綜合評價、統(tǒng)計預(yù)測預(yù)報、鑒別分類、統(tǒng)計質(zhì)量控制等方面。

2. 設(shè)計思想

使用數(shù)據(jù)大小的相對關(guān)系,對評價對象進(jìn)行排名,根據(jù)排名的結(jié)果計算得到RSR。

一般過程是將效益型指標(biāo)從小到大排序進(jìn)行排名、成本型指標(biāo)從大到小排序進(jìn)行排名,再計算秩和比,最后統(tǒng)計回歸、分檔排序。通過秩轉(zhuǎn)換,獲得無量綱統(tǒng)計量RSR;

在此基礎(chǔ)上,運(yùn)用參數(shù)統(tǒng)計分析的概念與方法,研究RSR的分布;以RSR值對評價對象的優(yōu)劣直接排序或分檔排序,從而對評價對象做出綜合評價。

2.1 優(yōu)點(diǎn)

以非參數(shù)法為基礎(chǔ),對指標(biāo)的選擇無特殊要求,適用于各種評價對象,由于計算時使用的數(shù)值是秩次,可以消除異常值的干擾。

2.1 缺點(diǎn)

排序的主要依據(jù)是利用原始數(shù)據(jù)的秩次,最終算得的 RSR 值反映的是綜合秩次的差距,而與原始數(shù)據(jù)的順位間的差距程度大小無關(guān),這樣在指標(biāo)轉(zhuǎn)化為秩次是會失去一些原始數(shù)據(jù)的信息,如原始數(shù)據(jù)的大小差別等。

當(dāng) RSR 值實(shí)際上不滿足正態(tài)分布時,分檔歸類的結(jié)果與實(shí)際情況會有偏差(根據(jù)中心極限定理,樣本量大時會趨近于正態(tài)分布),且只能回答分級程度是否有差別,不能進(jìn)一步回答具體的差別情況。

3. 計算步驟

此處計算步驟以基金投資案例說明,選取7個指標(biāo)對基金投資進(jìn)行評價。

其中X1,X2,X3為正向指標(biāo)(效益型指標(biāo)),值越大越好,排序時從小到大排。

? X4,X5為負(fù)向指標(biāo)(成本型指標(biāo)),值越低越好,排序時從大到小排。

原始數(shù)據(jù)如下:

X1X2X3X4X5
1341000.9990910.980.9717930.002727
2226300.6739730.67397310
357660.7741940.7741940.9930560
499210.93750.718750.21875
5132060.6807510.6643190.7758620.00939
6263190.8315670.8044760.8059490.014134
7456010.8076140.78450.7718860.004759
8340070.8368280.8076570.8997820.000912
9345650.9103140.8968610.7960590.006278
1057351110

3.1 編秩

編秩方法有整次秩和比法和非整次秩和比法。

3.1.1 整次秩和比法

將 n 個評價對象的 m 個評價指標(biāo)排列成 n 行 m 列的原始數(shù)據(jù)表。編出每個指標(biāo)各評價對象的秩,其中效益型指標(biāo)從小到大編秩,成本型指標(biāo)從大到小編秩,同一指標(biāo)數(shù)據(jù)相同者編平均秩。

得到秩矩陣 R=(Rij)m×nR=\left ( R_{ij} \right )_{m \times n}R=(Rij?)m×n?

如下表:

  • 對X2按從小到大排序,其中值為1的兩個指標(biāo)( R4,2R_{4,2}R4,2?R10,1R_{10,1}R10,1? ),按算術(shù)平均進(jìn)行編秩:(9+10)/2=9.5
  • 對X5按從大到小排序,其中值為0的三個指標(biāo),按算術(shù)平均進(jìn)行編秩:(8+9+10)/3=9
  • X1R1X2R2X3R3X4R4X5R5
    13410080.99909180.9890.97179340.0027276
    22263050.67397310.673973211.509
    3576630.77419430.77419430.993056309
    4992119.50.937580.71875100.218751
    51320640.68075120.66431910.77586280.009393
    62631960.83156750.80447650.80594960.0141342
    745601100.80761440.784540.77188690.0047595
    83400770.83682860.80765760.89978250.0009127
    93456590.91031470.89686170.79605970.0062784
    105735219.511011.509

    3.1.1 非整次秩和比法

    用類似于線性插值(也比較像優(yōu)劣解距離法)的方式對指標(biāo)值進(jìn)行編秩,以改進(jìn) RSR 法編秩方法的不足,所編秩次與原指標(biāo)值之間存在定量的線性對應(yīng)關(guān)系,從而克服了 RSR 法秩次化時易損失原指標(biāo)值定量信息的缺點(diǎn)。

    • 對于正向指標(biāo)(效益型指標(biāo)): Rij=1+(n?1)Xij?min(X1j,X2j,...,Xnj)max(X1j,X2j,...,Xnj)?min(X1j,X2j,...,Xnj)R_{ij}=1+\left ( n-1 \right )\frac{X_{ij}-min\left ( X_{1j},X_{2j},...,X_{nj} \right )}{max\left ( X_{1j},X_{2j},...,X_{nj} \right ) - min\left ( X_{1j},X_{2j},...,X_{nj} \right )}Rij?=1+(n?1)max(X1j?,X2j?,...,Xnj?)?min(X1j?,X2j?,...,Xnj?)Xij??min(X1j?,X2j?,...,Xnj?)?
    • 對于負(fù)向指標(biāo)(成本型指標(biāo)): Rij=1+(n?1)max(X1j,X2j,...,Xnj)?Xijmax(X1j,X2j,...,Xnj)?min(X1j,X2j,...,Xnj)R_{ij}=1+\left ( n-1 \right )\frac{max\left ( X_{1j},X_{2j},...,X_{nj}\right ) - X_{ij}}{max\left ( X_{1j},X_{2j},...,X_{nj} \right ) - min\left ( X_{1j},X_{2j},...,X_{nj} \right )}Rij?=1+(n?1)max(X1j?,X2j?,...,Xnj?)?min(X1j?,X2j?,...,Xnj?)max(X1j?,X2j?,...,Xnj?)?Xij??

    3.2 計算RSR

    將某對象的各秩乘以相應(yīng)的權(quán)重并求和后,除以對象個數(shù),得到該對象的RSR,公式: RSRi=1n∑j=1mωjRijRSR_{i} = \frac{1}{n}\sum_{j=1}^{m}\omega_{j}R_{ij}RSRi?=n1?j=1m?ωj?Rij?

    其中,iii表示某個對象,jjj表示各指標(biāo)的序號。

    當(dāng)各指標(biāo)權(quán)重相同時,權(quán)重 ωj=1m\omega_{j}=\frac{1}{m}ωj?=m1? ,RSR的計算可以簡化為: RSRi=1mn∑j=1mRijRSR_{i} = \frac{1}{mn}\sum_{j=1}^{m}R_{ij}RSRi?=mn1?j=1m?Rij?

    • 本步驟計算得到的RSR,即可作為為各對象綜合評價得分。
    • 有時我們不僅需要計算綜合得分,還需要對評價對象進(jìn)行分級,此時可以從正態(tài)分布的角度對各評價對象分級。

    本例中使用整次秩和比法編秩,計算結(jié)果如下,如 RSR11=(8+8+9+4+6)/(5×10)=0.7RSR_{11}=\left (8+8+9+4+6 \right ) /(5 \times 10)=0.7RSR11?=(8+8+9+4+6)/(5×10)=0.7

    X1X2X3X4X5R1R2R3R4R5RSR
    1341000.9990910.9800000.9717930.002727889460.7
    2226300.6739730.673973105121.590.37
    357660.7741940.7741940.9930560333390.42
    499210.9375000.718750.2187519.581010.59
    5132060.6807510.6643190.7758620.00939421830.36
    6263190.8315670.8044760.8059490.014134655620.48
    7456010.8076140.7845000.7718860.0047591044950.64
    8340070.8368280.8076570.8997820.000912766570.62
    9345650.9103140.8968610.7960590.006278977740.68
    10573511.0000001029.5101.590.64

    3.3 評價對象分級

    對RSR進(jìn)行分布檢驗(yàn),確認(rèn)分布之后通過分布的概率進(jìn)行分級。主要步驟:

  • 通過將RSR進(jìn)行排序,并轉(zhuǎn)為概率單位Probit
  • 回歸分析,計算出回歸方程
  • 將第1步的概率單位代入到第2步的回歸方程,計算出校正RSR值
  • 根據(jù)校正RSR值進(jìn)行分級
  • 3.3.1 確定RSR分布

    確定RSR分布是指用概率單位Probit表達(dá)值的累計頻率。Probit模型是一種廣義的線性模型,服從正態(tài)分布。其轉(zhuǎn)換步驟為:

  • 編制RSR頻數(shù)分布表,列出各組頻數(shù) fff ,計算各組累計頻數(shù) ∑f\sum ff
  • 為各組RSR編秩
  • 計算累計頻率 Rˉ/n×100\bar R/n \times 100%Rˉ/n×100 ,最后一項(xiàng)使用 1?14n1-\frac{1}{4n}1?4n1? 進(jìn)行修正。(不修正的話,該值對應(yīng)的Probit為無窮大,不能用于計算)
  • 將累計頻率換算為概率單位ProbitProbitProbit,Probit為累計頻率對應(yīng)的標(biāo)準(zhǔn)正態(tài)離差加5。(研究過程經(jīng)常通過加5,使結(jié)果都為正數(shù))
  • 以上4個步驟為理論步驟,實(shí)際操作中可以簡化為:

  • 將RSR按從小到大進(jìn)行排序,計算各RSR值的分位數(shù),RSR值一樣的分位數(shù)使用算術(shù)平均值法計算。(該分位數(shù)結(jié)果與上一方法中第3步一致)
  • 將累計頻率換算為概率單位Probit,Probit為累計頻率對應(yīng)的標(biāo)準(zhǔn)正態(tài)離差加5。換算時將分位數(shù)值為1的使用 1?14n1-\frac{1}{4n}1?4n1? 進(jìn)行修正。
  • X1X2X3X4X5R1R2R3R4R5RSRfΣfRˉ/n\bar R/nRˉ/nRˉ/n\bar R/nRˉ/n 修正原ProbitProbit
    1132060.6807510.6643190.7758620.00939421830.36110.10.1-1.281553.718448
    2226300.6739730.673973105121.590.37120.20.2-0.841624.158379
    357660.7741940.7741940.9930560333390.42130.30.3-0.52444.475599
    4263190.8315670.8044760.8059490.014134655620.48140.40.4-0.253354.746653
    599210.9375000.718750.2187519.581010.59150.50.505
    6340070.8368280.8076570.8997820.000912766570.62160.60.60.2533475.253347
    7456010.8076140.7845000.7718860.0047591044950.6417.50.750.750.674495.67449
    8573511.0000001029.5101.590.6417.50.750.750.674495.67449
    9345650.9103140.8968610.7960590.006278977740.68190.90.91.2815526.281552
    10341000.9990910.9800000.9717930.002727889460.711010.9751.9599646.959964

    3.3.2 計算回歸方程

  • 通過QQ圖的方式對數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。以累積頻率所對應(yīng)的概率單位Probit為自變量,RSR值為因變量,計算直線回歸方程: RSR=a+b×ProbitRSR=a+b \times ProbitRSR=a+b×Probit
  • 計算出回歸方程之后,需要進(jìn)行校驗(yàn),主要包括:殘差獨(dú)立性檢驗(yàn)、方差齊性檢驗(yàn)、回歸系數(shù)有效性檢驗(yàn)、擬合優(yōu)度檢驗(yàn)
  • ? 此處的校驗(yàn)R-squared和Adj. R-squared值并不高,因?yàn)閿?shù)據(jù)做了截取。在真實(shí)數(shù)據(jù)中這兩項(xiàng)的值都超過了0.99

    3.3.3 計算校正RSR值

    將Probit代入回歸方程,計算出校正RSR值

    X1X2X3X4X5R1R2R3R4R5RSRfΣfR/nR/n’ProbitProbit’regression
    1132060.6807510.6643190.7758620.00939421830.36110.10.1-1.281553.7184480.368154
    2226300.6739730.673973105121.590.37120.20.2-0.841624.1583790.42236
    357660.7741940.7741940.9930560333390.42130.30.3-0.52444.4755990.461446
    4263190.8315670.8044760.8059490.014134655620.48140.40.4-0.253354.7466530.494844
    599210.9375000.718750.2187519.581010.59150.50.5050.52606
    6340070.8368280.8076570.8997820.000912766570.62160.60.60.2533475.2533470.557276
    7456010.8076140.7845000.7718860.0047591044950.6417.50.750.750.674495.674490.609168
    8573511.0000001029.5101.590.6417.50.750.750.674495.674490.609168
    9345650.9103140.8968610.7960590.006278977740.68190.90.91.2815526.2815520.683967
    10341000.9990910.9800000.9717930.002727889460.711010.9751.9599646.9599640.767558

    3.3.4 根據(jù)校正RSR分級

    在分級時可以按照合理拍檔或最佳拍檔原則進(jìn)行分級。本例中將40%以下的作為C等,80%以下的作為B等,其余的作為A等。40%,80%對應(yīng)的就是正態(tài)分布函數(shù)的累計概率(面積)。

    注:其實(shí)在實(shí)際操作中,level分類時,直接使用regression的分位數(shù)得到的效果也是一樣的,而且操作起來更簡單。

    X1X2X3X4X5R1R2R3R4R5RSRfΣfR/nR/n’ProbitProbit’regressionlevel
    1132060.6807510.6643190.7758620.00939421830.36110.10.1-1.281553.7184480.368154C
    2226300.6739730.673973105121.590.37120.20.2-0.841624.1583790.42236C
    357660.7741940.7741940.9930560333390.42130.30.3-0.52444.4755990.461446C
    4263190.8315670.8044760.8059490.014134655620.48140.40.4-0.253354.7466530.494844C
    599210.9375000.718750.2187519.581010.59150.50.5050.52606B
    6340070.8368280.8076570.8997820.000912766570.62160.60.60.2533475.2533470.557276B
    7456010.8076140.7845000.7718860.0047591044950.6417.50.750.750.674495.674490.609168B
    8573511.0000001029.5101.590.6417.50.750.750.674495.674490.609168B
    9345650.9103140.8968610.7960590.006278977740.68190.90.91.2815526.2815520.683967A
    10341000.9990910.9800000.9717930.002727889460.711010.9751.9599646.9599640.767558A

    4. 相關(guān)代碼Python

    import pandas as pd import statsmodels.api as sm from warnings import simplefilter from scipy.stats import normdf = pd.DataFrame([[34100, 0.999091, 0.98, 0.971793, 0.002727],[22630, 0.673973, 0.673973, 1, 0],[5766, 0.774194, 0.774194, 0.993056, 0],[992, 1, 0.9375, 0.71875, 0.21875],[13206, 0.680751, 0.664319, 0.775862, 0.00939],[26319, 0.831567, 0.804476, 0.805949, 0.014134],[45601, 0.807614, 0.7845, 0.771886, 0.004759],[34007, 0.836828, 0.807657, 0.899782, 0.000912],[34565, 0.910314, 0.896861, 0.796059, 0.006278],[5735, 1, 1, 1, 0] ], columns=["X1", "X2", "X3", "X4", "X5"]) # 正向指標(biāo),從小到大排序 df["R1"] = df["X1"].rank(ascending=True, method="average") df["R2"] = df["X2"].rank(ascending=True, method="average") df["R3"] = df["X3"].rank(ascending=True, method="average") # 負(fù)向指標(biāo),從大到小排 df["R4"] = df["X4"].rank(ascending=False, method="average") df["R5"] = df["X5"].rank(ascending=False, method="average") # 計算RSR值 df["RSR"] = df.loc[:, ["R1", "R2", "R3", "R4", "R5"]].sum(axis=1) / (5 * 10) # 排序 df.sort_values(by="RSR", inplace=True) # 因?yàn)閷?shí)際數(shù)據(jù)沒有重復(fù),此處偷懶,直接寫1 df["f"] = 1 df["Σf"] = df["RSR"].rank(method="average") df["R/n"] = df["Σf"] / len(df) df["R/n'"] = df["R/n"] df.iat[-1, -1] = 1 - 1 / 4 / len(df)df["Probit"] = norm.ppf(df["R/n'"]) df["Probit'"] = df["Probit"] + 5 import numpy as npr0 = np.polyfit(df["Probit'"], df["RSR"], deg=1) if r0[1] > 0:print(f"\n回歸直線方程為:y = {r0[0]} Probit + {r0[1]}") else:print(f"\n回歸直線方程為:y = {r0[0]} Probit - {abs(r0[1])}")simplefilter(action="ignore", category=FutureWarning) simplefilter(action="ignore", category=UserWarning) print(sm.OLS(df["Probit"], sm.add_constant(df["RSR"])).fit().summary()) df["regression"] = np.polyval(r0, df["Probit'"])C_LEVEL = norm.ppf(0.4) + 5 B_LEVEL = norm.ppf(0.8) + 5 A_LEVEL = 10threshold = np.polyval(r0, [0, C_LEVEL, B_LEVEL, A_LEVEL]) print("threshold:", threshold) df["level"] = pd.cut(df["regression"], threshold, labels=["C", "B", "A"]) df["regression_pct"] = df["regression"].rank(pct=True, ascending=True, method="average") # 設(shè)置pandas打印時顯示的列數(shù) pd.set_option("display.max_columns", 1000) pd.set_option("display.max_columns", None) pd.set_option("display.width", 1000) print(df)

    總結(jié)

    以上是生活随笔為你收集整理的综合评价法之秩和比法(RSR)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。