11种常见的多变量分析方法
| 在社會科學(xué)研究中,主要的多變量分析方法包括多變量方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、典型相關(guān)(Canonical correlation analysis)、聚類分析(Cluster analysis)、判別分析(Discriminant analysis)、多維量表分析(Multidimensional scaling),以及近來頗受矚目的驗(yàn)證性因子分析(Confirmatory factor analysis )或線性結(jié)構(gòu)模型(LISREL)與邏輯斯蒂回歸分析等,以下簡單說明這些方法的觀念和適用時機(jī)。 ? 1?多變量方差分析 MANOVA適用于同時探討一個或多個自變量與兩個以上因變量間因果關(guān)系的統(tǒng)計(jì)方法,依照研究者所操作自變量的個數(shù),可以分為單因素(一個自變量)或多因素(兩個以上自變量)MANOVA。進(jìn)行多變量方差分析時,自變量必須是離散的定類或定序變量,而因變量則必須是定距以上層次的變量。 ? 2?主成分分析 主成分分析的主要功能在分析多個變量間的相關(guān),以建構(gòu)變量間的總體性指標(biāo)(overall indicators)。當(dāng)研究者測量一群彼此間具有高度相關(guān)的變量,則在進(jìn)行顯著性檢驗(yàn)錢,為避免變量數(shù)過多,造成解釋上的復(fù)雜與困擾,常會先進(jìn)行主成分分析,在盡量不喪失原有信息的前提下,抽取少數(shù)幾個主成分,作為代表原來變量的總體性指標(biāo),達(dá)到資料縮減(data reduction)的功能。進(jìn)行主成分分析時,并無自變量和因變量的區(qū)別,但是所有的變量都必須是定距以上層次變量。 ? 3?因子分析 因子分析與主成分分析常被研究者混用,因?yàn)槎叩墓δ芏际峭ㄟ^對變量間的相關(guān)分析,以達(dá)到簡化數(shù)據(jù)功能。但不同的是,主成分分析是在找出變量間最佳線性組合(linear combination)的主成分,以說明變量間最多的變異量;至于因子分析,則在于找出變量間共同的潛在結(jié)構(gòu)(latent structure)或因子,以估計(jì)每一個變量在各因子上的負(fù)荷量(loading)。進(jìn)行因子分析時,并無自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。 ? 4?典型相關(guān) 典型相關(guān)可視為積差相關(guān)或多元回歸分析的擴(kuò)展,主要功能在分析兩個變量間的相關(guān)。進(jìn)行多元回歸分析的目的,是在分析一個或多個自變量與一個因變量間的關(guān)系,而典型相關(guān)中因變量也可以是多個;也就是說,典型相關(guān)的目的在于通過計(jì)算得到兩個變量線性組合的加權(quán)系數(shù)。以使(maximum)兩個變量間的相關(guān)達(dá)到最大化。進(jìn)行典型相關(guān)時,并無自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。 ? 5 聚類分析 聚類分析的主要功能在進(jìn)行分類(classification),當(dāng)研究者有觀測值時,常會根據(jù)觀測值的相似性或差異性進(jìn)行分類,以形成幾個性質(zhì)不同的類別,簡化解釋的工作。也就是說,聚類分析根據(jù)對變量進(jìn)行測量的觀察值進(jìn)行分類,以達(dá)到組內(nèi)同質(zhì)、組間異值的目的。其次,聚類分析完成后,通常可以進(jìn)行判別分析,以識別分類的效度。當(dāng)然,在某些時候也可以對變量進(jìn)行分類(此功能類似因子分析,因此多采用因子分析解決問題)。進(jìn)行聚類分析時,并無自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。 ? 6?判別分析 判別分析是多變量分析中應(yīng)用相當(dāng)廣泛的統(tǒng)計(jì)方法,它可以用來對樣本進(jìn)行分類的工作;也可以用來了解不同類別樣本在某些變量上的差異情形;同時也可以根據(jù)不同類別的樣本在某些變量的實(shí)際表現(xiàn),用來預(yù)測新的樣本屬于某一類別的概率。因此,在行為科學(xué)中,常見的研究者單獨(dú)使用判別分析,建立判別函數(shù)(discriminant function),以對新樣本進(jìn)行預(yù)測;或是多變量方差分析的檢驗(yàn)值達(dá)到顯著性水平后,比較不同組別樣本在因變量平均數(shù)的差異情形;或是聚類分析后,檢驗(yàn)聚類分析的正確性。進(jìn)行判別分析時,自變量是定距以上層次變量,至于因變量通常是離散變量。 ? 7?多維量表分析 多維量表分析基本上也是一種分類的統(tǒng)計(jì)方法,他在市場上普遍被應(yīng)用。當(dāng)研究者想要解釋一群受試者(例如消費(fèi)者)對一組客體(例如商品)在某些變量上相似性的測量中所包含的信息,此時多維量表分析就是一個相當(dāng)適用的方法。研究者只要將這一組客體在變量上的測量值轉(zhuǎn)化成多維度的幾何表征,就能夠?qū)⑦@些客體有效地顯示在這個幾何空間中,達(dá)到分類的目的,同時也可以進(jìn)一步解釋這些幾何表征所代表的潛在結(jié)構(gòu)或意義。進(jìn)行多維量表分析時,并無自變量和因變量的區(qū)分,同時變量可以是等距以上變量,也可以是定類或定序變量。 ? 8?線性結(jié)構(gòu)方程 線性結(jié)構(gòu)方程是一個相當(dāng)具有變通與彈性的統(tǒng)計(jì)方法,隨著研究者對變量間關(guān)系界定的差異,LISREL的常見名稱包括協(xié)方差結(jié)構(gòu)分析,潛變量分析、線性結(jié)構(gòu)模型或驗(yàn)證性因子分析。LISREL可視為多元回歸分析與因子分析兩個方法論的整合模型,讓研究者可以探討變量間的線性關(guān)系(回歸分析),并對可測量顯變量與不可測量的潛變量見(因子分析)的因果模型作假設(shè)檢驗(yàn)。 ? 9?邏輯斯蒂回歸分析 邏輯斯蒂回歸可視為傳統(tǒng)多元回歸分析的一個特列。它和多元回歸分析一樣,都具有解釋自變量與因變量之間的關(guān)系,并可進(jìn)行預(yù)測。所不同的是在進(jìn)行多元回歸分析時,包括自變量與因變量都必須是定距以上層次變量;但在進(jìn)行邏輯斯蒂回歸分析時,自變量仍是定距以上層次變量,因變量則是二分的定類變量或多分定類變量或定序變量。 ? 10 對數(shù)線性方程 在基本統(tǒng)計(jì)學(xué)中,當(dāng)研究者面對探討兩個定類或定序變量間關(guān)系的研究問題時,都是以卡方檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。當(dāng)問題的性質(zhì)是探討兩個定類變量間是否獨(dú)立或是關(guān)聯(lián)強(qiáng)度時,是以卡方獨(dú)立性檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。進(jìn)行卡方獨(dú)立性檢驗(yàn)時,研究者必須將樣本在兩個定類變量上的反應(yīng),建立二維列聯(lián)表(contingency table),以進(jìn)一步根據(jù)列聯(lián)表中各單元格(cell)的次數(shù)反應(yīng),進(jìn)行顯著性檢驗(yàn)。但當(dāng)研究者面對三個或三個以上的定類變量時,所建立的多元列聯(lián)表間變量關(guān)聯(lián)的分析,卡方獨(dú)立性檢驗(yàn)將無法解決這樣的問題,此時適合的方法就是對數(shù)線性模型。利用對數(shù)線性模型來解決多元列聯(lián)表的問題的目的,主要就在于探討構(gòu)成列聯(lián)表的多個定類變量間的關(guān)系,進(jìn)而在精簡原則下構(gòu)建擬合的解釋模型,并根據(jù)所建立的模型估計(jì)單元格參數(shù)值,以了解各變量效果對單元格次數(shù)的影響。 ? 11?Logit對數(shù)線性模型 在對數(shù)線性模型中,多個定類變量間是互為因果的關(guān)系(即相關(guān)關(guān)系),并無自變量與因變量的區(qū)分,研究目的在于探討變量間的關(guān)聯(lián)強(qiáng)度和性質(zhì)。但有時研究者會面臨變量間有自變量和因變量的區(qū)分的情境。在基本統(tǒng)計(jì)學(xué)中,當(dāng)研究者面對的問題性質(zhì)是兩個定類變量間有自變量和因變量的區(qū)別,目的在于探討兩個變量間的因果關(guān)系時,多是以卡方齊性檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。但自變量個數(shù)在兩個以上時,卡方齊性檢驗(yàn)就不再適用,而必須改用logit對數(shù)線性模型方法來對數(shù)據(jù)進(jìn)行分析。Logit對數(shù)線性模型的功能與多元回歸分析相當(dāng)類似,都可以用來探討與解釋因變量與自變量間的關(guān)系,但不同的是,多元回歸分析的變量都是定距以上層次變量,通常以最小二乘法進(jìn)行模型估計(jì)與檢驗(yàn);logit對數(shù)線性模型的變量都是定類變量,通常以最大似然估計(jì)法進(jìn)行模型估計(jì)與檢驗(yàn)。 ? ·END· |
轉(zhuǎn)載自:http://www.360doc.com/content/18/0309/10/52857582_735589820.shtml
總結(jié)
以上是生活随笔為你收集整理的11种常见的多变量分析方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图片怎么去底色变透明?怎么把图片变透明背
- 下一篇: 为STM32F0搭建FreeRTOS实录