mysql中vlookup函数_数据库合并函数vlookup介绍
昨天我們介紹了EXCEL當中的IF函數以及COUNTIF函數在數據處理當中的使用。今天來介紹另外一個我們在數據提取經常用到的函數:Vlookup。
實例介紹
我們在進行數據分析的時候,經常需要對數據進行匹配。比如我們這里有一個胃癌相關患者的臨床信息的數據庫,這個數據庫包括這些患者的基本臨床信息,其中包括其年齡,性別,TMN分期。
同時我還有另外一個數據庫,這個數據庫是我做了一部分患者的TP53和RNF10表達的結果。
這兩個數據庫的樣本量都不一樣,但是其有一個相同的地方在于,這兩個數據庫都有一個患者ID。這個ID是唯一的。即我們可以通過ID號來查到每個患者的臨床信息,同時也能查到其基因表達的情況。這個時候,如果我想要分析TP53基因的表達和胃癌臨床信息的關系的話,那就需要把這兩個數據庫來進行合并成一個表格來進行分析。
如果是只有幾個樣本。那我們完全可以一個一個ID查找來進行合并。但是如果是有差不多幾百個樣本,那總不能查找幾百次吧。這個時候我們就可以使用vlookup函數來完成這個操作。
函數介紹
關于VLOOKUP而言,我們需要輸入以下幾個參數來完成操作VLOOKUP(想要查找的ID號, 想要在哪個范圍內查找, 想要返回的列,是否是精確查找)。
例如上面的例子,我們想要把如果我們想要把基因的表達數據庫當中的樣本的年齡信息匹配上。那就需要輸入=VLOOKUP(A2,Sheet1!A:F,2,FALSE)
通過以上的例子我們來解釋一下函數的輸入和輸出在函數的的第一個參數是想要查找的ID號,這里我們輸入的是A2。即想要查找在A2這個位置上的這個ID號(TCGA-VQ-AA6G-01A)的相關信息
第二個參數是我們想要查找的范圍。這里我們輸入是Sheet1!A:F(這里的數據內容就是臨床信息的數據)。這個的意思是,我們想要在哪個數據庫查找剛才輸入的唯一的ID號(TCGA-VQ-AA6G-01A)。
這里需要注意的是,對于這個數據庫的第一列一定要是唯一ID號。
第三個參數是我們想要返回的第幾列的數據。在想要查找的數據庫當中,age在第二列,所以我們輸入2。就代表如果在這個數據庫當中查找到目標ID號(TCGA-VQ-AA6G-01A), 返回這個ID對應的第二列的數據。
第四個參數代表對于ID和數據庫的匹配是否是精確匹配。這個參數接受兩個輸入TRUE是非精確匹配,FLASE是精確匹配。
通過以上的介紹,大致可能就明白VLOOKUP是怎么使用了吧。因此如果我們想要查找gender這里列的數據怎么辦。那就是把其中的第三個參數當中的2改成3即可,即=VLOOKUP(A2,Sheet1!A:F,3,FALSE)。
以上的基本操作可以讓我們來進行不同數據庫的匹配,但是對于由于每次Vlookup的時候都需要輸入制定的返回列。因此我們只能一列一列的返回。如果我們有十幾或者上百的列需要匹配。那就很麻煩。所以更進階的方法。
多列數據的自動匹配
關于多列數據的自動匹配,這個時候就需要用到COLUMN函數了。這個函數返回每一個單元格的列數。例如我們輸入COLUMN(B1)。那就會返回2.如果輸入是COLUMN(C1)則返回3。如果輸入COLUMN(B100)那返回的還是2。
因此通過VLOOKUP和COLUMN函數進行組合就可以來進行隨著拖動自己匹配了。
在上面的操作我們使用到了絕對引用,關于絕對引用可以參照我們之前的帖子:?excel函數基礎
總結
以上是生活随笔為你收集整理的mysql中vlookup函数_数据库合并函数vlookup介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 零基础怎样系统的学习Python
- 下一篇: MySQL 分库拆表方案