日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql top 1效率_TOP 1比不加TOP慢的疑惑

發布時間:2025/3/8 数据库 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 mysql top 1效率_TOP 1比不加TOP慢的疑惑 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

問題描述: 有一個查詢如下,去掉 TOP 1 的時候,很快就出來結果了,但加上 TOP 1 的時候,一般要 2~3 秒才出數據,何解? SELECT TOP 1 ??? A . INVNO FROM A , B WHERE A . Item = B . ItemNumber ??? AND B . OwnerCompanyCode IS NOT NULL ? 問題原因分

問題描述:

有一個查詢如下,去掉

TOP 1

的時候,很快就出來結果了,但加上

TOP 1

的時候,一般要

2~3

秒才出數據,何解?

SELECT

TOP

1

???

A.

INVNO

FROM

A,

B

WHERE

A.

Item =

B.

ItemNumber

???

AND

B.

OwnerCompanyCode IS

NOT

NULL

?

問題原因分析:

在使用

TOP 1

的時候,

SQL Server

會盡力先找出這條

TOP 1

的記錄,這就導致它采用了與不加

TOP

時不一致的掃描算法,

SQL Server

查詢優化器始終認為,應該可以比較快的找到匹配的第

1

條記錄,所以一般是使用嵌套循環的聯接,則不加

TOP 1

時,

SQL Server

會根據結構和數據的統計信息決策出聯接策略。

嵌套循環一般適用于聯系的兩個表,一個表的數據較大,而另一個表的數據較小的情況

,如果查詢匹配的值出現在掃描的前端,則在取

TOP 1

的情況下,是符合嵌套循環聯系的使用條件的,但當匹配的數據出現在掃描的后端,或者是基本上沒有匹配的數據時,則嵌套循環要掃描完成兩個大表,這顯然是不適宜的,也正是因為這種情況,導致了

TOP 1

比不加

TOP 1

的效率慢很多

?

關于此問題的模擬環境:

USE

tempdb

GO

?

SET

NOCOUNT

ON

--======================================

--

創建測試環境

--======================================

RAISERROR

(

'

創建測試環境

'

,

10,

1)

WITH

NOWAIT

-- Table A

CREATE

TABLE

[dbo].

A(

???

[TranNumber] [int] IDENTITY

(

1,

1)

NOT

NULL,

???

[INVNO] [char](

8)

NOT

NULL,

???

[ITEM] [char](

15)

NULL

DEFAULT

(

''

),

???

PRIMARY

KEY

(

[TranNumber])

)

?

CREATE

INDEX

[indexONinvno] ON

[dbo].

A(

[INVNO])

CREATE

INDEX

[indexOnitem] ON

[dbo].

A (

[ITEM])

CREATE

INDEX

[indexONiteminnvo] ON

[dbo].

A(

[INVNO],

[ITEM])

GO

?

-- Table B

CREATE

TABLE

[dbo].

B(

???

[ItemNumber] [char](

15)

NOT

NULL

DEFAULT

(

''

),

???

[CompanyCode] [char] (

4)

NOT

NULL,

???

[OwnerCompanyCode] [char](

4)

NULL,

???

PRIMARY

KEY

(

[ItemNumber],

[CompanyCode])

)

?

CREATE

INDEX

[ItemNumber] ON

[dbo].

B(

[ItemNumber])

CREATE

INDEX

[CompanyCode] ON

[dbo].

B(

[CompanyCode])

CREATE

INDEX

[OwnerCompanyCode] ON

[dbo].

B(

[OwnerCompanyCode])

GO

?

--======================================

--

生成測試數據

--======================================

RAISERROR

(

'

生成測試數據

'

,

10,

1)

WITH

NOWAIT

INSERT

[dbo].

A(

[INVNO],

[ITEM])

SELECT

LEFT(

NEWID

(),

8),

RIGHT(

NEWID

(),

15)

FROM

syscolumns A,

syscolumns B

?

INSERT

[dbo].

B(

[ItemNumber],

[CompanyCode],

[OwnerCompanyCode])

SELECT

RIGHT(

NEWID

(),

15),

LEFT(

NEWID

(),

4),

LEFT(

NEWID

(),

4)

FROM

syscolumns A,

syscolumns B

GO

?

速度測試腳本:

--======================================

--

進行查詢測試

--======================================

RAISERROR

(

'

進行查詢測試

'

,

10,

1)

WITH

NOWAIT

DECLARE

@dt DATETIME

,

@id int

,

@loop int

DECLARE

@ TABLE

(

???

id int

IDENTITY

,

???

[TOP 1] int

,

???

[WITHOUT TOP] int

)

?

SET

@loop =

0

WHILE

@loop <

10

BEGIN

???

SET

@loop =

@loop +

1

???

RAISERROR

(

'test %d'

,

10,

1,

@loop)

WITH

NOWAIT

???

SET

@dt =

GETDATE

()

???????

SELECT

TOP

1

???????????

A.

INVNO

???????

FROM

A,

B

???????

WHERE

A.

Item =

B.

ItemNumber

???????????

AND

B.

OwnerCompanyCode IS

NOT

NULL

???

INSERT

@([TOP 1])

VALUES

(

DATEDIFF

(

ms,

@dt,

GETDATE

()))

???

SELECT

@id =

SCOPE_IDENTITY

(),

@dt =

GETDATE

()

???????

SELECT

--TOP 1

???????????

A.

INVNO

???????

FROM

A,

B

???????

WHERE

A.

Item =

B.

ItemNumber

???????????

AND

B.

OwnerCompanyCode IS

NOT

NULL

???

UPDATE

@ SET

[WITHOUT TOP] =

DATEDIFF

(

ms,

@dt,

GETDATE

())

???

WHERE

id =

@id

END

SELECT

*

FROM

@

UNION

ALL

SELECT

NULL,

SUM

(

[TOP 1]),

SUM

(

[WITHOUT TOP])

FROM

@

GO

?

測試數據的變更腳本:

DECLARE

@value char

(

15),

@value1 char

(

15)

SELECT

???

@value =

LEFT(

NEWID

(),

15),

???

@value1 =

LEFT(

NEWID

(),

15)

?

UPDATE

A

SET

Item =

@value

FROM

A

???

INNER

JOIN(

???????

SELECT

TOP

1

???????????

[TranNumber]

???????

FROM

(

???????????

SELECT

TOP

20

PERCENT

???????????????

[TranNumber]

???????????

FROM

A

???????????

ORDER

BY

[TranNumber]

???????

)

AA

???????

ORDER

BY

[TranNumber] DESC

???

)

B

???????

ON

A.

[TranNumber] =

B.

[TranNumber]

?

UPDATE

B

SET

ItemNumber =

@value

FROM

B

???

INNER

JOIN(

???

???

SELECT

TOP

1

???????????

[ItemNumber],

[CompanyCode]

???????

FROM

(

???????????

SELECT

TOP

20 PERCENT

???????????????

[ItemNumber],

[CompanyCode]

???????????

FROM

B

???????????

ORDER

BY

[ItemNumber],

[CompanyCode]

???????

)

BB

???????

ORDER

BY

[ItemNumber] DESC

,

[CompanyCode] DESC

???

)

B1

???????

ON

B.

[ItemNumber] =

B1.

[ItemNumber]

???????????

AND

B.

[CompanyCode] =

B1.

[CompanyCode]

GO

?

測試說明:

1.??

在剛建立好測試環境的時候,是沒有任何匹配項的,這時候,

TOP 1

會掃描兩個表的所有數據,運行“速度測試腳本

”可以看到此時有無

TOP 1

的效率差異:

TOP 1

明顯比不加

TOP

2.??

修改“測試數據的變更腳本

”中,紅色的

20

讓匹配的數據出現在掃描的頂端、中間和尾端,分別使用

“速度測試腳本

”測試,可以看到,匹配的值靠近掃描的前端的時候,

TOP 1

比不加

TOP

快,隨著匹配數據很后端的推移,這種效率差異會越來越小,到后面就變成

TOP 1

比不加

TOP 1

慢。

注意:

每次變更數據,并且完成“速度測試腳本

”測試后,需要修改“測試數據的變更腳本

”中,紅色的

@

value

@value1

,讓剛才設置匹配的數據再變回為不匹配

?

附:聯接的幾種方式

1.????

嵌套循環聯接

嵌套循環聯接也稱為

嵌套迭代

,它將一個聯接輸入用作外部輸入表(顯示為圖形執行計劃中的頂端輸入),將另一個聯接輸入用作內部(底端)輸入表。外部循環逐行處理外部輸入表。內部循環會針對每個外部行執行,在內部輸入表中搜索匹配行。

最簡單的情況是,搜索時掃描整個表或索引;這稱為

單純嵌套循環聯接

。如果搜索時使用索引,則稱為

索引嵌套循環聯接

。如果將索引生成為查詢計劃的一部分(并在查詢完成后立即將索引破壞),則稱為

臨時索引嵌套循環聯接

。查詢優化器考慮了所有這些不同情況。

如果外部輸入較小而內部輸入較大且預先創建了索引,則嵌套循環聯接尤其有效。在許多小事務中(如那些只影響較小的一組行的事務),索引嵌套循環聯接優于合并聯接和哈希聯接。但在大型查詢中,嵌套循環聯接通常不是最佳選擇。

?

2.????

合并聯接

合并聯接要求兩個輸入都在合并列上排序,而合并列由聯接謂詞的等效

(ON)

子句定義。通常,查詢優化器掃描索引(如果在適當的一組列上存在索引),或在合并聯接的下面放一個排序運算符。在極少數情況下,雖然可能有多個等效子句,但只用其中一些可用的等效子句獲得合并列。

由于每個輸入都已排序,因此

Merge Join

運算符將從每個輸入獲取一行并將其進行比較。例如,對于內聯接操作,如果行相等則返回。如果行不相等,則廢棄值較小的行并從該輸入獲得另一行。這一過程將重復進行,直到處理完所有的行為止。

合并聯接操作可以是常規操作,也可以是多對多操作。多對多合并聯接使用臨時表存儲行。如果每個輸入中有重復值,則在處理其中一個輸入中的每個重復項時,另一個輸入必須重繞到重復項的開始位置。

如果存在駐留謂詞,則所有滿足合并謂詞的行都將對該駐留謂詞取值,而只返回那些滿足該駐留謂詞的行。

合并聯接本身的速度很快,但如果需要排序操作,選擇合并聯接就會非常費時。然而,如果數據量很大且能夠從現有

B

樹索引中獲得預排序的所需數據,則合并聯接通常是最快的可用聯接算法。

?

3.????

哈希聯接

哈希聯接有兩種輸入:生成輸入和探測輸入。查詢優化器指派這些角色,使兩個輸入中較小的那個作為生成輸入。

哈希聯接用于多種設置匹配操作:內部聯接;左外部聯接、右外部聯接和完全外部聯接;左半聯接和右半聯接;交集;聯合和差異。此外,哈希聯接的某種變形可以進行重復刪除和分組,例如

SUM(salary) GROUP BY department

。這些修改對生成和探測角色只使用一個輸入。

以下幾節介紹了不同類型的哈希聯接:內存中的哈希聯接、

Grace

哈希聯接和遞歸哈希聯接。

內存中的哈希聯接

希聯接先掃描或計算整個生成輸入,然后在內存中生成哈希表。根據計算得出的哈希鍵的哈希值,將每行插入哈希存儲桶。如果整個生成輸入小于可用內存,則可以

將所有行都插入哈希表中。生成階段之后是探測階段。一次一行地對整個探測輸入進行掃描或計算,并為每個探測行計算哈希鍵的值,掃描相應的哈希存儲桶并生成

匹配項。

Grace

哈希聯接

如果生成輸入大于內存,哈希聯接將分為幾步進行。這稱為

“Grace

哈希聯接

每一步都分為生成階段和探測階段。首先,消耗整個生成和探測輸入并將其分區(使用哈希鍵上的哈希函數)為多個文件。對哈希鍵使用哈希函數可以保證任意兩個

聯接記錄一定位于相同的文件對中。因此,聯接兩個大輸入的任務簡化為相同任務的多個較小的實例。然后將哈希聯接應用于每對分區文件。

遞歸哈希聯接

如果生成輸入非常大,以至于標準外部合并的輸入需要多個合并級別,則需要多個分區步驟和多個分區級別。如果只有某些分區較大,則只需對那些分區使用附加的分區步驟。為了使所有分區步驟盡可能快,將使用大的異步

I/O

操作以便單個線程就能使多個磁盤驅動器繁忙工作。

border: 1pt solid #dedfef; padding: 0cm

本文原創發布php中文網,轉載請注明出處,感謝您的尊重!

總結

以上是生活随笔為你收集整理的mysql top 1效率_TOP 1比不加TOP慢的疑惑的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。