日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > asp.net >内容正文

asp.net

.NET8极致性能优化Non-GC Heap

發布時間:2023/11/25 asp.net 54 coder
生活随笔 收集整理的這篇文章主要介紹了 .NET8极致性能优化Non-GC Heap 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

.NET8里面JIT引入了一個新的機制,叫做Non-GC Heap。JIT可以確保相關對象分配在Non-GC Heap上,該堆像其名稱一樣,不受GC管理。JIT需要保證這個對象沒有被GC引用,并且在這個對象的生命周期內一直是根對象(不會被GC消滅的對象)的狀態。原文:.NET8極致性能優化Non-GC Heap

概述

為什么要引入這種機制?先來看一段代碼:

public static string GetPrefix() => "https://";
static void Main(string[] args)
{
  GetPrefix ();
}

這里的GetPrefix函數返回的是一個常量字符串值,它的ASM如下:

mov  rax,185CAC02068h
mov  rax,qword ptr [rax]

兩個mov指令,第一個是對象指針的指針,第二個是對象的指針。雖然是簡單的兩個指令,但是背后的邏輯卻較為復雜,基本如下:
一個字符串常量值,.NET7里面JIT也會給這個字符串常量值復制到一個堆分配到字符串對象中,返回的是對象的二級指針。因為是堆對象,可能會被GC移動,每次都需要獲取新的地址,頻繁增加負擔。

這里的問題在哪兒呢?一個字符串常量值需要這么多的步驟操作嗎?開銷是否太大,我們是否可以簡化它呢?有一個常規的很容易想到的方法,就是把這個字符串常量值的地址給它固定起來,每次需要用到這個常量值,就直接去這個固定地址讀取,這樣行不行呢?GC堆很明顯不能硬編碼固定。

當然可以,做法就是把這個字符串常量值放到POH(固定對象堆)上,不讓GC移動。這樣是減少了GC回收的時候移動的開銷,但是并沒有從根本上解決問題,因為固定對象同樣受到GC的管控,上面的步驟除了不能移動一樣不少,并且POH不會進行根對象的處理,可能會導致它們被回收,地址指向了其它的數據,進而錯誤。

特點

要徹底的解決這個問題,本篇的主角:Non-GC Heap出場了。它有三個特點:
1.JIT要保證這個對象沒有被GC引用
2.這個對象在生命周期內一直是根對象
3.它不能是可卸載上下文的一部分

你可以認為GC堆包括:小對象堆(SOH-小于85000字節的對象),大對象堆(LOH-大于85000字節的對象),固定對象堆(POH)
而No-GC Heap超脫于GC Heap之外的FOH(凍結堆)。

JIT現在可以避免在生成的代碼中訪問該對象時的間接尋址,而是直接硬編碼對象的地址

GetPrefix函數的ASM在.NET8 Non-GC Heap里面如下:

mov  rax,26180000218h
C3   ret

26180000218h為對象地址,一個mov直接返回。看似只簡化了一個mov,但是實際上它這種硬編碼固定模式地址,簡化的是整個字符串常量值的原理,也就是把字符串常量值分配到FOH里面,而不是GC堆里。性能極大的提升自不必多說。以下測量13倍的性能提升。

Method Job Mean Ratio
GetPrefix .NET 7 1.3450 ns
GetPrefix .NET 8 0.0729 ns

其它Non-GC Heap的操作

一:使用typeof(T)生成的RuntimeType對象

public Type GetTestsType() => typeof(Tests);

二:空數組分配到Non-GC Heap上,使Array.Empty()更加高效

public string[] Test() => Array.Empty<string>();

它倆在.NET8里面都類似于如下ASM,一個mov直接返回:

mov rax,1A0814EAEA8
ret

三:靜態值類型字段關聯的堆對象,不包含任何GC引用的字段

public partial class Tests
{
    private static readonly ConfigurationData s_config = ConfigurationData.ReadData();
    public TimeSpan GetRefreshInterval() => s_config.RefreshInterval;
    private struct ConfigurationData
    {
        public static ConfigurationData ReadData() => new ConfigurationData
        {
            Index = 0x12345,
            Id = Guid.NewGuid(),
            IsEnabled = true,
            RefreshInterval = TimeSpan.FromSeconds(100)
        };
        public int Index;
        public Guid Id;
        public bool IsEnabled;
        public TimeSpan RefreshInterval;
    }
}

RefreshInterval .NET7如下:

mov       rax,13D84001F78
mov       rax,[rax]
mov       rax,[rax+20]
ret

RefreshInterval .NET8如下:

mov       rax,20D9853AE48
mov       rax,[rax]
ret

四:代之間的GC引用判斷
代碼:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst, "new");
    }

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst, string s) => dst = s;
}

Write在.NET7和.NET8上生成如下:

call      CORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

CORINFO_HELP_CHECKED_ASSIGN_REF是一個JIT幫助程序函數,其中包含所謂的“GC write barrier (GC寫屏障)”,一個小代碼片段,用于讓GC跟蹤正在寫入的引用,因為它可能需要知道,例如,因為正在分配的對象可能是gen0,而目標可能是gen2。

微調下這個代碼:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst);
    }

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst) => dst = "new";
}

實現的功能都是一樣的,只不過dst直接賦值了常量字符串,記得上面常量字符串的分配是在Non-GC Heap嗎?.NET7里面還是需要幫助函數:

mov       rdx,1FF0E4014A0
mov       rdx,[rdx]
call      CORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

然.NET8里面則是

mov       rax,1B3814EAEC8
mov       [rcx],rax
ret

因為.NET8意識到常量字符串是在Non-GC Heap,不需要GC跟蹤判斷在那個代碼,類似于card_table那種。所以優化掉了CORINFO_HELP_CHECKED_ASSIGN_REF

結尾

作者:江湖評談
歡迎關注公眾號:jianghupt,文章首發,以及更多高階內容分享。

總結

以上是生活随笔為你收集整理的.NET8极致性能优化Non-GC Heap的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。