日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[architecture]-armv8-aarch64种的SIMD/FP指令介绍

發布時間:2025/3/21 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 [architecture]-armv8-aarch64种的SIMD/FP指令介绍 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

快速鏈接:
.
👉👉👉 個人博客筆記導讀目錄(全部) 👈👈👈

目錄

        • 1、hardware floating-point 和 Software floating-point
        • 2、armv8中的浮點型介紹
        • 3、擴展寄存器的map圖
        • 4、存儲指令對浮點型寄存器的操作
        • 5、SIMD和浮點型的對比
        • 參考

1、hardware floating-point 和 Software floating-point

在 ARMv8 中,hardware floating-point 是架構中的部分。AArch32 狀態支持 Software floating-point,但 AArch64 狀態不支持 Software floating-point

ARM 系統可能具有:

  • VFP 協處理器,即支持hardware floating-point
  • 沒有浮點硬件,即支持hardware floating-point

如果您為帶有硬件 VFP 協處理器的系統進行編譯,則 ARM 編譯器會使用它。
如果您為沒有協處理器的系統編譯,編譯器會在軟件中實現計算。例如,編譯器選項-mfloat-abi=hard選擇硬件 VFP 協處理器,該選項-mfloat-abi=soft指定算術運算將在軟件中執行,而不使用任何協處理器指令。

2、armv8中的浮點型介紹

浮點寄存器組與 SIMD 寄存器使用相同的擴展寄存器,且是banked的。
在 AArch32 狀態下,除了添加了一些符合 IEEE 754 標準的指令外,浮點支持與 VFPv4 基本沒有變化。

AArch64 狀態的浮點架構也是基于 VFPv4。主要區別如下:

  • 在 AArch64 狀態下,128 位 SIMD 和浮點寄存器的數量從16個增加到32個。
  • 單精度寄存器不再打包成雙精度寄存器,因此寄存器 Sx為 D x[31:0]。
  • 浮點硬件的存在是強制性的,因此不支持軟件浮點鏈接。
  • AArch64 狀態不支持早期版本的浮點架構,例如 VFPv2、VFPv3 和 VFPv4。
  • AArch32 或 AArch64 狀態不支持 VFP 矢量模式。對向量浮點使用高級 SIMD 指令。
  • 添加了一些新說明,包括:
    半精度和雙精度之間的直接轉換。
    加載和存儲對,替換加載和存儲多個。
    融合乘加和乘減。
    IEEE 754-2008 兼容性說明

3、擴展寄存器的map圖

  • 32個 128-bit registers V0-V31. (也叫q0-q31,其實是q0-q31直接map到了v0-v31)
  • 32個 64-bit registers D0-D31.
  • 32個 32-bit registers S0-S31.
  • 32個 16-bit registers H0-H31.
  • 32個 8-bit registers B0-B31.

4、存儲指令對浮點型寄存器的操作

例如:

  • LDP Qt1, Qt2, addr //將兩個連續的四字從addr尋址的內存中加載到128位Qt1和Qt2中
  • STP Qt1, Qt2, addr //將128位Qt1和Qt2的兩個連續四字存儲到addr尋址的內存中。


(使用是咧)

5、SIMD和浮點型的對比

基本概念:

  • VFP : 是指浮點型運算器的架構,如vfpv3 vfpv4,目前在armv8上使用的都是vfpv4
  • FP : 是指hardware float-point 指令
  • SIMD :是指SIMD指令
  • NEON :也一種提供SIMD指令的技術

補充NEON簡介
NEON :Arm Neon 技術是適用于 Arm Cortex-A 和 Cortex-R 系列處理器的高級單指令多數據 (SIMD : Single Instruction Multiple Data) 的架構擴展。Neon 技術旨在通過加速音頻和視頻編碼和解碼、用戶界面、2D/3D 圖形和游戲來改善多媒體用戶體驗。Neon 還可以加速信號處理算法和功能,以加快音頻和視頻處理、語音和面部識別、計算機視覺和深度學習等應用的速度。

做為一名軟件工程師,您可以通過以下方式使用ARM NEON技術

  • Neon intrinsics
  • Neon-enabled libraries
  • Auto-vectorization by your compiler
  • Hand-coded Neon assembler

總結: 我猜的哈,VFP是一個運算器(相當于ALU那種),它操作的是v0-v31寄存器(也可以說是q0-q31), 進行浮點型運算。而NEON技術,又提供了一些SIMD指令,也是使用VFP運算器,也是使用V0-V31寄存器。


參考

About floating-point support
Floating-point hardware
Extension register bank mapping in AArch64 state
NEON

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的[architecture]-armv8-aarch64种的SIMD/FP指令介绍的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产精华一区二区三区 | 日韩精品一区二区三区不卡在线 | 精品一区二区三区蜜桃 | 午夜激情视频网 | 欧美69精品久久久久久不卡 | 中文字幕第100页 | 熟女性饥渴一区二区三区 | 911毛片| www.黄在线 | 国产精品久久久久久亚洲伦 | 手机av在线不卡 | 黄色av日韩 | 女同一区二区三区 | 777久久久| 网友自拍咪咪爱 | 在线看片网站 | 69国产精品 | 欧美性生交xxxxx久久久 | 国产激情久久久久久熟女老人av | 国产精品久久久久影院 | 成人手机视频在线观看 | 日韩怡春院 | 久在线视频 | 麻豆精品视频在线 | 蜜臀久久精品久久久久久酒店 | 久草福利资源在线 | 一本久道综合色婷婷五月 | 久久人人爽人人人人片 | 麻豆成人入口 | 欧美顶级metart裸体全部自慰 | 男人天堂2014| 国产精品国产一区 | 在线看污片 | 三级黄在线观看 | a资源在线 | 免费观看成人av | 国产欧美在线精品日韩 | 暖暖免费观看日本版 | 男人和女人日批视频 | 伦hdwww日本bbw另类 | 欧美日韩成人网 | 日本大尺度吃奶做爰久久久绯色 | 一本加勒比波多野结衣 | 免费看的av片 | 自拍偷拍在线播放 | 成人黄色激情 | 中文字幕一区二区三区乱码不卡 | 午夜在线观看视频 | 无码人妻丰满熟妇区毛片18 | 日韩欧美在线观看一区二区 | 精品久久久久久久 | 欧美不卡在线视频 | 日日干,夜夜操 | 日日日人人人 | 精品毛片 | 久久五十路 | 五月开心网| 自拍偷拍亚洲欧洲 | 成人一级视频在线观看 | 四虎永久在线观看 | 在线成人中文字幕 | 日韩中文一区二区三区 | 日韩一区二区三区中文字幕 | 农村末发育av片一区二区 | 亚洲人午夜射精精品日韩 | 国产精品一二三级 | 亚洲女同av| 亚洲AV无码成人片在线观看 | 少妇导航av | 国产传媒在线视频 | 善良的女朋友在线观看 | 日本不卡中文字幕 | 男人天堂2020 | 一区二区黄色片 | 色婷婷视频在线 | 性av在线| www日日| 91在线日本 | 国产视频在线一区二区 | 国产在线日本 | 亚洲人成无码网站久久99热国产 | 超碰在线影院 | 亚洲清色 | 91自啪 | av一区免费 | 国产综合精品视频 | 九九热免费在线视频 | 欧美在线视频你懂的 | 女女同性女同一区二区三区九色 | 国产一级片麻豆 | 九九热视频在线免费观看 | 国产黄色高清视频 | 黄色自拍视频 | 奇米影视一区二区三区 | 国产区在线观看 | 黄色毛毛片 | 日本中文视频 | 波多野结衣家庭主妇 | 成人黄色短视频在线观看 |