日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

服务器硬件和算力,硬件科普Filecoin运维交付之业务部署

發布時間:2023/12/9 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 服务器硬件和算力,硬件科普Filecoin运维交付之业务部署 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

隨著Filecoin存儲體量的不斷增加,“運維”的重要性在這個行業里也愈發凸顯。如何將每個環節的各種因素變得可控:一方面需要對硬件環境進行預檢措施,以高效應對突發事件;另一方面也需要通過規范的業務部署,確保集群的穩定性,協調集群間的調動和需求。

對于運維交付中硬件預檢的問題之前已經跟大家分享過,今天小冰主要通過具體的實例來給大家講解運維交付中業務部署的相關內容:

一、首先,根據項目規劃進行邏輯集群的劃分,這部分包含我們邏輯集群劃分的最佳實踐。

二、其次,進入正式的業務部署,我們將依托自主研發的自動化部署工具,詳細的講解業務部署步驟以及部署中的注意事項。

三、最后,在業務部署完成后,分享我們業務驗證的邏輯和方法。

交付計劃

在我們進行業務規劃之前,首先需要知道我們需要交付多少算力,多少存儲,運行時長等信息。然后根據算力和存儲量來進行交付規劃。要做好規劃有幾個關鍵詞需要注意:扇區大小、封裝時間、日封裝量。

說到規劃,需要先了解各個程序的功能,見下面的名詞解釋:

※名詞解釋

·鏈

Chain:負責對外算力證明及高度同步。

·算力

Manage:算力調度程序,控制一組算力服務器的運行的進程數。

P1 P2:算力服務器,提供封裝數據的算力支持和結果輸出。

·證明

WindowPost:Wind證明,半小時一次,主力創收程序。

WinningPost:Winn證明,隨機執行,創收程序。

·存儲

Worker:存儲中間件,一組或多組存儲集群的中間件程序,負責保存扇區文件。

Storage:存儲集群,負責扇區文件的保存,通常是一組存儲集群,一般由10~20臺存儲服務器組成。

※規劃流程圖

※流程說明

1. 首先我們需要確定日封裝量,這是我們規劃的基礎。

2. 根據IDC的資源情況(算力機、管理機、存儲)決定在哪個IDC部署。

3. 根據日封裝量確定算力機的數量。

4. 確定算力機的數量后,開始規劃鏈服務器。

5. 規劃管理機(Manage)的數量。

6. WinningPost和WindowPost各一臺。

7. 根據1月內的封裝量確定WindowPost要不要做1主1備還是共用現有備機。

8. 規劃存儲使用,Worker一般在初次部署的時候,都只會規劃1臺Worker:

→ 優先選擇存儲余量大的存儲。

→ 優先選擇寫入掛載次數少的存儲。

業務部署

在介紹業務部署之前,必須要先說一下我們用到的工具,一次部署上百臺服務器沒有工具輔助是不可以能的;在部署之前還需要進行一系列的例行檢查和準備。然后才真正開始我們的部署流程,下面從會用到的工具開始逐一介紹:

※工具簡介

堡壘機:方便我們對資產進行管理,遠程連接和命令分發還有權限控制,是運維工作中必不可少的工具。如果需要了解更多,請自行百度,這里不再詳細講解。

Ansible:Linux下的自動化工具,批量任務執行的不二之選,極大的減少運維人員的工作量。它實現了批量系統配置、批量程序部署、批量運行命令等功能。如果需要了解更多,請自行百度,這里不再詳細講解。

※部署前的準備及檢查

·準備項

獲取涉及部署所有服務器的IP地址。

編寫Ansible的Playbook文檔,以便批量初始化和部署應用 。

·檢查項

網絡情況:所有相關的服務器是否能連接并執行命令。

操作系統版本:程序都是在Ubuntu上編譯的,運行環境必須是在Ubuntu上運行才能保證最佳穩定性。

硬件基本配置:會不會有掉盤掉顯卡或者CPU沒有開啟超線程等異常情況。

存儲是否能正常訪問。

※部署流程

·部署細節

鏈程序-Chain

部署完成以后一定要記得導入錢包。

算力-Manage

封裝的扇區分為32G和64G,在配置的時候需要特別注意。

PreCommit(P1 P2)

同一個Manage集群下的顯卡型號是否一致。

證明程序-WinningPost和WindowPost

存儲目錄是否正常掛載。

存儲-Worker

啟動前檢查存儲的掛載情況,需要掛載后在啟動腳本中修改相關配置,再啟動程序腳本,需要根據集群規模和Worker服務器的網絡帶寬來確定運行幾個進程。

部署質量驗證

※鏈程序運行情況

1. 檢查鏈高度是否能正常同步。

2. 檢查是否能正常生成api和token。

3. 檢查日志,看是否報錯。

4. 檢查Keepalived和Proxy是否工作正常。

5. 檢查錢包是否導入。

※算力運行情況

1. 檢查是否有關聯賬戶。

2. 檢查日志是否有異常報錯。

3. 當第一輪扇區任務到Commit2階段時,查看日志是否有報錯。

4. 查看算力機是否有任務失敗。

5. 檢查PreCommit2和Commit2是否上鏈。

※證明程序運行情況

1. 查看是否關聯賬戶。

2. 檢查存儲的掛載情況。

3. 查看Winn和Wind日志是否有異常。

4. 在有扇區完成后,進行Wind預做,查看是否能正常證明算力。

5. 有效算力達到40T后,查看Winn是否有包塊和包塊后是否上鏈。

※存儲運行情況

1. 檢查Worker日志是否有報錯信息。

2. 查看存儲目錄是否有扇區文件。

3. 傳輸帶寬是否正常。

結尾

Filecoin復雜的證明系統和經濟模型要求集群需要7*24小時不間斷運轉,一旦集群出現故障將會面臨著算力丟失或罰沒的風險。雅典娜云池規范化的運維流程可以理清業務脈絡,通過優化升級提高集群的效率和穩定性,保證Filecoin網絡的穩定和長久。此外,雅典娜云池的運維工程師們根據設備磁盤容量、CPU性能、內存大小等配置的不同,進行合理化的搭配,以實現多角色程序順利且持續的運行,通過工具化、流程化的作業方式,充分發揮Filecoin硬件設備的性能。

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的服务器硬件和算力,硬件科普Filecoin运维交付之业务部署的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。