阿里云超算异构Spot集群,助力深势科技30%成本驱动MDaaS海量算力
本文主要介紹藥物研發算法科技公司深勢科技是如何實現低成本在阿里云上構建分子模擬MDaaS (Molecular Dynamics as a Service)超算集群。
客戶簡介
公司名稱:深勢科技
公司網址:http://dptech.deepmd.net/
公司介紹:
深勢科技是一家成立于2018年的藥物研發算法科技公司,致力于運用新一代分子模擬MDaaS (Molecular Dynamics as a Service)技術解決藥物研發難題,實現藥物分子的理性發現和設計。
企業的主要產品Hermite 藥物研發套件,旨在幫助用戶在第一性原理精度力場基礎上,實現高通量藥物篩選與優化;DP-Cloudserver軟件,旨在幫助用戶更便捷創建基于深度學習的原子間勢能和力場模型和運行分子動力學模型,有效解決分子模擬中的準確性和效率性難以兼顧的問題。
公司由中科院院士領銜,核心團隊來自北京大學、普林斯頓大學、上海藥物研究所等高校和科研機構,在機器學習、第一性原理建模、RiD高效采樣、生成算法、力場開發等方面有著深厚的技術積累,在小分子藥物設計和大分子藥物設計領域有著豐富的項目經驗。
公司已在力場開發、小分子藥物篩選與優化、藥物ADMET性質預測、結合自由能微擾、多肽藥物設計等領域提出更加高效和準確的解決方案,并與諸多來自學界和工業界的客戶開展合作。目前已經獲得來自知名投資機構的近2000萬元天使投資。
業務痛點
深勢科技的業務量波動較大,希望可以提供基于作業負載的彈性伸縮能力,最大化利用計算資源;
深勢科技可以有效調度集群的計算資源,希望提供跨可用區的多規格實例彈性擴容,并且支持不同實例規格使用不同的鏡像;
集群的作業量很大,所以深勢科技希望可以提供作業粒度的費用賬單便于計費;
深勢科技作為一家初創企業,追求高性價比,以較低成本完成有效計算。
為什么選擇阿里云?
主要是領先的產品與靈活的售賣模式。
阿里云是國內少有提供云上彈性高性能計算平臺(EHPC)的云廠商,阿里云EHPC集群的自動伸縮功能,超越傳統超算的“靜態”資源分配,用戶可根據負載實現按需擴容縮容。通過用戶自定義設置,有效提升作業的吞吐量,加快作業處理速度,極大提升集群的利用率。
植根于阿里云自動運維與可視化管控技術,E-HPC提供集群管理、作業管理、用戶管理和可視化等功能,幫助用戶輕松使用云上HPC集群。阿里云后臺實現對集群的主動運維、熱升級與遷移,讓HPC客戶專注于應用與科研本身,無需費時費力于集群管理與運維,更加便捷地使用超算帶來的便利。
同時基于費用中心的賬單,EHPC提供開源計費工具,支持作業粒度的費用統計,高效解決計費需求。同時阿里云的搶占式實例提供了低成本的算力資源,價格最低達到按量付費的一折。
解決方案
方案細節:
深勢科技通過阿里云彈性高性能計算的平臺,調度下層多種算力資源。在選擇算力資源時,深勢科技多選用了具有低成本優勢的搶占式實例,同時通過阿里云彈性供應解決方案,深勢科技可以一次性獲取所需的算力資源,無需關注底層實例。
由于客戶需求多跟著項目周期走,深勢科技的業務有不穩定的周期性,阿里云彈性高性能計算平臺(EHPC)的自動伸縮功能,利用云上的彈性,根據作業負載自動管理計算資源,深勢科技不需要自行管理資源規模,有助于深勢科技降低運維成本。
深勢科技需要計算每個用戶、作業所用資源費用,幫助統計成本;阿里云EHPC的作業詳情導出功能,可以查看每個作業的資源使用量。同時開發費用統計工具,結合費用中心賬單可以統計每個作業的計算費用。
阿里云彈性供應組是一個使用搶占式實例和按量付費實例快速部署實例集群的方案,支持一鍵部署跨計費方式、跨可用區、跨實例規格族的實例集群,可以穩定提供計算力,在享受緩解搶占式實例的回收機制帶來的不穩定因素,免去重復手動創建實例的繁瑣操作。
因此,使用彈性供應的成本最優策略來調度搶占式實例資源,指定多個可用區和實例規格,確保以最優價格完成spot+按量計算資源的交付。按秒計費,價格最低至1折。
客戶效益
1、滿足了客戶低成本構建高可用算力集群的需求:30%成本實現海量算力交付:深勢科技利用彈性供應的成本優化策略,結合spot實例的價格巡檢,以30%的成本完成日均3w+ vCPU資源的交付。
2、EHPC自動運維的易用特性,降低了深勢科技的運維成本,提升了集群管理效率。
客戶證言
分子模擬為我們提供了認識世界的重要工具,而具體實現這一過程一方面需要優質的算法,另一方面需要海量的計算資源。深勢科技采用的“AI+物理建模+HPC”的研發范式,在算法層面取得了重大突破;而在資源層面,我們要感謝阿里云的彈性高性能計算服務在較低成本的基礎上提供了海量的計算資源。接下來,深勢科技會與阿里云進一步緊密合作,將“AI+物理建模+HPC+云計算”的MDaaS模式推及更多有需求的朋友們。——深勢科技CEO孫偉杰
選用產品
彈性高性能計算E-HPC
彈性高性能計算(E-HPC)基于阿里云基礎設施,為用戶提供一站式公共云HPC/AI平臺服務,面向科研,生產,教育和行業大計算,提供快捷,彈性,安全和與阿里云產品互通的云超算平臺。
更多關于彈性高性能計算E-HPC的介紹,請參見彈性高性能計算E-HPC產品詳情頁。
云服務器ECS
云服務器(Elastic Compute Service,簡稱ECS)是阿里云提供的性能卓越、穩定可靠、彈性擴展的IaaS(Infrastructure as a Service)級別云計算服務。云服務器ECS免去了您采購IT硬件的前期準備,讓您像使用水、電、天然氣等公共資源一樣便捷、高效地使用服務器,實現計算資源的即開即用和彈性伸縮。阿里云ECS持續提供創新型服務器,解決多種業務需求,助力您的業務發展。
更多關于云服務器ECS的介紹,參見云服務器ECS產品詳情頁。
搶占式實例
搶占式實例是云服務器ECS一種特殊的實例,相對于按量付費實例價格有一定的折扣,其價格以小時為周期根據供需情況不同而變化,最低可至按量付費的一折,旨在為用戶降低部分場景下使用ECS實例的成本。
更多關于搶占式實例的介紹,參見搶占式實例文檔頁。
GPU 云服務器
提供 GPU 算力的彈性計算服務,具有超強的計算能力,服務于深度學習、科學計算、圖形可視化、視頻處理多種應用場景。阿里云作為亞洲第一的云服務提供商,隨時為您提供觸手可得的算力,有效緩解計算壓力,提升您的業務效率,助您提高企業競爭力。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的阿里云超算异构Spot集群,助力深势科技30%成本驱动MDaaS海量算力的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 重磅发布 | 阿里云视图计算,边缘计算的
- 下一篇: 教程系列——用模板快速上线一个HR 服务