SOA、网格计算、云计算与P2P技术
1)定義:Service-Oriented Architecture,一種應用的體系結構,其中所有的功能都定義為獨立的具有可調用的接口的服務。這些服務可以在一個流程中被調用從而完成相應的商業處理過程。服務可以位于同一個應用,也可以位于不同的進程,甚至可以在遠程。業務邏輯(business logic)或獨立功能被模塊化,并作為服務呈現給消費者或客戶端。應用開發人員或者系統集成者可以通過組合一個或多個服務來構建應用,而無須理解服務的底層實現。
SOA的核心就是找到將軟件組織在一起的方法,是讓IT更加關注于業務流程而非底層的基礎結構!
SOA的目的是最大限度地重用應用程序中獨立的服務以提高IT適應性和效率,它可以根據需求通過網絡對松散耦合的粗粒度應用組件進行分布式部署、組合和使用。
因此,與其說SOA是一種技術,不如說它是一種架構和組織IT基礎結構及業務功能的方法。是一種在計算環境中設計、開發、部署和管理離散邏輯單元(服務)的模型,是一種架構模型和一套設計方法學。
?
2)架構:
- 服務提供者:發布自己的服務,并且對使用自己自身服務的請求進行響應。
- 服務代理:注冊已經發布的服務提供者,對其進行分類并提供搜索服務
- 服務請求者:利用服務代理查找所需的服務,然后使用該服務。
3)特性:
- SOA服務具有平臺獨立的自我描述XML文檔:WSDL是描述服務的標準語言
- SOA 服務用消息進行通信:該消息通常用XML Schema(主要是SOAP)定義
- SOA服務通過實現目錄服務的注冊中心(Registry)來維護,應用通過注冊中心來查找和調用服務:UDDI是服務注冊的標準
- 每項SOA服務都有與之相關的QoS:QoS包括安全需求、可靠通信等策略
4)實現技術:
SOA不是一種具體的實現技術,更不是一個全新的概念。它是一個抽象的概念和指導方針。我們可以用任何一種現今成熟的技術實現它:EJB、CORBA、Web Service(Web Service的出現讓SOA提出的一切得到了實現)。
注意WebService和SOA的區別和聯系:
- Web服務是技術規范,而SOA是設計原則,WSDL是Web服務與SOA的根本聯系
- SOA是一種架構模式,而Web服務是利用一組標準實現的服務
- Web服務是實現SOA的方式之一,實際上也是最主要的實現方式,用Web服務來實現SOA的好處是可以通過中立平臺來獲得服務。
5)優勢:
大多數軟件商接受SOA并有相關平臺和應用,這也是SOA與現有的分布式技術的區別。
SOA的標準化程度更好:SOA能夠在最新的和現有的應用之上創建應用,能夠使客戶或服務使用者免受服務實現的改變所帶來的影響,能夠升級單個服務或服務消費者而無需重寫整個應用,也無需保留已經不再適用于新需求的現有系統。
總之,SOA以借助現有的應用來組合產生新服務的敏捷方式,提供給企業更好的靈活性來構建應用程序和業務流程。
?
6)問題:
- 標準仍不完備。Web 服務是實現SOA最好的方式,但Web服務本身還有很多不成熟的方面。
- 服務粒度的確立問題:要在靈活和效率方面找到一個折中點;
- 服務的監控和管理問題
- 服務間的交互性、相互關聯性難以把握
?
?
2.網格計算
1)定義:利用互聯網把分散在不同地理位置的電腦組織成一個“虛擬的超級計算機”,其中每一臺參與計算的計算機就是一個“節點”,而整個計算是由成千上萬個“節點”組成的“一張網格”,網格是把整個網絡整合成一臺巨大的超級計算機,實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享,來解決復雜問題的計算模式,適于大型科學計算和項目研究。
2)目的:
- 設計一種能夠提供以下功能的系統:
- 提高或拓展企業內所有計算資源的效率和利用率,滿足最終用戶的需求,同時能夠解決以前由于計算、數據或存儲資源的短缺而無法解決的問題。
- 建立虛擬組織,通過讓他們共享應用和數據來對公共問題進行合作。
- 整合計算能力、存儲和其他資源,能使得需要大量計算資源的巨大問題求解成為可能。
- 通過對這些資源進行共享、有效優化和整體管理,能夠降低計算的總成本。
- 通過任何一臺計算機都可以提供無限的計算能力,可以接入浩如煙海的信息
3)應用領域:
科學領域
- 分布式超級計算:一些科學與工程計算問題的解決
- 高吞吐率計算:分時廣域分布式儀器系統,包括遠程可視化以及遠程控制等,其核心是網格支持的遠程控制操作。
- 數據密集型計算:大型的天體物理、人體醫學、圖像等大型數據庫的分析和處理
社會經濟生活領域
- 基于廣泛信息共享的人與人交互:對性能和服務質量有特別的要求,應用于交互的計算可視化、教育、培訓、場景模擬、藝術與娛樂等領域。
- 更廣泛的資源貿易
4)特點:
a.分布性:
b.自相似性:網格的局部和整體之間存在著一定的相似性,局部往往在許多地方具有全局的某些特征,而全局的特征在局部也有一定的體現。
c.多樣性和動態性:網絡資源異構多樣,資源動態增加和動態減少。
d.可擴展性:系統計算規模會逐漸增大,需要在網格資源規模不斷擴大、應用不斷增大的情況下,不能降低網格計算的性能。
e.動態適應性:資源管理必須能夠動態監視和管理網格資源,從可利用的資源中選取最佳資源服務。
f.自治性和管理的多重性。
?
5)內部主要功能:
- 管理層次:確定管理層次體系,管理域按層次劃分
- 通信服務:隨應用目的的不同提供不同的服務,支持各種通信協議,提供延遲、帶寬等指標
- 信息服務:提供方便可靠的機制,獲得不斷變化的各節點信息和狀態
- 名字服務:提供全局統一的名字服務
- 文件系統:提供一個分布式文件系統機制、全局存儲和緩存空間
- 監視系統:提供監視系統資源和運行情況的工具
- 資源管理和調度:提供透明的資源調度,高效的利用可利用的資源。
- 資源交易機制:提供一種計算資源的交易機制,允許資源提供者獲得利益,使系統能動態地取得更好的性價比資源。
- 編程工具:提供豐富的用戶接口和編程環境,提供最常用的語言,以及分布式共享存儲器和一些函數庫等。
- 用戶圖形界面:提供方便的用戶訪問接口,包括Web 方式接口,使用戶可以在任何位置、任何平臺上使用系統資源。
6)分類:
a.五層沙漏結構:由Foster等最早提出的,是一個最先出現的應用和影響最廣泛的結構。是一種以協議為中心的結構,也十分強調服務與API(Application Programming Interfaces)和SDK (Software Development Kits)的重要性。基本思想:共享+互操作+協議+服務+API/SDK
b.OGSA體系結構:開放網格服務結構OGSA(Open Grid Services Architecture)是Global Grid Forum 4的重要標準建議,是繼五層沙漏結構之后最重要,也是目前最新的一種網格體系結構。2002年,Globus和IBM發布了開放網格服務體系結構OGSA(Open Grid Services Architecture); OGSA 完善和擴展了Globus toolkit.
三大基本思想:
- 一切都是服務:將資源,信息。數據等統一起來,十分有利于靈活的一致的動態的共享機制的實現,使得分布式系統管理有標準的接口和行為,網格={網格服務},網格服務可以以不同的方式聚集起來滿足虛擬組織的需要。在OGSA 內,一切都表示為一個Grid 服務,即一個遵循一套規范(使用WSDL 來表示)的(潛在短暫的)服務,這些規范用于實現生命周期管理、發現特性、通知等目的。
- 統一的Web 服務架構:自然具備了原來Web Service的所有有利因素:服務描述和發現;從描述中自動產生客戶和服務器端的代碼;…….OGSA通過標準接口和規范支持創建、終止、管理和調用有狀態的短暫服務,這些服務具有動態的、可管理的生命周期,是可命名、可管理的實體。
- 突破科技應用領域:同樣可用于商業領域
組成:
- 持久服務實例:“Web services” 強調永久 服務的發現和調用:整個企業持久狀態的接口,無狀態的服務。
- 瞬間服務實例:? 分布活動狀態的接口,例如工作流, 視頻會議, 遠程數據分析等。
服務架構:
支撐技術:
- 網格技術(即Globus軟件包):Globus是一種基于社團的,開放結構,開放源碼的服務的集合,也是支持網格與網格應用的軟件庫,該工具包解決了安全,信息發現,資源管理,數據管理,通信,錯誤檢測以及可移植等問題。
- Web Service:Web Service 只要是涉及一些協議標準的,主要有SOAP,WSDL,WS-Inspection,UDDI等協議。這些協議之間互相可以支持。其中關于XML協議是它的工作基礎。
7)網格服務——基于Web Service的資源虛擬化
a.網格服務=接口/行為+服務數據。
服務化各類資源,多個邏輯實例映射相同物理資源,位置透明、多協議綁定和服務的多種實現,組成高級服務,不關心各服務如何構成實現。
例如存儲的虛擬化:
b.生存期管理
GS 實例由factory或手工創建,GridService 接口支持:Destroy 操作用于顯式撤消和軟狀態撤銷
軟狀態生命周期管理機制:初始的生命周期在創建時和Factory協商,用戶可以SetTerminationTime設置生命周期 ,GetTerminationTime 查詢,通知 interface也允許生命周期的通知。軟狀態生命期管理可避免資源的無限期占用等。
7)四種形式:
- 企業計算
企業計算是“以實現大型組織內部和組織之間的信息共享和協同工作為主要需求而形成的網絡計算技術”,其核心是Client/Server計算模型和相關的中間件技術。 其研究熱點是建立標準化的對象請求代理,屏蔽網絡環境下計算平臺、操作系統、編程語言、網絡協議的異構性和復雜性,使分布在網絡上的應用系統能夠協同工作,為網絡應用提供通用的高級網絡管理服務以及與應用領域相關的增值服務。隨著電子商務需求的發展,企業計算面臨企業間的信息共享和協同工作問題,面向Web的企業計算解決方案成為熱點,企業計算技術全面進入Internet時代。 - 網格計算
從概念上,網格計算的目標是資源共享和分布協同工作;網格的這種概念可以清晰地指導行業和企業中各個部門的資源進行行業或企業整體上的統一規劃、部署、整合和共享,而不僅僅是行業或大企業中的各個部門自己規劃、占有和使用資源;網格是一種技術;為了達到多種類型的分布資源共享和協作,網格計算技術必須解決多個層次的資源共享和合作技術,制定網格的標準,將Internet從通訊和信息交互的平臺提升到資源共享的平臺。 網格是基礎設施,是通過各種網絡綜合計算機、數據、設備和服務等資源的基礎設施;隨著網格技術逐步成熟,建立地理分布的遍布全國或世界的大型資源節點,集成網絡上的多個資源,聯合向全社會按需提供全方位的信息服務。 - 對等計算
P2P(Peer to Peer)系統由若干互聯協作的計算機構成,且至少具有如下特征之一:系統依存于邊緣化(非中央式服務器)設備的主動協作,每個成員直接從其他成員而不是從服務器的參與中受益;系統中成員同時扮演服務器與客戶機的角色;系統應用的用戶能夠意識到彼此的存在,構成一個虛擬或實際的群體。P2P把網絡計算模式從集中式引向分布式,也就是說,網絡應用的核心從中央服務器向網絡邊緣的終端設備擴散:所有網絡節點上的設備都可以建立P2P對話。 從目前的應用看,P2P的威力還主要體現在大范圍的共享和搜索的優勢上,諸如對等計算、協同工作、搜索引擎、文件交換等。 - 普及計算
普及計算(ubiquitous computing or pervasive computing)強調人與計算環境的緊密聯系,使計算機和網絡更有效地融入人們的生活,讓人們在任何時間、任何地點都能方便快捷地獲得網絡計算提供的各種服務。普及計算研究的內容主要包括兩個方面:自然的人機交互和網絡計算。
相同點:目標一致
- 廣泛共享:通過各種方法、技術和策略將網絡上的各種資源提供給網絡上眾多用戶共享使用;
- 有效聚合:將網絡上的巨大資源通過協同工作連接集成起來,產生巨大的綜合效能,聯合完成應用任務;
- 充分釋放:為用戶提供良好的開發手段和使用環境,將網絡上的多種資源的聚合效能按照需求傳遞給用戶,為用戶提供個性化的信息服務、計算服務和決策支持服務。
不同點:
- 面向對象的分布式計算技術強調的是分布系統的集成能力,以兩層或多層Client/Server為主要計算模式,關心的是簡化用戶端的工作,強化多層服務器的功能,注重分布系統之間的協同工作和快速的應用開發和實現,強調應用服務之間的可交互、可操作性,代碼的可移植性,通常關注一個組織內的資源共享。
- P2P技術弱化了集中服務器的功能,重視網絡中所有個體的作用,強調的是個體之間、系統之間、計算機之間的直接通信和聯系,每一個參與者既是客戶又是服務方,它與現行以中間件為主的分布式計算技術所采用的Client/Server模式有本質區別。
- 網格計算是在Internet基礎上強調對計算、數據、設備等網絡基本資源進行整合,力圖將Internet作為一個社會化的計算基礎設施。在計算模型、技術路徑和研究目標上,Grid計算和目前分布計算中間件領域面向應用級別的交互、互操作和開發有很大的不同。它強調多機構之間大規模的資源共享和合作使用,提供了資源共享的基本方法,而分布計算技術沒有提供多組織之間的資源共享通用框架,以Client/Server為主要的交互形式,傳統企業計算技術集中在一個組織內的資源共享。
- 普及計算模式則是要顛覆“人使用計算機”的傳統方式,將人與計算機的關系改變為“計算機為人服務”,從某種意義上說,是讓人與計算環境更好地融合在一起。
盡管各種網絡計算技術有差異,但是它們之間并不是沖突的關系,而是一種正交關系,有時甚至是融合的,因此,各種網絡計算技術可以共同存在。例如網格計算和CORBA、SOAP、XML等技術結合可以訪問多個機構組成的虛擬組織的資源。
?
常見FAQ(這部分是轉載):
1.什么是網格 ,網格的目標?
網格是從電力網格中借鑒過來的一個概念,原本是希望計算力和計算資源能夠象電力一樣,“打開電源開關就可以使用”,不用去關心是誰、如何提供的這些服務。
網格的目標是抽象并量化計算資源,隨時隨地能夠通過網絡“定額”完成“定量”的計算相關的工作。
2.網格的本質特征是什么?
網格的本質特征是:
分布與資源共享:分布是網格最本源的特征,網格是通過集中分散的資源來完成計算的,資源的共享是一種集中資源的手段
高度抽象:把計算力和所有的計算資源高度抽象成為用戶可見的“電源接線板”,其它的東西對用戶透明。
自相似:在大尺度上和小尺度上有相同或者類似的規律
動態性和多樣性:和電力網格一樣,用戶的需求是變化的,所以動態性是網格需要考慮的一個基本問題
自治性與管理的多重性:網格節點內部的自治和外部的受控整合是網格的一個特征,分層的資源需要層次化的管理,而分層來自于網格節點的歸屬問題和性能方面的考慮。
3.網格計算中有哪些基礎概念?
資源發現:資源發現是網格主動去發現可用的資源,并注冊、管理這些資源的過程
資源調度:如何充分利用網格收集的計算資源進行高效率地合理地使用是資源調度的研究范疇
異構:是抽象的本源動力
元計算:是關于“計算”的計算,就像“元語言”是描述語言的語言一樣,元計算是為了進行計算而展開的計算活動,是網格對資源進行抽象的過程
計算網格:網格的重心在解決高密度的計算問題的網格結構
數據網格:重心在高密度、海量數據的儲存和管理、使用過程的網格結構
4.如何判斷是否是網格
還沒有網格的確切定義出爐,只能根據網格的一些基本特征來判斷。P2P嚴格來說也是一種網格。
根據Globus toolkit的創始人的觀點,Globus就是網格,這個觀點有些偏頗,姑且這么認為吧。
5.網格目前有標準嗎,有人在制定標準嗎?
OGSI和OGSA是目前關于網格的一個標準
6.能用非常簡單的例子說明什么是網格嗎?
例如P2P,目前已經實現了儲存共享,以解決服務器資源限制(帶寬和服務能力)的問題,但是目前的P2P 計算還在熱門研究中。它的特點是通過分布式的共享儲存和帶寬資源,也包括部分計算資源的共享來提高服務的可用性,已經包括了網格的幾個主要特征。
又如,國外一些如抗癌項目,充分發掘PC 的計算力來尋找治療癌癥的新藥,也具有相應的特征,只不過其資源調度的粒度很粗,各節點的耦合很松散,只要計算任務和結果,節點只與中央節點交換數據,結構比較簡單。
7.如何在應用領域體現網格的優勢
高性能(大計算吞吐量)、低成本
8.為什么要把網格比做電網
不要考慮計算力從什么地方來,只管用就行了。
9.網格如何分類
分為計算網格、數據網格、訪問網格、信息網格、服務網格等
10.何為元計算,與網格是什么關系
元計算技術是將一組通過廣域網連接起來的性質不同的計算資源集合起來,作為一個單獨的計算環境向用戶提供計算服務。元計算系統的目標是使用戶能夠共享其中的計算資源并以合作的方式進行計算。元計算前端主要解決最終用戶通過統一的界面來使用廣域網上各類計算資源的問題;元計算內核主要解決計算任務在廣域網中各種超級計算機上協作完成的問題,提供一個完整的程序開發和運行環境。當用戶提出計算請求時,計算問題的執行代碼在系統內部的計算資源上進行合理的調度和管理,最后得出運行結果并通過元計算前端反饋給最終用戶。一個良好的元計算系統主要由三個部分組成:一是盡量簡單而又可靠的使用界面;二是資源管理系統;三是良好的編程模型和高效可靠的運行時環境。其中資源管理系統處于核心地位,它負責整個系統中各個資源的描述、變動、分配與保護,與運行時系統密切合作,保證整個系統的正常運行。資源管理系統需要為不同級別的系統管理員提供強有力的工具或界面來對這些資源進行控制和保護。
元計算是網格計算的初級形態。
11.什么是計算網格
強調計算力獲取、管理等的網格
12.什么是數據網格
強調數據存儲、管理、傳輸、處理的網格
13.什么是信息網格
強調信息存儲、管理、傳輸、處理的網格
14.什么是存儲網格
強調數據存儲的網格
15.什么是知識網格
強調知識存儲、管理、傳輸、處理的網格
16.什么是語義網格
強調語義解析的網格,實現語義互操作
17.什么是access? grid
簡單來講,是一個項目。目的是為網格用戶提供簡單有效的視頻、音頻會議功能,為e-science提供基礎的工具。 提供單一訪問通道獲取網格資源的網格。
18.什么是grid portal
格網門戶,提供格網單一訪問通道
19.什么是服務網格
強調應用服務集成的網格
20.目前有哪些應用網格
美國科學格網(DOE Science Grid)、遠程分布式計算與通信(Distance and Distributed Computing and Communication,DisCom2)和地球 系統格網(Earth System Grid II,ESG)、TeraGrid和國家地震工程仿真格網(Network for Earthquake Engineering Simulation Grid,NEES Grid)、CrossGrid、天體物理虛擬天文臺(Astronomical Virtual Observatory,AVO)、英國國家格網(U.K. National Grid)、德國的計算資源統一接口項目(Uniform Interface to Computing Resources,UNICORE)、亞太地區格網(APGrid)
21.什么是P2P計算,與網格有什么關系
對等(P2P)計算是在Internet上實施分布式計算的新模式。在這種模式下,服務器與客戶端的界限消失了,網絡上的所有節點都可以“平等”共享其他節點的計算資源。IBM為對等下了如下定義:對等系統由若干互聯協作的計算機構成,且至少具有如下特征之一:系統依存于邊緣化(非中央式服務器)設備的主動協作,每個成員直接從其他成員而不是從服務器的參與中受益;系統中成員同時扮演服務器與客戶機的角色;系統應用的用戶能夠意識到彼此的存在,構成一個虛擬或實際的群體。
網格采用P2P計算體系結構
22.網格與分布式計算是什么關系
格網計算是一種新的高性能的分布式計算方法。格網計算作為新一代的分布式計算方法,與傳統分布式計算的主要區別在于在沒有集中控制機制的情況下,通過對計算資源進行大規模共享,滿足應用對高性能計算要求,并且這種對計算資源進行大規模共享是動態的、柔性的、安全的和協作式的。
23.網格與中間件是什么關系
網格中間件(Gridware)就是一種在網格中應用的中間件
現在的globus toolkit就是一種網格中間件,連接異質的主機節點構成globus網格
24.什么是web service,網格與web service是什么關系。
OGSA吸納了許多Web服務 標準,如Web服務描述語言(WSDL)、簡單對象訪問協議(SOAP)、輕目錄訪問協議(LDAP)、Web服務探測(WS-Inspection)等。這些標準用于定位、調度計算資源并保證它們的安全。
OGSA采用Web服務框架的優點是:一方面,通過注冊和發現接口定義和終端(endpoint)實現描述以及動態產生特定接口綁定的代理,在異構環境中能夠支持服務的動態發現和合成。另一方面,由于Web服務機制在商業應用領域廣泛采用,OGSA采用Web服務框架使人們能夠利用許多現有的開發工具和擴展服務,如產生語言綁定的WSDL處理器。
25.網格跟.net, corba, jini,java的rmi,J2EE都是什么關系。
網格融合了.net, corba, jini或java的rmi,J2EE思想,并從軟件集成擴展到CPU、存儲設備、儀器等硬件的集成。
26.網格和CSCW是什么關系
CSCW可以定義為地域分散的一個群體借助計算機及其網絡技術,共同協調與協作來完成一項任務。網格促進了這種工作模式。
27.網格跟IBM提出的自主計算有什么關系
“自主計算”的設想是將日益復雜的IT系統管理后臺化、自動化和智能化,通過強大的中間件將異構網絡改造成真正意義上的和諧自主的數字神經系統。
網格本身就是一種自主計算
28.什么是網格的體系結構
網格體系結構就是關于如何建造網格的技術描述。它給出了網格的基本組成與功能,描述了網格各組成部分的關系以及它們集成的方式或方法,刻畫了支持網格有效運轉的機制。
29.網格的主要有那些體系結構,他們目前發展狀況如何。
美國Globus項目提出的格網體系結構模型采用本地服務層、核心服務層、高層服務與工具層、應用層四層結構。在此基礎上,美國的Argonne國家實驗室、芝加哥大學、南加州大學和IBM公司共同提出了開放式格網服務體系結構(Open Grid Services Architecture,OGSA)。OGSA采用纖維層、聯絡層、資源層、協作層、應用層五層結構。
30.網格的起源是什么
“網格”(Grid)一詞來源于人們熟悉的電力網(Power Grid)。目前對計算力的需求正在持續不斷地增長。高速網絡、功能和性能更加強大的大規模計算系統、高性能存儲系統以及高級數據分析軟件的應用為解決商業領域和科學領域的計算問題帶來了希望。但是利用這些新的能力意味著應付不斷增加的工作負荷要求所帶來的空前挑戰。當一個組織機構在努力保持競爭力的時候他們面臨許多前所未有的挑戰:減少計算費用、增加計算吞吐量、加快對市場的響應、改進生產服務質量和產品創新等都是非常重要的。一個組織機構在硬件方面的投資需要謹慎地進行權衡,并且必須找到利用可得資源完成更多工作的方法。
盡管對計算力的需求是非常大的,但是許多現有的系統都沒有得到充分利用。其中一些單個服務器也許滿負荷工作,但是大多數系統卻不是滿負荷工作的,使許多計算周期(computing cycles)沒有使用,而實際上這些計算周期可以用于滿足不斷增長的計算資源需求。格網計算使組織機構可以更加有效地和靈活地用他們的分布式計算資源,從現有的系統中獲取更加有用的計算力,幫助組織機構獲得競爭優勢。
31.網格目前的發展狀況如何
研究、開發、炒作,即處于預熱期。
32.國內的網格有那些項目,每個項目的目標如何,目前進展如何。
ACI工程的目標是把分布在不同地理位置的高性能計算機、貴重儀器、數據庫等用高速網絡連接在一起構成一臺虛擬計算機,用戶通過ACI共享資源、共同討論、合作開展科研項目。
織女星計劃(Vega計劃以元數據、構件框架、智能體、格網公共信息協議和格網計算協議為主要研究突破點。
33.介紹一些國外的主要網格項目的狀況
美國科學格網項目的目標是建立基于格網中間件(Gridware)和系統工具的高級分布式計算基礎設施(ADCI)使能源部科學計算體系的可伸縮性滿足能源部內部科學研究任務要求。
遠程分布式計算與通信項目的目標是創建一個用于訪問美國能源部三個武器實驗室的具有可操作性的格網,以支持國防計劃中遠程計算和分布式計算這兩個關鍵戰略領域復雜的分析、設計、制造、認證功能。
地球系統格網(Earth System Grid II,ESG)項目由阿貢國家實驗室(Argonne National Laboratory)等五個國家實驗室的科學家聯合承擔。主要目標是解決從全球地球系統模型分析和發現知識所面臨的巨大挑戰,為下一代氣候研究提供一個無縫的強大的虛擬協同環境。
國家地震工程仿真格網的目標使地震研究人員能夠進行各種地震工程實驗數據分析的大規模計算任務。
此外,目前美國正在進行的格網計算研發項目還包括Globus、美國航空航天局(NASA)的信息動力格網(Information Power Grid,IPG)、美國國家技術格網(National Technology Grid)、虛擬實驗室項目(Virtual Laboratory Project)、天體物理仿真合作實驗室(Astrophysics Simulation Collaboratory,ASC)、國際虛擬數據格網實驗室(International Virtual Data Grid Laboratory,iVDGL)等。Globus目標構建一個格網軟件基礎設施。研究內容包括資源管理、數據訪問、應用開發、格網安全等。目前全球許多用戶利用Globus工具包創建格網和開發格網應用。信息動力格網的目標是為國家航空航天局科學研究任務提供持續、可靠的計算動力源。美國國家技術格網項目的目標是創建一個無縫集成的協同計算環境原型系統。虛擬實驗室項目致力于研究、設計、開發能夠幫助解決數據密集的、涉及大規模計算的分子生物學問題的格網技術。天體物理仿真合作實驗室項目的主要目標利用Cactus和Globus格網計算的研究成果為高級可視化交互和元計算提供大規模并行計算能力,實現在相對論天體物理學領域的大規模仿真。國際虛擬數據格網實驗室項目由歐盟的數據格網(DataGrid)、美國的格網物理網絡(Grid Physics Network)和粒子物理數據格網(Particle Physics Data Grid)協作創建。
34.網格的發展有哪些困難
信息安全、商業模式等
35.網格面臨哪些技術問題
格網資源管理、注冊、預訂、分配、調度、安全、計費等
36.GGF主要的工作是什么
應用程序及編程模型和環境(APME)。
架構。
數據。
安全性。
信息系統和性能(ISP)。
端到端應用(P2P)。
調度和資源管理(SRM)。
37.國內有類似GGF的組織嗎
沒有,至少沒有成規模、成氣候、分工協作。
38. OGSA,OGSI,Globus,WSRF有什么關系
OGSI(Open Grid Service Ieterface,開放網格服務接口)規定了向網格發送處理請求時所使用的接口,相當于Web服務中的WSDL(Web服務描述語言),在網格計算相關標準中處于核心地位。
開放式格網服務體系結構(Open Grid Services Architecture,OGSA)采用纖維層、聯絡層、資源層、協作層、應用層五層結構,格網是通過調用服務來構造應用的,這就涉及接口問題。
OGSA是一個抽象的東西,里面沒有具體的內容,OGSA的推出要比OGSI早,OGSI是對OGSA的主要方面具體化,規范化.Globus是基于 OGSI標準的一個實現. WSRF是和OGSI同一個層次的東西,是吸收了Web Service最新成果后,對OGSI的重構和發展.
39.網格是一種新技術,任何新技術或多或少都會帶有泡沫的成分?你是否贊成?網格技術是否也帶有泡沫的色彩?
技術本身沒有泡沫,泡沫是商業炒作產生的,現在已經開始商業炒作了。
40.從總體上看,網格技術目前的發展,是處在一個什么狀況?
技術研究開發階段
41.網格離實際應用,離商業應用還有多遠?
2到3年時間
42.一個新技術,從理論性的研究,到實際的商業的推廣需要經歷幾個階段,你認為“網格”需要經歷幾個階段,才能走向真正的商用?
原型應用系統開發、格網標準化(規范、協議)、成熟的商業模式
43.網格想要得到廣泛的商業應用,是否會遇到一些阻礙?
是的,例如安全問題、計費問題等。
44.任何一個新技術的發展趨勢,都應該受到身在政府、行業、企業中的CIO所關注。你認為作為“網格”技術,這些CIO應該從哪幾方面進行關注?
網格在政府、行業、企業中的應用
45.什么才算是Ian Foster三個checklist中的非平凡服務?
大吞吐量、服務透明、高可靠性
46.學習網格要學習哪些基礎知識
計算機原理、計算機網絡、數據庫、編程語言 等
47:什么是制造網格
是現代集成制造哲理和敏捷制造模式在網絡化經濟環境下的一種具體物化形式,目標是快速設計、快速制造、快速檢測、快速響應和快速重組,克服空間上的距離給不同企業間的協同帶來的障礙,在最大程度上實現設計、制造、信息、技術資源的共享,以及協同制造過程中物流、信息流、價值流的優化運行,它能為實現敏捷制造和虛擬企業的運作提供支持,形成具有數字化、柔性化、敏捷化等基本特征的優勢互補的協同企業。而在這樣的制造網絡支持下,整個制造網格系統中的制造企業群體將以較低的成本、較短的開發周期,制造出符合市場需求的高質量產品。
?
?
?
3.云計算
1)定義:云計算是分布式處理(Distributed Computing)、并行處理(Parallel Computing)和網格計算(Grid Computing)的發展,或者說是這些計算機科學概念的商業實現
“Cloud Computing is a paradigm in which information is permanently stored in servers on the Internet and cached temporarily on clients that include desktops, entertainment centers, tablet computers, notebooks, wall computers, handhelds, sensors, monitors, etc.”
??????????????? ---- IEEE Internet Computing, 2008
云模式的初衷是讓硬件層的消費象按需計算,按所需存儲空間那樣進行,而為了讓云模式帶來更多力量,我們需要在整個應用架構中,在一個虛擬的環境中實現配制,部署,服務。云計算就是為一些需要動態改變的需要訪問資源與服務。應用和服務請求的資源來自“云”,而不是固定的有形的實體。云就是一些可以自我維護和管理的虛擬資源。
2)基本原理:
通過使計算分布在大量的分布式計算機上,而非本地計算機或遠程服務器中,企業數據中心的運行將更與互聯網相似,這使得企業能夠將資源切換到需要的應用上,根據需求訪問計算機和存儲系統,這意味著計算能力也可以作為一種商品進行流通,就像煤氣、水電一樣,取用方便,費用低廉。最大的不同在于,它是通過互聯網進行傳輸的。類比:從古老的單臺發電機模式轉向了電廠集中供電的模式。
3)特點:超大規模+虛擬化+高可靠性+通用性+高可擴展性+按需服務+極其廉價。
4)應用分類:
軟件即服務(SaaS):通過網絡瀏覽器將單個的應用軟件推廣到用戶,從用戶角度來說,前期無需在服務器或軟件許可證授權上進行投資;從供應商角度來看,與常規的軟件服務模式相比,維護一個應用軟件的成本要相對低廉。成功應用:Salesforce.com,在人力資源管理軟件方面的應用較為成功,Workday,ERP軟件供應商,Google App,知名的在線辦公軟件。
效用計算(Utility computing):想法本無新意,目前逐漸應用在數據中心,將計算和存儲等資源,打包成為可量化的服務,類似于傳統的電力資源等公共效用,例如,Liquid Computing公司的LiquidQ服務,能幫助企業將內存,I/0,存儲和計算容量通過網絡集成為一個虛擬的資源池來使用。
網絡集成 :云基礎服務的集成尚處于初始階段,案例包括:OpSource推出的OpSource Services Bus;Workday收購的CapeClear,其從事B-TO-B商業模式服務;Grand Central向用戶提供集成解決方案,被Google收購。
網絡服務:與軟件即服務(SaaS)是密切相關的,網絡服務供應商提供API能幫助開發商通過網絡拓展功能性,而不只是提供成熟的應用軟件,成功應用: Google Maps。
管理服務供應商(MSP):管理服務是云計算最古老的形式之一,是面向IT廠商而并非最終用戶的一種應用軟件,例如,用于電子郵件的病毒掃描服務或者應用軟件監控服務。
服務商業平臺 :服務商業平臺是軟件即服務(SaaS)和管理服務供應商(MSP)的混合體,為用戶和提供商之間的互動提供了一個平臺。比如用戶個人開支管理系統,能夠根據用戶的設置來管理其開支并協調其訂購的各種服務。
?
4.P2P技術
1)定義:P2P是一種分布式網絡,網絡的參與者共享他們所擁有的一部分硬件資源(處理能力、存儲能力、網絡連接能力等),這些共享資源需要由網絡提供服務和內容,能被其它對等節點(Peer)直接訪問而無需經過中間實體。在此網絡中的參與者既是資源提供者(Server),又是資源獲取者(Client)servent。P2P打破了傳統的Client/Server (C/S)模式,在網絡中的每個結點的地位都是對等的。每個結點既充當服務器,為其他結點提供服務,同時也享用其他結點提供的服務。
例如BT原理:
Tracker即時接收所有下載者信息(IP地址和端口),并且給每個下載者一份隨機的peer列表。 下載者每隔一段時間連一次Tracker,告知自己的進度和取得列表,這樣就可以和那些已經直接連接上的peer進行數據的上傳下載。在進行文件傳輸時,每個文件一般被劃分成256K的大小的塊,每個塊都計算其校驗值。用戶間互相的Choke和UnChoke對方,來交換這些文件塊。
2)優勢
非中心化:網絡中的資源和服務分散在所有結點上,信息的傳輸和服務的實現都直接在結點之間進行,可以無需中間環節和服務器的介入,避免了可能的瓶頸
可擴展:隨著用戶的加入,不僅服務的需求增加了,系統整體的資源和服務能力也在同步地擴充
健壯性:P2P架構天生具有耐攻擊、高容錯的優點。多副本沒有單點失效問題,部分結點或網絡遭到破壞對其它部分的影響很小
負載均衡:資源分布在多個節點,更好的實現了整個網絡的負載均衡
高性能/價格比:通過利用網絡中的大量空閑資源,可以用更低的成本提供更高的計算和存儲能力。
隱私保護:信息的傳輸分散在各節點之間進行而無需經過某個集中環節,用戶的隱私信息被竊聽和泄漏的可能性大大縮小,所有參與者都可以提供中繼轉發的功能,因而大大提高了匿名通訊的靈活性和可靠性,能夠為用戶提供更好的隱私保護。
3)拓撲結構
- 中心化拓撲:共享軟件 Napster
- 中央服務器的癱瘓容易導致整個網絡的崩潰,可靠性和安全性較低
- 隨著網絡規模的擴大,對中央索引服務器進行維護和更新的費用將急劇增加,所需成本過高。
- 中央服務器的存在引起共享資源在版權問題上的糾紛,并因此被攻擊為非純粹意義上的P2P網絡模型
優點:維護簡單,發現效率高,資源的發現依賴中心化的目錄系統,發現算法靈活高校并并能夠實現復雜查詢
問題: - 全分布式非結構化拓撲:P2P文件共享系統? Gnutella
?優點:容錯性好,支持復雜的查詢,并受結點頻繁加入和退出系統的影響小。
問題:查詢的結果可能不完全,查詢速度較慢,采用廣播查詢的系統對網絡帶寬的消耗非常大,并由此帶來可擴展性差等問題。 - 全分布式結構化拓撲:
采用分布式散列表(DHT),DHT實際上是一個由廣域范圍大量結點共同維護的巨大散列表。散列表被分割成不連續的塊,每個結點被分配給一個屬于自己的散列塊,并成為這個散列塊的管理者,如Chord:網絡結點按照一定的方式分配一個唯一結點標識符(Node ID) ,資源對象通過散列運算產生一個唯一的資源標識符(Object ID) ,且該資源將存儲在結點ID與之相等或者相近的結點上。需要查找該資源時,采用同樣的方法可定位到存儲該資源的結點。提出了一個分布式查找協議,該協議可將指定的關鍵字(Key) 映射到對應的結點。
優點:DHT類結構能夠自適應結點的動態加入/退出,有著良好的可擴展性、魯棒性、結點ID分配的均勻性和自組織能力。由于重疊網絡采用了確定性拓撲結構,DHT可以提供精確的發現。
問題:DHT的維護機制較為復雜,尤其是結點頻繁加入退出造成的網絡波動(Churn)會極大增加DHT的維護代價。DHT僅支持精確關鍵詞匹配查詢,無法支持內容/語義等復雜查詢。 - 半分布式拓撲:選擇性能較高(處理、存儲、帶寬等方面性能)的結點作為超級點(英文文獻中多稱作:SuperNodes, Hubs).在各個超級點上存儲了系統中其他部分結點的信息,發現算法僅在超級點之間轉發,超級點再將查詢請求轉發給適當的葉子結點。半分布式結構也是一個層次式結構,超級點之間構成一個高速轉發層,超級點和所負責的普通結點構成若干層次。KaZaa就是個實例。
優點:性能、可擴展性較好,較容易管理
問題:對超級點依賴性大,易于受到攻擊,容錯性也受到影響
比較:
4)應用
- ICQ、Skype類的即時通信應用。兩個或多個用戶互相使用文字、語音或視頻進行交流。利用P2P技術可以弱化甚至擺脫對服務器的依賴,這樣的通信更接近人與人的通信模式。
- 海量存儲類數據存儲應用,如Microsoft提出的Farsite。在網絡上將存儲對象分散化存放。而不像現在放置在專用服務器,可以減輕服務器負擔,增加數據的可靠性和傳輸速度。
- Napster、BT類文檔交換應用。實現數據和文件共享,使用者可以直接從任意一臺安裝同類軟件的PC下載及上傳文件,而不是從服務器上傳及下載。用戶可以檢索、復制共享的文件。軟件自動發現最新的文件列表,發布者無需使用其他途徑發布。
- Infrasearch、Pointera類數據搜索及查詢軟件。用來在P2P網中完成信息檢索,動態地將當前P2P網絡中各個f對等點的內容進行收集,并且有效地向用戶傳遞。
- Netbatch(Intel)類協同計算應用。現有實驗可連接近1萬臺PC,利用它們的空閑時間進行協同計算,完成超級計算量的工作(如空間探測、分子生物學計算、芯片設計)。
- Groove類數據或行動協同應用,是基于P2P連接的軟件工具,可以建立一個安全的企業級協同工作平臺(P2P網),提供供求信息鏈上的互動信息溝通,如貨品目錄、庫存及發貨清單,幫助使用者進行經銷渠道維護、客戶服務和支持。
- 在線游戲類應用。許多雙人及多人對弈網絡游戲采用P2P技術交換數據。
5)相關研究與未來
6)主要問題:
- P2P類應用吞噬帶寬 :BT類業務的流量占據了超過40%的網絡帶寬 ,無論運營商如何擴容,帶寬似乎永遠不夠,運營商之間互聯帶寬加倍后會在短短的幾周內被占滿
- P2P類應用難以監管:基于P2P技術的即時通信工具使合法監聽難以實施,基于P2P技術的即時通信工具在業務層沒有一個集中的點來建立呼叫或者安排路由,因此不能基于業務控制設置合法監聽點 ,雖然可以在骨干設備或者互聯設備上得到經過該設備的所有數據,但是由于數據量過大,一般很難進行實時的海量分析,由于P2P通信由兩端計算機直接協商,很容易實現端到端強加密,即使第三方得到通信數據,也很難在較短時間使用較小代價解密。?
7)P2P對電信行業帶來的思考:
- 互聯網的建設和運營 :接入網出口及骨干網帶寬問題和運營模式問題——內容擁有者在產業鏈各環節中的發言權增強,其甚至可以利用P2P技術,自己進行網絡傳輸。 從文件交換服務提供者的角度來看,P2P作為一種單純的服務,似乎不存在贏利的可能———用戶需要的不是P2P軟件,他們需要的只是通過P2P能得到的東西,也就是共享的文件。這更加凸現了內容提供商而非網絡提供者的價值。另外電信運營商是否應當提供內容以及增值業務 ?
- 互聯網網絡中立問題 :網絡中立的提案中既排斥區別使用者分配資源也排斥區別應用分配資源。 網絡中立提案希望電信運營商將網絡像高速公路或者電網那樣運營。電信運營商將只能作為管道提供商為內容提供商以及用戶提供管道,不能按照自己的意愿以及所傳送內容分配資源。雖然電信運營商擁有網絡,但是只能得到少量的接入費用,而內容提供商卻“寄生”在網絡上得到絕大多數的利潤,因此絕大多數運營商都反對網絡中立。當前網絡中立法案還沒有在美國通過。 在以P2P為首的業務應用引出問題以后,互聯網在網絡中立問題上是否改變,如何改變,何時改變,都是需要思考的內容。
- 互聯網安全保障 :因為P2P類應用是用戶到用戶的,骨干網上不存在用戶數據的必經點,對用戶行為以及用戶傳送內容的過濾、合法監聽越來越困難。當然如果在所有用戶接入點上布置分析過濾工具不是不可能。但是這樣帶來的附加成本可能會急劇上升電信運營商是否應當為通信內容的安全負責?電信運營商應當對網絡安全負多大的責任?成為管道提供者的電信運營商如何對安全負責。
總結
以上是生活随笔為你收集整理的SOA、网格计算、云计算与P2P技术的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C程序设计(第五版)谭浩强第七章课后答案
- 下一篇: win7cdc驱动安装不成功的解决办法