動態資源管理在CAD系統的應用
一、問題的提出 隨著......
一、問題的提出
隨著設計手段的不斷提高,CAD軟件已成為設計、分析、仿真的強有力工具。從陌生到熟練地應用,從排斥到喜歡甚至離不開它,因為它的加
入,我們的設計變得更快、更好、更及時。然而,在MDA系統中,隨著使用部門和使用人數的增加,CAD軟件也面臨著另外一個問題:軟件資源
和系統資源問題。具體表現是:
CAD有設計、分析、仿真、工業設計多個軟件,這些軟件分散管理,沒有集中監控,機器多和軟件多,造成管理工作量極大。
用戶完成軟件后往往不主動退出應用程序,造成license(許可證)被無效占用,降低了license的使用效率。
在部門內部,無法實現計算機資源共享,網絡中有的機器繁忙,有的機器卻空閑,無法自動將繁忙機器上的作業分流到空閑的機器上。
對管理層而言,無法從總體上把握機器的使用狀況,不利于制定精確的采購計劃,以最少的開支滿足用戶最大的需求。
對系統管理員而言,系統的使用基本上處于黑箱狀態,無法確切知道系統是如何被使用的。
使用的過程中,我們采用了多種辦法來緩和這些矛盾,如編程來限制用戶的使用軟件license(許可證)個數;增加軟件的許可證數量;人為地
讓性能好的機器承擔更多的任務;還有人工的協調,但這一切只能緩和卻不能解決矛盾。
如何讓最少的資源發揮最大的作用,這是我們需要解決的問題,這樣不僅能夠節約成本,也能提高效率。為此,我們使用了動態資源管理系統
。
二、動態資源管理的分析
動態資源管理,就是監控分布式計算環境,并根據現存的資源動態地重新配置系統和負載。確保客戶的計算機系統得以安全、有效、高效率、
低消耗運行。
動態資源管理按功能分為以下幾個部分:
● 統一管理軟、硬件及用戶
在硬件級,我們的MDA硬件資源存在平臺多樣化,包括IRIX、HPUX、Windows等,性能差異也較大,有最新款的雙CPU 1G內存的主機,也有使用
七八年的老機型,任務就是您使用的那臺機器提供執行,常常會出現性能好的機器還沒有性能弱的機器任務繁重,造成資源的浪費和工作效率
的降低。
動態資源管理軟件LSF Base&Batch能把我們的MDA服務器納入統一管理,由Master Server服務器根據負載調配作業,使用戶的應用程序盡量均
勻地運行在機群中,并總在滿足資源要求負載最輕的機器上執行,提高機器的利用率,又從總體上縮短了作業完成時間。同時,我們可通過任
何運行LSF的機器監控所有服務器的系統負載(如:內存、CPU利用率、許可證的當前使用情況等)、用戶運行應用程序情況,并管理整個機群
。
在軟件級, LSF Base&Batch將把所有應用程序按隊列管理,不同的應用程序對應不同的隊列,并按隊列配置不同的管理策略,還可以按照應
用程序的許可證的可用數量來調度用戶的應用程序。我所的MDA系統中有設計、仿真、分析、數據清理、備份等,可以根據任務的不同,輕重
緩急分成不同的隊列執行,比如說大計算量的ansys分析、MDA數據清理工作就可以安排在night隊列執行,而I-deas三維設計則安排在優先級最
高的I-deas隊列。這樣既保證了應用程序之間的獨立,也有利于所有應用程序的集中統一管理。
在用戶級,LSF Base&Batch可按項目、部門將所有用戶進行分組,從而針對不同項目或部門實行不同的管理策略。我們可以在LSF內部定義用
戶和組,也可以引用外部用戶和組,分配給不同的組別不同的權限。比如,一般的用戶只賦予他提交任務的權限,但是只有項目主管和系統管
理員才有權限刪除任務或者是改變任務的優先級。
● 實現統計、分析和模擬計費和成本核算
利用動態管理軟件LSF Analyzer可以提供如下統計、分析報表:
詳細的機器使用情況,如CPU,內存的利用率曲線
用戶對機器的使用情況,如用戶使用CPU,許可證時間
許可證的使用情況,如許可證的利用率
用戶提交的所有作業的情況,如作業名、作業數等使計算資源的使用
通過對我所的MDA系統的觀測,可以從產生的數據中獲得,我所的MDA設計工作的瓶頸不是在硬件資源上,而是在軟件的許可證不能很好的滿足
用戶的需求。 所以我們會用到下面的Llicense管理。
●License管理
LSF可以對軟件license進行完全量化管理
LSF將軟件license作為一種資源納入到完備的資源管理機制中。license的使用也就是資源的使用,用戶可以通過LSF提供的各種命令和機制對
license的使用進行監控。我所的MDA軟件license使用一直都是一個矛盾,一味的增加Licesen數量并不能解決問題。通過對license的量化管
理,我們可以把license計費,統計設計人員使用的license情況和工作效率,達到軟件更有效的使用。
對用戶進行分組控制
LSF可以將使用軟件的所有用戶分成若干組,對應于實際工作中的各個工作/項目組,每組具有不同的優先級。每一組擁有的license 種類、數
量、運行時間窗口都可以由LSF來定義和管理。
LSF可以根據用戶優先級優化軟件license的使用
用軟件的不同用戶/項目組具有不同的優先級。當軟件的license數量足夠多時,用戶都可以正常使用。當軟件license不足時,高優先級的用
戶作業將強行搶占低優先級的作業,保證緊要作業的及時完成。
三、動態資源管理系統的構造
我們使用動態資源管理系統來監控分布式計算資源管理,并使其自動操作的資源管理。它將現有的人工任務轉變為自動進程。在使用模式和資
源可獲得性的基礎上,通過重新自動設置負載,確保軟件和服務始終保持運轉狀態。
首先我們需要確立我們實現的管理目標
1、計算機硬件資源使用的統計、管理和分析
2、CAD應用軟件使用的統計和分析
3、用戶使用情況的統計與分析
在硬件上,我們建立MDA域,將所有需要管理的計算機加入該域,統一管理和調配;在軟件上,我們把所有的CAD應用軟件信息收集到服務器上
,集中管理所有軟件的使用情況;用license收費統計來記錄用戶的使用情況。
在軟件上,我們完成一個MDA作業,必須通過下列的流程:1、作業提交:我們可以選擇提交的隊列和主機,也可以讓系統采用默認的設置;2
、作業的調度與分配,可根據用戶的優先級,采用不同的策略,如先來先服務或是分時服務;3、作業的主機選擇,按任務的優先級,選擇滿