當前位置：首頁 > 编程语言 > python >内容正文

python

ACM在线测评系统评测程序设计与python实现

發布時間：2025/3/20 python 18 豆豆

生活随笔收集整理的這篇文章主要介紹了 ACM在线测评系统评测程序设计与python实现小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

寫此文目的：

讓外行人了解ACM，重視ACM。
讓ACMer了解評測程序評測原理以便更好得做題。
讓pythoner了解如何使用更好的使用python。

在講解之前，先給外行人補充一些關于ACM的知識。

什么是ACM？

我們平常指的ACM是ACM/ICPC（國際大學生程序設計競賽），這是由ACM（Association for Computing Machinery，美國計算機協會）組織的年度性競賽，始于1970年，是全球大學生計算機程序能力競賽活動中最有影響的一項賽事。被譽為計算機界奧林匹克。

了解更多關于ACM的信息可以參考：

百度百科：http://baike.baidu.com/view/201684.htm?
維基百科：http://zh.wikipedia.org/wiki/ACM國際大學生程序設計競賽
ACM國際大學生程序設計競賽指南:http://xinxi.100xuexi.com/view/trend/20120328/47133.html

什么是ACM測評系統？

為了讓同學們擁有一個練習和比賽的環境，需要一套系統來提供服務。

系統要提供如下功能：

用戶管理
題目管理
比賽管理
評測程序

典型的ACM評測系統有兩種

一種是C/S模式，典型代表是PC^2。主要用在省賽，區預賽，國際賽等大型比賽中。官網：http://www.ecs.csus.edu/pc2/
另一種是B/S模式，國內外有幾十個類似網站，主要用于平常練習和教學等。國內比較流行的OJ有：
- 杭州電子科技大學：http://acm.hdu.edu.cn/
- 北京大學：http://poj.org/
- 浙江大學：http://acm.zju.edu.cn/onlinejudge/
- 山東理工大學：http://acm.sdut.edu.cn/sdutoj/index.php

評測程序是做什么的？

評測程序就是對用戶提交的代碼進行編譯，然后執行，將執行結果和OJ后臺正確的測試數據進行比較，如果答案和后臺數據完全相同就是AC(Accept)，也就是你的程序是正確的。否則返回錯誤信息，稍后會詳細講解。

ACM在線測評系統整體架構

為了做到低耦合，我們以數據庫為中心，前臺頁面從數據庫獲取題目、比賽列表在瀏覽器上顯示，用戶通過瀏覽器提交的代碼直接保存到數據庫。

評測程序負責從數據庫中取出用戶剛剛提交的代碼，保存到文件，然后編譯，執行，評判，最后將評判結果寫回數據庫。

評測程序架構

評測程序要不斷掃描數據庫，一旦出現沒有評判的題目要立即進行評判。為了減少頻繁讀寫數據庫造成的內存和CPU以及硬盤開銷，可以每隔0.5秒掃描一次。為了提高評測速度，可以開啟幾個進程或線程共同評測。由于多線程/進程會競爭資源，對于掃描出來的一個題目，如果多個評測進程同時去評測，可能會造成死鎖，為了防止這種現象，可以使用了生產者-消費者模式，也就是建立一個待評測題目的任務隊列，這個隊列的生產者作用就是掃描數據庫，將數據庫中沒有評測的題目列表增加到任務隊列里面。消費者作用就是從隊列中取出要評測的數據進行評測。

為什么任務隊列能防止出現資源競爭和死鎖現象？

python里面有個模塊叫Queue，我們可以使用這個模塊建立三種類型的隊列：

FIFO：先進先出隊列
LIFO：后進先出隊列
優先隊列

這里我們用到的是先進先出隊列，也就是先被添加到隊列的代碼先被評測，保持比賽的公平性。

隊列可以設置大小，默認是無限大。

生產者發現數據庫中存在沒有評測的題目之后，使用put()方法將任務添加到隊列中。這時候如果隊列設置大小并且已經滿了的話，就不能再往里面放了，這時候生產者就進入了等待狀態，直到可以繼續往里面放任務為止。在等待狀態的之后生產者線程已經被阻塞了，也就是說不再去掃描數據庫，因此適當設置隊列的大小可以減少對數據庫的讀寫次數。

消費者需要從任務隊列獲取任務，使用get()方法，一旦某個線程從隊列get得到某個任務之后，其他線程就不能再次得到這個任務，這樣可以防止多個評測線程同時評測同一個程序而造成死鎖。如果任務隊列為空的話，get()方法不能獲得任務，這時候評線程序就會阻塞，等待任務的到來。在被阻塞的時候評測程序可以被看做停止運行了，可以明顯減少系統資源消耗。

隊列還有兩個方法：

一個是task_done()，這個方法是用來標記隊列中的某個任務已經處理完畢。

另一個是join()方法，join方法會阻塞程序直到所有的項目被刪除和處理為止，也就是調用task_done()方法。

這兩個方法有什么作用呢？因為評測也需要時間，一個任務從隊列中取出來了，并不意味著這個任務被處理完了。如果沒有處理完，代碼的狀態還是未評判，那么生產者會再次將這個代碼從數據庫取出加到任務隊列里面，這將造成代碼重復評測，浪費系統資源，影響評測速度。這時候我們需要合理用這兩個方法，保證每個代碼都被評測并且寫回數據庫之后才開始下一輪的掃描。后面有代碼示例。

我們使用如下代碼創建一個FIFO隊列：

#初始化隊列 q = Queue(config.queue_size)

如何有效得從數據庫獲取數據？

這里我們以mysql為例進行說明。python有數據庫相關的模塊，使用起來很方便。這里我們需要考慮異常處理。

有可能出現的問題是數據庫重啟了或者偶爾斷開了不能正常連接，這時候就需要不斷嘗試重新連接直到連接成功。然后判斷參數，如果是字符串就說明是sql語句，直接執行，如果是列表則依次執行所有的語句，如果執行期間出現錯誤，則關閉連接，返回錯誤信息。否則返回sql語句執行結果。

下面這個函數專門來處理數據庫相關操作

def run_sql(sql):'''執行sql語句,并返回結果'''con = Nonewhile True:try:con = MySQLdb.connect(config.db_host,config.db_user,config.db_password,config.db_name,charset=config.db_charset)breakexcept: logging.error('Cannot connect to database,trying again')time.sleep(1)cur = con.cursor()try:if type(sql) == types.StringType:cur.execute(sql)elif type(sql) == types.ListType:for i in sql:cur.execute(i)except MySQLdb.OperationalError,e:logging.error(e)cur.close()con.close()return Falsecon.commit()data = cur.fetchall()cur.close()con.close()return data

需要注意的是這里我們每次執行sql語句都要重新連接數據庫，能否一次連接，多次操作數據庫？答案是肯定的。但是，這里我們需要考慮的問題是如何將數據庫的連接共享？可以設置一個全局變量。但是如果數據庫的連接突然斷開了，在多線程程序里面，問題就比較麻煩了，你需要在每個程序里面去判斷是否連接成功，失敗的話還要重新連接，多線程情況下如何控制重新連接？這些問題如果在每個sql語句執行的時候都去檢查的話太麻煩了。

有一種方法可以實現一次連接，多次操作數據庫，還能方便的進行數據庫重連，那就是使用yield生成器，連接成功之后，通過yield將sql語句傳遞進去，執行結果通過yield反饋回來。這樣聽起來很好，但是有個問題容易被忽略，那就是yield在不支持多線程，多個線程同時向yield發送數據，yield接收誰？yield返回一個數據，誰去接收？這樣yield就會報錯，然后停止執行。當然可以使用特殊方法對yield進行加鎖，保證每次都只有一個線程發送數據。

通過測試發現，使用yield并不能提高評測效率，而每次連接數據庫也并不慢，畢竟現在服務器性能都很高。所以使用上面的每次連接數據庫的方法還是比較好的。

還有一個問題，當多線程同時對數據庫進行操作的時候，也容易出現一些莫名其妙的錯誤，最好是對數據庫操作加鎖：

#創建數據庫鎖，保證一個時間只能一個程序都寫數據庫 dblock = threading.Lock() # 讀寫數據庫之前加鎖 dblock.acquire() # 執行數據庫操作 runsql() # 執行完畢解鎖 dblock.release()

生產者如何去實現？

為了隱藏服務器信息，保證服務器安全，所有的SQL語句都用五個#代替。

生產者就是一個while死循環，不斷掃描數據庫，掃描到之后就向任務隊列添加任務。

def put_task_into_queue():'''循環掃描數據庫,將任務添加到隊列'''while True:q.join() #阻塞安程序,直到隊列里面的任務全部完成sql = "#####"data = run_sql(sql)for i in data:solution_id,problem_id,user_id,contest_id,pro_lang = itask = {"solution_id":solution_id,"problem_id":problem_id,"contest_id":contest_id,"user_id":user_id,"pro_lang":pro_lang,}q.put(task)time.sleep(0.5) #每次掃面完后等待0.5秒，減少CPU占有率

消費者如何實現？

基本是按照上面說的來的，先獲取任務，然后處理任務，最后標記任務處理完成。

def worker():'''工作線程，循環掃描隊列，獲得評判任務并執行'''while True:#獲取任務，如果隊列為空則阻塞task = q.get() #獲取題目信息solution_id = task['solution_id']problem_id = task['problem_id']language = task['pro_lang']user_id = task['user_id']# 評測result=run(problem_id,solution_id,language,data_count,user_id)#將結果寫入數據庫dblock.acquire()update_result(result) dblock.release()#標記一個任務完成q.task_done()

如何啟動多個評測線程？

def start_work_thread():'''開啟工作線程'''for i in range(config.count_thread):t = threading.Thread(target=worker)t.deamon = Truet.start()

這里要注意t.deamon=True，這句的作用是當主線程退出的時候，評測線程也一塊退出，不在后臺繼續執行。

消費者獲取任務后需要做什么處理？

因為代碼保存在數據庫，所以首先要將代碼從數據庫取出來，按文件類型命名后保存到相應的評判目錄下。然后在評判目錄下對代碼進行編譯，如果編譯錯誤則將錯誤信息保存到數據庫，返回編譯錯誤。編譯通過則運行程序，檢測程序執行時間和內存，評判程序執行結果。

如何編譯代碼？

根據不同的編程語言，選擇不同的編譯器。我的評測程序支持多種編程語言。編譯實際上就是調用外部編譯器對代碼進行編譯，我們需要獲取編譯信息，如果編譯錯誤，需要將錯誤信息保存到數據庫。

調用外部程序可以使用python的subprocess模塊，這個模塊非常強大，比os.system()什么的牛逼多了。里面有個Popen方法，執行外部程序。設置shell=True我們就能以shell方式去執行命令?？梢允褂胏wd指定工作目錄，獲取程序的外部輸出可以使用管道PIPE，調用communicate()方法可以可以獲取外部程序的輸出信息，也就是編譯錯誤信息。

可以根據編譯程序的返回值來判斷編譯是否成功，一般來說，返回值為0表示編譯成功。

有些語言，比如ruby和perl是解釋型語言，不提供編譯選項，因此在這里僅僅加上-c參數做簡單的代碼檢查。

python，lua，java等可以編譯成二進制文件然后解釋執行。

ACMer們著重看一下gcc和g++和pascal的編譯參數，以后寫程序可以以這個參數進行編譯，只要在本地編譯通過一般在服務器上編譯就不會出現編譯錯誤問題。

可能有些朋友會有疑問：為什么加這么多語言？正式ACM比賽只讓用C,C++和JAVA語言啊！對這個問題，我只想說，做為一個在線測評系統，不能僅僅局限在ACM上。如果能讓初學者用這個平臺來練習編程語言不是也很好？做ACM是有趣的，用一門新的語言去做ACM題目也是有趣的，快樂的去學習一門語言不是學得很快？我承認，有好多語言不太適合做ACM，因為ACM對時間和內存要求比較嚴格，好多解釋執行的語言可能占內存比較大，運行速度比較慢，只要抱著一種學習編程語言的心態去刷題就好了。此外，對于新興的go語言，我認為是非常適合用來做ACM的。牛逼的haskell語言也值得一學，描述高級數據結果也很方便。感興趣的可以試試。

我的評測程序是可以擴展的，如果想再加其他編程語言，只要知道編譯參數，知道如何執行，配置好編譯器和運行時環境，在評測程序里面加上就能編譯和評測。

def compile(solution_id,language):'''將程序編譯成可執行文件'''build_cmd = {"gcc" : "gcc main.c -o main -Wall -lm -O2 -std=c99 --static -DONLINE_JUDGE","g++" : "g++ main.cpp -O2 -Wall -lm --static -DONLINE_JUDGE -o main","java" : "javac Main.java","ruby" : "ruby -c main.rb","perl" : "perl -c main.pl","pascal" : 'fpc main.pas -O2 -Co -Ct -Ci',"go" : '/opt/golang/bin/go build -ldflags "-s -w" main.go',"lua" : 'luac -o main main.lua',"python2": 'python2 -m py_compile main.py',"python3": 'python3 -m py_compile main.py',"haskell": "ghc -o main main.hs",}p = subprocess.Popen(build_cmd[language],shell=True,cwd=dir_work,stdout=subprocess.PIPE,stderr=subprocess.PIPE)out,err = p.communicate()#獲取編譯錯誤信息if p.returncode == 0: #返回值為0,編譯成功return Truedblock.acquire()update_compile_info(solution_id,err+out) #編譯失敗,更新題目的編譯錯誤信息dblock.release()return False

用戶代碼在執行過程中是如何進行評判的（ACMer必看）？

前面說了，如果出現編譯錯誤(Compile Error)，是不會執行的。每個題目都有一個標準的時間和內存限制，例如時間1000ms，內存65536K，程序在執行的時候會實時檢查其花費時間和使用內存信息，如果出現超時和超內存將會分別返回Time Limit Exceeded和Memory Limit Exceeded錯誤信息，如果程序執行時出現錯誤，比如非法指針，數組越界等，將會返回Runtime Error信息。如果你的程序沒有出現上面的信息，說明程序順利執行結束了。接下來，就是對你的程序的輸出也就是運行結果進行檢查，如果你的執行結果和我們的標準答案完全一樣，則返回Accepted，也就說明你這個題目做對了。如果除去空格，換行，tab外完全相同，則說明你的代碼格式錯誤，將返回Presentation Error，如果你輸出的內容有一部分和標準答案完全一樣，但是還輸出了一些其他內容，則說明你多輸出了，這時候將返回Output Limit Exceeded錯誤信息，出現其他情況，就說明你的輸出結果和標準答案不一樣，就是Wrong Answer了。

總結一下錯誤的出現順序：

Compile Error?->?Memory Limit Exceeded?=?Time Limit Exceeded?=?Runtime Error?->?Wrong Answer?->?Output Limit Exceeded?->Presentation Error?->?Accepted

直接說難免有些空洞，做了張流程圖：

如果你得到了其他信息，比如System error，則說明服務器端可能出問題了，我們技術人員會想法解決。如果看到waiting，說明等待評測的代碼比較多，你需要稍作等待，直到代碼被評測。如果你得到了Judging結果，說明你的代碼正在評測，如果長時間一直是Judging，則說明評測程序在評測過程中可能出問題了，沒有評判出結果就停止了。技術人員會為你重判的。

希望ACMer們能根據上面的評測流程，在看到自己的評判結果的時候，能夠分析出你離AC還有多遠，以及如何改進你的代碼才能AC。

評判答案的那部分源碼：

def judge_result(problem_id,solution_id,data_num):'''對輸出數據進行評測'''currect_result = os.path.join(config.data_dir,str(problem_id),'data%s.out'%data_num)user_result = os.path.join(config.work_dir,str(solution_id),'out%s.txt'%data_num)try:curr = file(currect_result).read().replace('\r','').rstrip()#刪除\r,刪除行末的空格和換行user = file(user_result).read().replace('\r','').rstrip()except:return Falseif curr == user: #完全相同:ACreturn "Accepted"if curr.split() == user.split(): #除去空格,tab,換行相同:PEreturn "Presentation Error"if curr in user: #輸出多了return "Output limit"return "Wrong Answer" #其他WA

注意一下，代碼中有個replace('\r','')方法，它的作用就是將\r替換成空字符串。為什么要做這個替換呢？因為在windows下，文本的換行是"\r\n",而在Linux下是"\n"。因為不能確定測試數據來源與windows還是Linux，增加一個\r，就是增加一個字符，如果不刪除的話，兩個文本就是不一樣的，就會造成wrong answer結果?；蛟S你曾經遇到過在windows下用記事本打開一個純文本文件，格式全亂了，所有文本都在一行內，非常影響閱讀。你可以通過用寫字板打開來解決這個問題。據說"\r\n"來源于比較古老的打印機，每打印完一行，都要先“回車(\r)”，再“換行”(\n)。同樣一個C語言的printf("\n")函數，在windows下將生成"\r\n"，而在Linux下生成"\n"，因為評測程序為你自動處理了，因此你就不必關注這些細節的東西了。

評測程序是如何檢測你的程序的執行時間和內存的？

這個問題困擾了我好久，也查了好多資料。

用戶的程序要在服務器上執行，首先不能讓用戶的程序無限申請內存，否則容易造成死機現象，需要將程序的內存限制在題目規定的最大內存內。其次要限制用戶程序的執行時間，不能讓用戶的程序無限制運行。

一般解決方案是：在用戶的程序執行前，先做好資源限制，限制程序能使用的最大內存和CPU占用，當用戶的程序一旦超出限制就自動終止了。還有個比較重要的問題是如何獲取程序執行期間的最大內存占用率。用戶的代碼在執行前需要申請內存，執行期間還能動態申請和釋放內存，執行完畢釋放內存。程序執行時還有可能使用指針等底層操作，這無疑給檢測內存造成更大的困難。在windows下，程序執行結束后，可以調用系統函數獲取程序執行期間的最大內存，貌似在Linux下沒用現成的函數可以調用。

在Linux下，我們可以使用ps或top命令來獲取或監視在某個時刻應用程序的內存占用率，要獲取程序的最大執行內存，就要不斷去檢測，不斷去比較，直到程序結束，獲取最大值就是用戶程序執行期間的最大內存。根據這個設想，我寫了一個程序來實現這個想法：

def get_max_mem(pid):'''獲取進程號為pid的程序的最大內存'''glan = psutil.Process(pid)max = 0while True:try:rss,vms = glan.get_memory_info()if rss > max:max = rssexcept:print "max rss = %s"%maxreturn maxdef run(problem_id,solution_id,language,data_count,user_id):'''獲取程序執行時間和內存'''time_limit = (time_limit+10)/1000.0mem_limit = mem_limit * 1024max_rss = 0max_vms = 0total_time = 0for i in range(data_count):'''依次測試各組測試數據'''args = shlex.split(cmd)p = subprocess.Popen(args,env={"PATH":"/nonexistent"},cwd=work_dir,stdout=output_data,stdin=input_data,stderr=run_err_data)start = time.time()pid = p.pidglan = psutil.Process(pid)while True:time_to_now = time.time()-start + total_timeif psutil.pid_exists(pid) is False:program_info['take_time'] = time_to_now*1000program_info['take_memory'] = max_rss/1024.0program_info['result'] = result_code["Runtime Error"]return program_inforss,vms = glan.get_memory_info()if p.poll() == 0:end = time.time()breakif max_rss < rss:max_rss = rssprint 'max_rss=%s'%max_rssif max_vms < vms:max_vms = vmsif time_to_now > time_limit:program_info['take_time'] = time_to_now*1000program_info['take_memory'] = max_rss/1024.0program_info['result'] = result_code["Time Limit Exceeded"]glan.terminate()return program_infoif max_rss > mem_limit:program_info['take_time'] = time_to_now*1000program_info['take_memory'] = max_rss/1024.0program_info['result'] =result_code["Memory Limit Exceeded"]glan.terminate()return program_infologging.debug("max_rss = %s"%max_rss) # print "max_rss=",max_rsslogging.debug("max_vms = %s"%max_vms) # logging.debug("take time = %s"%(end - start))program_info['take_time'] = total_time*1000program_info['take_memory'] = max_rss/1024.0program_info['result'] = result_code[program_info['result']]return program_info

上面的程序用到了一些進程控制的一些知識，簡單說明一下。

程序的基本原理是：先用多進程庫subprocess的Popen函數去創建一個新的進程，獲取其進程號(pid)，然后用主線程去監測這個進程，主要是監測實時的內存信息。通過比較函數，獲得程序的執行期間的最大內存。什么時候停止呢？有四種情況：

程序運行完正常結束。這個我們可以通過 subprocess.Popen里面的poll方法來檢測，如果為0,則代表程序正常結束。

程序執行時間超過了規定的最大執行時間，用terminate方法強制程序終止

程序執行內存超過了規定的最大內存，terminate強制終止。

程序執行期間出現錯誤，異常退出了，這時候我們通過檢查這個pid的時候就會發現不存在。

還有一點是值得注意的：上文提到在編譯程序的時候，調用subprocess.Popen，是通過shell方式調用的，但是這里沒有使用這種方式，為什么呢？這兩種方式有什么區別？最大的區別就是返回的進程的pid，以shell方式執行，返回的pid并不是子進程的真正pid，而是shell的pid，當我們去檢查這個pid的內存使用率的時候得到的并不是用戶進程的pid！不通過shell方式去調用外部程序則是直接返回真正程序的pid，而不用去調用shell。官方文檔是這么說的：if shell is true, the specified command will be executed through the shell.

如果不用shell方式去執行命令的話，傳遞參數的時候就不能直接將字符串傳遞過去，例如ls -l這個命令ls和參數-l，當shell=False時，需要將命令和參數變成一個列表['ls','-l']傳遞過去。當參數比較復雜的時候，將命令分隔成列表就比較麻煩，幸好python為我們提供了shlex模塊，里面的split方法就是專門用來做這個的，官方文檔是這么說的：Split the string s using shell-like syntax.，最好不要自己去轉換，有可能會導致錯誤而不能執行。

上面的檢測內存和時間的方法靠譜嗎？

不靠譜，相當不靠譜！（當然學學python如何對進程控制也沒壞處哈！）為什么呢？有點經驗的都知道，C語言的運行效率比python高啊！執行速度比python快！這會造成什么后果？一個簡單的hello world小程序，C語言“瞬間”就執行完了，還沒等我的python程序開始檢測就執行完了，我的評測程序什么都沒檢測到，然后返回0，再小的程序內存也不可能是0啊！在OJ上顯示內存為0相當不科學！

那怎么辦？能不能讓C語言的程序執行速度慢下來？CPU的頻率是固定的，我們沒法專門是一個程序的占用的CPU頻率降低，在windows下倒是有變速齒輪這款軟件可以讓軟件執行速度變慢，不知道在Linux下有沒有。還有沒有其他辦法？聰明的你也許會想到gdb調試，我也曾經想用這種方法，用gdb調試可以使程序單步執行，然后程序執行一步，我檢測一次，多好，多完美！研究了好一陣子gdb，發現并不是那么簡單。首先，我們以前用gdb調試C/C++的時候，在編譯的時候要加上一個-g參數，然后執行的時候可以單步執行，此外，還有設置斷點什么的。有幾個問題：

其他語言如何調試？比如java，解釋執行的，直接調試java虛擬機嗎？

如何通過python對gdb進行控制？還有獲取執行狀態等信息。

這些問題都不是很好解決。

那上面的方法測量的時間準嗎？不準！為什么？我們說的程序的執行時間，嚴格來說是占用CPU的時間。因為CPU采用的是輪轉時間片機制，在某個時刻，CPU在忙別的程序。上面的方法用程序執行的結束時間減去開始時間，得到的時間一定比它實際執行的時間要大。如果程序執行速度過快，不到1毫秒，評測程序也不能檢測出來，直接返回0了。

如何解決時間和內存的測量問題？

后來在v2ex上發了一個帖子提問，得到高人指點，使用lorun。lorun是github上的一個開源項目，項目地址：https://github.com/lodevil/Lo-runner，這是用C語言寫的一個python擴展模塊，讓程序在一個類似沙盒的環境下執行，然后精準的獲取程序的執行時間和內存，還能對程序進行限制，限制程序的系統調用。原文是這么說的：We use this python-c library to run program in a sandbox-like environment. With it, we can accurately known the resource using of the program and limit its resource using including system-call interrupt.。安裝使用都非常方便。我主要用它來測量執行時間和內存，后期代碼檢查還是用我的程序。

感興趣的同學可以將這個模塊下載下來，作為本地測試使用，可以預先生成一些測試數據，然后測量你的代碼的執行時間和內存，比對你的答案是否正確。

不同編程語言時間內存如何限定？

一般來說，假設C/C++語言的標程是時間限制：1000ms,內存限制32768K，那么java的時間和內存限制都是標準限制的2倍，即2000ms，65536K。

由于后來我再OJ增加了好多其他語言，我是這樣規定的：編譯型的語言和速度較快的解釋型語言的時間和內存限制和C/C++是一樣的，這樣的語言包括：C、C++、go、haskell、lua、pascal，其他速度稍慢的解釋執行的語言和JAVA是一樣的，包括：java、python2、python3、ruby、perl。畢竟使用除C，C++，JAVA外的語言的朋友畢竟是少數，如果限制太嚴格的話可以根據實際情況對其他編程語言放寬限制。

多組測試數據的題目時間和內存如何測算？

多組測試數據是一組一組依次執行，時間和內存取各組的最大值，一旦某組測試數據時間和內存超出限制，則終止代碼執行，返回超時或超內存錯誤信息。

如何防止惡意代碼破壞系統？

我們可以使用以下技術來對用戶程序進行限制：

lorun模塊本身就有限制，防止外部調用

降低程序的執行權限。在Linux下，目錄權限一般為755，也就是說，如果換成一個別的用戶，只要不是所有者，就沒有修改和刪除的權限。python里面可以使用os.setuid(int(os.popen("id -u %s"%"nobody").read()))來將程序以nobody用戶的身份執行

設置沙盒環境，將用戶執行環境和外部隔離。Linux下的chroot命令可以實現，python也有相關方法，但是需要提前搭建沙盒環境。用jailkit可以快速構建沙盒環境，感興趣的朋友可以看看

使用ACL訪問控制列表進行詳細控制，讓nobody用戶只有對某個文件夾的讀寫權限，其他文件夾禁止訪問

評判機和服務器分離，找單獨的機器，只負責評判

對用戶提交的代碼預先檢查，發現惡意代碼直接返回Runtime Error

禁止評測服務器連接外網，或者通過防火墻限制網絡訪問

如何啟動和停止評測程序以及如何記錄錯誤日志？

啟動很簡單，只要用python執行protect.py就行了。

如果需要后臺執行的話可以使用Linux下的nohup命令。

為了防止同時開啟多個評測程序，需要將以前開啟的評測程序關閉。

為了方便啟動，我寫了這樣一個啟動腳本：

#!/bin/bash sudo kill `ps aux | egrep "^nobody .*? protect.py" | cut -d " " -f4` sudo nohup python protect.py &

第一條命令就是殺死多余的評測進程，第二條是啟動評測程序。

在程序里面使用了logging模塊，是專門用來記錄日志的，這么模塊很好用，也很強大，可定制性很強，對我們分析程序執行狀態有很大幫助。下面是一些示例：

2013-03-07 18:19:04,855 --- 321880 result 1 2013-03-07 18:19:04,857 --- judging 321882 2013-03-07 18:19:04,881 --- judging 321883 2013-03-07 18:19:04,899 --- judging 321884 2013-03-07 18:19:04,924 --- 321867 result 1 2013-03-07 18:19:04,950 --- 321883 result 7 2013-03-07 18:19:04,973 --- 321881 result 1 2013-03-07 18:19:05,007 --- 321884 result 1 2013-03-07 18:19:05,012 --- 321882 result 4 2013-03-07 18:19:05,148 --- judging 321885 2013-03-07 18:19:05,267 --- judging 321886 2013-03-07 18:19:05,297 --- judging 321887 2013-03-07 18:19:05,356 --- judging 321888 2013-03-07 18:19:05,386 --- judging 321889 2013-03-07 18:19:05,485 --- 321885 result 1

python的配置文件如何編寫？

最簡單有效的方式就是建立一個config.py文件，里面寫上配置的內容，就像下面一樣：

#!/usr/bin/env python #coding=utf-8 #開啟評測線程數目 count_thread = 4 #評測程序隊列容量 queue_size = 4 #數據庫地址 db_host = "localhost" #數據庫用戶名 db_user = "user" #數據庫密碼 db_password = "password" #數據庫名字 db_name = "db_name"

使用的時候只需要將這個文件導入，然后直接config.queue_size就可以訪問配置文件里面的內容，很方便的。

評測程序的評測效率如何？

自從服務器啟用新的評測程序之后，已經經歷了兩次大的比賽和幾次大型考試，在幾百個人的比賽和考試中，評測基本沒用等待現象，用戶提交的代碼基本都能立即評測出來。大體測了一下，單服務器平均每秒能判6個題目左右（包括獲取代碼，編譯，運行，檢測，數據庫寫入結果等流程）。評測程序目前已經穩定運行了幾個月，沒有出現大的問題，應該說技術比較成熟了。

評測程序還能繼續改進嗎？

當時腦子估計是被驢踢了，居然使用多線程來評測！有經驗的python程序猿都知道，python有個全局GIL鎖，這個鎖會將python的多個線程序列化，在一個時刻只允許一個線程執行，無論你的機器有多少個CPU，只能使用一個！這就明顯影響評測速度！如果換成多進程方式，一個評測進程占用一個CPU核心，評測速度將會是幾倍幾十倍的性能提升！到時候弄個上千人的比賽估計問題也不大，最起碼評測速度能保證。

此外，還可以構建一個分布式的評測服務器集群，大體設想了一下可以這樣實現：

首先，可以選一臺服務器A專門和數據庫交互，包括從數據庫中獲取評測任務以及評測結束將結果寫回數據庫。然后選擇N臺普通計算機作為評測機，評測機只和數據庫A打交道，也就是從服務器A獲取任務，在普通機器上評測，評測完后將結果反饋到服務器A，再由A將結果寫入到數據庫。服務器A在這里就充當一個任務管理和分配的角色，協調各個評測機去評測。這樣可以減少對數據庫的操作，評測機就不用去一遍一遍掃數據庫了。評測的速度和安全性可以得到進一步提升。

其他

附在線簡歷一份：http://ma6174.github.io/#show/me，準備實習，希望大牛指點
項目地址：https://github.com/ma6174/acmjudger
原文鏈接：http://www.cnblogs.com/ma6174/archive/2013/05/12/3074034.html
上面的程序和方法僅供學習和研究用，嚴禁任何非法用途
本人學識有限，如有錯誤歡迎批評指正

總結

以上是生活随笔為你收集整理的ACM在线测评系统评测程序设计与python实现的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：使用Git工具下载android源码--
下一篇： python 抓取网页（一）