當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

2016年秋-网络程序设计学习总结

發(fā)布時(shí)間：2024/5/14 编程问答 40 豆豆

生活随笔收集整理的這篇文章主要介紹了 2016年秋-网络程序设计学习总结小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

對(duì)血常規(guī)檢驗(yàn)報(bào)告的OCR識(shí)別、深度學(xué)習(xí)與分析

項(xiàng)目背景

?????? 2016是人工智能爆發(fā)的一年，各種層出不窮的新技術(shù)、新概念讓人眼花繚亂。醫(yī)療保健領(lǐng)域中的大數(shù)據(jù)在改善患者護(hù)理以及最終實(shí)現(xiàn)合理成本方面具有巨大的潛力。大數(shù)據(jù)時(shí)代的出現(xiàn)給統(tǒng)計(jì)機(jī)器學(xué)習(xí)提供了更多的機(jī)遇，因?yàn)楹Ａ康臄?shù)據(jù)更加需要統(tǒng)計(jì)、抽樣的方法。

????? 本學(xué)習(xí)孟寧老師的網(wǎng)絡(luò)程序設(shè)計(jì)課程內(nèi)容為基于神經(jīng)網(wǎng)絡(luò)的醫(yī)療輔助診斷專(zhuān)家系統(tǒng)設(shè)計(jì)，我和同學(xué)們都滿(mǎn)懷興趣和激情加入了課程的學(xué)習(xí)。同學(xué)們?cè)诜窒碛懻撝?#xff0c;對(duì)機(jī)器學(xué)習(xí)的相關(guān)算法、圖片和數(shù)據(jù)的處理方法都進(jìn)行了學(xué)習(xí)和了解，這樣的學(xué)習(xí)方式是高效且充滿(mǎn)意義的。同時(shí)，對(duì)課程項(xiàng)目?jī)?nèi)容也不斷地充實(shí)、完善，在此進(jìn)行回顧和總結(jié)。

項(xiàng)目目標(biāo)

?????? 能夠?qū)⑹謾C(jī)拍攝的血常規(guī)檢驗(yàn)報(bào)告圖片預(yù)處理，并且實(shí)現(xiàn)圖像識(shí)別，將檢驗(yàn)結(jié)果輸入到神經(jīng)網(wǎng)絡(luò)，進(jìn)行性別和年齡的預(yù)測(cè)。對(duì)項(xiàng)目進(jìn)行展望，可以通過(guò)更加豐富的檢驗(yàn)數(shù)據(jù)，基于更加完善的深度學(xué)習(xí)模型，對(duì)對(duì)象的健康狀況給出預(yù)測(cè)。

課程中的貢獻(xiàn)與學(xué)習(xí)成果

課程貢獻(xiàn)：

與同學(xué)們分享了機(jī)器學(xué)習(xí)中的決策樹(shù)算法，并進(jìn)行了具體應(yīng)用的演示。

學(xué)習(xí)成果：

（1）通過(guò)參與同學(xué)們的分享和討論，對(duì)機(jī)器學(xué)習(xí)的方法有了基礎(chǔ)地學(xué)習(xí)和認(rèn)識(shí)。學(xué)習(xí)了常見(jiàn)的機(jī)器學(xué)習(xí)算法（SVM、隨機(jī)森林、決策樹(shù)、感知機(jī)、Adaboost等）的原理和特性。感受到了opencv在圖像預(yù)處理方面的強(qiáng)大功能，學(xué)習(xí)了本項(xiàng)目中對(duì)圖片進(jìn)行處理的方法原理，掌握了利用ocr方法進(jìn)行圖像文本識(shí)別的方法。

（2）在對(duì)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)中，掌握了BP神經(jīng)網(wǎng)絡(luò)的算法原理。通過(guò)同學(xué)們的分享交流，對(duì)深度學(xué)習(xí)的常用框架caffe、tensorflow、MxNet等有了更進(jìn)一步的了解。其中，對(duì)caffe框架進(jìn)行了較為深入的研究，受到啟發(fā)，在工程實(shí)踐項(xiàng)目中采用caffe實(shí)現(xiàn)了圖像多目標(biāo)檢測(cè)任務(wù)。

（3）在認(rèn)真聆聽(tīng)同學(xué)們對(duì)各種算法的介紹中，開(kāi)拓了眼界，能夠主動(dòng)思考比較各類(lèi)算法和框架的有點(diǎn)與不足，考慮何種算法更適合應(yīng)用在何種場(chǎng)合，產(chǎn)生了對(duì)機(jī)器學(xué)習(xí)的濃厚興趣。

（4）在學(xué)習(xí)中，能夠與老師和同學(xué)們步調(diào)保持一致，逐步把項(xiàng)目完善。最終能夠成功運(yùn)行項(xiàng)目Demo，并在同學(xué)們的指導(dǎo)和幫助下，能夠理解項(xiàng)目代碼。

項(xiàng)目部署和Demo演示

項(xiàng)目地址：對(duì)血常規(guī)檢驗(yàn)報(bào)告的OCR識(shí)別、深度學(xué)習(xí)與分析

安裝numpy

$ sudo apt-get install Python-numpy

安裝Opencv

$ sudo apt-get install python-opencv

安裝pytesseract

$ sudo apt-get install tesseract-ocr

$ sudo pip install pytesseract

$ sudo apt-get install python-tk

$ sudo pip install pillow

安裝Flask框架

$ sudo pip install Flask

安裝mongodb

$ sudo apt-get install mongodb # 如果提示no modulename mongodb, 先執(zhí)行sudo apt-get update

$ sudo service mongodb started

$ sudo pip install pymongo

安裝Tensorflow

$ sudo apt-get install python-numpy

$ sudo apt-get install python-imaging

$ pip install --upgradehttps://storage.googleapis.com/tensorflow/Linux/cpu/tensorflow-0.12.0rc0-cp27-none-linux_x86_64.whl

運(yùn)行

$ git clone https://git.coding.net/mengning/np2016.git

$ cd np2016

$ cd?BloodTestReportOCR

$ python view.py # upload圖像,在瀏覽器打開(kāi)http://localhost:8080

訪(fǎng)問(wèn) localhost:8080

選擇報(bào)告單圖片上傳

點(diǎn)擊生成報(bào)告

點(diǎn)擊predict

設(shè)計(jì)分析

1.Web模塊設(shè)計(jì)

采用flask框架，json部分用來(lái)傳輸數(shù)據(jù)，index.html為網(wǎng)頁(yè)編輯

app = Flask(__name__, static_url_path="") # 讀取配置文件 app.config.from_object('config') # 連接數(shù)據(jù)庫(kù)，并獲取數(shù)據(jù)庫(kù)對(duì)象 db = MongoClient(app.config['DB_HOST'], app.config['DB_PORT']).test # 將矯正后圖片與圖片識(shí)別結(jié)果（JSON）存入數(shù)據(jù)庫(kù) def save_file(file_str, f, report_data):content = StringIO(file_str)try:mime = Image.open(content).format.lower()print 'content of mime is：', mimeif mime not in app.config['ALLOWED_EXTENSIONS']:raise IOError()except IOError:abort(400)c = dict(report_data=report_data, content=bson.binary.Binary(content.getvalue()), filename=secure_filename(f.name),mime=mime)db.files.save(c)return c['_id'], c['filename'] @app.route('/', methods=['GET', 'POST']) def index():return redirect('/index.html')
2.opencv圖片預(yù)處理,將檢驗(yàn)報(bào)告圖片進(jìn)行預(yù)處理并切割，為ocr識(shí)別做準(zhǔn)備

import cv2 def digitsimg(src):#灰度化img_gray = cv2.cvtColor(src,cv2.COLOR_BGR2GRAY)#Otsu thresholding 二值化ret,result= cv2.threshold(img_gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)#腐蝕去除一些小的點(diǎn)kernel = cv2.getStructuringElement(cv2.MORPH_CROSS,(3,2))eroded = cv2.erode(result,kernel)#將結(jié)果放大便于識(shí)別result = cv2.resize(result,(128,128),interpolation=cv2.INTER_CUBIC)#腐蝕去除放大后的一些小的點(diǎn)eroded = cv2.erode(result,kernel)#膨脹使數(shù)字更飽滿(mǎn)result = cv2.dilate(eroded,kernel)#直方圖均衡化使圖像更清晰cv2.equalizeHist(result)#中值濾波去除噪點(diǎn)result = cv2.medianBlur(result,5)return result
3.perspect函數(shù)用于透視image，他會(huì)緩存一個(gè)透視后的opencv numpy矩陣，并返回該矩陣

def perspect(self, param=default):#載入?yún)?shù)gb_param = param[0] #必須是奇數(shù)canny_param_upper = param[1]canny_param_lower = param[2]ref_lenth_multiplier = param[3]ref_close_multiplier = param[4]kernel = cv2.getStructuringElement(cv2.MORPH_RECT,(3, 3))# 載入圖像，灰度化，開(kāi)閉運(yùn)算，描繪邊緣img_sp = self.img.shaperef_lenth = img_sp[0] * img_sp[1] * ref_lenth_multiplierimg_gray = cv2.cvtColor(self.img, cv2.COLOR_BGR2GRAY)img_gb = cv2.GaussianBlur(img_gray, (gb_param, gb_param), 0)closed = cv2.morphologyEx(img_gb, cv2.MORPH_CLOSE, kernel)opened = cv2.morphologyEx(closed, cv2.MORPH_OPEN, kernel)edges = cv2.Canny(opened, canny_param_lower , canny_param_upper)# 調(diào)用findContours提取輪廓contours, hierarchy = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
4. filter函數(shù)返回img經(jīng)過(guò)透視過(guò)后的PIL格式的Image對(duì)象，如果緩存中有PerspectivImg則直接使用，沒(méi)有先進(jìn)行透視過(guò)濾失敗則返回None

def filter(self, param=default):if self.PerspectiveImg is None:self.PerspectivImg = self.perspect(param)if self.PerspectiveImg is None:return Noneimg = Image.open(self.output_path + 'region.jpg')if not(classifier.isReport(img)):print "it is not a is Report!",classifier.isReport(self.PerspectiveImg)return Nonetry:Image.fromarray(self.PerspectivImg)except Exception:return Nonereturn Image.fromarray(self.PerspectivImg)
5. autocut函數(shù)用于剪切ImageFilter中的img成員，剪切之后臨時(shí)圖片保存在out_path，如果剪切失敗，返回-1，成功返回0

def autocut(self, num, param=default):if self.PerspectiveImg is None:self.PerspectivImg = self.filter(param)# 仍然是空，說(shuō)明不是報(bào)告if self.PerspectiveImg is None:return -1#輸出年齡img_age = self.PerspectiveImg[15 : 70, 585 : 690]cv2.imwrite(self.output_path + 'age.jpg', img_age)#輸出性別img_gender = self.PerspectiveImg[15 : 58, 365 : 420]cv2.imwrite(self.output_path + 'gender.jpg', img_gender)#輸出時(shí)間img_time = self.PerspectiveImg[722 : 760, 430 : 630]cv2.imwrite(self.output_path + 'time.jpg', img_time)#轉(zhuǎn)換后的圖分辨率是已知的，所以直接從這個(gè)點(diǎn)開(kāi)始讀數(shù)據(jù)就可以了startpoint = [199, 132]vertical_lenth = 37lateral_lenth = 80
? 6.ocr函數(shù)用于對(duì)img進(jìn)行ocr識(shí)別，他會(huì)先進(jìn)行剪切，之后進(jìn)一步做ocr識(shí)別，返回一個(gè)json對(duì)象如果剪切失敗，則返回None

def ocr(self, num):digtitsresult = []chiresult = []# 不是報(bào)告if self.autocut(num) == -1:return None# 識(shí)別def image_to_string(image, flag=True):if flag:text = pytesseract.image_to_string(Image.fromarray(image), config='-psm 7 digits')else:text = pytesseract.image_to_string(Image.fromarray(image), lang='chi_sim', config=' -psm 7 Bloodtest')return text# 讀取圖片def read(url):image = cv2.imread(url)return image# load json examplewith open('bloodtestdata.json') as json_file:data = json.load(json_file)# 識(shí)別檢測(cè)項(xiàng)目編號(hào)及數(shù)字for i in range(num):item = read('temp_pics/p' + str(i) + '.jpg')item_num = classifier.getItemNum(item)image = read('temp_pics/data' + str(i) + '.jpg')image = imgproc.digitsimg(image)digtitstr = image_to_string(image)digtitstr = digtitstr.replace(" ", '')digtitstr = digtitstr.replace("-", '')digtitstr = digtitstr.strip(".")data['bloodtest'][item_num]['value'] = digtitstrjson_data = json.dumps(data,ensure_ascii=False,indent=4)return json_data

切割后的數(shù)據(jù)：

利用TensorFlow框架進(jìn)行模型訓(xùn)練和預(yù)測(cè)：

模型定義（以年齡屬性為例）

??? x_sex = tf.placeholder("float", [None, n_input])y_sex = tf.placeholder("float", [None, n_classes_sex])def multilayer_perceptron_sex(x_sex, weights_sex, biases_sex):# Hidden layer with RELU activationlayer_1 = tf.add(tf.matmul(x_sex, weights_sex['h1']), biases_sex['b1'])layer_1 = tf.nn.relu(layer_1)# Hidden layer with RELU activationlayer_2 = tf.add(tf.matmul(layer_1, weights_sex['h2']), biases_sex['b2'])layer_2 = tf.nn.relu(layer_2)# Output layer with linear activationout_layer = tf.matmul(layer_2, weights_sex['out']) + biases_sex['out']return out_layerweights_sex = {'h1': tf.Variable(tf.random_normal([n_input, n_hidden_1_sex])),'h2': tf.Variable(tf.random_normal([n_hidden_1_sex, n_hidden_2_sex])),'out': tf.Variable(tf.random_normal([n_hidden_2_sex, n_classes_sex]))}biases_sex = {'b1': tf.Variable(tf.random_normal([n_hidden_1_sex])),'b2': tf.Variable(tf.random_normal([n_hidden_2_sex])),'out': tf.Variable(tf.random_normal([n_classes_sex]))}pred_sex = multilayer_perceptron_sex(x_sex, weights_sex, biases_sex)
模型訓(xùn)練

# 激活計(jì)算圖 sess.run(init_op) # 啟動(dòng)隊(duì)列 threads = tf.train.start_queue_runners(sess=sess) # 迭代次數(shù) = 10000 for i in range(10000):# batchimage, label = sess.run([img_batch, label_batch])# 輸出局部正確率if i % 100 == 0:train_accuracy = accuracy.eval(feed_dict={x: image, y_:dense_to_one_hot(label)})print("step %d, training accuracy %g" % (i, train_accuracy))result = sess.run(merged,feed_dict={x:image,y_:dense_to_one_hot(label)})writer.add_summary(result,i)train_step.run(feed_dict={x: image, y_: dense_to_one_hot(label)}) # 加載測(cè)試集 test_img, test_label = sess.run([test_img_batch, test_label_batch]) # 輸出整體正確率 print("test accuracy %g" % accuracy.eval(feed_dict={x: test_img, y_: dense_to_one_hot(test_label)})) # 保存模型 save_path = saver.save(sess, cwd + "/ckpt_sex/sex.ckpt", write_meta_graph=None) print("Model saved in file: %s" % save_path)

訓(xùn)練后產(chǎn)生模型文件model.ckpt.data-00000-of-00001和model.ckpt.index

調(diào)用訓(xùn)練好的模型進(jìn)行預(yù)測(cè)

saver.restore(sess, "./model.ckpt") print ("load model success!") p_sex = sess.run(pred_sex, feed_dict={x_sex: data_predict}) p_age = sess.run(pred_age, feed_dict={x_age: data_predict})

收獲與感悟

??????? 在這門(mén)課的學(xué)習(xí)過(guò)程中，雖然對(duì)項(xiàng)目所涉及到的工具和方法還沒(méi)有達(dá)到精通的程度，但是收獲是巨大的。

??????? 首先，在與同學(xué)們的分享交流中，讓我體會(huì)到了分享的快樂(lè)。在課程的開(kāi)始階段，我與同學(xué)們分享了我對(duì)機(jī)器學(xué)習(xí)算法中決策樹(shù)的理解和應(yīng)用，在分享準(zhǔn)備過(guò)程中也加深了我對(duì)知識(shí)的掌握程度。在其他同學(xué)分享知識(shí)和項(xiàng)目進(jìn)展的過(guò)程中，也讓我收獲了之前沒(méi)有涉及到的方法，對(duì)于我在項(xiàng)目中遇到的疑問(wèn)也能夠得到很好解答。這樣的學(xué)習(xí)方式比自己閉門(mén)造車(chē)高效許多。

??????? 其次，項(xiàng)目中基于opencv對(duì)圖片預(yù)處理的過(guò)程令我感到很神奇，這是之前從未接觸到的，不斷地去了解新方法、新技術(shù)為將來(lái)的學(xué)習(xí)和開(kāi)發(fā)提供了新的思路。

??????? 最重要的是，在課程學(xué)習(xí)中接觸到了機(jī)器學(xué)習(xí)這個(gè)領(lǐng)域，在學(xué)習(xí)中收獲了很多新的思路和方法，這也指導(dǎo)我在工程實(shí)踐項(xiàng)目中取得突破和進(jìn)步。使我認(rèn)識(shí)到，機(jī)器學(xué)習(xí)是未來(lái)幾年應(yīng)用比較廣泛的方法，也激起了我在這一領(lǐng)域深入研究的興趣。計(jì)劃利用寒假期間，從算法原理到代碼實(shí)現(xiàn)對(duì)機(jī)器學(xué)習(xí)進(jìn)行深入學(xué)習(xí)。

總結(jié)

以上是生活随笔為你收集整理的2016年秋-网络程序设计学习总结的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： anaconda离线环境迁移（舍弃繁文缛
下一篇： Unity：实现UI上下翻动效果