當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

学习记录1-python图片分割transforms方法

發(fā)布時(shí)間：2024/4/17 python 36 豆豆

生活随笔收集整理的這篇文章主要介紹了学习记录1-python图片分割transforms方法小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

python 圖片分割

import os from PIL import Image Image.MAX_IMAGE_PIXELS = Nonedef splitimage(src, rownum, colnum, dstpath):img = Image.open(src)w, h = img.sizeif rownum <= h and colnum <= w:print('Original image info: %sx%s, %s, %s' % (w, h, img.format, img.mode))print('開(kāi)始處理圖片切割, 請(qǐng)稍候...')s = os.path.split(src)if dstpath == '':dstpath = s[0]fn = s[1].split('.')basename = fn[0]ext = fn[-1]num = 0rowheight = h // rownumcolwidth = w // colnumfor r in range(rownum):for c in range(colnum):box = (c * colwidth, r * rowheight, (c + 1) * colwidth, (r + 1) * rowheight)img.crop(box).save(os.path.join(dstpath, basename + '_' + str(num) + '.' + ext), ext)num = num + 1print('圖片切割完畢，共生成 %s 張小圖片。' % num)else:print('不合法的行列切割參數(shù)！')src = input('請(qǐng)輸入圖片文件路徑：') if os.path.isfile(src):dstpath = input('請(qǐng)輸入圖片輸出目錄（不輸入路徑則表示使用源圖片所在目錄）：')if (dstpath == '') or os.path.exists(dstpath):row = int(input('請(qǐng)輸入切割行數(shù)：'))col = int(input('請(qǐng)輸入切割列數(shù)：'))if row > 0 and col > 0:splitimage(src, row, col, dstpath)else:print('無(wú)效的行列切割參數(shù)！')else:print('圖片輸出目錄 %s 不存在！' % dstpath) else:print('圖片文件 %s 不存在！' % src)

transforms方法,常用的數(shù)據(jù)預(yù)處理方法，提高泛化能力

1.resize:transforms.Resize
功能：重置圖像分辨率
參數(shù)：
size:- If size is an int, if height > width, then image will be rescaled to (size * height / width, size)，所以建議size設(shè)定為h*w
interpolation-插值方法選擇
2.中心裁剪：transforms.CenterCrop
功能：依據(jù)給定的size從中心裁剪
參數(shù)：
size-(sequence or int ),若為sequence，則為（和，w）,若為int，則（size,size）
3.transforms.ToTensor
功能：ToTensor()將shape為(H, W, C)的nump.ndarray或img轉(zhuǎn)為shape為(C, H, W)的tensor，其將每一個(gè)數(shù)值歸一化到[0,1]，其歸一化方法比較簡(jiǎn)單，直接除以255即可。
補(bǔ)充理解：
什么是張量：
通俗一點(diǎn)講：張量是對(duì)標(biāo)量，矢量，矩陣的推廣。張量的表達(dá)看起來(lái)像是數(shù)組，其實(shí)每個(gè)值是在對(duì)應(yīng)空間上的分量的大小。基向量和分量一起形成了張量的表達(dá)，他在物理學(xué)上的優(yōu)點(diǎn)是，當(dāng)基向量發(fā)生變化的時(shí)候（坐標(biāo)系發(fā)生變化或者說(shuō)是觀察方向發(fā)生了變化），對(duì)應(yīng)的分量也會(huì)發(fā)生變化，但整個(gè)張量卻能保持不變
下圖是對(duì)張量從直觀上給出的示意。一階張量可以理解成一個(gè)向量，二階張量可以理解成矩陣，三階張量可以理解成立方體，四階張量可以理解成立方體組成的一個(gè)向量，五階張量可以理解成立方體組成的矩陣，依次類推。

什么是RANK
rank就是上文所說(shuō)的階。他是指這個(gè)張量擁有的基底向量的數(shù)量，也就是他的方向的數(shù)量。從上圖中其實(shí)能明白為什么是一階，二階，三階。
在實(shí)際操作中，可以理解成 [ 的深度。例如：

rank=1: [0,1,2]

rank=2: [[0,1],[2,3]]

rank=3: [[[0,1],[2,3]],[[4,5],[6,7]]]
什么是shape
shape是形狀，他指明每一層有多少個(gè)元素。比如[2,3,4]是指第一層2個(gè)元素，第二層3個(gè)元素，第三層4個(gè)元素，通過(guò)這個(gè)我們就可以知道這個(gè)張量一共有2 × 3 × 4=24 個(gè)元素。

4.數(shù)據(jù)歸一化處理transforms.Normalize
功能：逐channel的圖像進(jìn)行標(biāo)注化（均值變?yōu)?，標(biāo)準(zhǔn)差變?yōu)?），可以加快模型的收斂

總結(jié)

以上是生活随笔為你收集整理的学习记录1-python图片分割transforms方法的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： HLS Pargmas(2) inter
下一篇：学习记录2-Python中的注册器模块