学习记录1-python图片分割transforms方法
python 圖片分割
import os from PIL import Image Image.MAX_IMAGE_PIXELS = Nonedef splitimage(src, rownum, colnum, dstpath):img = Image.open(src)w, h = img.sizeif rownum <= h and colnum <= w:print('Original image info: %sx%s, %s, %s' % (w, h, img.format, img.mode))print('開(kāi)始處理圖片切割, 請(qǐng)稍候...')s = os.path.split(src)if dstpath == '':dstpath = s[0]fn = s[1].split('.')basename = fn[0]ext = fn[-1]num = 0rowheight = h // rownumcolwidth = w // colnumfor r in range(rownum):for c in range(colnum):box = (c * colwidth, r * rowheight, (c + 1) * colwidth, (r + 1) * rowheight)img.crop(box).save(os.path.join(dstpath, basename + '_' + str(num) + '.' + ext), ext)num = num + 1print('圖片切割完畢,共生成 %s 張小圖片。' % num)else:print('不合法的行列切割參數(shù)!')src = input('請(qǐng)輸入圖片文件路徑:') if os.path.isfile(src):dstpath = input('請(qǐng)輸入圖片輸出目錄(不輸入路徑則表示使用源圖片所在目錄):')if (dstpath == '') or os.path.exists(dstpath):row = int(input('請(qǐng)輸入切割行數(shù):'))col = int(input('請(qǐng)輸入切割列數(shù):'))if row > 0 and col > 0:splitimage(src, row, col, dstpath)else:print('無(wú)效的行列切割參數(shù)!')else:print('圖片輸出目錄 %s 不存在!' % dstpath) else:print('圖片文件 %s 不存在!' % src)transforms方法,常用的數(shù)據(jù)預(yù)處理方法,提高泛化能力
1.resize:transforms.Resize
功能:重置圖像分辨率
參數(shù):
size:- If size is an int, if height > width, then image will be rescaled to (size * height / width, size),所以建議size設(shè)定為h*w
interpolation-插值方法選擇
2.中心裁剪:transforms.CenterCrop
功能:依據(jù)給定的size從中心裁剪
參數(shù):
size-(sequence or int ),若為sequence,則為(和,w),若為int,則(size,size)
3.transforms.ToTensor
功能:ToTensor()將shape為(H, W, C)的nump.ndarray或img轉(zhuǎn)為shape為(C, H, W)的tensor,其將每一個(gè)數(shù)值歸一化到[0,1],其歸一化方法比較簡(jiǎn)單,直接除以255即可。
補(bǔ)充理解:
什么是張量:
通俗一點(diǎn)講:張量是對(duì)標(biāo)量,矢量,矩陣的推廣。張量的表達(dá)看起來(lái)像是數(shù)組,其實(shí)每個(gè)值是在對(duì)應(yīng)空間上的分量的大小。基向量和分量一起形成了張量的表達(dá),他在物理學(xué)上的優(yōu)點(diǎn)是,當(dāng)基向量發(fā)生變化的時(shí)候(坐標(biāo)系發(fā)生變化或者說(shuō)是觀察方向發(fā)生了變化),對(duì)應(yīng)的分量也會(huì)發(fā)生變化,但整個(gè)張量卻能保持不變
下圖是對(duì)張量從直觀上給出的示意。一階張量可以理解成一個(gè)向量,二階張量可以理解成矩陣,三階張量可以理解成立方體,四階張量可以理解成立方體組成的一個(gè)向量,五階張量可以理解成立方體組成的矩陣,依次類推。
什么是RANK
rank就是上文所說(shuō)的階。他是指這個(gè)張量擁有的基底向量的數(shù)量,也就是他的方向的數(shù)量。從上圖中其實(shí)能明白為什么是一階,二階,三階。
在實(shí)際操作中,可以理解成 [ 的深度。例如:
rank=1: [0,1,2]
rank=2: [[0,1],[2,3]]
rank=3: [[[0,1],[2,3]],[[4,5],[6,7]]]
什么是shape
shape是形狀,他指明每一層有多少個(gè)元素。比如[2,3,4]是指第一層2個(gè)元素,第二層3個(gè)元素,第三層4個(gè)元素,通過(guò)這個(gè)我們就可以知道這個(gè)張量一共有2 × 3 × 4=24 個(gè)元素。
4.數(shù)據(jù)歸一化處理transforms.Normalize
功能:逐channel的圖像進(jìn)行標(biāo)注化(均值變?yōu)?,標(biāo)準(zhǔn)差變?yōu)?),可以加快模型的收斂
總結(jié)
以上是生活随笔為你收集整理的学习记录1-python图片分割transforms方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: HLS Pargmas(2) inter
- 下一篇: 学习记录2-Python中的注册器模块