日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

学习记录1-python图片分割transforms方法

發(fā)布時(shí)間:2024/4/17 python 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 学习记录1-python图片分割transforms方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

python 圖片分割

import os from PIL import Image Image.MAX_IMAGE_PIXELS = Nonedef splitimage(src, rownum, colnum, dstpath):img = Image.open(src)w, h = img.sizeif rownum <= h and colnum <= w:print('Original image info: %sx%s, %s, %s' % (w, h, img.format, img.mode))print('開(kāi)始處理圖片切割, 請(qǐng)稍候...')s = os.path.split(src)if dstpath == '':dstpath = s[0]fn = s[1].split('.')basename = fn[0]ext = fn[-1]num = 0rowheight = h // rownumcolwidth = w // colnumfor r in range(rownum):for c in range(colnum):box = (c * colwidth, r * rowheight, (c + 1) * colwidth, (r + 1) * rowheight)img.crop(box).save(os.path.join(dstpath, basename + '_' + str(num) + '.' + ext), ext)num = num + 1print('圖片切割完畢,共生成 %s 張小圖片。' % num)else:print('不合法的行列切割參數(shù)!')src = input('請(qǐng)輸入圖片文件路徑:') if os.path.isfile(src):dstpath = input('請(qǐng)輸入圖片輸出目錄(不輸入路徑則表示使用源圖片所在目錄):')if (dstpath == '') or os.path.exists(dstpath):row = int(input('請(qǐng)輸入切割行數(shù):'))col = int(input('請(qǐng)輸入切割列數(shù):'))if row > 0 and col > 0:splitimage(src, row, col, dstpath)else:print('無(wú)效的行列切割參數(shù)!')else:print('圖片輸出目錄 %s 不存在!' % dstpath) else:print('圖片文件 %s 不存在!' % src)

transforms方法,常用的數(shù)據(jù)預(yù)處理方法,提高泛化能力

1.resize:transforms.Resize
功能:重置圖像分辨率
參數(shù):
size:- If size is an int, if height > width, then image will be rescaled to (size * height / width, size),所以建議size設(shè)定為h*w
interpolation-插值方法選擇
2.中心裁剪:transforms.CenterCrop
功能:依據(jù)給定的size從中心裁剪
參數(shù):
size-(sequence or int ),若為sequence,則為(和,w),若為int,則(size,size)
3.transforms.ToTensor
功能:ToTensor()將shape為(H, W, C)的nump.ndarray或img轉(zhuǎn)為shape為(C, H, W)的tensor,其將每一個(gè)數(shù)值歸一化到[0,1],其歸一化方法比較簡(jiǎn)單,直接除以255即可。
補(bǔ)充理解:
什么是張量:
通俗一點(diǎn)講:張量是對(duì)標(biāo)量,矢量,矩陣的推廣。張量的表達(dá)看起來(lái)像是數(shù)組,其實(shí)每個(gè)值是在對(duì)應(yīng)空間上的分量的大小。基向量和分量一起形成了張量的表達(dá),他在物理學(xué)上的優(yōu)點(diǎn)是,當(dāng)基向量發(fā)生變化的時(shí)候(坐標(biāo)系發(fā)生變化或者說(shuō)是觀察方向發(fā)生了變化),對(duì)應(yīng)的分量也會(huì)發(fā)生變化,但整個(gè)張量卻能保持不變
下圖是對(duì)張量從直觀上給出的示意。一階張量可以理解成一個(gè)向量,二階張量可以理解成矩陣,三階張量可以理解成立方體,四階張量可以理解成立方體組成的一個(gè)向量,五階張量可以理解成立方體組成的矩陣,依次類推。

什么是RANK
rank就是上文所說(shuō)的階。他是指這個(gè)張量擁有的基底向量的數(shù)量,也就是他的方向的數(shù)量。從上圖中其實(shí)能明白為什么是一階,二階,三階。
在實(shí)際操作中,可以理解成 [ 的深度。例如:

rank=1: [0,1,2]

rank=2: [[0,1],[2,3]]

rank=3: [[[0,1],[2,3]],[[4,5],[6,7]]]
什么是shape
shape是形狀,他指明每一層有多少個(gè)元素。比如[2,3,4]是指第一層2個(gè)元素,第二層3個(gè)元素,第三層4個(gè)元素,通過(guò)這個(gè)我們就可以知道這個(gè)張量一共有2 × 3 × 4=24 個(gè)元素。

4.數(shù)據(jù)歸一化處理transforms.Normalize
功能:逐channel的圖像進(jìn)行標(biāo)注化(均值變?yōu)?,標(biāo)準(zhǔn)差變?yōu)?),可以加快模型的收斂

總結(jié)

以上是生活随笔為你收集整理的学习记录1-python图片分割transforms方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。