日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略

發(fā)布時(shí)間:2025/3/21 python 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Python之pandas:數(shù)據(jù)類型變換之object、category、bool、int32、int64、float64以及數(shù)據(jù)類型標(biāo)準(zhǔn)化之詳細(xì)攻略

?

?

?

?

?

目錄

數(shù)據(jù)類型變換之object、category、bool、int32、int64、float64以及數(shù)據(jù)類型標(biāo)準(zhǔn)化

知識(shí)點(diǎn)

1、category類型與object類型

輸出結(jié)果

實(shí)現(xiàn)代碼


?

?

?

?

推薦文章
???????Python之pandas:在pandas中創(chuàng)建category類型數(shù)據(jù)的幾種方法之詳細(xì)攻略
ML之FE:將dataframe中的數(shù)據(jù)類型進(jìn)行標(biāo)準(zhǔn)化

數(shù)據(jù)類型變換之object、category、bool、int32、int64、float64以及數(shù)據(jù)類型標(biāo)準(zhǔn)化

知識(shí)點(diǎn)

在pandas中,如果某個(gè)字段下,數(shù)據(jù)類型不一致導(dǎo)致整個(gè)字段類型不相同,可以進(jìn)行字段類型轉(zhuǎn)換!,在pandas中,進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換非常簡(jiǎn)單,只需要使用astype函數(shù)即可!

?

1、category類型與object類型

?object類型(python中)category類型(pandas中特有)
簡(jiǎn)介

? ? ? python是面向?qū)ο蟮恼Z(yǔ)言。在python里面,一切皆為對(duì)象

在python中,

  • object類型,一般表示文本類型數(shù)據(jù)。
  • 有些難以被自動(dòng)判別的數(shù)據(jù)類型,或者由不止一種數(shù)據(jù)類型組成;由于Python一切皆對(duì)象,因此都會(huì)被處理為最寬泛的"對(duì)象"也就是object類型數(shù)據(jù)。
  • 其實(shí),在數(shù)據(jù)分析中,有時(shí)候會(huì)遇到某個(gè)字段的數(shù)據(jù)類型與初始設(shè)置的不相符,此時(shí),就要去分析是否是數(shù)據(jù)不規(guī)整造成的。
  • category是 pandas 的一種數(shù)據(jù)類型,對(duì)應(yīng)著被統(tǒng)計(jì)的變量。它實(shí)際上是動(dòng)態(tài)枚舉的一種形式。如果某個(gè)字段的內(nèi)容中,其可能值的范圍是固定且有限的,則category類型數(shù)據(jù)最為適用;
  • category是由固定的且有限數(shù)量的變量組成的。比如:性別、血型、等級(jí)等;
  • category類型數(shù)據(jù)的每一個(gè)元素的值,要么是預(yù)設(shè)好的類型中的某一個(gè),要么是空值(np.nan);
  • 在比較大的數(shù)據(jù)集中,可以通過(guò)使用category類型數(shù)據(jù)來(lái)加快速度
屬性具有object類型數(shù)據(jù)的基本屬性。
  • .describe()
  • .cat.categories  
  • .cat.rename_categories  
  • .value_counts()
  • .str 屬性  
  • pd.concat
  • union_categoricals   
  • 內(nèi)存使用量
轉(zhuǎn)換df["col"].astype(‘category‘)

?

?

?

?

輸出結(jié)果

?

?

實(shí)現(xiàn)代碼

import pandas as pd import numpy as npcontents={"name": ['Bob', 'LiSa', 'Mary', 'Alan'],"ID": [1, 2, ' ', None], # 輸出 NaN"age": [np.nan, 28, 38 , '' ], # 輸出 "age02": [14, 26, 24 , 6], "born": [pd.NaT, pd.Timestamp("1990-01-01"), pd.Timestamp("1980-01-01"), ''], # 輸出 NaT"sex": ['男', '女', '女', None,], # 輸出 None"hobbey":['打籃球', '打羽毛球', '打乒乓球', '',], # 輸出 "money":[200.0, 240.0, 290.0, 300.0], # 輸出"weight":[140.5, 120.8, 169.4, 155.6], # 輸出"test01":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 輸出"test02":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 輸出} data_frame = pd.DataFrame(contents)print('Init-------------------------------') print(data_frame.dtypes) print(data_frame)# 將dataframe格式中的數(shù)據(jù)類型轉(zhuǎn)為object數(shù)據(jù)類型 data_frame['test02'] = data_frame['test02'].astype('object') # 關(guān)鍵字bool,'object'、'category'、str data_frame['test02'] = data_frame['test02'].apply(str) data_frame.to_excel("data_demo.xls")print('after astype-------------------------------') print(data_frame.dtypes) print(data_frame) data_frame_temp=data_frame.copy()# ML之FE:將dataframe中的數(shù)據(jù)類型進(jìn)行標(biāo)準(zhǔn)化 print('after Categorical-------------------------------') data_frame=cols2DfCatAndNum(data_frame) print(data_frame.dtypes)

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

總結(jié)

以上是生活随笔為你收集整理的Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。