日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【项目实战】:Python 商铺地址分布数据分析

發布時間:2025/3/21 python 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【项目实战】:Python 商铺地址分布数据分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

'''
【項目01】 ?商鋪數據加載及存儲

作業要求:
1、成功讀取“商鋪數據.csv”文件
2、解析數據,存成列表字典格式:[{'var1':value1,'var2':value2,'var3':values,...},...,{}]
3、數據清洗:
① comment,price兩個字段清洗成數字
② 清除字段缺失的數據
③ commentlist拆分成三個字段,并且清洗成數字
4、結果存為.pkl文件

?

一 ?文件讀取

①文件讀取:open()

②瀏覽前5 行:readlines()

③ 拆分:split()

f = open('C:/Users/Hjx/Desktop/商鋪數據.csv','r',encoding='utf8') for i in f.readlines()[:5]:print(i.split(','))

二 ?函數式編程,?并做數據清洗

①構建函數:def ? ?n(x): ? ? ? ? ? return()

②條件判斷語句:if: ? ?else:

②字符串處理,文字類型轉化:int(),float()

# 創建comment、price、commentlist清洗函數 # 函數式編程def fcm(s):if '條' in s:return int(s.split(' ')[0])else:return '缺失數據' # comment清洗函數:用空格分段,選取結果list的第一個為點評數,并且轉化為整型def fpr(s):if '¥' in s:return float(s.split('¥')[-1])else:return '缺失數據' # print清洗函數:用¥分段,選取結果list的最后一個為人均價格,并且轉化為浮點型def fcl(s):if ' ' in s:quality = float(s.split(' ')[0][2:])environment = float(s.split(' ')[1][2:])service = float(s.split(' ')[2][2:-1])return [quality,environment,service]else:return '缺失數據' # commentlist清洗函數:用空格分段,分別清洗出質量、環境及服務數據,并轉化為浮點型

三 ?數據處理

①創建空列表:[ ]

②操縱文件游標,歸零:seek()

③循環遍歷,處理數據:

④ 列表字典化:dict()

⑤裝載數據:append()

# 數據清洗datalst = [] # 創建空列表f.seek(0) n = 0 # 創建計數變量 for i in f.readlines()[1:20]:data = i.split(',')#print(data)classify = data[0] # 提取分類name = data[1] # 提取店鋪名稱comment_count = fcm(data[2]) # 提取評論數量star = data[3] # 提取星級price = fpr(data[4]) # 提取人均add = data[5] # 提取地址qua = fcl(data[6])[0] # 提取質量評分env = fcl(data[6])[1] # 提取環境評分ser = fcl(data[6])[2] # 提取服務評分if '缺失數據' not in [comment_count, price, qua]: # 用于判斷是否有數據缺失n += 1data_re = [['classify',classify],['name',name],['comment_count',comment_count],['star',star],['price',price],['address',add],['quality',qua],['environment',env],['service',ser]]datalst.append(dict(data_re)) # 生成字典,并存入列表datalstprint('成功加載%i條數據' %n)else:continueprint(datalst) print('總共加載%i條數據' %n)

四 ?保存文件

永久化文件:pickle

# 數據存儲.pkl數據import pickle pic = open('C:/Users/Hjx/Desktop/data.pkl','wb') pickle.dump(datalst,pic) pic.close() print('finished!') # 將數據存成了pkl文件

?

總結

以上是生活随笔為你收集整理的【项目实战】:Python 商铺地址分布数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。