當前位置：首頁 > 编程语言 > python >内容正文

python

【项目实战】：Python 商铺地址分布数据分析

發布時間：2025/3/21 python 36 豆豆

生活随笔收集整理的這篇文章主要介紹了【项目实战】：Python 商铺地址分布数据分析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

'''
【項目01】 ?商鋪數據加載及存儲

作業要求：
1、成功讀取“商鋪數據.csv”文件
2、解析數據，存成列表字典格式：[{'var1':value1,'var2':value2,'var3':values,...},...,{}]
3、數據清洗：
① comment，price兩個字段清洗成數字
② 清除字段缺失的數據
③ commentlist拆分成三個字段，并且清洗成數字
4、結果存為.pkl文件

一 ?文件讀取

①文件讀取：open（）

②瀏覽前5 行：readlines()

③ 拆分：split()

f = open('C:/Users/Hjx/Desktop/商鋪數據.csv','r',encoding='utf8') for i in f.readlines()[:5]:print(i.split(','))

二 ?函數式編程，?并做數據清洗

①構建函數：def ? ?n(x): ? ? ? ? ? return()

②條件判斷語句：if: ? ?else:

②字符串處理，文字類型轉化：int()，float()

# 創建comment、price、commentlist清洗函數 # 函數式編程def fcm(s):if '條' in s:return int(s.split(' ')[0])else:return '缺失數據' # comment清洗函數：用空格分段，選取結果list的第一個為點評數，并且轉化為整型def fpr(s):if '￥' in s:return float(s.split('￥')[-1])else:return '缺失數據' # print清洗函數：用￥分段，選取結果list的最后一個為人均價格，并且轉化為浮點型def fcl(s):if ' ' in s:quality = float(s.split(' ')[0][2:])environment = float(s.split(' ')[1][2:])service = float(s.split(' ')[2][2:-1])return [quality,environment,service]else:return '缺失數據' # commentlist清洗函數：用空格分段，分別清洗出質量、環境及服務數據，并轉化為浮點型

三 ?數據處理

①創建空列表：[ ]

②操縱文件游標，歸零：seek()

③循環遍歷，處理數據：

④ 列表字典化：dict()

⑤裝載數據：append()

# 數據清洗datalst = [] # 創建空列表f.seek(0) n = 0 # 創建計數變量 for i in f.readlines()[1:20]:data = i.split(',')#print(data)classify = data[0] # 提取分類name = data[1] # 提取店鋪名稱comment_count = fcm(data[2]) # 提取評論數量star = data[3] # 提取星級price = fpr(data[4]) # 提取人均add = data[5] # 提取地址qua = fcl(data[6])[0] # 提取質量評分env = fcl(data[6])[1] # 提取環境評分ser = fcl(data[6])[2] # 提取服務評分if '缺失數據' not in [comment_count, price, qua]: # 用于判斷是否有數據缺失n += 1data_re = [['classify',classify],['name',name],['comment_count',comment_count],['star',star],['price',price],['address',add],['quality',qua],['environment',env],['service',ser]]datalst.append(dict(data_re)) # 生成字典，并存入列表datalstprint('成功加載%i條數據' %n)else:continueprint(datalst) print('總共加載%i條數據' %n)

四 ?保存文件

永久化文件：pickle

# 數據存儲.pkl數據import pickle pic = open('C:/Users/Hjx/Desktop/data.pkl','wb') pickle.dump(datalst,pic) pic.close() print('finished!') # 將數據存成了pkl文件

總結

以上是生活随笔為你收集整理的【项目实战】：Python 商铺地址分布数据分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【Python】条件及循环语句
下一篇：【Python】对self和_init_