【项目实战】:Python 商铺地址分布数据分析
生活随笔
收集整理的這篇文章主要介紹了
【项目实战】:Python 商铺地址分布数据分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
'''
【項目01】 ?商鋪數據加載及存儲
作業要求:
1、成功讀取“商鋪數據.csv”文件
2、解析數據,存成列表字典格式:[{'var1':value1,'var2':value2,'var3':values,...},...,{}]
3、數據清洗:
① comment,price兩個字段清洗成數字
② 清除字段缺失的數據
③ commentlist拆分成三個字段,并且清洗成數字
4、結果存為.pkl文件
?
一 ?文件讀取
①文件讀取:open()
②瀏覽前5 行:readlines()
③ 拆分:split()
f = open('C:/Users/Hjx/Desktop/商鋪數據.csv','r',encoding='utf8') for i in f.readlines()[:5]:print(i.split(','))二 ?函數式編程,?并做數據清洗
①構建函數:def ? ?n(x): ? ? ? ? ? return()
②條件判斷語句:if: ? ?else:
②字符串處理,文字類型轉化:int(),float()
# 創建comment、price、commentlist清洗函數 # 函數式編程def fcm(s):if '條' in s:return int(s.split(' ')[0])else:return '缺失數據' # comment清洗函數:用空格分段,選取結果list的第一個為點評數,并且轉化為整型def fpr(s):if '¥' in s:return float(s.split('¥')[-1])else:return '缺失數據' # print清洗函數:用¥分段,選取結果list的最后一個為人均價格,并且轉化為浮點型def fcl(s):if ' ' in s:quality = float(s.split(' ')[0][2:])environment = float(s.split(' ')[1][2:])service = float(s.split(' ')[2][2:-1])return [quality,environment,service]else:return '缺失數據' # commentlist清洗函數:用空格分段,分別清洗出質量、環境及服務數據,并轉化為浮點型三 ?數據處理
①創建空列表:[ ]
②操縱文件游標,歸零:seek()
③循環遍歷,處理數據:
④ 列表字典化:dict()
⑤裝載數據:append()
# 數據清洗datalst = [] # 創建空列表f.seek(0) n = 0 # 創建計數變量 for i in f.readlines()[1:20]:data = i.split(',')#print(data)classify = data[0] # 提取分類name = data[1] # 提取店鋪名稱comment_count = fcm(data[2]) # 提取評論數量star = data[3] # 提取星級price = fpr(data[4]) # 提取人均add = data[5] # 提取地址qua = fcl(data[6])[0] # 提取質量評分env = fcl(data[6])[1] # 提取環境評分ser = fcl(data[6])[2] # 提取服務評分if '缺失數據' not in [comment_count, price, qua]: # 用于判斷是否有數據缺失n += 1data_re = [['classify',classify],['name',name],['comment_count',comment_count],['star',star],['price',price],['address',add],['quality',qua],['environment',env],['service',ser]]datalst.append(dict(data_re)) # 生成字典,并存入列表datalstprint('成功加載%i條數據' %n)else:continueprint(datalst) print('總共加載%i條數據' %n)四 ?保存文件
永久化文件:pickle
# 數據存儲.pkl數據import pickle pic = open('C:/Users/Hjx/Desktop/data.pkl','wb') pickle.dump(datalst,pic) pic.close() print('finished!') # 將數據存成了pkl文件?
總結
以上是生活随笔為你收集整理的【项目实战】:Python 商铺地址分布数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】条件及循环语句
- 下一篇: 【Python】对self和_init_