日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

维基百科 mysql_把维基百科首页词条的数据导入mysql【Python】

發布時間:2024/3/12 数据库 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 维基百科 mysql_把维基百科首页词条的数据导入mysql【Python】 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

title: 把維基百科首頁詞條的數據導入mysql【Python】

date: 2016-09-13 0:59:28

tags:

1、此文是跟著上一篇來寫的,之前,已經完成了對維基百科詞條的數據采集工作。

2、本文和作者示范不同的地方是,建立數據庫和表格的工具我維持使用了sqlyog軟件,作者用的是哪個不確定,因為視頻看不清上面的名字。

3、代碼如下,已經有一定說明,原作者可沒提供代碼哦,請把password對應的密碼部分,從xxxx修改成你的真實數據庫密碼:

__author__ = 'Administrator'

# coding:utf-8

# 運行在python 3.5.2

import re

from urllib.request import urlopen

from bs4 import BeautifulSoup as bs

import pymysql.cursors

# 使用urllib的urlopen方法,去打開維基百科的首頁,讀取,并用utf-8解碼

resp = urlopen('https://en.wikipedia.org/wiki/Main_Page').read().decode('utf-8')

# 使用BeautifulSoup去解析,其中html.parser是默認的解析器

soup = bs(resp, 'html.parser')

# 獲取所有的/wiki/開頭的a標簽的href屬性。

listUrls = soup.find_all('a', href=re.compile(r'^/wiki/'))

print(listUrls)

# 輸出所有的詞條對應的名稱和URL

for url in listUrls:

# 排除.jpg JPG結尾的

if not re.search('\.(jpg|JPG)$', url['href']):

# 顯示名稱和網址的格式

# string只能顯示一個,而get_text()可顯示標簽下所有的文字。

print(url.get_text(), '', 'https://en.wikipedia.org'+url['href'])

# 得到數據庫的連接

connection = pymysql.connect(host='localhost',

user='root',

password='xxxx',

db='wikiurl',

charset='utf8'

)

try:

# 創建會話指針

with connection.cursor() as cursor:

# 創建sql語句

sql = 'insert into `urls` (`urlname`, `urlhref`) values(%s, %s)'

# 執行sql語句

cursor.execute(sql, (url.get_text(), 'https://en.wikipedia.org' + url['href']))

# 提交

connection.commit()

finally:

connection.close()

4、其中關鍵的步驟有:

A):sqlyog中表格的制作和設置,千萬注意,id的int類型,需要添加自增,否則運行程序會報錯: "Field 'id' doesn't have a default value

B)數據庫的插入和執行命令,因為不太熟悉,對著視頻敲代碼都錯誤了幾次,并且要注意以下代碼urls (urlname, urlhref)使用的是Tab鍵上面的那個上點號

C)當程序沒有報錯,在sqlyog查看表格要先刷新

D)在之前的帖子,是在python2.7下,通過sqlyog的import MySQLdb 來操作mysql的,并且,代碼中的密碼對應的是passwd,而這個和直接用python 運行pymysql的對應命令password是不同的,要分清楚。

5、結果圖,有一絲喜悅感:

總結

以上是生活随笔為你收集整理的维基百科 mysql_把维基百科首页词条的数据导入mysql【Python】的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产福利一区在线 | 国产一级片免费播放 | 黄页网站视频 | 国产资源网 | 亚洲乱码国产乱码精品精软件 | 亚洲91久久 | 午夜宅男在线 | 精国产品一区二区三区a片 国产精品第一 | 中文字幕在线导航 | 一级免费在线观看 | 日本成人福利视频 | 日本公妇乱偷中文字幕 | 国产一级免费片 | 我的公把我弄高潮了视频 | 久久最新精品 | 大奶一区 | 成人黄色在线 | 精品人妻一区二区三区日产 | 日韩欧美精品久久 | 国产a√精品区二区三区四区 | 波多野吉衣毛片 | 美女扒开腿让男生捅 | 中文字幕在线观看视频一区二区 | 日本黄色免费在线观看 | 91国自产精品中文字幕亚洲 | 亚洲国产精品综合 | 日韩美女激情视频 | 国产精品1区2区3区4区 | 欧美性猛交乱大交3 | 久热精品在线视频 | 亚洲一区电影在线观看 | 国产乱码精品一区二三赶尸艳谈 | 成人手机在线播放 | 欧美日韩三区 | 一区二区网站 | 秒拍福利视频 | 四虎成人在线观看 | 久久国产精品毛片 | 五十路毛片 | 国产原创中文av | 欧美专区在线播放 | 开元在线观看视频国语 | 一区二区视屏 | 一级a毛片免费观看久久精品 | www.爱操| 色播在线 | 国产精品熟妇人妻g奶一区 a少妇 | 一级黄色电影片 | 久久综合网址 | 亚洲欧美精品一区 | 欧美精品一区二区视频 | 依人久久| 婷婷色六月| 精品人妻码一区二区三区红楼视频 | 欧美第一精品 | 伊人影院av | 久久一区二区电影 | 精品人妻午夜一区二区三区四区 | 成人网站免费观看入口 | 另类av小说 | 国产精品久久国产 | 小珊的性放荡羞辱日记 | 91香焦视频 | 熟女少妇内射日韩亚洲 | 中文字幕人妻一区二区三区在线视频 | av不卡一区二区三区 | 亚洲久爱 | 成人天堂av| 日本草草视频 | 国产一区二区播放 | 午夜涩涩| 欧美大片黄 | 一区二区三区中文视频 | 亚洲人午夜精品 | 人妻精品久久久久中文字幕69 | 欧美日韩免费观看视频 | 色婷婷aⅴ一区二区三区 | 黑人性高潮 | 中文字幕一二三四 | 91精品国产高清 | 美女自拍偷拍 | 国产成人精品免高潮在线观看 | 中文字幕一区二区三区不卡 | 中文字幕在线字幕中文 | 久久久久久久综合 | 国产91丝袜在线18 | 青青草一区二区三区 | 激情精品 | 台湾综合色 | 久久久一区二区三区四区 | 成人快色| 天天射夜夜爽 | 亚洲午夜av在线 | 俄罗斯乱妇| 亚洲色婷婷久久精品av蜜桃 | 超碰免费在线播放 | 亚av| 日本特级毛片 | 日本在线三级 |