【Python】Webスクレイピング ~指定したタグを取得する~
PythonでWebスクレイピングを実施する方法を紹介します。
自由自在にタグを取得できればWebスクレイピングマスター。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
from urllib import requet from bs4 import BeautifulSoup url = 'XXXXXXX.com' x = request.urlopen(url) html = BeautifuSoup(x, 'html.parser') # divタグを最初の1つだけ取得 tag_1 = html.find('div') # divタグを全て取得 tag_2 = html.find_all('div') # divタグのclassが「abcPekita」のものを最初の1つだけ取得 tag_3 = html.find('div',{'class','abcPekita'}) # divタグのclassが「abcPekita」のものを全て取得 tag_ = html.find_all('div',{'class','abcPekita'}) |
ご質問はココナラのページへどうぞ。
ディスカッション
コメント一覧
まだ、コメントがありません