書籍1:Webページ上のH2タグ、画像を取得してエクセルに表示

これはH2タグ、画像を取得するためのテスト用のページです。

以下はH2タグのテキストを取得するプログラムです。

テキスト取得

importrequests
frombs4importBeautifulSoup
r=requests.get("https://py.k-hp.com/test/")
soup=BeautifulSoup(r.text, "html.parser")
print(soup.find("h2"))
print(soup.find("h2").text)

画像の取得

from io import BytesIO
from urllib import parse
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.drawing.image import Image
url = "https://py.k-hp.com/test/"
r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")
bs4img = soup.select("section img")
wb = Workbook()
ws = wb.active
ws.column_dimensions["A"].width = 60
ws.column_dimensions["B"].width = 30
image_url = parse.urljoin(url, bs4img[0]["src"])
ws["A1"] = image_url
image_r = requests.get(image_url)
image = Image(BytesIO(image_r.content))
image.width = 80
image.height = 120
ws.add_image(image, ws["B1"].coordinate)
wb.save("画像.xlsx")

テスト画像

エラー

PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057> cd “c:/Users/DELL/OneDrive/Python/本python&excel/Chapter7/s057g”
PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g> & C:/Users/DELL/AppData/Local/Programs/Python/Python313/python.exe “c:/Users/DELL/OneDrive/Python/本python&excel/Chapter7/s057g/booklist_img.py”
Traceback (most recent call last):
File “c:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g\booklist_img.py”, line 19, in <module>
image_url = parse.urljoin(url, bs4img[0][“src”])
IndexError: list index out of range
PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g>

表の取得(テストの表)

import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

wb = Workbook()
ws = wb.active
ws.column_dimensions["C"].width = 40

url = "https://py.k-hp.com/test/"
dfs = pd.read_html(url, match="品名")

for df in dfs:
    for row in dataframe_to_rows(df, index=None, header=True):
        ws.append(row)

wb.save("ランキング.xlsx")

テスト用の表

品名 エネルギー たんぱく質 脂質 塩分
かき揚げそば 868 18.8 42.9 6.2
天玉そば 939 24.9 48.0 6.4
かきちくそば 729 20.6 28.3 6.9
竹輪天そば 590 22.4 13.7 7.4
海老天そば 566 19.8 14.7 6.3
かけそば 385 15.3 2.3 6.1
たぬきそば 644 17.4 22.7 6.2
月見そば 456 21.4 7.4 6.3
わかめそば 392 16.2 2.5 7.3
きつねそば 492 19.4 9.2 6.5
もりそば 357 13.1 2.4 2.4
大盛りそば 512 18.6 3.5 2.5
二枚もりそば 715 26.0 4.9 4.8
三枚もりそば 1,041 37.8 7.1 5.0
海老天せいろ 651 19.0 22.9 3.1

コメント