これはH2タグ、画像を取得するためのテスト用のページです。
以下はH2タグのテキストを取得するプログラムです。
テキスト取得
importrequests
frombs4importBeautifulSoup
r=requests.get("https://py.k-hp.com/test/")
soup=BeautifulSoup(r.text, "html.parser")
print(soup.find("h2"))
print(soup.find("h2").text)
画像の取得
from io import BytesIO
from urllib import parse
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.drawing.image import Image
url = "https://py.k-hp.com/test/"
r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")
bs4img = soup.select("section img")
wb = Workbook()
ws = wb.active
ws.column_dimensions["A"].width = 60
ws.column_dimensions["B"].width = 30
image_url = parse.urljoin(url, bs4img[0]["src"])
ws["A1"] = image_url
image_r = requests.get(image_url)
image = Image(BytesIO(image_r.content))
image.width = 80
image.height = 120
ws.add_image(image, ws["B1"].coordinate)
wb.save("画像.xlsx")
テスト画像


エラー
PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057> cd “c:/Users/DELL/OneDrive/Python/本python&excel/Chapter7/s057g”
PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g> & C:/Users/DELL/AppData/Local/Programs/Python/Python313/python.exe “c:/Users/DELL/OneDrive/Python/本python&excel/Chapter7/s057g/booklist_img.py”
Traceback (most recent call last):
File “c:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g\booklist_img.py”, line 19, in <module>
image_url = parse.urljoin(url, bs4img[0][“src”])
IndexError: list index out of range
PS C:\Users\DELL\OneDrive\Python\本python&excel\Chapter7\s057g>

表の取得(テストの表)
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
wb = Workbook()
ws = wb.active
ws.column_dimensions["C"].width = 40
url = "https://py.k-hp.com/test/"
dfs = pd.read_html(url, match="品名")
for df in dfs:
for row in dataframe_to_rows(df, index=None, header=True):
ws.append(row)
wb.save("ランキング.xlsx")
テスト用の表
| 品名 | エネルギー | たんぱく質 | 脂質 | 塩分 |
| かき揚げそば | 868 | 18.8 | 42.9 | 6.2 |
| 天玉そば | 939 | 24.9 | 48.0 | 6.4 |
| かきちくそば | 729 | 20.6 | 28.3 | 6.9 |
| 竹輪天そば | 590 | 22.4 | 13.7 | 7.4 |
| 海老天そば | 566 | 19.8 | 14.7 | 6.3 |
| かけそば | 385 | 15.3 | 2.3 | 6.1 |
| たぬきそば | 644 | 17.4 | 22.7 | 6.2 |
| 月見そば | 456 | 21.4 | 7.4 | 6.3 |
| わかめそば | 392 | 16.2 | 2.5 | 7.3 |
| きつねそば | 492 | 19.4 | 9.2 | 6.5 |
| もりそば | 357 | 13.1 | 2.4 | 2.4 |
| 大盛りそば | 512 | 18.6 | 3.5 | 2.5 |
| 二枚もりそば | 715 | 26.0 | 4.9 | 4.8 |
| 三枚もりそば | 1,041 | 37.8 | 7.1 | 5.0 |
| 海老天せいろ | 651 | 19.0 | 22.9 | 3.1 |


コメント