request.get()したものをテキストデータに書き出す方法!はじめてのPython

request.get()で指定したURLのHTML情報を取得したら、その内容をテキストデータで書き出してみようと思います。

環境

ざっくりMac
Python3.9を使用しています。

with open()で書き出す

withを使うとclose()を書き忘れることがないので便利です。

# 指定したurlの情報をresponseで受け取る
url = "https://xxx/xxx.html"
response = requests.get(url)

# 文字化け防止
response.encoding = response.apparent_encoding

# ファイルの名前を決める
name = "download.txt"

# ファイルを書き込みモードで開いて書き込んだら閉じる
with open(name, mode="w") as file:
    # responseを文字データにして書き込む(インデントをhtmlで表示する方法がわからないのでスペースだ代用)
    file.write(response.text)

おまけ モードについて

mode説明
r読み込み (デフォルト)
w書き込み(新規作成)
a追加書き込み
tテキストモード (デフォルト)
bバイナリモード
r+既存ファイルの読み書き
w+ファイルの読み書き(新規作成)
a+追記・読み書き

モードを変えるだけでいろいろできそうです。

おわり

Pythonの書き方になれないけれど、短いコードでいろいろできて便利ですね。
これでhtmlを解析する準備ができたかな。スクレイピングの道のりは遠いな。

Python

Posted by Nakamoto