request.get()したものをテキストデータに書き出す方法！はじめてのPython

request.get()で指定したURLのHTML情報を取得したら、その内容をテキストデータで書き出してみようと思います。

Contents

環境
with open()で書き出す
おまけモードについて
おわり

環境

ざっくりMac
Python3.9を使用しています。

with open()で書き出す

withを使うとclose()を書き忘れることがないので便利です。

# 指定したurlの情報をresponseで受け取る
url = “https://xxx/xxx.html”
response = requests.get(url)

# 文字化け防止
response.encoding = response.apparent_encoding

# ファイルの名前を決める
name = “download.txt”

# ファイルを書き込みモードで開いて書き込んだら閉じる
with open(name, mode=”w”) as file:
# responseを文字データにして書き込む（インデントをhtmlで表示する方法がわからないのでスペースだ代用）
file.write(response.text)

おまけモードについて

mode	説明
r	読み込み (デフォルト)
w	書き込み（新規作成）
a	追加書き込み
t	テキストモード (デフォルト)
b	バイナリモード
r+	既存ファイルの読み書き
w+	ファイルの読み書き（新規作成）
a+	追記・読み書き

モードを変えるだけでいろいろできそうです。

おわり

Pythonの書き方になれないけれど、短いコードでいろいろできて便利ですね。
これでhtmlを解析する準備ができたかな。スクレイピングの道のりは遠いな。

request.get()したものをテキストデータに書き出す方法！はじめてのPython

環境

with open()で書き出す

おまけモードについて

おわり

関連

djangoでgmailの送信ができなかった時に確認したこと

スプレッドシートのデータを読み込む方法！Pythonの勉強

セレニウムでfind_elementでdeprecated(非推奨)のメッセージが出...

COMMENT コメントをキャンセル

環境

with open()で書き出す

おまけ モードについて

おわり

共有:

関連

djangoでgmailの送信ができなかった時に確認したこと

スプレッドシートのデータを読み込む方法！Pythonの勉強

セレニウムでfind_elementでdeprecated(非推奨)のメッセージが出...

COMMENT コメントをキャンセル

おまけモードについて