Yahooニュースを持ってくるプログラム

プログラムコード

  1. import requests
  2. from bs4 import BeautifulSoup
  3. import urllib
  4. import codecs
  5. #yahooから情報を持ってきます
  6. url = "https://www.yahoo.co.jp/l"
  7. html = requests.get(url)
  8. soup = BeautifulSoup(html.content,"html.parser")
  9. #filenameを定義しテキストファイルとして書き込みます
  10. filename = "linklist.text"
  11. with open(filename,"w", encoding="utf-8") as f:
  12. #中身。_2DunygeBZHdgHX_Gih3GC4ていうクラスのリンクとテキストを持ってくる指示。
  13.     topic = soup.find(class_="_2DunygeBZHdgHX_Gih3GC4")
  14.     for element in topic.find_all("a"):
  15.         print(element.text)
  16.         url2 = element.get("href")
  17.         link_url = urllib.parse.urljoin(url,url2)
  18.         f.write(element.text+"\n")
  19.         f.write(link_url+"\n")
  20.         f.write("\n")

プログラムの意図について

Yahooのサイトから今日のニュースを引っ張ってくるプログラムです。テキストファイルに見出しとURLがまとめられます。YahooのURLさえあれば開く必要がありません。