www.regentechlog.com
を見ながら、少し書いてみました。
t = lxml.html.parse(url) print t.find(".//title").text
で実行
!!
文字化けしとる。
何が変なんだろってことで調べたらエンコードする方法あるじゃん
parser = lxml.html.HTMLParser(encoding='utf-8') t = lxml.html.parse(url,parser) print t.find(".//title").text
で無事に表示されました。
htmlをよう知らないままやってるが、
http経由で情報を取得
取得したデータからほしいものを抜き出す
出力orどっかのDBにぶち込む
みたいな流れね。
次は新着記事の取得でもチャレンジするか。