NokogiriでHTMLのタイトル取得
HTML解析用に「Nokogiri」をインストールし、HTMLのタイトルを取得した。
Gemfileに下記のように記述する。
gem "nokogiri"
コマンドプロンプトでbundle installを実行する。
bundle insatall
下記のようにソースに書いて、タイトルを取り出した。
require 'open-uri' doc = Nokogiri::HTML(open("http://www.google.com")) title = doc.xpath("//title").text
ただし、実行すると下記のようなエラーが出た。
SSL_connect returned=1 errno=0 state=SSLv3 read server certificate B: certificate verify failed
environment.rbに下記を追記し、SSL非接続にしたら、とりあえずうまくいった。
require 'openssl' OpenSSL::SSL::VERIFY_PEER = OpenSSL::SSL::VERIFY_NONE
参考:
Nokogiriの覚書 - toyoshiの日記
Nokogiriでページタイトルを取得する | Into my web