NokogiriでHTMLのタイトル取得

HTML解析用に「Nokogiri」をインストールし、HTMLのタイトルを取得した。

Gemfileに下記のように記述する。

gem "nokogiri"

コマンドプロンプトでbundle installを実行する。

bundle insatall

下記のようにソースに書いて、タイトルを取り出した。

require 'open-uri'
doc = Nokogiri::HTML(open("http://www.google.com"))
title = doc.xpath("//title").text


ただし、実行すると下記のようなエラーが出た。

SSL_connect returned=1 errno=0 state=SSLv3 read server certificate B: certificate verify failed

environment.rbに下記を追記し、SSL非接続にしたら、とりあえずうまくいった。

require 'openssl'
OpenSSL::SSL::VERIFY_PEER = OpenSSL::SSL::VERIFY_NONE


参考:
Nokogiriの覚書 - toyoshiの日記
Nokogiriでページタイトルを取得する | Into my web

守破離でいこう!!: Rails 3 で OpenSSL::SSL::SSLError