Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
require 'open-uri' require 'nokogiri' # スクレイピング先のURL url = 'http://finance.yahoo.com/q/cf?s=KO+Cash+Flow&annual'#米コカコーラ charset = nil html = open(url) do |f| charset = f.charset #文字種別を取得 f.read #htmlを読み込んで変数htmlに渡す end # htmlをパース(解析)してオブジェクトを作成 doc = Nokogiri::HTML.parse(html, nil, charset) # 抽出したいデータノードを取り出す mainNode = doc.css("table#yfncsumtab") ## ループの行が長くなるので代入 trs = mainNode.css('tr > td > ta
RubyでHTMLやXMLをパースする構文解析ツールの定番は、Nokogiriです。スクレイピングする際の必需品で、なくてはならないモジュールの1つです。ただ色々なことが出来る反面、どこから取りかかれば良いのか解り難い部分もあります。自習を兼ねて、Nokogiri概要と主要な機能を紹介してみます。 Nokogiriとは何か? ReademeによるとNokogiriとは、「HTMLとXMLとSAXとXSLTとReaderのパーサー」で、特徴としては、XPathとCSS3セレクター経由で探索する機能を持つことのようです。他にもHTMLやXMLのビルダーの機能を持っていますが、HTMLとXMLのパーサー(構文解析器)と覚えておけばよいでしょう。 Nokogiriのクラス構造 Nokogiriは、なかなか巨大なライブラリです。10以上のモジュールと70以上のクラスで構成されていて、yardでダイア
スクレイピングのチュートリアルを書いてみた。 参考:http://nokogiri.rubyforge.org/nokogiri/Nokogiri.html まだまだたくさんのクラスやメソッドがあるが(読んでない)、HTMLのスクレイピングに限定すれば多分これくらいで十分。 2014-02-16追記 なんかたくさんブックマークされていることに気づいたので、サンプルコードのRuby1.9/2対応のアップデート。 Mechanize周りも修正。WWW::Mechanize → Mechanize 等 (0) 前提知識 Ruby、HTML、DOM、CSSセレクタまたはXPath (1) クラス構造の理解 Nokogiri::HTML::Document < Nokogiri::XML::Document < Nokogiri::XML::Node < Object Nokogiri::XML::
今年も早いもので、残すところ半分となりましたね!今回は2012年の上半期までで色々なプログラミング学習サービスを徹底的にまとめてみました。今回の記事で今リリースされているものはほとんど網羅されていると思います。 今回の記事は特にプログラミング初心者〜中級者に役立つサービスまとめ記事だと思います。去年の暮れに書いたプログラミング学習サービスまとめがおかげさまではてぶホットエントリーに入るなど、プログラミング学習への注目度の高さを実感しているところです。特にスタートアップの世界では、もう文系だからとかエンジニアじゃないからと言ってプログラミングの知識ゼロで許される時代でもなくなってきていますしね。色々なサービスがありますが、ご自身の学ぶ目的やレベルに合わせて活用してください! プログラミング学習サービスまとめ 1.メールを使ってコーディング学習できるCodecademy 料金:無料 言語:Ja
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く