
今回は、HeadlineReaderと、なんでもRSS 0.1bというサービスを連携させて、
2chから特定の発言のみ抽出する方法を紹介します。
なんでもRSSとは、その名の通り、
RSSを発信していないページをRSS化してしまうためにあるページです。
たまに変換出来ないサイトもありますが、試してみるとけっこう便利ですよ。
今回これを活用することで、
例えばSleipnirの板では、
作者であるやすゆき氏の発言のみ取ってくる、などということができます。
HTML抽出の時は、リンクしか抽出できませんでしたが、
この方法を使えば発言全体を取得することが出来ます。
では、やり方です。
なんでもRSSにURIを送る
まず、なんでもRSS 0.1bで、RSS化したいURIを入れます。
ここでは例として、Sleipnirの板のURIを入れます。
すると、板が解析されて、RSSボタンが出ます。
(ここで注意することは、必ずページのRSSボタンをHeadlineReaderにドラッグ&ドロップしてください、ということです。
タブを追加したり、ブラウザ右下のRSSでは、
上手くいかないことがあったので、但し書きしておきます。)
これをHeadlineReaderに追加します。
フィルタ文字に取得したい文字を追加する
RSSを追加する際に出る設定ダイアログで、
取得したい特定の文字列を、フィルタ文字に追加します。
ここでは、[ 邪悪なことはしない ]をフィルタ文字に追加して、RSSを登録してみます。
これで、以下のように発言を取ってくることが出来るようになります。

指定した文字列によっては、ノイズがかなり混じることがあるので、
その際はフィルタ文字をさらに便利にする特殊文字を参考に、色々絞ってみてください。
これの難点は、
URIが変わるごとに、登録し直さなければならないこと。
新規スレが立つたびに登録し直すのはめんどいかも。
なんでもRSSではブックマークレットも配信してるから、
それを利用すれば、慣れていいかもですね。
関連記事:
高速なRSSリーダー、HeadlineReaderを導入しよう(インストール編)
HeadlineReaderでHTML抽出を使ってRSSがなくても更新情報を受け取る
HeadlineReaderでフィルタ文字(キーワード指定)して欲しい情報だけ抽出する
フィルタ文字をさらに便利にする特殊文字[RSSリーダー][Headlinereader]

