Google Readerのそとのそのまたむこう

はじめに

リードテックラボ、RSSを考える編、です。考えるというよりはいつもの通り手を動かして遊んでみる、の方ですが、最初に少しRSSのこれからについて整理して書いてみて後半で手を動かした部分を記しておきます。
まず始めにはっきりさせておきたいこととして、Google Readerがサービス終了とのことでしたが、もちろんRSSはこのまま終わるはずがありません。なぜか?答えは簡単で、

  • おそらくRSSが現在ウェブ上で一番使われている構造化データ形式だから

です*1。よりセマンティックに情報をシェアしようよ、というような方向に進んでいるウェブ界隈において、ここまで普及している構造化データ形式の一つであるRSSの利用が減っていくとは思えません。Google Readerのサービス終了をどう考えるかについては「一般ユーザーのRSS利用の裾野を広げきれなかった結果」ということだと思います。つまり、RSSのフィードをRSSリーダーにちまちま登録して日々情報収集を行うという行為は一般層にまで広がりきれなかった事実のみを示している、ということです。つまり何が言いたいのかというとRSSという技術は一般ユーザーに直接的には受け入れられなかったかもしれないけれど、ウェブにおいてはぜんぜんまだまだこれからだよ、ということです。
そんなことわざわざ言わなくても分かってるよ、という人も多いのかもしれません。が、Google Readerがサービス終了ということがもたらすものが「あー、今まで使ってたツールがなくなって不便になるなー」とかいうレベルの話ではなく、自身にとってそれ以上の脅威だと感じたからあえてブログに書いたりするんでしょう。「え、こんなに便利なのにみんな使わないの?で、GoogleまでRSSリーダーのサービス辞めちゃうの?」という単純な衝撃を多少でも言語化することで和らげておくこととともに「自分が便利と感じる」理由と「みんなが使わない」理由を整理しておく必要がある、と思いました。情報発信と情報収集*2を主たる仕事とする“情報流通”の分野に身を置く一人として、今回のGoogle Readerの終了は自身の情報収集ツール利用と他のネットユーザーの情報収集ツール利用実態の間にある乖離をまざまざと見せつけられる機会となりました。

RSSを使う人

RSSを“直接的に”フィードとしてリーダー*3に登録して情報収集を行う人は少数でこれからおそらく伸びないという読みがあるそうです。それを裏付けるのはGoogle Readerのサービス終了です。じゃあ、誰がRSSを使うのか?もちろん今まで利用してきた一部のコアユーザーは使い続けるでしょう。ええ*4。次に考えられるのはコンテンツアグリゲータサービスです。RSSをデータとして機械的に収集し各種サービスにてうまく加工してユーザーに情報提供する、というコンテンツアグリゲータ的な使われ方を念頭におきながらRSSを情報発信ツールとして捉えていく必要がありそうです。
つまり、RSSリーダーRSSフィードを登録して“直接的に”使っているユーザーは頭打ちで、RSSフィードをうまくまとめてユーザーに提供することで“間接的に”使うユーザーについてはまだ分からない、という状況だと思います。もちろん後者はRSSをうまく使ったどんなサービスが登場するのかわからないという意味で未知数です。

RSSはニュース配信やウェブページの更新のお知らせなどに利用されることが多いのですが、RSSそのもののありかたとして「構造化データである」というメリットがあります。これはもうなんというか大変な強みであると言えると思います。

というわけで前置きが大変長くなりましたが「構造化データである」という特性を活かしたRSSの新しい利用の可能性があるのではないかと思い、今回のリードテックラボではとある組織が発信しているRSSのデータをコンテンツアグリゲータサービスの立場に立って*5加工して遊んでみたいと思います。

NDLの新着書誌情報RSS

NDLではご存知のとおり「納本制度」という制度のもと日本国内で刊行された"本”が納本される仕組みがあります。納本後、NDLでは書誌情報を作って各種サービスで検索したりあれこれしたりできるようにするのですが、つい数年前から納本されたばかりの「新着書誌」情報をエクセルデータで提供してくれるようになり*6、昨年からはなんとRSSにて発信を始めてくれました。というわけで対象となるデータは、

  • NDLが提供する新着書誌情報RSS(作成中)

http://www.ndl.go.jp/jp/library/data/pbsrss.html

にしました*7。このデータをRSSリーダーのようなリーダーで頭のデータから終わりのデータまで順々にチェックしていくのではなくいくつかのカテゴリでブラウンジング可能な「New Books!」というサービスを作ってみました。

  • NewBooks!

http://haseharu.org/labs/newbooks/

f:id:haseharu:20130407170409p:plain

  • Category(分類)
  • Publisher(出版者)
  • Author(著者)
  • Price(ねだん)
  • PublicationPlace(出版地)
  • All data(ぜんぶ)

の6つでブラウジングできます。ええ。前置き長かったくせにこのサービスでできるのはそれだけです。
たとえば、「Price」をクリックするとこんな感じでずらずらと書誌情報が表示されるのでブラウジングできます。

f:id:haseharu:20130407170551p:plain

本のタイトルをクリックするとリンク先はNDLサーチになります。そちらで詳細情報や各種SNSサービスへ登録したりデータダウンロードできます。

6つ*8の観点でカテゴライズしブラウズする。これ、ものすごくシンプルで簡単にできるように見えますが、実は構造化されない状態でウェブ上に掲載されているデータに対して同じような処理をしようとすると途方に暮れること間違いありません。利用しているデータがあくまでもRSSのような「構造化データ」で提供されているというメリットがあるからこそ簡単に実現できるということを付け加えておきたいと思います。

仕組み

データベースを使って処理している、とかそういうことではなく基本的には、NDLの配信しているRSSデータをPHPで取得しにいって処理するという、NDL RSSのラッパー的なサービスです。とはいえ、この新着書誌RSSのデータファイルですが、2MB近くもあるのでNDL側のサーバ負荷とサービスの処理速度が落ちるため、こちら側のサーバ側で最新データを保存、参照するようにして基本はそちらをアクセスしています。

用途

これを使ってNDLの新着書誌情報をブラウジングする方って、

・本の選書

をする方だと思います。新刊本チェックにぜひお使いいただければ嬉しいです。選書のようなことはしない人でも「こんなマニアックな本が日々刊行されているのか!」という気持ちにもなれると思います*9

さいごに

RSSリーダーのように網羅的に情報を収集し情報をチェックする、というやり方はエンドユーザーの多くに採用されなかった、ということかもしれません。裏を返せば、それが人なのかアルゴリズムなのか仕組みなのか知りませんが、情報をフィルターにかけた上でセレクトされた一部の情報を提供してくれるコンテンツアグリゲータ的な何かを使って情報を収集することが多くのエンドユーザーにとっての最適化された情報収集のカタチという可能性は残ります。それに合わせた情報発信のモデルを常に考えておく必要があるのかなと思いました。と、書きながらそれがイメージできていませんが。
最後の最後に。NDLの新着書誌RSS配信はけっこういろいろな使い方がされるのではないかと思います。データ公開してくださっているNDLと担当者の方に感謝しつつ、もっとおもしろい使い方されるといいな、と思っています。

*1:別に何か統計的根拠があるわけではないので「おそらく」としています。

*2:組織化

*3:厳密にはGoogle Reader

*4:便利ですし、そもそも誰かがセレクトした情報だけでなく日々網羅的に情報をチェックすることが必要な職業なので。

*5:データは一つだけ、ですが。

*6:たしか

*7:これをRSSリーダーに登録してチェックしている方はいらっしゃるのでしょうか。少なくとも自分はしていません。かなりの件数があるので、登録するにはけっこうな勇気がいりそうです。

*8:全部をブラウズする、というものをのぞけば5つの

*9:書誌情報だけで、ですが