読者です 読者をやめる 読者になる 読者になる

参考文献情報からDOIを同定する「Reference Search」

はじめに

リードテックラボ、DOIで遊んでみる編です*1。別件の作業の副産物的なものとして、先日CrossRefから公開されたCrossRef metadata search betaのAPIを使って、論文や図書等で引用、参考にされている文献の情報をいれてDOIを検索・同定しフルテキストへたどりつくことができる「Reference Search」を作ってみました。

たとえば、こんな感じの「参考文献情報」のテキストを入れて検索し、

Paul Gray, 2002, 'Knowledge Management', Information Systems Management, vol. 19, no. 1, pp. 89-93

当該論文へのフルテキストURL(DOI)を取得するためのツールです。

Reference Search

http://haseharu.org/labs/ref_search/

画面はこんな感じ。

f:id:haseharu:20130519120318p:plain

論文を読んでいて引用あるいは参考文献として上げられているテキストデータを特に整形することなくぽいっと検索窓にいれて検索する、あるいはテキスト選択してBookmarkletをクリック、でDOIが同定できてそのままフルテキストを読める(読めない場合もありますが)という感じです。

f:id:haseharu:20130519120429p:plain

つかいかた

「論文タイトル、雑誌名、巻号、ページ数」に関するデータをサイトの検索窓へコピペするか入力するか、「論文タイトル、雑誌名、巻号、ページ数」をテキスト選択してBookmarkletを動かす、の2種類で動きます。

検索結果

検索窓の下に同定された論文の書誌情報及びDOIが表示されます。DOIをクリックすれば外部サイトへ飛んでいきますのでそこでフルテキストを読むことができます*2。「SCORE」という数値が出てきますが、どのくらいの精度で同定できているかの参考となる値です。3以上だと同定できていますが、1-2だとやや怪しい感じです。このSCOREという値は後述しますが、利用しているCrossRefのAPIが算出している数字で詳しいことはよくわかりません*3。また、このAPIではCOinSも出力してくれているので検索結果の中にCOinSもそのまま出力しています*4

使ったもの

基本的にはCrossRefのAPIに「整形していないテキストをまるごと渡してDOIを同定する」機能があるためそれをそのまま使いました。ただしこの機能を使う場合POSTでデータを渡してあげる必要があります。

補足

DOIのRAとして最大のCrossRefではSimple text queryというサービスを提供しています。今回作った「Reference Search」と同じものです。が、CrossRefのSimple text queryは2010年から「登録制」となってしまい、メールアドレスを登録した上で、利用時にメールアドレスも入力しなければいけない、非常に使い勝手が悪いサービスになりました。あとわざわざサイトにいって「テキストを入力する」のも面倒で、このサービスおもしろそうだなと思ったものの結局自分は一度もまともに使ったことがありません。というわけでAPI公開に合わせて、登録不要で、Bookmarkletから簡単にDOIの検索ができるものがあれば自分も使うんじゃないかと思い作ってみました。

おわりに

今回は取り上げませんでしたが、CrossRef metadata search betaという仕組み自体はけっこうおもしろいです。

ファセット(資料タイプ、OA、分野、刊行年)による検索結果の絞り込み、ORCIDとの連携など、おもしろいことやってます*5

*1:ここのところDOIばかり触っています。

*2:当然ながら全てがオープンアクセスの論文ではないので契約が必要なものや課金されるものもあるので必ずしも全てが読めるわけではありません。

*3:ドキュメントがあるかもしれませんが

*4:上の画面キャプチャには「Find in a library」というworldcatへのリンクが貼られていますがこれは自分がGoogle chromeのCOinS 2 OpenURLをいれていてそこにWorldcatを登録しているためです。何もしていないとでてきません。

*5:資料タイプに「conference paper」があるのが個人的に気になっています。