ことばの海をもぐる

いいわけとしてのはじめに


どうもLi:te tech*1には「隔週で書く」というルールがあったらしくおおよそ適当に生きている自分は「えー、そうだっけー」という感じですが前回のエントリーから一ヶ月近く経とうとしているのでそれは何か書かないとまずいよね、と。

OCLC Researchの年報が出ていましたが、OCLC周りのサービスっておもしろいのがたくさんあるのにわりと日本語の情報がなかったりするので、英語をみると「うっ」となる自分としてはみんなブログとかでがんがん情報だしてよー頼むよー、と思っていたので、OCLCのサービスを取り上げてみたいとおもいます。OCLC Researchで「Terminology Services」という実験的なサービスをやっていますが、それで遊んだことがあるので少し書きます。

[Terminology Services]
http://www.oclc.org/research/activities/termservices/default.htm

OCLCでの位置づけ


今回取り上げる「Terminology Services」というサービスはOCLCの活動のなかで「Metadata Support & Management」というところに分類されるそうです。C4LJにも記事が出ていた「mapFAST」やFRBRな「Worldcat Identities」や上の年報でも取り上げられていた「Classify」などと一緒に分類されるようです。

ちなみにOCLCのやってるいくつかの活動・サービスはここで一覧で見ることができます。余談ですが、OCLCの一連のプロジェクトやサービスはウェブに成果物も含め、きっちり載せてくれているので調べるときには非常に助かります。

  • Terminology Services [DEMO SITE]

http://tspilot.oclc.org/resources/index.html

  • Terminology Services [OCLC activities]

http://www.oclc.org/research/activities/default.htm

とりあえずいっぱいありすぎてくらくらします。

何ができるの?


それでは本題。Terminology Servicesは、その名のとおり「統制語彙」をいくつかのデータ形式で提供してくれるサービスです。対象となる語彙は以下の10個。

  • Controlled Vocabulary Metadata (meta)*2
  • Library of Congress Genre/Form Terms for Library and Archival Materials (lcgft)
  • Faceted Application of Subject Terminology (fast)
  • Form and Genre Terms for Fiction and Drama (gsafd)
  • Library of Congress Annotated Card Program Subject Headings (lcshac)
  • Library of Congress Subject Headings (lcsh)
  • Medical Subject Headings (mesh)
  • Thesaurus for Graphic Materials: TGM I, Subject Terms (lctgm)
  • Thesaurus for Graphic Materials: TGM II, Genre and Physical characteristic Terms (gmgpc)

これらの語彙を、

といった形式でデータを受け取ることが可能です。それじゃあ、どういう形でリクエストすればいいのか?ということになりますが、基本的には、OCLC側で用意しているデモサイトで検索するか、SRU*5で問い合わせることになります。

トップページの「Standards」のところにJSONの文字が見えたので「使えるのかな」と思ったら、SRUリクエストのデータ返戻形式にJSONは取り扱えないとのことで、以前使ったときはJavaScriptからデータを引き出したかったので、ええーという感じでした。なんとかしてくれないかなあ。

布石としてのおわりに


以前、code4lib-MLに流れていたり、CA-Rにも載っていた「TemaTres」なんかもおもしろそうと思いつつ。でも、隔週はちょっときついよね、と思いつつ。

TemaTres
http://www.vocabularyserver.com/

オープンソースシソーラス管理・公開用Webシステム“TemaTres” (CA-R)
http://current.ndl.go.jp/node/18780

*1:Li:d techの2年目のプロジェクト、らいとてっく

*2:これは語彙と言っていいのか微妙ですが、一応

*3:DEMO siteのことです

*4:SKOS,MARC,Zthes,MADS等々のschemeがあります

*5:CQL:Context Query Language