るるるkindle
はじめに
ひさびさのリードテックラボ、今回はkindle編です。kindle paperwhiteを買ってもうじき1ヶ月くらい経ちます。ディスプレイと本体のマットな質感、ちらつかないディスプレイ、電池持つ持つ、軽いなあ、等々けっこういい感じです。自分のように、駅まで車でいき電車にのりかえ会社の最寄りの駅から自転車に乗るという通勤の人*1は「重い荷物」は敵です。自分が読む大抵の本は重いです。つまり大抵の本は敵です。なので軽いkindleは友人になれそうです。それから、一番良いのが余計なアプリは入れられず「読む」ことしかできない端末である、だと思います。「文字を読む」に特化した専用のツール。潔い。良いです。ページ切り替え時のもっさり感は許容範囲。あとはコンテンツが少ない!ということ*2。電子書籍だとどんな本を買えばいいのかなあ、と自分自身で掴めなくって今までにもオライリーのDRM FreeのEbookを1冊しか買ったことがなく、kindleでもまだ1冊しか本を買っていなかったりします*3。とりあえずは「繰り返し読む本」を電子書籍で買おうかなあと思っています*4。じゃあ、本も買わずに何してるんだ、というとほとんどが、RSSをkindlefeederでkindleに変換して通勤中に読んだり、ツールを作ってウェブ上の情報源を変換して遊んでいました。paperwhiteが届いて「あ。これいいわ。遊べる」と、有料コンテンツに見向きもせずに次の日にはスクリプトを書いていた程度のデジタルガジェット類好きです。
JATS × kindle!
JSTのJ-STAGEではJATS形式でのデータ搭載を始めたそうで、JATS形式でのデータ搭載された論文はPDFだけでなく「全文html」で公開されています。まだそんなにたくさんの雑誌が対応しているわけではないようなのですが、自分が毎月チェックしている「情報管理」でも「全文html」始めたよー、ということなのでそれをkindleで読むためのスクリプトを書きました。J-STAGEで公開されている「全文html」をkindle形式に変換するツールを紹介します*5。
ツール
bookmarkletは「kindle!」です。ブックマークバーにぽいっといれてみてください*6。ちなみにここがサーバ兼公開サイトです。とりあえずJ-STAGEのこちらの記事のページへいってみてさきほどブックマークツールバーにいれたbookmarkletをクリックしてみてください。うまくいけば変換された.mobiファイルをダウンロードできます。ダウンロードしたmobi形式のファイルをkindleに転送すればOKです。
しくみ
以下の流れで処理してます。
開発中に使ったもの
KindleGen
htmlをmobi formatに変換してくれます。試してませんがEPUBもmobiに変換してくれるようです。win,mac,linux用が公開されています。商用利用でなければこういった形で変換ツールとして公開してもOKなようですが利用にあたっては利用規約をご覧ください。htmlはそのまま流し込んでもある程度は変換してくれますがKF8*8やAmazon Kindle Publishing Guidelinesが公開されているのでそちらを参考に作った方がきれいに変換できます。特にKF8のページはサンプルデータが公開されているのでとりあえずそちらを見ながら仕組みを理解して詳細はPublishing Guideを読む、という流れがいいかもしれません*9。
Kindle Previewer
まんまkindleビューワーです。.mobiを作ったらとりあえずこれで開いて出力結果を確認できます。win,mac用*10が用意されていて、e-ink(paperwhite)はもちろん、Fire HDやiOS用のデバイスでの表示も確認できます。
JATSをスクレイピングの謎
JATSってxmlじゃないの?xmlをスクレイピングなんてどういうこと?と思ったあなた。自分も「xmlいいねえ」と思って始めたのでまさかの展開でした。つまりこういうことっぽいです*11。
- 出版社がJATSでJ-STAGEに入稿、搭載
- J-STAGE側では利用者にhtmlとして出力
- 利用者は直接的には構造化データの恩恵を受けられない*12
JSTさんにはぜひJATSをそのまんま公開していただきたいと世のデータギークたちは思っています。
Web APIで全文htmlのデータももしかしたら受け取れる?、とおもったのですが、J-STAGE3になったタイミングでWeb APIページが準備中でした。
かんそう
kindleで論文を読む。自分はそれなりに満足してますが、もう少し遊んでみます。
paperwhite、通勤時の読書端末としてかなり良いです。
コンテンツ、できればもっと増やしてください。
JSTさんJATSそのまんま公開してください。
*1:いないですよね。
*2:洋書を手に入れやすくなった、というメリットもあると思います。
*3:しかも漫画w
*4:繰り返し読む本って漫画とか小説でわりと薄かったりして。
*5:paperwhiteが届いて次の日に試験的に書いてみたものです。
*7:JATSってxmlじゃないの?なぜにスクレイピング?と思ったあなたは鋭いです。後ほど書きます。
*9:自分もざっくりとしか変換処理していないので、どちらもあまり詳細は読めてません。
*10:2013.3.17現在ver2.8です。
*11:間違ってたらどなたか早急に教えてください。
*12:「全文html」形式で公開されている部分は直接的に恩恵を受けられているとは言えるのですが。