生物多様性情報学の出張所

生物多様性情報学関係のあれこれを中心に扱います。「生物多様性情報学の情報交換の場」の投稿の抜粋中心。

「DNAバーコードデータベース」を公開しました

「DNAバーコードデータベース」
http://db.jboli.org/ 

 「DNAバーコーディング」という言葉、聞き慣れない方もいるかもしれませんが、DNAの決められた塩基配列(「DNAバーコード配列」などと呼ばれます)の情報を使って生物の種を同定するテクニックのことです(参考 日本語パンフレット http://www.jboli.org/wp/wp-content/uploads/2011/01/DNAbarcoding_JP.pdf)。国際的なプロジェクト(国際バーコードオブライフ http://ibol.org/)によって、日夜様々な生物のDNA情報が蓄積されつつあります。私は、前職でこの技術のプロモーションをやっていたのですが、残念ながら日本では研究以外の面であまり注目されておらずにいました。とはいえ、研究の中でDNAバーコードはずいぶん使われるようになりましたが、研究者の中には精力的にDNAバーコードの情報を蓄積されている方もおられます。そういう方々と協働で、DNAバーコードを取った標本(証拠標本と言います)の情報と、DNAの情報を見られるようにしたのがこのデータベースになります。このデータベースには、動物・植物・菌類の約3000個体の情報が掲載されており、標本画像のデータベースとして使えるようになっています。

このデータベースのシステムは、私の自作になっています。システムは、日本産蝶類和名学名便覧(http://binran.lepimages.jp/)の多くの部分を流用しており、ベースとなっているのはRuby on Railsというウェブシステム構築フレームワーク、データベースは今のところSqlite3です。日本産蝶類和名学名便覧はウェブホスティングサービスHeroku(https://www.heroku.com/)経由で公開していますが、今回は画像の容量が多くて難しいので、共同研究している東大のサーバーを使わせてもらっています。システム自体にはruga-specimenという名前をつけており、そのプログラム自体は、オープンソース(誰でも使ったり修正したり出来るような形)でGitHubで公開しています(https://github.com/mothprog/ruga-specimen)。 

本当は、これをベースにして本職の方に作っていただいた方がセキュリティ上は良いのですが、こういうところにかける資金源はなかなか無いですし、自分でさらっと作ったことを伝えて作ってもらうには手間も数倍かかるので、今はこんな風にしています。理想を言えば、みんなで作る図書館情報管理システムであるNext-L Enju (http://www.next-l.jp/) のように、腕に覚えがある人でシステムを作っていくような世の中を作りたいところです。日本の図書館のためのソフトウェアを関係者で作ろうというアクティビティであるCode4Libの日本版Code4Lib JAPAN(http://www.code4lib.jp/)よろしく、自然史博物館のためのCode4NaturalHistoryMuseum JAPANを作りたいというのが妄想となっております。