2008-12-17 23:03:44
タンパク質核酸酵素バックナンバー全文検索というサイトがライフサイエンス統合データベースプロジェクトにできたということを生化学・分子生物学合同大会で知ったので早速使ってみた。
検索結果から該当記事のpdfファイルをダウンロードできるが、テキストのコピーや印刷はできない。
検索結果は検索語とその前後およそ30文字が表示される。学会で見たときにはそうなってなかったような気がするのだが。前後関係がわかると嬉しいのにと希望は伝えておいたのだった。
私はもちろん検索語を中心にきちんと並んでほしいのだ。一緒に使われる語(共起表現)が何かを一望したいから。
どんなふうに使うのかと思うことがあるではないか。専門用語には専門用語独特の用法がある。それは単語一つに意味ではなく、組み合わせとして専門用語固有の表現がある。それから逸脱していると、どうも不自然に感じられてしまうものだ。こういう日本語の論文データベースは貴重である。
PHPでざっと作ってみたものの検索結果はこんな感じに。後で、もう少し修正してまたここで報告します。
このライフサイエンス統合データベースプロジェクトには、毎日新聞2002〜2007年ライフサイエンス記事全文検索というのもある。これも全く同じように検索できる。本当は科学記事以外の文章と比べてみたりしたいのだけど、これでも新聞記事と「蛋白質・核酸・酵素」の総説(論文)との違いなどが見えてくるかも知れないので、ちょっと比べてみたい。