紫だちたる雲の細くたなびきたる blog

春はあけぼの(をかし)

英語じゃなく日本語も!

 近藤のインタビューで一つ気になるのは、英語一辺倒なとこかな。どうも米原万里さんの著作を読んでからというもの、もっと言語のバランスを取った方がいいんじゃないかって思えてしまう。
 確かにアルファベット26文字だけで表せてしまう英語のほうがプログラムを書くのにも有利だし、文章を記憶する領域も少なくて済むなどメリットは多い。加えて、英語はゲルマン言語(ドイツ語など)とラテン言語(フランス語など)のいいとこ取りをして、さらに文法を簡略化したような言語だから習得も比較的楽だ。だからコンピュータが爆発的に普及した今、ほぼ世界標準語的地位を占めるに至っているんだろうけど、「ちょっと待て」とも思うのだ。
 コンピュータの世界、特にプログラミングの世界は英語だけでもいい。(日本語のプログラミング言語もあるけど。なでしこ:日本語プログラミング言語。ちなみにJavaは変数名やクラス名などを日本語で記述してもちゃんとコンパイルできて動作もする。)
しかし、そこに記録されるブログやらなんやらはこの星に存在するすべての言語をサポートせねばならないと思うのだ(文字が無い言語(例えばアイヌ語など)はサポートできないとしても)。
 はてなダイアリーの大きな特徴とも言えるキーワード機能。たぶん単語を抜き出すのに数日前僕が挫折した形態素解析を使っているんだろうと思うんだけど、たまに変な区切り方で変なキーワードとリンクされることがある。まだまだ改善の余地はあると思う。もちろん形態素解析には専門の研究者がいて日々研究を重ねている所ではあるのだが。もっと産学連携してみてはいかがだろう。

 そういえば、高校時代の友達が形態素解析や検索関連の研究をしていた。今、彼はGoogleの検索とは別のやり方で人の役に立つ検索エンジンを作れないだろうかと言って研究をしている。「GoogleAmazonアフィリエイトは1つのビジネスモデルとして確立され、多大な収益をもたらすようになった。はてなが目指した知識の共有、それは人力検索やキーワードに具現化されているし、2chの情報やWikiPediaなんかも知識のデータベースとしての地位を確立しつつある。でも、、、」と彼は言うのだ。
 「例えば2chWikiPediaの情報は正確性を欠くことがある。そしてどの情報が正確なのか、その判断をユーザに委ねる分、馴れていない人には難しい。Googleは多数のリンクやキーワードを含むページを探し出すのは得意だけれど、Googleでは検索できない重要な知識も世の中にはたくさんある。そういう情報を検索しやすいエンジンを作りたい。」
 彼は手始めに図書館のデータベースの検索の研究をしている。図書館の情報は膨大で、そしてそれを使いこなせる人はそれほど多くない。図書館にある情報を誰でも容易に検索し取得できるようになればきっと情報の共有が進み、新たな科学の発展も生まれるはず。なるほど。