世界最高峰の自然言語処理エンジン「Semantic Kernel」を開発するベンチャー、株式会社Studio Ousia(スタジオ・ウーシア)

この記事はに専門家 によって監修されました。

執筆者: ドリームゲート事務局

ACL、WWW2015など国際会議のコンペティションで優勝。Wikipediaなどから辞書を生成し、人間的な言語認識を実現。
展開している事業の内容・特徴

20160419-12015年7月に中国で開催された世界最大の自然言語処理に関する国際会議ACL(Association for Computational Linguistics)で行われたNoisy User-generated Text (W-NUT)のコンペティションや、2015年5月にイタリアで開催された国際会議WWW2015(International World Wide Web Conference)内で行われた「エンティティ・リンキング」に関するコンペティションNamed Entity rEcognition and Linking (NEEL) Challengeで、2位以降に大差をつけて優勝した日本のベンチャー企業、株式会社Studio Ousia(スタジオ・ウーシア)。

上記の優勝を勝ち取った技術をベースにした自然言語処理エンジン「Semantic Kernel(セマンティック・カーネル)」が、2016年4月頭にリリースされた。同エンジンは言葉・文章の意味を認識し、解析を行うが、その際にWikipediaなどから生成した辞書を利用する。従来、言葉・文章を文字列としてだけ扱うと、その意味を正確にコンピューターが理解・分析することは難しかった。それは単語が文脈によって意味が変わるためだ。

例えば下記の例文だが、

「New ‘Frozen’ boutique to open at Disney’s Hollywood Studios」

文章全体から「Frozen」の意味が、Disney、Hollywoodという単語から映画か何かだと類推できる。実際、これは2013年にディズニーが公開した映画「Frozen(邦題ではアナと雪の女王)」を指す。しかし、これを機械的に解析すると、「凍った」とか「寒い」というように認識されてしまう。言語解析の難しさの理由の一つは、単語の意味が多様であり、しかも新しい意味が次々出てくる点にある。人間は日々の生活で常に新しい知識を取り入れているため、Frozenの意味も他の言葉との関連性から自然と理解できるが、これを人工知能的にコンピューターに行わせようというのが「Semantic Kernel」だ。ちなみに上記の文章も、映画に関する基礎知識(ディズニーやハリウッドを知らない)やニュース(Frozenという題名の映画がヒットしている)を知らなければ理解できないだろう。つまり言葉の背景にある知識の学習量が、文章を高い精度で理解・分析するうえで必要となる。

まだリリースされたばかりのエンジンのため商業的な実用はこれからだが、同社代表の渡邉 安弘氏と山田 育矢氏によれば、より精度の高い記事レコメンドサービスの実現やFAQの検索サービスへの活用など、すでにいくつかの企業より導入に向けて検討がはじまっているという。

SFC発、世界で戦えるソフトウェアサービスを目指した研究特化型ベンチャー。
ビジネスアイディア発想のきっかけ

20160419-2株式会社Studio Ousiaは渡邉 安弘氏と山田 育矢氏を共同創業者としてスタートした。渡邉氏は日本合同ファイナンス(現 JAFCO)からアイエヌジー生命保険を経て、インキュベイトキャピタルパートナーズの設立に参画。株式会社ファンコミュニケーションズ、株式会社コマース21、株式会社エー・アイ・ピー等への出資を手がけた。インキュベートファンドでの投資案件のEXITが一段落して、今度は自分自身で起業に挑戦しようと考え、2007年にStudio Ousiaを設立した。

もう一方の共同創業者の山田氏は、高校時代に教育に役立つWeb教材の国際開発コンテストであるThinkQuestで銀賞を受賞したのち、株式会社ニューロンを起業しP2P通信技術に取り組んでいた。その後、ニューロンはフラクタリストに売却され、山田氏は同社の役員となっていたが、共通の知人を介して渡邉氏と知り合い、2006年には山田氏を含む5名のチームで新しいブラウザの開発プロジェクトを立ち上げ、2007年2月のStudio Ousiaを設立した。

ユーザが興味を持ちそうなキーワードをリンク化し、ワンタップで関連するコンテンツにアクセスできるようにするサービス「Phroni」や、キーワードを自動的にリンク化する機能を簡単に組み込むことの出来る開発者向けAPI「Linkify」などを開発していたが、2013年頃からは自然言語処理エンジンに特化し、研究開発を進めていた。Wikipediaを辞書として使うというアイデアで課題だったのは「速度」。Wikipediaに登録されている情報は日本語だけでも100万記事、290万項目、英語版では510万記事、3888万項目と膨大なため、その処理を実用的な速度で行う部分に苦労したという。

ちなみに、社名である「Ousia」は哲学用語で本質を意味する言葉。その語義とおり、同社の設立理念は、世界で戦える本質的なソフトウェアを作り出すこと。山田氏が在籍していたSFC発の本格的なコンビューターサイエンス・ベンチャーとしてスタートし、現在も開発拠点はSFCのある藤沢にある。

また、開発資金は株式会社エヌアイデイ、ニッセイ・キャピタル4号投資事業有限責任組合、Seed Technology Capital Partners投資事業組合などから調達。資本金は2億1,404万円(資本準備金含む)となっている。

Googleやマイクロソフト、IBMなどの競合と期して戦える、世界最高峰のソフトウェア研究所を目指す
将来の展望

渡邉氏、山田氏に同分野での競合を聞いたところ、Googleやマイクロソフト、IBMといった超巨大企業の名前が挙がった。とはいっても、まだまだ研究が必要な技術・研究分野であり、両氏によれば実用的になるにはあと3〜5年はかかるという。

また、同分野は世界中で研究・開発が進んでいることから、ドメスティックになってしまうと、最先端の研究成果やフィードバックを受けられなくなり、すぐに陳腐化してしまう恐れがあるため、同社では研究結果を公開して、できるだけオープンイノベーション的な取り組み方で進めていく構えだ。

ちなみに、東京大学合格を目標に、国立情報学研究所などが中心となって開発を進めている人工知能「東ロボくん」や、マイクロソフトの共同創業者ポール・アレン氏が設立した人工知能アレン研究所が開発している人工知能「アリスト(Aristo)」は小学生レベルだが理科を勉強している。あと数年もすれば人工知能でも文章題のテストで合格点を取れるようになり、そうした人工知能を使って大学入試の採点をやらせようという動きもある。そうした応用も、文章を正確に理解するという基礎技術が確立されてこそのものだ。日本の人工知能研究が世界をリードしていくことを、大いに期待したい。

株式会社Studio Ousia
代表者:渡邉 安弘氏、山田 育矢氏 設立:2007年2月
URL:http://www.ousia.jp/ スタッフ数:10名
事業内容:人工知能型検索サービス、自然言語処理エンジンの開発

当記事の内容は 2016/04/12 時点のもので、該当のサービス内容が変わっていたり、サービス自体が停止している場合もございますので、あらかじめご了承ください。

起業、経営ノウハウが詰まったツールのすべてが、
ここにあります。

無料で始める