研究テーマ

綱川研究室は自然言語処理およびその周辺分野を研究テーマとしています。

自然言語処理とは、人間が扱う言語をコンピュータで扱うことを指します。代表的な応用に「機械翻訳」や「情報検索」などがありますが、PCやスマートフォン等を通じて我々が「ことば」に触れる機会はどんどん多様化し、それにつれ新しい応用が生まれています。また、近年の人工知能技術のブレークスルーにより最も恩恵を受けている分野の一つでもあります。

当研究室は2019年4月からスタートしたばかりです。主要となる研究テーマはこれから新たに所属する研究室メンバーの皆さんと一緒に創り上げていくことになりますが、現在の研究テーマをご紹介します。

 

機械翻訳

機械翻訳はコンピュータ黎明期からコンピュータの主要な応用として取り組まれている伝統的かつ最先端の研究テーマです。近年、日本語の書き言葉から英語への翻訳はニューラル機械翻訳と呼ばれる技術の導入によりかなり流ちょうになっていますが、それでも正確さが要求されるシーンでは人手による修正が不可欠であり、また音声翻訳といった話し言葉の翻訳はまだまだ課題が残されています。

 

Wikipediaを対象とした研究

Web上のテキストの大半は知識としての体系化がなされていませんが、Wikipediaは項目間の関係も含めて知識がある程度体系化され、かつテキストの品質もある程度保たれている大規模な資源です。本研究室ではテキスト中に現れた事柄をWikipedia記事に対応づけるタスク(wikification、あるいはエンティティ・リンキング)に取り組んできました。これにより、Wikipedia記事自身にあるリンクの付与を自動化したり、Web上のテキスト中にある未知の事柄をすぐ調べられたりすることができるようになります。さらに、自然言語処理においてある語を処理するときにその対象が何なのかが明示的にWikipedia記事で特定できるようになる可能性があります。

 

特許情報処理

特許を構成する文書は膨大であり、また法律上の効力を得るため一般の書き言葉とは異なる独特の文体を持っています。このため特許関連文書を対象とする自然言語処理ではそれに特化した対応を行う必要が生じます。また、特許の検索や分類、特許文書の翻訳といった特許特有の事情から生じる課題があるのも特徴です。

 

雑談対話システム

対話システムの中でも、人間どうしが行うような雑談をターゲットとしたものがあり、認知症予防といった効果が期待されています。しかし、観光案内など何かを目的とした対話システムと異なり、雑談する上ではシステムがいかに人間に近い振る舞いをするかということがより強く要求されます。現在、人間が自然な雑談と感じる上で重要な要素のうち、話題選択と自然な相槌をテーマとして研究を進めています。

 

自動評定システム

学校で行われる試験の中の記述式問題や、オンラインショッピングサイトの商品に対するレビューのように、その記述に何らかの評価が付けられる場合があります。これには労力がかかるので自動化しようというのが動機です。現在は、一定数の評価例があるものの評価基準が複雑な記述式タスクを対象にその評価を予測する課題に取り組んでいます。

 

 

関連リンク

静岡大学情報学部 NIST研(西村研/綱川研/西田研)ホームページ

静岡大学情報学部内の自己紹介ページ