自然言語処理

システム工学科Aコース3年生後期

(1)この授業のねらい

機械翻訳システムを中心とした自然言語処理の技術を習得する。

(2)授業の概要

自然言語処理とは、人間が話す言葉をコンピュータで処理させることである。 そこには自然言語インタフェース、仮名漢字変換、ドキュメント処理、自然言 語によるプログラミングなどの分野も含まれる。しかし、ここでは、自然言語 処理の1つの応用である機械翻訳システムを中心にして、そこで必要とされる 要素技術と多少の周辺技術について解説する。
トピックとして、歴史、機械翻訳システム、自然言語のモデル、形態素解析、 構文解析、意味解析などを取り上げる。
また近年研究の盛んな実例による機械翻訳、コーパスからの言語知識獲得にも ふれる。またインターネットの普及に伴い発生してきた自然言語処理技術につ いても概説する。

(3)履修にあたって留意すること

教科書は指定しない。

(4)授業計画

以下にトピックを述べる。1つのトピックを1、2週で説明する。

・機械翻訳システムの歴史
自然言語処理の歴史を述べて、自然言語処理とはどういったものかを大まかに説明する。

・機械翻訳システム
機械翻訳システムの方式と特徴を説明する。特に近年研究の盛んな実例による翻訳方式も説明する。

・自然言語のモデル
自然言語処理を言語モデルから捉える考え方を説明し、代表的なモデルとその上での処理を説明する。

・形態素解析
日本語の形態素解析の技術について解説する。

・構文解析
パージングアルゴリズムと文法記述の2面から構文解析を概説する。

・意味解析
意味とは何か。意味の記述形式と構文木からの変換を説明する。

・ 文生成
意味表現から表層の文の生成とその問題点を説明する。

・ 言語知識獲得と機械学習
近年研究の盛んなコーパスからの言語知識の獲得について解説する。同時に事例に基づく機械学習も解説する。

・ 情報検索
インターネットの普及により発生した自然言語処理技術として、情報抽出、要約、キーワード抽出などがある。これらについて解説する。

(5)教科書及び参考書

日本語による代表的な参考書を以下に挙げる。
・「自然言語処理」 長尾真 岩波書店
・「自然言語処理 -基礎と応用-」 田中穂積監修 電子情報通信学会
・「自然言語解析の基礎」 田中穂積 産業図書
・「自然言語処理の基礎技術」 野村浩郷 電子情報通信学会
・「自然言語理解」 田中穂積、辻井潤一 オーム社
・「言語処理と機械翻訳」 野村浩郷 講談社サイエンティフィク

近年の自然言語処理の応用などを更に勉強したい人のために
・「音声言語処理」 北研二 他 森北出版
・「確率的言語モデル」 北研二 東京大学出版
・「情報検索」 徳永健伸 東京大学出版

授業では取り上げないが、言語学、認知心理学の観点からの参考書
・「自然言語」 郡司隆男 日本評論社
・「自然言語の意味論」白井賢一郎 産業図書