オープンソースカンファレンス2020 Tokyo/Spring
2020-02-21 (金)   17時15分

深層学習を利用した新しいOSSかな漢字変換『Egoistic Lily』 〜その仕組みと展望〜

このエントリーをはてなブックマークに追加

講師:橋本 雅彦
担当:おーぷん万葉
レベル:入門編
対象者:自然言語処理に興味のある方
前提知識:特にありません。

Linuxデスクトップを使用する場合、その多くは『mozc』というかな漢字変換システムを使用していると思います。
ただし『mozc』は、現在メンテナンスがほぼ停止しており、「令和」を変換させる仕組みも各ディストリビューションで対応するという状況です。
この状況を改善しようと、あらゆるコミュニティーで対策が練られています。

おーぷん万葉プロジェクトでは、オープンデータを活用した新しいかな漢字変換の仕組みを模索中です。
そして昨年夏に完成したかな漢字変換システムでは、深層学習が使われています。

かな漢字変換で深層学習と言うと、多くの場合RNN(リカレントニューラルネットワーク)を思い浮かべると思いますが、おーぷん万葉ではAutoEncoderモデルで実装を行い、RNNよりも短い学習時間、そして拡張性の高いかな漢字変換を目指しています。
本セミナーでは、その仕組みについて紹介します。

【カテゴリ】自然言語処理/オープンデータ/Linux