研究分野
研究内容
機械翻訳
世界には数多くの言語があり、自らの母語以外の言語を読み、聞き、書き、話すことは苦労を伴います。
機械翻訳は言語間の翻訳を自動的に行う技術であり、言語を超えたコミュニケーションや情報収集?発信の手助けになるものと期待されています。
特に2010年代後半以降は深層学習の技術とインターネット上で流通する大量のことばのデータをもとに急速に性能が向上し、数多くの商用サービスに気軽にアクセスできるようになりました。
しかしながら翻訳というのはプロの翻訳者にとっても容易でない問題であり、今機械翻訳でできていることは比較的簡単な部類の問題に過ぎないのかもしれません。
そのため、最新の技術でも依然としてうまく翻訳できないような問題を解決するための研究や、音声を入力として同時通訳のように次々に訳していく方法の研究、翻訳された結果が良いものであるか評価する方法の研究、また翻訳者や通訳者の手助けになるような技術の研究等に取り組んでいます。
音声言語処理
ことばは大きく書きことば(書記言語)と話しことば(音声言語)に分けることができます。
自然言語処理では書記言語を扱うことが多いのですが、音声言語はコミュニケーションの基本であり、文字にすると同じものでも異なった伝え方ができるという利点もあります。
一方で、音声を入力とする、文の切れ目が曖昧だったり、言い淀みや言い誤りがあったり、書記言語よりも扱いにくい側面もありますし、音声を出力とすると情報伝達のためにどのような話し方にするべきなのかを細かく調整する必要が出てきます。
自然言語処理と同じようにこうした技術も深層学習によって大きな性能向上を遂げましたが、実際の音声に対して完璧に動作するわけではありません。
そのため、書記言語に基づく様々な基盤は活用しつつも、音声言語ならではの特性に着目し、音声を通じたコミュニケーションの充実や音声アーカイブに対するデータ処理の効率化に繋がるような技術の研究に取り組んでいます。
対話
ことばを通じて人間同士が対話をするように、人間と計算機の間でも何か課題の解決をしたり、あるいは単にお話をしたりする目的で対話を行うことができます。
相手の話したことの意図や意味を理解し、適切な答えを返すことは人間にとってもときには難しい課題であり、ことばに関する技術の中でも特に難しい領域と言えます。
深層学習に基づく対話システムの隆盛は2022年の年末に発表されたOpenAIのChatGPTによって新たな局面を迎え、特定の分野の課題解決や単純な雑談という応用を超えつつあります。
そういった技術の進展を背景に、人間に何かの働きかけをしたり、人間と人間の対話の手助けをしたりできるような対話システムの研究に取り組もうとしています。
その他
上に挙げた他にもことばやコミュニケーションに関わる様々な研究に幅広く取り組むことを目指しています。
須藤は深層学習による自然言語処理の基盤となっている埋め込み(ことばを実数値ベクトルで表現する)に関する基盤的技術や、外国語学習に関わることばの運用能力の推定技術等にも取り組んできました。
研究に取り組む学生がことばに対して持つ問題意識を大切にして、人間のことばやコミュニケーションを豊かにすることに繋がることにオープンに取り組みたいと思います。
主な論文
- Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura, Improving Speech Translation Accuracy and Time
Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation, IEEE/ACM Transactions on Audio,
Speech, and Language Processing, Vol. 32, pp. 906-916 (2024)
- Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura, Prefix Alignment for Training Simultaneous Machine
Translation, Journal of Natural Language Processing, Vol. 31, No. 1, pp. 79-104 (2024)
- Yoichi Ishibashi, Sho Yokoi, Katsuhito Sudoh, Satoshi Nakamura, Subspace Representations for Soft
Set Operations and Sentence Similarities, Proceedings of 2024 Annual Conference of North American
Chapter of the Association for Computational Linguistics, accepted (2024)
- Shohei Tanaka, Koichiro Yoshino, Katsuhito Sudoh, Satoshi Nakamura, Reflective Action Selection
Based on Positive-Unlabeled Learning and Causality Detection Model, Computer Speech & Language, Vol.
78, Article 101463 (2023)
- Kosuke Takahashi, Katsuhito Sudoh, Satoshi Nakamura, Automatic Machine Translation Evaluation using
a Source and Reference Sentence with a Cross-lingual Language Model, Journal of Natural Language
Processing, Vol. 29, No. 1, pp. 3-22 (2022)
- Katsuhito Sudoh, Kosuke Takahashi, Satoshi Nakamura, Is This Translation Error Critical?:
Classification-Based Human and Automatic Machine Translation Evaluation Focusing on Critical Errors,
Proceedings of the Workshop on Human Evaluation of NLP Systems (HumEval), pp. 46-51 (2021)
- Yuta Nishimura, Katsuhito Sudoh, Graham Neubig, Satoshi Nakamura, Multi-Source Neural Machine
Translation with Missing Data, IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol.
28, pp. 560-589 (2020)
- Noise-aware Character Alignment for Extracting Transliteration Fragments, Journal of Natural
Language Processing, Vol. 21, No. 6, pp. 1107-1131 (2014)
- Syntax-based Post-ordering for Efficient Japanese-to-English Translation, ACM Transactions on Asian
Language Information Processing, Vol. 12, No. 3 (2013)
- Divide and Translate: Improving Long Distance Reordering in Statistical Machine Translation,
Proceedings of the Joint Fifth Conference on Statistical Machine Translation and MetricsMATR, pp.
418-427 (2010)
- Named Entity Recognition from Speech Using Discriminative Modles and Speech Recognition Confidence,
Journal of Information Processing, Vol. 17, pp. 72-81 (2009)
- Post-Dialogue Confidence Scoring for Unsupervised Statistical Language Model Training, Speech
Communication, Vol. 45, No. 4, pp. 387-400 (2005)
関連リンク