調査
「これからデコードを行います」
Language Weaverの開発にあたり、RWSは自然言語処理分野で長年にわたり研究開発を続けています。これを担当するRWSの多角的な多国籍チームは、科学の発展という短期目標を掲げ、最先端の研究を行っています。その先には、この取り組みをRWSのツールやテクノロジーに取り入れ、お客様がコンテンツをより理解できるように、また、新しいコンテンツをより効果的に作成できるように支援するという長期目標があります。
次のような分野について積極的に研究開発を行っています。
- ニューラル機械翻訳
- MT品質の評価
- 多言語での要約
- 固有表現認識
- センチメント分析
- テキストの生成
- テキストの単純化と言い換え
- 質問への回答
- トピックとスタイルの分析
RWSは、NAACL、(E)ACL、EMNLP、MT Summitなどの有名な会議に定期的に出席し、講演を行い、当社の取り組みを発表しています。以下では、RWSの発行物の一部をご紹介しています。
Language Weaver担当チームの日常
Language Weaverの仕事の最大の特長は、退屈しないことです。このチームは、新たな顧客との仕事が途切れることなく発生し、新たなデータや、興味深い言語、幅広い分野や用途に取り組んでいるため、同じ作業や調査項目の繰り返しということがありません。
毎年何十億ワードも処理し翻訳するお客様の実際の問題を解決するため、新たな手法を日常的に試しており、スキルセットの調整や拡充の機会は常にあります。また、さまざまな経歴を持つ人材が集まったチームのため、互いから学ぶことも多くあります。
このチームは、ロサンゼルスや、クルージナポカ、ダブリン、その他の欧州の都市に拠点を置いています。科学者、エンジニア、翻訳者から構成され、NLP分野の基盤がしっかりとし、視野を積極的に広げようとしている、ダイナミックでエネルギーに溢れるチームです。チーム内では、MTエンジンで翻訳できる言語のほとんどを話せます。
日常業務のほかに、勉強会を毎週実施し、この分野における独自の研究論文や他の優れた論文などを発表し合っています。さらに、「The Neural MT Weekly」という週刊ブログを公開しており、毎週1,000人の読者に読まれています。
私たちのチームにご興味がありますか?こちらからお問い合わせください!
発行物
発行物の一部をご紹介します。
2021年:
M. Roemmele、D. Sidhpura、S. DeNeefe、L. Tsou著(2021年)『AnswerQuest:A System for Generating Question-Answer Items from Multi-Paragraph Documents』、EACL 2021(The 16th Conference of the European Chapter of the Association for Computational Linguistics)、デモトラック。
2020年:
D. Saunders、W. Feely、B. Byrne著(2020年)『Inference-only sub-character decomposition improves translation of unseen logographic characters』、WAT 2020(The 7th Workshop on Asian Translation)の議事録。
2019年:
W. Febely、E. Hasler、A. de Gispert著(2019年)『Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation』、WAT 2019(The 6th Workshop on Asian Translation)の議事録。
D. Saunders、F. Stahlberg、A. de Gispert、B. Byrne著(2019年)『Domain Adaptive Inference for Neural Machine Translation』、ACL(The 57th Annual Meeting of the Association for Computational Linguistics)の議事録。
M. Roemmele著(2019年)『Identifying Sensible Lexical Relations in Generated Stories』、NAACL-HLT 2019(The 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies)の談話理解に関するワークショップ。
2018年:
G. Iglesias、W. Tambellini、A. de Gispert、E. Hasler、B. Byrne著(2018年)『Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment』、NAACL-HLT 2018(The 2018 Conference of the North American Chapter of the Association for Computational Linguistics)の議事録。
E. Hasler、A. de Gispert、G. Iglesias、B. Byrne著(2018年)『Neural Machine Translation Decoding with Terminology Constraints』、NAACL-HLT 2018(The 2018 Conference of the North American Chapter of the Association for Computational Linguistics)の議事録。
D. Saunders、F. Stahlberg、A. de Gispert、B. Byrne著(2018年)『Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT』、ACL(The 56th Annual Meeting of the Association for Computational Linguistics)の議事録。
F. Stahlberg、A. de Gispert、B. Byrne著(2018年)『The University of Cambridge's Machine Translation Systems for WMT18』、WMT(Conference of Machine Translation)の議事録。
2017年:
E. Hasler、A. de Gispert、F. Stahlberg、A. Waite、B. Byrne著(2017年)『Source sentence simplification for statistical machine translation』、Computer Speech & Language、vol.45、p.221~235。
F. Stahlberg、A. de Gispert、E. Hasler、B. Byrne著(2017年)『Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices』、EACL 2017(The 15th Conference of the European Chapter of the Association for Computational Linguistics)の議事録。
E. Hasler、F. Stahlberg、M. Tomalin、A. de Gispert、B. Byrne著(2017年)『A Comparison of Neural Models for Word Ordering』、INLG(International Conference on Natural Language Generation)。
2015年:
A. Gispert、G. Iglesias、W. Byrne著(2015年)『Fast and Accurate Preordering for SMT using Neural Networks』、NAACL-HLT。
M. Dreyer、J. Graehl著(2015年)『hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs』、NAACL-HLT。
M. Dreyer、D. Dong著(2015年)『APRO: All-Pairs Ranking Optimization for MT Tuning』、NAACL-HLT。
2014年:
J. May、Y. Benjira、A. Echihabi著(2014年)『An Arabizi-English Social Media Statistical Machine Translation System』、アメリカ機械翻訳協会
L. Jehl、A. Gispert、M. Hopkins、M. Byrne著(2014年)『Source-side preordering for translation using logistic regression and depth-first branch-And-bound search』、EACL(p.239~248)。
2013年:
M. Hopkins、J. May著(2013年)『Models of Translation Competitions』、ACL 2013の議事録。
D. S. Munteanu、D. Marcu著(2013年)「Exploiting Comparable Corpora」、出版社Springerの『Building and Using Comparable Corpora』内。
2012年:
R. Soricut、N. Bach、Z. Wang(2012年)『The SDL Language Weaver Systems in the WMT12 Quality Estimation Shared Task』、WMT 2012(The Seventh Workshop on Statistical Machine Translation)の議事録。2012年6月、カナダ、ケベック州モントリオール。
M. Dreyer、D. Marcu著(2012年)『HyTER: Meaning-Equivalent Semantics for Translation Evaluation』、NAACL-HLT 2012(カナダ、モントリオール)の議事録。
2011年:
M. Hopkins、J. May著(2011年)『Tuning as Ranking』、EMNLP 2011の議事録。
M. Hopkins、G. Langmead、T. Vo著(2011年)『Extraction Programs: A Unified Approach to Translation Rule Extraction』、2011年WMTの議事録。
2010年:
R. Soricut、A. Echihabi著(2010年)『TrustRank: Inducing Trust in Automatic Translations via Ranking』、Association for Computational Linguistics Conference(p.612~621)。
M. Hopkins、G. Langmead著(2010年)『SCFG Decoding Without Binarization』、2010年EMNLPの議事録。
W. Wang、J. May、K. Knight、D. Marcu著(2010年)『Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation』、Computational Linguistics(36.2)。
2009年:
M. Hopkins、G. Langmead著(2009年)『Cube Pruning as Heuristic Search』、2009年EMNLPの議事録。
K. Yamada、I. Muslea著(2009年)『Re-ranking for large-scale statistical machine translation』、『Learning Machine Translation』(p.151~169)。
2007年:
W. Wang、K. Knight、D. Marcu著(2007年)『Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy』、EMNLP-07の議事録、p.746~754、プラハ。
2006年:
D. Marcu、W. Wang、A. Echihabi、K. Knight著(2006年)『SPMT: Statistical Machine Translation with Syntactified Target Language Phrases』、Empirical Methods in Natural Language Conference(p.44~52)。
B. Huang、K. Knight著(2006年)『Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality』、2006年HLT-NAACLの議事録。