Forschun
„Ich werde nun mit der Dekodierung beginnen.“
Hier bei Language Weaver können wir auf eine lange und erfolgreiche Forschungs- und Entwicklungsgeschichte im NLP-Bereich (Natural Language Processing) zurückblicken. Unser vielseitiges multinationales Team leistet hochmoderne Forschungsarbeit, um die Wissenschaft voranzubringen. Die Ergebnisse fließen in unsere Tools und Technologien ein und helfen unseren Kunden, ihre Inhalte besser zu verstehen und neue Inhalte effektiver zu erstellen.
Unser Team betreibt u. a. in den folgenden Bereichen Forschung und Entwicklung:
- Neuronale maschinelle Übersetzung
- MT-Qualitätsschätzung
- Mehrsprachige Zusammenfassung
- Eigennamenerkennung
- Sentimentanalyse
- Textgenerierung
- Vereinfachung und Paraphrasierung von Texten
- Beantwortung von Fragen
- Themen- und Stilanalyse
Wir nehmen regelmäßig an Konferenzen teil und treten dort auch als Redner auf. Außerdem veröffentlichen wir unsere Arbeiten an bekannten Orten wie NAACL, (E)ACL, EMNLP und MT Summit. Nachfolgend finden Sie einige unserer ausgewählten Publikationen.
Die Arbeit bei Language Weaver
Das Beste an der Arbeit bei Language Weaver ist, dass es nie langweilig wird. Unser Team ist nie lange mit derselben Aufgabe beschäftigt oder forscht an demselben Thema – wir arbeiten ständig mit neuen Kunden an neuen Daten, interessanten Sprachen und in unterschiedlichen Bereichen und Anwendungsgebieten.
Es gibt immer die Möglichkeit, Fähigkeiten zu verfeinern und zu erweitern, indem neue Techniken ausprobiert werden, um reale Probleme für Kunden zu lösen, die Jahr für Jahr Milliarden von Wörtern verarbeiten und übersetzen. Da unser Team sich aus Personen mit verschiedensten Hintergründen zusammensetzt, lernen wir auch viel voneinander.
Mit Niederlassungen in Los Angeles, Cluj-Napoca, Dublin und an anderen Orten in Europa bilden unsere Wissenschaftler, Ingenieure und Linguisten ein dynamisches, energiegeladenes Team mit starker NLP-Erfahrung und der Bereitschaft, seinen Horizont zu erweitern. Wir sprechen dabei beinahe so viele Sprachen, wie unsere MT-Engines übersetzen können!
Über den Arbeitsalltag hinaus gibt es bei uns auch eine wöchentliche Lesegruppe, in der wir unsere eigene Forschung und andere bedeutende Fachartikel präsentieren. Außerdem veröffentlichen wir einen wöchentlichen Blog – Neural MT Weekly –, der von Tausenden gelesen wird.
Möchten Sie Teil unseres Teams werden? Kontaktieren Sie uns!
Publikationen
Ausgewählte Publikationen:
2021:
Roemmele, M., Sidhpura, D., DeNeefe S. und Tsou, L. (2021). AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents. 16. Tagung des European Chapter of the Association for Computational Linguistics (EACL 2021), Demo-Track.
2020:
Saunders, D., Feely, W. und Byrne, B. (2020). Inference-only sub-character decomposition improves translation of unseen logographic characters, Proceedings of the 7th Workshop on Asian Translation.
2019:
Feely, W., Hasler, E. und de Gispert, A. (2019). Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation. Tagungsbericht zum 6. Workshop on Asian Translation.
Saunders, D., Stahlberg, F., de Gispert, A. und Byrne, B. (2019). Domain Adaptive Inference for Neural Machine Translation. Tagungsbericht zum 57. Annual Meeting of the Association for Computational Linguistics (ACL).
Roemmele, M. (2019). Identifying Sensible Lexical Relations in Generated Stories. Workshop zum narrativen Verständnis bei der Jahrestagung des North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT) 2019
2018:
Iglesias, G., Tambellini, W., de Gispert, A., Hasler, E. und Byrne, B. (2018). Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment. Tagungsbericht zur Conference des North American Chapter of the Association for Computational Linguistics (NAACL-HLT) 2018.
Hasler, E., de Gispert, A., Iglesias, G. und Byrne, B (2018). Neural Machine Translation Decoding with Terminology Constraints. Tagungsbericht zur Conference des North American Chapter of the Association for Computational Linguistics (NAACL-HLT) 2018
Saunders, D., Stahlberg, F., de Gispert, A und Byrne, B. (2018). Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT. Tagungsbericht zur 56. Jahrestagung der Association for Computational Linguistics (ACL).
Stahlberg, F., de Gispert, A. und Byrne, B. (2018). The University of Cambridge's Machine Translation Systems for WMT18. Tagungsbericht zur Conference of Machine Translation (WMT).
2017:
Hasler, E., de Gispert, A., Stahlberg, F., Waite, A. und Byrne, B. (2017). Source sentence simplification for statistical machine translation. Computer Speech & Language, Band 45, S. 221–235.
Stahlberg, F., de Gispert, A., Hasler, E. und Byrne, B. (2017). Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices. Tagesbericht zur 15. Tagung des European Chapter of the Association for Computational Linguistics (EACL).
Hasler, E., Stahlberg, F., Tomalin, M., de Gispert, A. und Byrne, B. (2017). A Comparison of Neural Models for Word Ordering. International Conference on Natural Language Generation (INLG).
2015
de Gispert, A., Iglesias, G., Byrne, B., (2015) Fast and Accurate Preordering for SMT using Neural Networks, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
Dreyer, M. und Graehl, J. (2015). hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
Dreyer, M. und Dong, D. (2015). APRO: All-Pairs Ranking Optimization for MT Tuning, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
2014
May, J., Benjira, Y., Echihabi, A., (2014). An Arabizi-English Social Media Statistical Machine Translation System, Association for Machine Translation in the Americas
Jehl, L., de Gispert, A., Hopkins, M., Byrne, B., (2014). Source-side preordering for translation using logistic regression and depth-first branch-And-bound search, European Chapter of the Association for Computational Linguistics, (S. 239–248).
2013
Hopkins, M. und May, J. (2013). Models of Translation Competitions. Tagungsbericht der ACL, 2013.
Munteanu, D. S. und Marcu, D. (2013). Exploiting Comparable Corpora. In Building and Using Comparable Corpora, Springer Publications.
2012
Soricut, R., Bach, N. und Wang, Z. (2012). The SDL Language Weaver Systems in the WMT12 Quality Estimation Shared Task, Tagunsbericht zum 7. Workshop on Statistical Machine Translation (WMT 2012), Juni 2012, Montreal, Quebec, Kanada.
Dreyer, M. und Marcu, D. (2012). HyTER: Meaning-Equivalent Semantics for Translation Evaluation, Tagungsbericht zur Tagung des North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2012, Montreal, Kanada.
2011
Hopkins, M. und May, J. (2011). Tuning as Ranking. Tagungsbericht der EMNLP, 2011.
Hopkins, M., Langmead, G. und Vo, T. (2011). Extraction Programs: A Unified Approach to Translation Rule Extraction. Tagungsbericht der WMT, 2011.
2010
Soricut, R. und Echihabi, A. (2010). TrustRank: Inducing Trust in Automatic Translations via Ranking, Association for Computational Linguistics Conference, (S. 612–621).
Hopkins, M. und Langmead, G. (2010). SCFG Decoding Without Binarization. Tagungsbericht der EMNLP, 2010.
Wang, W., May, J., Knight, K. und Marcu, D. (2010). Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation, Computational Linguistics. (36.2).
2009
Hopkins, M. und Langmead, G. (2009). Cube Pruning as Heuristic Search. Tagungsbericht der EMNLP, 2009.
Yamada, K. und Muslea, I. (2009). Re-ranking for large-scale statistical machine translation, Learning Machine Translation, (S. 151–169)
2007
Wang, W., Knight,K. und Marcu, D. (2007). Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy. Tagungsbericht der EMNLP-07, S. 746–754, Prag.
2006
Marcu, D., Wang, W., Echihabi, A. und Knight, K. (2006). SPMT: Statistical Machine Translation with Syntactified Target Language Phrases, Empirical Methods in Natural Language Conference, (S. 44–52).
Huang, B. und Knight, K. (2006). Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality. Tagungsbericht der NAACL-HLT, 2006.