Ricerca
"Ora provvederò a decodificarlo."
In Language Weaver, vantiamo una lunga storia di ricerca e sviluppo nel campo dell'elaborazione di linguaggi naturali. Il nostro team multinazionale e multifunzionale svolge ricerche all'avanguardia con l'obiettivo a breve termine di far progredire la scienza, e gli obiettivi a lungo termine di introdurre questo lavoro negli strumenti e nelle tecnologie che aiutano i nostri clienti a comprendere meglio i loro contenuti e di creare nuovi contenuti in modo più efficace.
Alcune delle aree in cui il nostro team sta attivamente svolgendo attività di ricerca e sviluppo includono:
- Traduzione automatica neurale
- Stima della qualità della MT
- Riepilogo multilingue
- Riconoscimento delle entità nominate
- Analisi delle reazioni
- Generazione di testo
- Semplificazione e parafrasi del testo
- Risposte alle domande
- Analisi di argomenti e stili
Partecipiamo regolarmente a conferenze sia come uditori che come relatori e pubblichiamo il nostro lavoro in sedi note come NAACL, (e)ACL, EMNLP, MT Summit e altri. Di seguito sono riportate alcune delle nostre pubblicazioni selezionate.
Lavorare in Language Weaver
L'aspetto migliore del lavoro in Language Weaver è che non è mai noioso! Il nostro team non è costretto a lavorare sempre sullo stesso progetto o a fare ricerche continue sullo stesso argomento; infatti, lavoriamo sempre con nuovi clienti su nuovi dati, lingue interessanti e domini e applicazioni di ampia portata.
Abbiamo sempre la possibilità di perfezionare e ampliare le nostre competenze, provando nuove tecniche per risolvere problemi reali per clienti che elaborano e traducono miliardi di parole ogni anno. Poiché i membri del nostro team hanno un'ampia varietà di esperienze, impariamo molto anche gli uni dagli altri.
Con sedi a Los Angeles, Cluj-Napoca, Dublino e altri paesi in Europa, il nostro team di scienziati, ingegneri e linguisti forma una squadra dinamica ed energica con una solida base in NLP e la volontà di ampliare i propri orizzonti. Tra tutti parliamo quasi tante lingue quante sono quelle tradotte dai nostri motori di traduzione automatica!
Oltre alle nostre attività quotidiane, abbiamo anche un gruppo di lettura settimanale in cui presentiamo la nostra ricerca e altri documenti di rilievo del settore. Inoltre, pubblichiamo un blog settimanale, "The Neural MT Weekly", letto da oltre 1.000 lettori ogni settimana!
Vi interessa entrare a far parte del nostro team? Contattateci!
Pubblicazioni
Pubblicazioni selezionate:
2021:
Roemmele, M. and Sidhpura, D., and DeNeefe S., and Tsou, L. (2021). AnswerQuest: A System for Generating Question-Answer Items from Multi-Paragraph Documents. 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021), Demo Track.
2020:
Saunders, D., Feely, W. and Byrne, B. (2020). Inference-only sub-character decomposition improves translation of unseen logographic characters, Proceedings of the 7th Workshop on Asian Translation.
2019:
Feely, W., Hasler, E. and de Gispert, A. (2019). Controlling Japanese Honorifics in English-to-Japanese Neural Machine Translation. Proceedings of the 6th Workshop on Asian Translation.
Saunders, D., Stahlberg, F., de Gispert, A. and Byrne, B. (2019). Domain Adaptive Inference for Neural Machine Translation. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL).
Roemmele, M. (2019). Identifying Sensible Lexical Relations in Generated Stories. Workshop on Narrative Understanding at the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL 2019)
2018:
Iglesias, G., Tambellini, W., de Gispert, A., Hasler, E. and Byrne, B. (2018). Accelerating NMT Batched Beam Decoding with LMBR Posteriors for Deployment. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT).
Hasler, E., de Gispert, A., Iglesias, G. and Byrne, B (2018). Neural Machine Translation Decoding with Terminology Constraints. Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT)
Saunders, D., Stahlberg, F., de Gispert, A. and Byrne, B. (2018). Multi-representation Ensembles and Delayed SGD Updates Improve Syntax-based NMT. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL).
Stahlberg, F., de Gispert, A. and Byrne, B. (2018). The University of Cambridge's Machine Translation Systems for WMT18. Proceedings of the Conference of Machine Translation (WMT).
2017:
Hasler, E., de Gispert, A., Stahlberg, F., Waite, A. and Byrne, B. (2017). Source sentence simplification for statistical machine translation. Computer Speech & Language, vol. 45, pp. 221-235.
Stahlberg, F., de Gispert, A., Hasler, E. and Byrne, B. (2017). Neural Machine Translation by Minimising the Bayes-risk with Respect to Syntactic Translation Lattices. Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics (EACL).
Hasler, E., Stahlberg, F., Tomalin, M. de Gispert, A. and Byrne, B. (2017). A Comparison of Neural Models for Word Ordering. International Conference on Natural Language Generation (INLG).
2015
Gispert, A., Iglesias, G., Byrne, W., (2015) Fast and Accurate Preordering for SMT using Neural Networks, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
Dreyer, M., & Graehl, J. (2015) hyp: A Toolkit for Representing, Manipulating, and Optimizing Hypergraphs, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
Dreyer, M., & Dong, D., (2015) APRO: All-Pairs Ranking Optimization for MT Tuning, North American Chapter of the Association for Computational Linguistics: Human Language Technologies
2014
May, J., Benjira, Y., Echihabi, A., (2014) An Arabizi-English Social Media Statistical Machine Translation System, Association for Machine Translation in the Americas
Jehl, L., Gispert, A., Hopkins, M., Byrne, M., (2014) Source-side preordering for translation using logistic regression and depth-first branch-And-bound search, European Chapter of the Association for Computational Linguistics, (pp. 239-248).
2013
Hopkins, M., & May, J. (2013) Models of Translation Competitions. Proceedings of ACL, 2013.
Munteanu, D. S., & Marcu, D. (2013) Exploiting Comparable Corpora. In Building and Using Comparable Corpora, Springer Publications.
2012
Soricut, R., Bach, N., & Wang, Z. (2012) The SDL Language Weaver Systems in the WMT12 Quality Estimation Shared Task, InProceedings of the Seventh Workshop on Statistical Machine Translation(WMT 2012), June 2012, Montreal, Quebec, Canada.
Dreyer, M. & Marcu, D. (2012) HyTER: Meaning-Equivalent Semantics for Translation Evaluation, In Proceedings of the 2012 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Montreal, Canada.
2011
Hopkins, M., & May, J. (2011) Tuning as Ranking. Proceedings of EMNLP, 2011.
Hopkins, M., Langmead, G., & Vo, T.(2011) Extraction Programs: A Unified Approach to Translation Rule Extraction. Proceedings of WMT, 2011.
2010
Soricut, R., & Echihabi, A. (2010) TrustRank: Inducing Trust in Automatic Translations via Ranking, Association for Computational Linguistics Conference, (pp. 612-621).
Hopkins, M., & Langmead, G. (2010) SCFG Decoding Without Binarization. Proceedings of EMNLP, 2010.
Wang, W., May, J., Knight, K., & Marcu, D. (2010) Re-Structuring, Re-Labeling, and Re-Aligning for Syntax-based Machine Translation, Computational Linguistics. (36.2).
2009
Hopkins, M., & Langmead, G. (2009) Cube Pruning as Heuristic Search. Proceedings of EMNLP, 2009.
Yamada, K., & Muslea, I. (2009). Re-ranking for large-scale statistical machine translation, Learning Machine Translation, (pp. 151-169)
2007
Wang, W., Knight, K., & Marcu, D. (2007) Binarizing Syntax Trees to Improve Syntax-Based Machine Translation Accuracy. Proceedings of EMNLP-07, pp. 746-754, Praga.
2006
Marcu, D., Wang, W., Echihabi, A., & Knight, K. (2006) SPMT: Statistical Machine Translation with Syntactified Target Language Phrases", Empirical Methods in Natural Language Conference, (pp. 44-52).
Huang, B., & Knight, K. (2006). Relabeling Syntax Trees to Improve Syntax-Based Machine Translation Quality. Proceedings of HLT-NAACL, 2006.