研究

“我现在开始解码。”

加入我们
Language Weaver - Research

Language Weaver 在自然语言处理领域拥有悠久的研究和开发历史。我们的多元化跨国团队开展先进的研究,短期目标是推进科学发展,长期目标是推进我们的工具和技术发展,帮助客户更好地了解他们的内容,和更有效地创建新内容。 

我们的团队积极研究和开发的部分领域包括: 

  • 神经机器翻译 
  • MT 质量评估 
  • 多语言摘要 
  • 命名实体识别 
  • 情感分析 
  • 文本生成 
  • 文本简化和阐释 
  • 问题回答 
  • 主题和风格分析 

我们定期出席会议并发言,并在 NAACL、(E)ACL、EMNLP、MT Summit 等知名会议上发布工作成果。下面是我们精选的一些出版物,敬请阅读。

在 Language Weaver 的生活

在 Language Weaver 工作最好的一点是,永远不会感到枯燥!我们的团队从不会一直忙于处理同一个任务,也不会总是研究同一个主题,因为我们始终与新客户合作处理新数据、有趣的语言以及广泛的领域和应用程序。 

我们始终在寻找机会改进和扩大技能组合,尝试采用新技术来解决客户每年处理和翻译数十亿字的实际问题。我们的团队成员来自广泛的背景,我们也从彼此身上学到了很多。 

我们在洛杉矶、克鲁日-纳波卡、都柏林和欧洲其他地区设有办事处,我们的团队由科学家、工程师和语言服务专家组成,他们充满活力、朝气蓬勃,在自然语言处理 (NLP) 领域有着扎实的基础,并且愿意拓宽视野。我们之间交流的语言,几乎和机器翻译引擎所能翻译的语言一样多!

除了日常工作外,我们还设有每周阅读小组,展示我们自己的研究成果和该领域的其他优秀论文。除此之外,我们还发布每周博客“神经机器翻译周刊”,每周有 1,000 名读者阅读!

有兴趣加入我们的团队?联系我们!

出版物 

精选出版物:    

2021 年:    

Roemmele, M. 和 Sidhpura, D. 和 DeNeefe S. 和 Tsou, L. (2021)。寻找答案之旅:从多段落文档生成问题答案项的系统。计算语言学协会欧洲分会第 16 届会议 (EACL 2021),Demo Track。    

2020 年:    

Saunders, D.、Feely, W. 和 Byrne, B. (2020)。仅基于推理的子字符分解改进了对看不见的语标字符的翻译,第 7 届亚洲翻译研讨会的会议记录。    

2019 年:    

Feely, W.、Hasler, E. 和 de Gispert, A. (2019)。英日神经机器翻译掌控日语敬语。第 6 届亚洲翻译研讨会的会议记录。    

Saunders, D.、Stahlberg, F.、de Gispert, A. 和 Byrne, B. (2019)。神经机器翻译的域自适应推理。计算语言学协会第 57 届年会的会议记录。    

Roemmele, M. (2019)。在生成的故事中确定合理的词汇关系。在计算语言学协会北美分会 2019 年年会:人工语言技术 (NAACL 2019) 上举办的叙事理解研讨会    

2018 年:    

Iglesias, G.、Tambellini, W.、de Gispert, A.、Hasler, E. 和 Byrne, B. (2018)。部署 LMBR Posteriors 加速 NMT 批量解码。计算语言学协会北美分会 (NAACL-HLT) 2018 年会议的会议记录。    

Hasler, E.、de Gispert, A.、Iglesias, G. 和 Byrne, B (2018)。使用术语约束的神经机器翻译解码。计算语言学协会北美分会 (NAACL-HLT) 2018 年会议的会议记录    

Saunders, D.、Stahlberg, F.、de Gispert, A 和 Byrne, B. (2018)。多表示合集和延迟的 SGD 更新改进了基于语法的 NMT。计算语言学协会第 56 届年会的会议记录。    

Stahlberg, F.、de Gispert, A. 和 Byrne, B. (2018)。剑桥大学 WMT18 机器翻译系统。机器翻译会议 (WMT) 记录。    

2017 年:    

Hasler, E.、de Gispert, A.、Stahlberg, F.、Waite, A. 和 Byrne, B. (2017)。为使用基于统计的机器翻译简化原文句子。计算机语音与语言,第 45 卷,第 221-235 页。    

Stahlberg, F.、de Gispert, A.、Hasler, E. 和 Byrne, B. (2017)。利用神经机器翻译,充分降低语法翻译晶格的贝叶斯风险计算语言学协会欧洲分会 (EACL) 第 15 届会议的会议记录。    

Hasler, E., Stahlberg, F.、Tomalin, M.、de Gispert, A. 和 Byrne, B. (2017)。用于单词排序的神经模型比较。国际自然语言生成会议 (INLG)。    

2015 年  

Gispert, A.、Iglesias, G.、Byrne, W. (2015) 使用神经网络为 SMT 实现快速准确的排序,计算语言学协会北美分会:人工语言技术    

Dreyer, M. 和 Graehl, J. (2015) hyp:用于表示、操作和优化超图的工具包,计算语言学协会北美分会:人工语言技术    

Dreyer, M. 和 Dong, D. (2015) APRO:MT 调优所有语言对排名优化,计算语言学协会北美分会:人工语言技术    

2014 年    

May, J.、Benjira, Y.、Echihabi, A. (2014) 阿拉伯语-英语社交媒体统计机器翻译系统,美洲机器翻译协会    

Jehl, L.、Gispert, A.、Hopkins, M.、Byrne, M. (2014) 使用逻辑回归和深度优先分支和边界搜索的源文预排序,计算语言学协会欧洲分会(第 239-248 页)。    

2013 年    

Hopkins, M. 和 May, J. (2013) 翻译竞争模型2013 年 ACL 会议记录。  

Munteanu, D. S. 和 Marcu, D. (2013) 利用可比较的语料库。建立和使用类似的语料库,Springer 出版物    

2012 年  

Soricut, R.、Bach, N., 和 Wang, Z. (2012) WMT12 质量评估共享任务中的 SDL Language Weaver 系统,第 7 届统计机器翻译研讨会 (WMT 2012) 的会议记录,2012 年 6 月,加拿大蒙特利尔、魁北克   

Dreyer, M. 和 Marcu, D. (2012) HyTER:翻译评估的含义等效语义,计算语言学协会北美分会 2012 年会议:人工语言技术的的会议记录,加拿大蒙特利尔。    

2011 年    

Hopkins, M. 和 May, J. (2011) 调优排名。2011 年 EMNLP 会议记录。    

Hopkins, M.、Langmead, G. 和 Vo, T.(2011) 提取程序:统一的翻译规则提取方法。2011 年 WMT 会议记录    

2010 年    

Soricut, R. 和 Echihabi, A. (2010) 信任度排名:通过排名在自动翻译中引入信任,计算语言学协会会议(第 612-621 页)。    

Hopkins, M. 和 Langmead, G. (2010) 无需二值化的 SCFG 解码2010 年 EMNLP 会议记录。    

Wang, W.、May, J.、Knight, K. 和 Marcu, D. (2010) 基于语法的机器翻译的重组、重新标记和重新对齐,计算语言学。(36.2).    

2009 年    

Hopkins, M. 和 Langmead, G. (2009) 多维数据集修剪作为启发式搜索。2009 年 EMNLP 会议记录。    

Yamada, K. 和 Muslea, I. (2009)。大规模统计机器翻译重新排名,学习机器翻译(第 151-169 页)    

2007 年   

Wang, W.、Knight,K., 和 Marcu, D. (2007) 使用二值化语法树提高基于语法的机器翻译准确性。EMNLP-07 会议记录,第 746-754 页,布拉格。    

2006 年    

Marcu, D.、Wang, W.、Echihabi, A., 和 Knight, K. (2006) SPMT:统计机器翻译与语法化目标语言短语,自然语言会议经验方法,(第 44-52 页)。    

Huang, B. 和 Knight, K. (2006)。重新标记语法树以提高基于语法的机器翻译质量。2006 年 HLT-NAACL 会议记录。

订阅神经机器翻译周刊

Loading...