百度亮相NeurIPS 2019 大秀最新NLP技术

本文章由注册用户 闻罗天下 上传提供 评论 发布 纠错/删除 版权声明 0

2019年12月8日,机器学习领域国际顶级会议NeurIPS于加拿大温哥华拉开帷幕,吸引了全球13000余名专家学者共赴盛会。本年度,自然语言处理领域在深度学习浪潮下取得了显著成就,成为大会的重要议题之一。百度也成为本届大会的重度参与者,向各国参与者展示了其最新的NLP技术。

  • 本届NeurIPS大会共收到6743篇论文投稿,两年时间翻了一番。其中1428篇论文入选,入选率仅21.1%。百度共有8篇论文被收录,覆盖量化压缩、对抗训练等诸多前沿方向。

    竞赛方面,在NeurIPS 2019: Learn to Move强化学习赛事中百度再度蝉联冠军,并受邀在Deep RL workshop中进行专题报告。本次比赛的难度非常大,在参赛的近300支队伍中,仅有3支队伍完成了最后挑战。百度基于飞桨的强化学习框架PARL不仅成功完成挑战,还大幅领先第二名(1490vs1346)。除了在Best Performance Track获得了第一,相关技术论文也在该赛事的Machine Learning Track中获得了Best Paper Reward。

    百度举办了自然语言处理专题研讨会,百度技术委员会主席、自然语言处理首席科学家吴华博士以及多名研究员和工程师,向现场参会者全面介绍了百度在这一领域的长期积累与全新突破。基于具有完全自主知识产权的飞桨平台,百度自然语言处理在语义计算、阅读理解、多轮对话、机器翻译、开放平台与数据等方向均取得了突破性进展,并进行了大规模产业化应用。

    预训练方面,百度提出知识增强的语义表示模型ERNIE及持续学习语义理解框架ERNIE2.0,在共计16个中英文任务上超越BERT、XLNET,取得了 SOTA 的效果。11月,百度发布基于ERNIE的语义理解开发套件。从原理、应用到开源及平台化,百度在NLP预训练领域进行了极具价值的创新及实践。

    机器阅读理解,已成为评估机器语言理解能力的重要方式,也是搜索引擎和对话系统等行业应用中的关键技术。百度建设及发布了最大规模的中文阅读理解数据集DuReader;在泛化方面提出训练框架D-NET,从多模型融合、多任务学习的角度提升模型的泛化能力;

    对于对抗样本的攻击,提出了一种面向阅读理解的对抗训练方法;提出文本表示和知识表示的融合模型KT-NET,以解决需要外部知识和常识的问题。其中具有高鲁棒性和迁移能力的阅读理解模型在2019年MRQA阅读理解评测中夺得冠军。

    对话方面,提出了基于深度注意网络的多轮响应选择匹配模型DAM(Deep Attention Matching Network),显著提高了口语理解能力。在对话系统框架中,百度一方面提供了可编程的对话管理框架,并内置了多个常用标准对话范式,为在云端开发灵活可变的业务对话逻辑提供了便利。另一方面,提供了需求分发和全局记忆机制,支持多个对话任务的集成与联动,提高了对话技能的可复用性,降低了新业务的重复开发成本。百度可定制对话技术依托百度大脑UNIT3.0平台,支持5万多个对话技能,广泛应用于行业客户。

    机器翻译领域,百度相继提出了多任务学习、多智能体联合训练等前沿方法,并在2019年国际权威WMT评测中取得中英翻译第一。机器同声传译方面百度走在领域前沿,提出了首个具有预测和可控时延的同传模型,首个语义单元驱动的上下文同传模型,并研发了业内首个语音到语音的同传系统,为用户提供高质量、低时延的同传体验。值得一提的是,基于在此领域取得的进步,由百度主导,联合Google、Facebook、Upenn、清华等海内外顶尖企业及高校共同组织首届机器同传研讨会,将在本领域顶级会议ACL 2020召开,并将举办国际首届同传评测,以进一步促进技术发展。此外,百度还将在领域权威会议EMNLP 2020中举办机器同传tutorial,就机器同传的原理、方法、前沿进展进行讲座。

    百度自然语言处理领域产出的卓越成果背后所运用的底层框架,是自研的开源深度学习平台百度飞桨。近两年来,飞桨围绕深度学习框架的基本功能、性能、芯片支持的完备性等技术指标进行了一系列的易用性开发和性能迭代,为开发者提供了优于其他深度学习框架的使用体验。在开发能力方面,飞桨除了支持对常用API的调用之外,还在编程范式上同时支持声明式编程和命令式编程,兼具很好的灵活性和稳定性,可满足不同开发者的开发习惯,更易上手。在训练方面,飞桨平台突破了超大规模深度学习模型训练技术,研制了千亿特征、万亿参数、数百节点的开源大规模训练平台,实现了万亿规模参数深度学习模型的实时更新。在自然语言处理领域,PADDLE-NLP提供了面向6类任务下的30+算法模型,包括上述工作中ERNIE、D-NET等多个国际竞赛的冠军模型。

  • 百度品牌介绍
行业推荐品牌

“百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,携搜索引擎专利技术,于2000年1月1日在中关村创建了百度公司。

基于搜索引擎,百度演化出语音、图像、知识图谱、自然语言处理等人工智能技术;最近10年,百度在深度学习、对话式人工智能操作系统、自动驾驶、AI芯片等前沿领域持续投入,使得百度成为一个拥有强大互联网基础的领先AI公司。

百度愿景是:成为最懂用户,并能帮助人们成长的全球顶级高科技公司。

推荐阅读
网站提醒和声明
本站为注册用户提供信息存储空间服务,非“MAIGOO编辑”、“MAIGOO榜单研究员”、“MAIGOO文章编辑员”上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。 申请删除>> 纠错>> 投诉侵权>> 网页上相关信息的知识产权归网站方所有(包括但不限于文字、图片、图表、著作权、商标权、为用户提供的商业信息等),非经许可不得抄袭或使用。
提交说明: 快速提交发布>> 提交资讯帮助>> 注册登录>>
相关推荐
【智能卡自动终端】自动柜员机怎么用 自动柜员机安全规范
自动柜员机俗称ATM机,使用银行的ATM机办理存取款、汇款转账等,相信已经成了许多人的习惯,这样既省去了去银行排长龙的麻烦,也可以在银行柜台的非营业时间自助办理相关业务,实在是方便快捷。但是使用自动柜员机的时候有很多人会遇到吞卡、吞钱、假钞,甚至是诈骗现象,给持卡人带来了不小的经济损失,所以如何合理谨慎使用ATM机,注意安全规范是很有必要的,下面就一起来了解一下详细介绍吧!
ATM机 银行
4018 86
2023信创产业领军企业100强名单发布 2023年中国信创企业百强榜一览
互联网周刊、eNet研究院等联合发布了“2023年度信创产业领军企业100强”榜单。榜单显示,上榜企业涉及了芯片、服务器、存储、数字技术、信息安全、云服务、协同办公等多个细分领域,华为、中芯国际、中兴通讯、联通数科、海光信息、金山办公、中国长城、紫光股份、天翼云、航天七〇六等优秀企业上榜。下面小编已经把榜单整理出来,一起看看国内信创龙头企业有哪些吧。
2025十大人工智能品牌排行榜 人工智能排行榜前十名
2025十大人工智能品牌排行榜、2025消费者喜爱人工智能品牌,2025消费者关注人工智能品牌,是CN10排排榜技术研究部门和CNPP品牌数据研究部门重磅推出的人工智能十大名牌排行榜。榜单由CNPP品牌数据研究部门通过资料收集整理大数据统计分析研究而得出,排序不分先后,仅提供给您参考。
【智能家居产品】智能家居必备精品推荐 这样炫酷的智能生活你不想要?
随着越来越多的智能产品走进日常生活当中,人们对智能生活的追求不再是遥不可及,那么,当下比较流行的智能产品有哪些呢?下面,小编为大家汇总智能家居必备精品,主要包括智能家电产品、智能家居产品、智能数码潮品以及智能健康设备,让炫酷的智能生活触手可及。
智能产品选购 智能家居 ★★★
5180 130
数字人技术有哪些 数字人怎么制作用什么软件
随着计算机技术和人工智能的发展,数字人逐渐成为了现实。那么数字人技术有哪些?数字人是通过深度学习、三维建模技术、计算机视觉技术、语音识别和合成技术等技术实现的,具有数字化外貌和人类特征的虚拟人物。下面一起来详细了解一下吧!