Learning Personalized End-to-End Goal-Oriented Dialog

本文是来自于AAAI 2019关于在任务型对话中引入个性化的文章，主要通过用户profile建模来实现个性化回答和语义消歧。

NLPNLU

2018-12-03

Slot-Gated Modeling for Joint Slot Filling and Intent Prediction

基于Attention的RNN模型在联合意图识别(ID)和槽位填充(SF)上实现最好性能（其ID和SF的attention权重独立）。本文提出slot gate结构，其关注于学习intent和slot attention向量之间的关系，通过全局优化获得更好的semantic frame。通过在ATIS和Snips数据集实验，相比于attention模型semantic frame准确率提升了4.2%。 paper linkcode link

NLP

2018-11-27

Discriminative Deep Dyna-Q Robust Planning for Dialogue Policy Learning

本文是Deep Dyna-Q Integrating Planning for Task-Completion Dialogue Policy Learning 团队的续作，主要解决的是原始DDQ模型对world model生成的simulated dialogues质量好坏的严重依赖，通过引入一个区分真实对话和模拟对话的判别器，进而提高DDQ模型的鲁棒性和有效性。paper linkcode link

NLP

2018-11-23

Multi-task learning for Joint Language Understanding and Dialogue State Tracking

本文是来自于SIGdial的一篇文章，主要研究的是LU和DST的联合建模，在不影响准确率的前提下提高了计算效率，同时在训练阶段引入了Scheduled Sampling，亦是创新点。本篇文章是作者一系列关于LU和DST的最新作，可结合之前两篇对比来看（参见Reference）。paper linkdataset link

NLPNLU

2018-11-08

An Efficient Approach to Encoding Context for Spoken Language Understanding

SLU是任务型对话系统的基础，本文提出了一种基于对话历史建模的SLU模型，通过RNN对对话上下文进行建模，进而辅助对当前句子的理解，并且可以用于DST（对话状态追踪）。paper linkdataset link

NLP

2018-10-30

BERT Pre-training of Deep Bidirectional Transformers for Language Understanding

本文介绍了一种新的语言表征模型 BERT——来自 Transformer 的双向编码器表征。与最近的语言表征模型不同，BERT 旨在基于所有层的左、右语境来预训练深度双向表征。BERT 是首个在大批句子层面和 token 层面任务中取得当前最优性能的基于微调的表征模型，其性能超越许多使用任务特定架构的系统，刷新了 11 项 NLP 任务的当前最优性能记录。paper linkcode link

NLP

2018-10-19

Deep Dyna-Q Integrating Planning for Task-Completion Dialogue Policy Learning

本文提出了一种新的通过与真实用户交互来学习对话策略的方法Deep Dyna-Q，与之前的工作相比，只需要少量的真实对话数据，通过world model对用户建模，结合model-free和model-based，该方法能够高效的学习对话策略。

NLP

2018-10-11

Deep Relevance Ranking Using Enhanced Document-Query Interactions

本文提出了几种针对于文档相关性排序问题的新模型，这些模型基于已有的DRMM模型：A Deep Relevance Matching Model for Ad-hoc Retrieval) 。不同之处在于，DRMM模型使用上下文无关的term encoding编码方式，而本文提出的改进模型则借鉴自PACRR的思想，融合n-grams和不同方式编码的上下文信息。实验证明，本文提出的模型优于BM25-baseline，DRMM和PACRR。code link

NLP

2018-10-07

Deep contextualized word representations

本文提出了ELMo（深度上下文词表示）模型，它是由AI2开发的，并在NAACL 2018上被评为最佳论文。在ELMo中，嵌入基于一个双层的双向语言模型（biLM）的内部状态计算，ELMo也是因此得名的：Embeddings from Language Models（来自语言模型的嵌入）。paper linkcode link

CVCNN

2018-10-02

Xception-Deep Learning with Depthwise Separable Convolutions

Xception是google继Inception后提出的对Inception v3的另一种改进，主要是采用depthwise separable convolution来替换原来Inception v3中的卷积操作。paper link

Helic He

Archive: 2018