Discriminative Deep Dyna-Q Robust Planning for Dialogue Policy Learning

本文是Deep Dyna-Q Integrating Planning for Task-Completion Dialogue Policy Learning 团队的续作，主要解决的是原始DDQ模型对world model生成的simulated dialogues质量好坏的严重依赖，通过引入一个区分真实对话和模拟对话的判别器，进而提高DDQ模型的鲁棒性和有效性。paper linkcode link

NLP

2018-11-23

Multi-task learning for Joint Language Understanding and Dialogue State Tracking

本文是来自于SIGdial的一篇文章，主要研究的是LU和DST的联合建模，在不影响准确率的前提下提高了计算效率，同时在训练阶段引入了Scheduled Sampling，亦是创新点。本篇文章是作者一系列关于LU和DST的最新作，可结合之前两篇对比来看（参见Reference）。paper linkdataset link

NLPNLU

2018-11-08

An Efficient Approach to Encoding Context for Spoken Language Understanding

SLU是任务型对话系统的基础，本文提出了一种基于对话历史建模的SLU模型，通过RNN对对话上下文进行建模，进而辅助对当前句子的理解，并且可以用于DST（对话状态追踪）。paper linkdataset link

Helic He

Archive: 2018/11

Discriminative Deep Dyna-Q Robust Planning for Dialogue Policy Learning

Multi-task learning for Joint Language Understanding and Dialogue State Tracking

An Efficient Approach to Encoding Context for Spoken Language Understanding