0
Conversations Are Not Flat Modeling the Dynamic Information Flow across Dialogue Utterances
本文提出了建模对话动态信息流的方法DialoFlow,引入dynamic flow 动态流机制通过处理每个话语带来的语义影响来模拟整个对话历史中的动态信息流。
本文提出了建模对话动态信息流的方法DialoFlow,引入dynamic flow 动态流机制通过处理每个话语带来的语义影响来模拟整个对话历史中的动态信息流。
自监督学习效率比全监督低很多(e.g.,100 epochs v.s. 1000 epochs),论文把这一现象的原因归结为欠聚类(under clustering)或过聚类(over clustering),并提出了一个median triplet loss来提高训练的效率,同时提升性能。