Modeling Fine-Grained Entity Types with Box Embeddings
Modeling Fine-Grained Entity Types with Box Embeddings
Modeling Fine-Grained Entity Types with Box Embeddings
本文提出了建模对话动态信息流的方法DialoFlow,引入dynamic flow 动态流机制通过处理每个话语带来的语义影响来模拟整个对话历史中的动态信息流。
自监督学习效率比全监督低很多(e.g.,100 epochs v.s. 1000 epochs),论文把这一现象的原因归结为欠聚类(under clustering)或过聚类(over clustering),并提出了一个median triplet loss来提高训练的效率,同时提升性能。
作者提出了一个用energy score检测OOD的统一框架,其既可以用于预训练网络分类器作为scoring fuction,也可以作为一个trainable cost function来微调分类模型。
主要介绍可控语言模型生成,分为三类:decoding strategy, smart prompt design, finetune