深度学习笔记
【深度学习笔记】Seq2Seq中的曝光偏差(exposure bias)现象
在Seq2Seq模型的训练与验证过程中,经常会出现输出句和输入句子有一些gap或者明显不符合常识的情 阅读更多…
对话系统 论文
【ACL 2022】SalesBot: Transitioning from Chit-Chat to Task-Oriented Dialogues
<端到端对话>、 <框架>、 <数据集> 论文解读仅代表个人观点 阅读更多…
Bert 论文
【arxiv】NSP-BERT: A Prompt-based Zero-Shot Learner Through an Original Pre-training Task–Next Sentence Prediction
<Bert>、<NSP>、<zero-shot> 论文解读仅代表 阅读更多…
对话系统 论文
【ACL 2022】Achieving Conversational Goals with Unsupervised Post-hoc Knowledge Injection
<对话系统>、 <知识注入> 论文解读仅代表个人观点,才疏学浅,如有错误欢迎 阅读更多…
深度学习基础 深度学习笔记
【深度学习笔记】为什么$attention$中要除以$\sqrt{k}$
首先查看一下注意力的计算方式: 主要是有两个方面可以进行解释。一点是训练时梯度传播的问题,另一个是训 阅读更多…
对话系统 论文
【ACL 2022】A Model-Agnostic Data Manipulation Method for Persona-based Dialogue Generation
<数据增强>、 <基于角色的对话系统>、 <GPT-2> 、 & 阅读更多…
对话系统 论文
【ACL 2022】Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System
<T5>、<微调>、<任务型对话> 论文解读仅代表个人观点,才疏 阅读更多…
对话系统 论文
【AAAI 2021】UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2
<GPT-2>、<端到端>、<任务型对话> 论文解读仅代表个人观点,才疏学浅,如有 阅读更多…