Sniper
  • 首页
  • github
  • 我的简历

深度学习

论文

【ICLR 2022】MULTITASK PROMPTED TRAINING ENABLES ZERO-SHOT TASK GENERALIZATION

<prompt>、<T5> 论文解读仅代表个人观点,才疏学浅,如有错误欢迎指正,未经授权 阅读更多…

由Sniper,1月2023-02-19 前
深度学习笔记

【深度学习笔记】keras中Layer、Node与Tensor之间的关系

本文主要讲述在Keras中,Layer、Node与Tensor在网络构建中的关系。 一些关于kera 阅读更多…

由Sniper,6月2022-09-18 前
深度学习笔记

【深度学习笔记】Seq2Seq中的曝光偏差(exposure bias)现象

在Seq2Seq模型的训练与验证过程中,经常会出现输出句和输入句子有一些gap或者明显不符合常识的情 阅读更多…

由Sniper,7月2022-09-12 前
对话系统 论文

【ACL 2022】SalesBot: Transitioning from Chit-Chat to Task-Oriented Dialogues

<端到端对话>、 <框架>、 <数据集> 论文解读仅代表个人观点 阅读更多…

由Sniper,8月2022-07-31 前
Bert 论文

【arxiv】NSP-BERT: A Prompt-based Zero-Shot Learner Through an Original Pre-training Task–Next Sentence Prediction

<Bert>、<NSP>、<zero-shot> 论文解读仅代表 阅读更多…

由admin,8月 前
对话系统 论文

【ACL 2022】Achieving Conversational Goals with Unsupervised Post-hoc Knowledge Injection

<对话系统>、 <知识注入> 论文解读仅代表个人观点,才疏学浅,如有错误欢迎 阅读更多…

由admin,8月 前
深度学习基础 深度学习笔记

【深度学习笔记】为什么$attention$中要除以$\sqrt{k}$

首先查看一下注意力的计算方式: 主要是有两个方面可以进行解释。一点是训练时梯度传播的问题,另一个是训 阅读更多…

由admin,8月 前
对话系统 论文

【ACL 2022】A Model-Agnostic Data Manipulation Method for Persona-based Dialogue Generation

<数据增强>、 <基于角色的对话系统>、 <GPT-2> 、 & 阅读更多…

由admin,9月 前
对话系统 论文

【ACL 2022】Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System

<T5>、<微调>、<任务型对话> 论文解读仅代表个人观点,才疏 阅读更多…

由admin,9月 前
对话系统 论文

【AAAI 2021】UBAR: Towards Fully End-to-End Task-Oriented Dialog System with GPT-2

<GPT-2>、<端到端>、<任务型对话> 论文解读仅代表个人观点,才疏学浅,如有 阅读更多…

由admin,9月 前

文章导航

1 2 … 8 下一页
分类
  • QQ红包的呓语 (2)
  • 其他资料 (7)
    • idea快捷键整理 (1)
    • others (6)
  • 学习笔记 (276)
    • JAVA SE (1)
    • Java虚拟机 (4)
    • JSP (8)
    • Python (27)
    • Ubuntu (2)
    • 云计算:概念,技术与架构 (9)
    • 机器学习实战 (11)
    • 深度学习 (72)
      • Bert (9)
      • transformers (7)
      • 动手学深度学习 (4)
      • 对话系统 (8)
      • 深度学习基础 (12)
      • 深度学习笔记 (28)
      • 翻译搬运 (5)
      • 自然语言处理基础 (3)
      • 论文 (9)
    • 算法 (91)
    • 算法分析与设计 (20)
    • 网络爬虫实战 (24)
    • 设计模式 (16)
近期文章
  • 【ICLR 2022】MULTITASK PROMPTED TRAINING ENABLES ZERO-SHOT TASK GENERALIZATION
  • 【深度学习笔记】keras中Layer、Node与Tensor之间的关系
  • 【深度学习笔记】Seq2Seq中的曝光偏差(exposure bias)现象
  • 【Python】python内置函数与装饰器汇总
  • 【ACL 2022】SalesBot: Transitioning from Chit-Chat to Task-Oriented Dialogues

attention bert transformer 基础 比赛 汇总 深度学习 爬虫 笔记 翻译搬运 论文 面试


如果哪里有不同见解或者有不懂的可以在文章下评论或email我,我会第一时间联系。

  • 首页
  • github
  • 我的简历
Sniper | 辽ICP备18006775号