Sniper
  • 首页
  • github
  • 我的简历

Blog

深度学习基础 深度学习笔记

【深度学习笔记】BLEU与ROUGE

本章用来说明一些深度学习翻译(文本生成)任务中的几个指标。 BLEU和ROUGE可以说是基本上一摸一样了,区别就是BLEU只计算准确率,而ROUGE只计算召回率。 为了说明这两种评价指标,我们首先引入 阅读更多…

由admin,5 年 前
Bert 深度学习笔记

【深度学习笔记】ELECTRA

本文来自Goggle的论文 ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generator 相比Bert,ELE 阅读更多…

由admin,5 年 前
深度学习笔记

【深度学习笔记】门控线性单元(Gated Linear Unit)

本文思路来自论文 GLU Variants Improve Transformer ,而这篇论文又借用了 Language Modeling with Gated Convolutional Netw 阅读更多…

由admin,5 年 前
网络爬虫实战

【python爬虫】各大网站反爬手段汇总

各大网站反爬手段汇总。 之前研究完时间久了就忘了,用那么就研究的js解密,回头全忘了太亏了。 简单写几笔。 0.大众点评 github链接(欢迎点star) 笔记1 笔记2 1.亚马逊 这个我没有实操 阅读更多…

由admin,5 年 前
Bert 深度学习笔记

【深度学习笔记】bert的mlm任务实现方式

之前对于bert的MLM任务一直都是模棱两可,今天对于实现细节进行了补全。 想看结论的直接拉到最后。 mlm的流程实际上是使用token,通过变换获得一个vocab size大小的输出,从而判断预测位 阅读更多…

由admin,5 年 前
深度学习笔记

【深度学习笔记】参数滑动平均EMA

滑动平均(exponential mobing average),也叫做指数加权平均(exponentially weighted moving average),可以用来估计变量的局部值,是的变量的 阅读更多…

由admin,5 年 前
深度学习笔记

【深度学习笔记】激活函数与损失函数

这篇文章讨论binary_crossentropy、(sparse)categorical_crossentropy的区别 还有 sigmoid和softmax 的区别 首先定义简称: binary_ 阅读更多…

由admin,5 年 前
深度学习笔记

【深度学习笔记】precision,recall,f1

这个问题其实并不难,但是最近遇到了一个比较新奇的F1算法,因此记录下来。 首先我们定义几个变量: TP:预测为1,实际为1. TN:预测为0,实际为0. FP:预测为1,实际为0. FN:预测为0,实 阅读更多…

由admin,5 年 前
算法

【Leetcode】排序集锦

L215:数组中的第K个最大元素 https://leetcode-cn.com/problems/kth-largest-element-in-an-array/ 这道题有点奇怪(指数据),其实按说 阅读更多…

由admin,5 年 前
深度学习笔记

【深度学习笔记】Conditional Layer Normalization

本文思路来源于苏建林大佬的Conditional Layer Normalization,本人整理消化后写的笔记。 如果你有两个相似的任务,比如文本生成,但是要根据指令生成积极的和消极的文本,那么怎么 阅读更多…

由admin,5 年 前

文章导航

上一页 1 … 5 6 7 … 31 下一页
分类
  • QQ红包的呓语 (2)
  • 其他资料 (7)
    • idea快捷键整理 (1)
    • others (6)
  • 学习笔记 (298)
    • JAVA SE (1)
    • Java虚拟机 (4)
    • JSP (8)
    • Python (27)
    • Ubuntu (2)
    • 云计算:概念,技术与架构 (9)
    • 机器学习实战 (11)
    • 深度学习 (94)
      • Bert (9)
      • transformers (7)
      • 动手学深度学习 (4)
      • 对话系统 (8)
      • 深度学习基础 (12)
      • 深度学习笔记 (43)
        • 强化学习 (2)
      • 翻译搬运 (5)
      • 自然语言处理基础 (3)
      • 论文 (16)
    • 算法 (91)
    • 算法分析与设计 (20)
    • 网络爬虫实战 (24)
    • 设计模式 (16)
近期文章
  • 【深度学习笔记】下一代大模型应该是什么架构?
  • 【论文】一个基于状态转移的高效推理框架
  • 【强化学习】DAPO:基于GRPO专为长推理优化的强化学习方案
  • 【强化学习】推理大模型:DeepSeek-R1 解读与复现
  • 【深度学习笔记】🍓o1之来龙去脉

attention bert transformer 基础 比赛 汇总 深度学习 爬虫 笔记 翻译搬运 论文 面试


如果哪里有不同见解或者有不懂的可以在文章下评论或email我,我会第一时间联系。

  • 首页
  • github
  • 我的简历
Sniper | 辽ICP备18006775号