Sniper
  • 首页
  • github
  • 我的简历

Blog

深度学习笔记

【深度学习笔记】大模型中的一些FAQ

开一个新坑,这个坑主要用来总结一些FAQ和遇到的一些有趣的结论。会慢慢的持续更新。 看到新的论文也会更新已有的FAQ。所以其实也不都是增量更新。 因为我会在notion先记,有时间了再整理到博客上,所 阅读更多…

由Sniper,1 年2024-03-21 前
深度学习笔记

【深度学习笔记】大模型中一些有意思的idea

这个系列其实也和【深度学习笔记】大模型中的一些FAQ 一样,慢慢更新。 有人催更请按1,有人提问请按2,有人讨论请按山,有人搬运请直接拨110!! 最新更新时间:2024.04.20 1.预训练时,对 阅读更多…

由Sniper,1 年2024-03-21 前
Python

【Python】python核心知识点(全)

1. 列出 5 个常用 Python 标准库? 很多,os、time、random、re、math、sys等 2. Python 内建数据类型有哪些? str,bytes,int,float,list 阅读更多…

由admin,5 年 前
强化学习

【强化学习】DAPO:基于GRPO专为长推理优化的强化学习方案

前言 虽然DeepSeek R1为大家提供了一个使用强化学习来完成推理能力的路线,但是最关键的技术和细节往往被隐藏,因此社区内还没有复现他们的结果。 字节跳动Seed+清华大学提出了解耦裁剪和动态采样 阅读更多…

由Sniper,2 月2025-03-21 前
强化学习

【强化学习】推理大模型:DeepSeek-R1 解读与复现

摘要 (Scaling Test-Time Compute/Human-like Long Thought o1, R1/RL) (SFT/DPO/PPO, Open-Ended Solution e 阅读更多…

由Sniper,3 月2025-02-10 前
深度学习笔记

【深度学习笔记】🍓o1之来龙去脉

注:本文写于2024年9月24日,有些技术猜测可能已经被证伪或过时。但是主线技术没问题,只是最后的技术猜测可能有错。 本文将试图以OpenAI历年来的研发思路变化为主线,涉及到可能的技术以及扩展,直至 阅读更多…

由Sniper,8 月2024-09-24 前
深度学习笔记

【深度学习笔记】MoE的介绍以及调研

MoE介绍 MoE(Mixture of Experts)和标准Dense模型的整体区别如下: 和标准Transformer模型的结构区别如下如所示[5],主要是将FFN层进行了更改,添加一个gate 阅读更多…

由Sniper,1 年2024-01-26 前
论文

【论文】Continual Pre-Training of Large Language Models: How to (re)warm-up your model?

拿大蒙特利尔的两所大学的工作,主要是验证继续预训练中,如何warmup你的模型。 写在notion上了,懒得搬运。链接如下(可能需要翻墙) https://daffodil-square-501.no 阅读更多…

由Sniper,1 年2023-11-21 前
论文

【论文】Small-scale proxies for large-scale Transformer training instabilities

google的一个工作,本文使用小模型来验证在训练大模型时会产生的loss问题(训练不稳定),成功的在小模型上复现了这一问题,并验证了当前解决大模型的loss问题的方法,在小模型上依然有效。并成功预测 阅读更多…

由Sniper,1 年2023-11-21 前
深度学习笔记

【深度学习笔记】Ziya2

现在的模型一直在堆叠规模,但是很少有人在数据上细致的下功夫。所以ziya2在13B模型上只训练700B的token,就超过了llama2很多。 整体流程如下。在llama2 13B的基础上,分了三个阶 阅读更多…

由Sniper,1 年2023-11-21 前
深度学习笔记

【深度学习笔记】SkyWork

模型结构 使用了RoPE,RMSNorm和SwiGLU。 整体结构和llama类似,也看得出来整体技术报告处处对比llama,应该是跟随llama的一个工作。不过比llama2更加的“细长”,增大了l 阅读更多…

由Sniper,1 年2023-11-21 前

文章导航

1 2 … 31 下一页
分类
  • QQ红包的呓语 (2)
  • 其他资料 (7)
    • idea快捷键整理 (1)
    • others (6)
  • 学习笔记 (296)
    • JAVA SE (1)
    • Java虚拟机 (4)
    • JSP (8)
    • Python (27)
    • Ubuntu (2)
    • 云计算:概念,技术与架构 (9)
    • 机器学习实战 (11)
    • 深度学习 (92)
      • Bert (9)
      • transformers (7)
      • 动手学深度学习 (4)
      • 对话系统 (8)
      • 深度学习基础 (12)
      • 深度学习笔记 (42)
        • 强化学习 (2)
      • 翻译搬运 (5)
      • 自然语言处理基础 (3)
      • 论文 (15)
    • 算法 (91)
    • 算法分析与设计 (20)
    • 网络爬虫实战 (24)
    • 设计模式 (16)
近期文章
  • 【强化学习】DAPO:基于GRPO专为长推理优化的强化学习方案
  • 【强化学习】推理大模型:DeepSeek-R1 解读与复现
  • 【深度学习笔记】🍓o1之来龙去脉
  • 【深度学习笔记】大模型中的一些FAQ
  • 【深度学习笔记】大模型中一些有意思的idea

attention bert transformer 基础 比赛 汇总 深度学习 爬虫 笔记 翻译搬运 论文 面试


如果哪里有不同见解或者有不懂的可以在文章下评论或email我,我会第一时间联系。

  • 首页
  • github
  • 我的简历
Sniper | 辽ICP备18006775号