跳至内容

深度学习个人笔记

st的个人博客

  • 首页
  • 解构
  • 笔记
  • 杂谈

model-based方法以及模拟器的训练

发表于2020年6月28日2020年11月20日 作者 2040179500@qq.com

model-based方法与model-free方法的对比如下: model-based: 一旦模拟器构建好,… 继续阅读 model-based方法以及模拟器的训练

强化学习基础笔记

发表于2020年6月16日2021年5月19日 作者 2040179500@qq.com

强化学习定义以下几个变量: a:操作action,可以是N种操作构成一个有限集合$\{a_1, a_2, &#… 继续阅读 强化学习基础笔记

人工智能的构建(3):复杂系统

发表于2020年5月17日2020年5月18日 作者 2040179500@qq.com

前一篇文章提出了一种可迭代,在不同抽象层中都具有自相似性的网络结构。这种解构中使用到了attention机制的… 继续阅读 人工智能的构建(3):复杂系统

人工智能的构建(2):从attention到Ising模型

发表于2020年5月16日2020年5月17日 作者 2040179500@qq.com

重构self-attention Self-attention机制,在深度学习中的各个方面都取得了巨大的成功。… 继续阅读 人工智能的构建(2):从attention到Ising模型

人工智能的构建(1):谜团

发表于2020年5月16日2020年5月16日 作者 2040179500@qq.com

序言 认知科学是一个交叉学科,有很多已知的情报,看似彼此独立,背后的的机制却存在种种或是巧合,或是令人费解的地… 继续阅读 人工智能的构建(1):谜团

常见知识点简要笔记

发表于2020年5月15日2021年6月10日 作者 2040179500@qq.com

简要笔记 Adam:= Netsterov动量+RMSprop Netsterov: 估算动量过后的x位置$\… 继续阅读 常见知识点简要笔记

XLNet论文笔记

发表于2020年5月15日2020年9月10日 作者 2040179500@qq.com

使用auto-regression进行编码:LSTM 。 优化目标:$p(\boldsymbol{x}) = … 继续阅读 XLNet论文笔记

变分推断方法笔记

发表于2020年5月15日2020年5月15日 作者 2040179500@qq.com

Variational Inference变分推断,在LDA与VAE中都使用到了,这里是视频https://w… 继续阅读 变分推断方法笔记

从梯度下降中的信噪比分析mini batch的作用

发表于2020年5月14日2020年5月15日 作者 2040179500@qq.com

无噪音下降路径 考虑一个通用的机器学习场景: 客观存在一个分布$p(\boldsymbol{x},y)$,定义… 继续阅读 从梯度下降中的信噪比分析mini batch的作用

估算交互信息Mutual Information

发表于2020年5月14日2020年5月15日 作者 2040179500@qq.com

现有估算方法的局限性 交互信息以及熵的相关知识,请翻阅之前我写的博客。正常的做法是将连续数据离散分箱,之后用蒙… 继续阅读 估算交互信息Mutual Information

文章导航

上一页< 分页 1 分页 2 分页 3 下一页>
跳至页脚

目录

  • 人工智能 (6)
  • 信息论与DL (6)
  • 未分类 (1)
  • 深度学习算法 (15)
    • NLP (2)
    • 强化学习 (7)

近期文章

  • Mamba模型解析
  • 主动推断active inference与free energy principle
  • 基于DICE的off-policy estimation评估
  • 《Model-based Offline Policy Optimization》论文笔记
  • Soft Actor Critic

功能

  • 登录
  • 条目feed
  • 评论feed
  • WordPress.org

备案信息

粤ICP备20037989号-1

由 WordPress 强力驱动 | 主题: Yocto 作者 Humble Themes

粤公网安备 44030502005361号