model-based方法与model-free方法的对比如下: model-based: 一旦模拟器构建好,… 继续阅读 model-based方法以及模拟器的训练
作者:2040179500@qq.com
强化学习基础笔记
强化学习定义以下几个变量: a:操作action,可以是N种操作构成一个有限集合$\{a_1, a_2, &#… 继续阅读 强化学习基础笔记
人工智能的构建(3):复杂系统
前一篇文章提出了一种可迭代,在不同抽象层中都具有自相似性的网络结构。这种解构中使用到了attention机制的… 继续阅读 人工智能的构建(3):复杂系统
人工智能的构建(2):从attention到Ising模型
重构self-attention Self-attention机制,在深度学习中的各个方面都取得了巨大的成功。… 继续阅读 人工智能的构建(2):从attention到Ising模型
人工智能的构建(1):谜团
序言 认知科学是一个交叉学科,有很多已知的情报,看似彼此独立,背后的的机制却存在种种或是巧合,或是令人费解的地… 继续阅读 人工智能的构建(1):谜团
常见知识点简要笔记
简要笔记 Adam:= Netsterov动量+RMSprop Netsterov: 估算动量过后的x位置$\… 继续阅读 常见知识点简要笔记
XLNet论文笔记
使用auto-regression进行编码:LSTM 。 优化目标:$p(\boldsymbol{x}) = … 继续阅读 XLNet论文笔记
变分推断方法笔记
Variational Inference变分推断,在LDA与VAE中都使用到了,这里是视频https://w… 继续阅读 变分推断方法笔记
从梯度下降中的信噪比分析mini batch的作用
无噪音下降路径 考虑一个通用的机器学习场景: 客观存在一个分布$p(\boldsymbol{x},y)$,定义… 继续阅读 从梯度下降中的信噪比分析mini batch的作用
估算交互信息Mutual Information
现有估算方法的局限性 交互信息以及熵的相关知识,请翻阅之前我写的博客。正常的做法是将连续数据离散分箱,之后用蒙… 继续阅读 估算交互信息Mutual Information