深度学习个人笔记 – 第2页

model-based方法以及模拟器的训练

model-based方法与model-free方法的对比如下： model-based: 一旦模拟器构建好，… 继续阅读 model-based方法以及模拟器的训练

强化学习定义以下几个变量： a：操作action，可以是N种操作构成一个有限集合$\{a_1, a_2, &#… 继续阅读强化学习基础笔记

前一篇文章提出了一种可迭代，在不同抽象层中都具有自相似性的网络结构。这种解构中使用到了attention机制的… 继续阅读人工智能的构建（3）：复杂系统

重构self-attention Self-attention机制，在深度学习中的各个方面都取得了巨大的成功。… 继续阅读人工智能的构建（2）：从attention到Ising模型

序言认知科学是一个交叉学科，有很多已知的情报，看似彼此独立，背后的的机制却存在种种或是巧合，或是令人费解的地… 继续阅读人工智能的构建（1）：谜团

简要笔记 Adam:= Netsterov动量+RMSprop Netsterov：估算动量过后的x位置$\… 继续阅读常见知识点简要笔记

使用auto-regression进行编码：LSTM 。优化目标：$p(\boldsymbol{x}) = … 继续阅读 XLNet论文笔记

Variational Inference变分推断，在LDA与VAE中都使用到了，这里是视频https://w… 继续阅读变分推断方法笔记

无噪音下降路径考虑一个通用的机器学习场景：客观存在一个分布$p(\boldsymbol{x},y)$，定义… 继续阅读从梯度下降中的信噪比分析mini batch的作用

现有估算方法的局限性交互信息以及熵的相关知识，请翻阅之前我写的博客。正常的做法是将连续数据离散分箱，之后用蒙… 继续阅读估算交互信息Mutual Information