分类: 实操 | Hexo

Hexo

Never really desperate, only the lost of the soul.

subtitle

文章分类

学习 33 算法 2 笔记 6 刷题 61 嵌入式 2 实操 2 题解模板 4 HJ-16. 1 HJ-19. 2 HJ-67. 1 HJ-24. 1 HJ-98. 1

policy_gradient(reinforce)

policy_gradient(reinforce)

伪代码： agent.py import random import torch from torch.utils.tensorboard import SummaryWriter from model import Policy

2022-04-08 实操

PyTorch Policy Gradient Reinforce

dqn

伪代码： Model.py: import torch from torch import nn import torch.nn.functional as F import numpy as np import random fr

2022-04-08 实操

Deep Q-Network