分类: 学习

Hexo

Never really desperate, only the lost of the soul.

subtitle

文章分类

学习 33 算法 2 笔记 6 刷题 61 嵌入式 2 实操 2 题解模板 4 HJ-16. 1 HJ-19. 2 HJ-67. 1 HJ-24. 1 HJ-98. 1

                            
                            stm32-2-INTERRUPT-1
                        
                                STM学习笔记2
                            
                                2022-06-13
                            
                                    学习
                                
                            STM32
                        
                            中断
                        
                            EXTI
                        
                            TIM
                        
                            stm32-1 GPIO
                        
                                STM学习笔记1
                            
                                2022-06-10
                            
                                    学习
                                
                            STM32
                        
                            GPIO
                        
                            KMP
                        
                                KMP算法
                            
                                2022-06-05
                            
                                    学习
                                
                            字符串匹配
                        
                            computer network
                        
                                计算机网络学习笔记。
                            
                                2022-05-03
                            
                                    学习
                                
                            计算机网络
                        
                            DDPG
                        
                                DDPG笔记。
                            
                                2022-04-11
                            
                                    学习
                                
                            DDPG
                        
                            Notes_on_PyTorch
                        
                                PyTorch学习笔记。
                            
                                2022-04-05
                            
                                    学习
                                
                            PyTorch
                        
                            Tries
                        
                                 字典树 概念字典树是一种按照字符串的前缀构建的一种特殊数据结构，是一种字典的存储结构，每个“单词”从根节点出发一直到某一节点为止的路径（通过节点上的bool end来判断是否为单词结尾），路径上的字母连起来即是所存储的“单词”。

 功能
                            
                                2022-04-03
                            
                                    学习
                                
                            字典树
                        
                            Value Iteration vs Policy Iteration
                        
                                 策略迭代 Policy Iteration
策略迭代包括策略评估(Policy Evaluation)和策略改进(Policy Improvement)两个步骤，通过二者的交替迭代来求解MDP。
策略评估
给定一个Policy，通过动态规
                            
                                2022-03-31
                            
                                    学习
                                
                            Reinforcement Learning
                        
                            值迭代
                        
                            策略迭代
                        
                            Notes on Markov Decision Process
                        
                                周博磊bilibili强化学习视频笔记。
                            
                                2022-03-28
                            
                                    学习
                                
                            Reinforcement Learning
                        
                            Markov Decision Process
                        
                            Reinforcement Learning
                        
                                李宏毅强化学习课程笔记。
                            
                                2022-03-25
                            
                                    学习
                                
                            Reinforcement Learning

            
3 / 4