⚡ Exploring the Frontiers of AI

深度学习与强化学习
学习笔记

探索神经网络的数学本质，从 Q-Learning 到 PPO，记录每一步 AI 学习旅程中的思考与实践。

⚡ 最新学习心得

🧠

通过经验回放和目标网络解决强化学习中的稳定性问题，深入理解 DQN 如何实现从像素到决策的端到端学习。

Deep Learning DQN PyTorch

阅读全文 →

🔧 最近项目

🤖

使用 PyTorch 实现 PPO 算法，实现机器人在复杂地形的自适应行走，探索策略梯度方法的强大表现力。

PPO Reinforcement Learning Robotics

查看项目 →

🎓 算法演示

📊

从基础 Q-Learning 到 DQN 再到 Double DQN，通过交互式幻灯片全面对比不同算法的性能表现。

Q-Learning Comparison Slides

查看演示 →

阶段一

神经网络基础

理解前馈网络、反向传播、激活函数，使用 PyTorch 构建 MLP

阶段二

强化学习入门

掌握 Q-Learning 核心思想，实现表格型 Q-Learning 解决简单环境

阶段三

深度强化学习

DQN、Double DQN、经验回放机制，实现 Atari 游戏控制

阶段四

策略梯度方法

PPO 算法实现，机器人行走控制，探索连续动作空间

🚀 最新内容