摘要: 目录1. 强化学习2. 马尔科夫链3. Q值和V值 1. 强化学习 首先a56爆大奖在线娱乐们需要明确,强化学习的任务是什么? 这用大白话说:就是a56爆大奖在线娱乐们希望用强化学习的方式,使智能体获得独立自主地完成某种任务的能力。 智能体学习和工作的地方,a56爆大奖在线娱乐们就称为环境。 注意!所谓独立自主,就是智能体一旦启动,就不需要人指挥了。 阅读全文
posted @ 2024-07-04 23:56 jack-chen666 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 目录1. 剪枝、聚类、量化协同2.知识蒸馏 1. 剪枝、聚类、量化协同 协同优化,即将剪枝、聚类、量化同时使用,用于减小模型体积、加速推理速度。 1 使用工具转换器的默认量化功能 2 有代表性的数据集可以进行整数量化 3 如果希望在GPU上加速模型,可以使用float16优化,或TensorRT 4 阅读全文
posted @ 2024-07-04 11:14 jack-chen666 阅读(1) 评论(0) 推荐(0) 编辑