摘要: 目录1. 什么是量化2 位宽,高精度浮点数的a56爆大奖在线娱乐3. K-means 聚类量化4. 均匀/线性量化(linear quantization)5. Thresholding量化6. 何时量化聚类量化代码 1. 什么是量化 量化可以理解为:从连续到离散,针对parameters(W)、activatio 阅读全文
posted @ 2024-07-03 14:41 jack-chen666 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 目录1. 模型压缩2. 神经网络剪枝4. 非结构化剪枝4. Pruning neurons结构化剪枝代码1模型的剪枝 这里针对整个模型进行剪枝使用TFLite创建一个压缩的模型使用TFLite创建一个压缩+量化的模型读取剪枝+量化的模型4. 结构化剪枝代码 1. 模型压缩 目的:使得模型体积更小,模 阅读全文
posted @ 2024-07-03 11:13 jack-chen666 阅读(4) 评论(0) 推荐(0) 编辑