Loading

【动手学深度学习】第四章笔记:多层感知机、权重衰减、暂退法、数值稳定性和模型初始化、环境和分布偏移

为了更好的阅读体验,请点击这里 4.1 多层感知机 4.1.1 隐藏层 由于仿射变换中的线性是一个很强的假设,因此导致了线性模型可能会不适用。线性意味着单调假设:任何特征的增大都会导致模型输出的增大或者模型输出的减小。 但是违反单调性的例子比比皆是。除此之外,分类任务中,仅依托像素强度分类也很不合理
posted @ 2023-04-25 19:44  bringlu  阅读(789)  评论(0编辑  收藏  举报