国外最火的深度学习实践课新版发布,100%全新前沿内容(2)
Jeremy 会教我们创建一个模型,用来区分泰迪熊和灰熊。 △ 图像分类器 这节课的后半部分,将从头开始训练一个简单的模型,创建我们自己的梯度下降回路。 △ 梯度下降 第三课:数据块、多标签分类、分割 我们从第 3 课开始研究一个有趣的数据集:Planet 的从太空了解亚马逊。 为了将这些数据转化为我们需要用于建模的形式,我们将使用 fastai 最强大的唯一工具:数据块 API。这个 API 以后还要用很多次。 学完本课后,如果你准备学习更多关于数据块 API 的知识,请查看这篇文章:Wayde Gilliam 的《Finding Data Block Nirvana》: Planet 数据集是一个多标签数据集。也就是说:每个 Planet 图像可以包含多个标签,而我们看过的先前数据集每个图像只有一个标签。我们将看看我们需要对多标签数据集进行哪些更改。 △ 图像分割 接下来,我们将看一下图像分割。我们将使用与早期图像分类模型类似的技术,并进行一些调整。fastai 使图像分割建模和解释与图像分类一样简单,因此不需要太多的调整。 本课程的这一部分使用的是CamVid数据集,它的误差远远低于其他任何学术论文中的模型。 第四课:NLP、表格数据、协同过滤、嵌入 在这节课中,Jeremy 给我们制定的目标是,预测电影评论是积极的还是消极的,称之为情绪分析。我们将使用 IMDb 电影评论数据集深入研究自然语言处理(NLP)。 Jeremy 将使用最初在 2018 年课程期间开发的ULMFiT算法,他说这是当今最准确的情绪分析算法。 创建情绪分析模型的基本步骤是: 1、创建语言模型,在大型语料库(例如维基百科)上训练,这里的“语言模型”是学习预测句子的下一个单词的任何模型 2、使用目标语料库(IMDb 电影评论)微调此语言模型 3、删除这个微调语言模型中的编码器,并用分类器替换它。然后,针对最终的分类任务微调这个情绪分析模型。 在进入 NLP 学习之后,我们将通过覆盖表格数据以及协同过滤来完成编码器深度学习的实际应用。 对于表格数据,我们将看到如何使用分类变量和连续变量,以及如何使用 fastai.tabular 模块来设置和训练模型。 然后,我们将看到如何使用类似于表格数据的想法来构建协同过滤模型。 在进入 NLP 学习之后,我们将通过覆盖表格数据以及协同过滤来完成编码器深度学习的实际应用。 对于表格数据,我们将看到如何使用分类变量和连续变量,以及如何使用 fastai.tabular 模块来设置和训练模型。 然后,我们将看到如何使用类似于表格数据的想法来构建协同过滤模型。 进入课程的中段,我们已经研究了如何在每个关键应用领域中创建和解释模型。在课程的后半部分,我们将了解这些模型是如何工作的,以及如何从头开始创建它们。 下面,我们将接触到以下概念:
第五课:反向传播、加速 SGD、从头开始搭神经网络 在第 5 课中,我们将所有训练组合在一起,以便准确理解反向传播时发生了什么,并利用这些知识从头开始创建和训练一个简单的神经网络。 △ 从头开始训练的神经网络 我们还将看到如何查看嵌入层的权重,以找出电影评论解读模型对从分类变量中学到了什么,让我们避开那些烂片。 (编辑:ASP站长网) |