橙色云资讯 - 工业互联网行业信息门户

更复杂的体系结构能保证更好的模型吗？

磐创AI 2022-04-19

卷积 relu 架构

1429 字丨阅读本文需 6 分钟

使用的数据集和数据预处理

我们将使用Kaggle的狗与猫数据集。它是根据知识共享许可证授权的，这意味着你可以免费使用它：

该数据集相当大——25000张图像均匀分布在不同的类中（12500张狗图像和12500张猫图像）。它应该足够大，以训练一个像样的图像分类器。

你还应该删除train／cat／666．jpg和train／dog／11702．jpg图像，这些已经损坏，你的模型将无法使用它们进行训练。

接下来，让我们看看如何使用TensorFlow加载图像。

如何使用TensorFlow加载图像数据

今天你将看到的模型将比前几篇文章中的模型具有更多的层。

为了可读性，我们将从TensorFlow中导入单个类。如果你正在跟进，请确保有一个带有GPU的系统，或者至少使用Google Colab。

让我们把库的导入放在一边：

这是很多，但模型会因此看起来格外干净。

我们现在将像往常一样加载图像数据——使用ImageDataGenerator类。

我们将把图像矩阵转换为0–1范围，使用用三个颜色通道，将所有图像调整为224x224。出于内存方面的考虑，我们将barch大小降低到32：

以下是你应该看到的输出：

让我们鼓捣第一个模型！

向TensorFlow模型中添加层会有什么不同吗？

从头开始编写卷积模型总是一项棘手的任务。网格搜索最优架构是不可行的，因为卷积模型需要很长时间来训练，而且有太多的参数需要检查。实际上，你更有可能使用迁移学习。这是我们将在不久的将来探讨的主题。

今天，这一切都是为了理解为什么在模型架构上大刀阔斧是不值得的。我们用一个简单的模型获得了75％的准确率，所以这是我们必须超越的基线。

模型1－两个卷积块

我们将宣布第一个模型在某种程度上类似于VGG体系结构——两个卷积层，后面是一个池层。滤波器设置如下，第一个块32个，第二个块64个。

至于损失和优化器，我们将坚持基本原则——分类交叉熵和Adam。数据集中的类是完全平衡的，这意味着我们只需跟踪准确率即可：

model＿1 ＝ tf．keras．Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝128， activation＝＇relu＇），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿1．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿1＿history ＝ model＿1．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

以下是经过10个epoch后的训练结果：

看起来我们的表现并没有超过基线，因为验证准确率仍然在75％左右。如果我们再加上一个卷积块会发生什么？

模型2－三个卷积块

我们将保持模型体系结构相同，唯一的区别是增加了一个包含128个滤波器的卷积块：

model＿2 ＝ Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝128， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝128， activation＝＇relu＇），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿2．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿2＿history ＝ model＿2．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

日志如下：

效果变差了。虽然你可以随意调整batch大小和学习率，但效果可能仍然不行。第一个架构在我们的数据集上工作得更好，所以让我们试着继续调整一下。

模型3－带Dropout的卷积块

第三个模型的架构与第一个模型相同，唯一的区别是增加了一个全连接层和一个Dropout层。让我们看看这是否会有所不同：

model＿3 ＝ tf．keras．Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝512， activation＝＇relu＇），

Dropout（rate＝0．3），

Dense（units＝128），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿3．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿3＿history ＝ model＿3．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

以下是训练日志：

太可怕了，现在还不到70％！上一篇文章中的简单架构非常好。反而是数据质量问题限制了模型的预测能力。

结论

这就证明了，更复杂的模型体系结构并不一定会产生性能更好的模型。也许你可以找到一个更适合猫狗数据集的架构，但这可能是徒劳的。

你应该将重点转移到提高数据集质量上。当然，有20K个训练图像，但我们仍然可以增加多样性。这就是数据增强的用武之地。

感谢阅读！

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：磐创AI

0 0

参与评论

登录后参与讨论 0/1000

下一篇基于卷积神经网络的图像分类

现在是学习卷积神经网络及其在图像分类中的...

2022-07-14

更复杂的体系结构能保证更好的模型吗？

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

更复杂的体系结构能保证更好的模型吗？

参与评论

为你推荐

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

“赢在南京·创业金陵”科技创新创业大赛圆满举行|北京·活动

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

对话清华大学张亚勤：AI发展应遵循3R法则

新三板蓝耘科技：伪科技伪成长的骗子股

C++版OpenCV里的机器学习

英特尔发布智慧社区解决方案参考架构

亚马逊在印度推出一款 4K 智能电视

华为：以智能体为参考架构 探索智能世界高度

【硕博之家】基于手绘草图的树叶种类识别

咕咚小魔瘦体脂秤，科学健身的小帮手，随时全面了解健康状况

视觉 Transformer 研究的关键问题: 现状及展望

手机防水处理的百亿赛道 | 行业

董明珠的“2020直播纪事”

美国可再生能源数据书2018（强烈推荐）

CNN结构演变总结（一）经典模型

AMD：准备就绪替客户打造 Arm 架构处理器

M3X火星架构PRO+星途凌云400T，星途用一记漂亮的组合拳迎接未来

云计算——被验证的半导体赛道

虚拟数字人TOP50排行榜（第二期）

实现计算机视觉——人脸检测

关于图像处理和Python深度学习的教程：第一部分

标配RGB灯效的侧透机箱，让工作娱乐不单调，ORICO昼夜机箱体验

物联网云平台-贝壳物联入门详细使用方法

NVIDIA GTX 1630性能首测：被RX 6400按在地上摩擦

睿安咨询：带量采购中的政策与市场竞争策略

西部数据刘钢：当数据中心存储面临挑战，存储架构需要创新

使用Python和docTR提取车辆识别号

使用 OpenCV 对图像进行特征检测、描述和匹配

无视美国制裁，依旧涨价的科技企业只有它了！

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

华为：以智能体为参考架构探索智能世界高度