橙色云资讯 - 工业互联网行业信息门户

使用Python+OpenCV+Tensorflow实现图像聚类

磐创AI 2021-03-11

2856 字丨阅读本文需 9 分钟

介绍大家好，最近在参加深度学习竞赛时，遇到了一个有趣的问题，即如何将给定的图像集进行聚类，你可能会说，这不是一个简单的分类问题吗？使用卷积神经网络，就实现，但关键在于没有合适训练数据提供训练。在不想自己收集数据集的情况，我们如何解决这个问题呢？这就是本文的主要内容，即将深度学习直接应用于测试数据（此处为图像），而无需创建训练数据集并在该数据集上训练神经网络。卷积神经网络作为特征提取器首先我们需要讨论为什么需要特征提取器？以及如何使卷积神经网络（CNN）发挥作用。图像数据的特征提取器：假设算法需要像特征一样需要两只眼睛，一只鼻子和一张嘴来将图像分类为面部，但是在不同的图像中，这些特征存在于不同的像素位置，因此简单地将图像扁平化并将其提供给算法是不起作用的。而解决这个问题刚好是CNN的卷积层发挥作用的地方。卷积层作为我们的特征提取器，并将图像分解为越来越精细的细节，我们来看一下下面的例子：

这是一只猫的图像，这是Vgg16的第一个卷积层看到它的样子

请注意不同的图像，这些是我们的CNN所学习的特征图，一些特征图着重于轮廓，一些特征着重于纹理，而某些特征则涉及更细微的细节（如耳和嘴），下一阶段的卷积层将这些特征分解得更细的细节。

上午我们知道了卷积层可以学习图像的特定功能，那么接下来我们将实现编码。实现CNN的卷积层网络：以下代码显示了如何使用预训练的CNN Vgg16获得以上结果：MyModel ＝ tf2．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．tensorflow．keras＇｝，＇＊＇）＂＞keras．applications．VGG16（
include＿top＝True， weights＝＇imagenet＇， input＿tensor＝None， input＿shape＝None，
pooling＝None， classes＝1000， classifier＿activation＝＇softmax＇
）
MyModel．summary（）
＃＃ lets Define a Function that can show Features learned by CNN＇s nth convolusion layer
def ShowMeWhatYouLearnt（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．Image＇｝，＇＊＇）＂＞Image，＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．layer＇｝，＇＊＇）＂＞layer，＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．MyModel＇｝，＇＊＇）＂＞MyModel）：
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img ＝ img＿to＿array（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．Image＇｝，＇＊＇）＂＞Image）
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img ＝ np．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．numpy．expand＿dims＇｝，＇＊＇）＂＞expand＿dims（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img， 0）
＃＃＃ preprocessing for img for vgg16
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img ＝ tf2．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．tensorflow．keras＇｝，＇＊＇）＂＞keras．applications．vgg16．preprocess＿input（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img）
＃＃ Now lets define a model which will help us
＃＃ see what vgg16 sees
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．inputs＇｝，＇＊＇）＂＞inputs ＝＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．MyModel＇｝，＇＊＇）＂＞MyModel．inputs
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．outputs＇｝，＇＊＇）＂＞outputs ＝＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．MyModel＇｝，＇＊＇）＂＞MyModel．layers［＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．layer＇｝，＇＊＇）＂＞layer］．output
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．model＇｝，＇＊＇）＂＞model ＝ Model（inputs＝＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．inputs＇｝，＇＊＇）＂＞inputs， outputs＝＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．outputs＇｝，＇＊＇）＂＞outputs）
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．model＇｝，＇＊＇）＂＞model．summary（）
＃＃ let make predictions to see what the Cnn sees

＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．featureMaps＇｝，＇＊＇）＂＞featureMaps ＝＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．model＇｝，＇＊＇）＂＞model．predict（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．img＇｝，＇＊＇）＂＞img）
＃＃ Plotting Features
for a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．maps＇｝，＇＊＇）＂＞maps in ＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．featureMaps＇｝，＇＊＇）＂＞featureMaps：
plt．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．matplotlib．pyplot．figure＇｝，＇＊＇）＂＞figure（figsize＝（20，20））
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．pltNum＇｝，＇＊＇）＂＞pltNum ＝ 1
for ＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．a＇｝，＇＊＇）＂＞a in range（8）：
for ＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．b＇｝，＇＊＇）＂＞b in ＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．range＇｝，＇＊＇）＂＞range（8）：
plt．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．matplotlib．pyplot．subplot＇｝，＇＊＇）＂＞subplot（8， 8，＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．pltNum＇｝，＇＊＇）＂＞pltNum）
plt．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．matplotlib．pyplot．imshow＇｝，＇＊＇）＂＞imshow（＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．maps＇｝，＇＊＇）＂＞maps［：，：，＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．pltNum＇｝，＇＊＇）＂＞pltNum － 1］， cmap＝＇gray＇）
＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．kaggle．usercode．12234793．44545592．ShowMeWhatYouLearnt．．pltNum＇｝，＇＊＇）＂＞pltNum ＋＝ 1
plt．＜a onclick＝＂parent．postMessage（｛＇referent＇：＇．matplotlib．pyplot．show＇｝，＇＊＇）＂＞show（）
接下来我们将重点介绍如何来创建我们的聚类算法。设计图像聚类算法在本节中，我们使用Kaggle上的 keep－babies－safe 数据集。https：／／www．kaggle．com／akash14／keep－babies－safe首先，我们创建一个图像聚类模型，来将给定的图像分为两类，即玩具或消费品，以下是来自该数据集的一些图像。

以下代码实现我们的聚类算法：＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃ Making Essential Imports ＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
import sklearn
import os
import sys
import matplotlib．pyplot as plt
import cv2
import pytesseract
import numpy as np
import pandas as pd
import tensorflow as tf
conf ＝ r＇－－ oem 2＇
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
＃ Defining a skeleton for our ＃
＃ DataFrame ＃
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
DataFrame ＝｛
＇photo＿name＇：［］，
＇flattenPhoto＇：［］，
＇text＇：［］，
｝
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
＃ The Approach is to apply transfer learning hence using Resnet50 as my ＃
＃ pretrained model ＃
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
MyModel ＝ tf．keras．models．Sequential（）
MyModel．add（tf．keras．applications．ResNet50（
include＿top ＝ False， weights＝＇imagenet＇， pooling＝＇avg＇，
））
＃ freezing weights for 1st layer
MyModel．layers［0］．trainable ＝ False
＃＃＃ Now defining dataloading Function
def LoadDataAndDoEssentials（path， h， w）：
img ＝ cv2．imread（path）
DataFrame［＇text＇］．append（pytesseract．image＿to＿string（img， config ＝ conf））
img ＝ cv2．resize（img，（h， w））
＃＃ Expanding image dims so this represents 1 sample
img ＝ img ＝ np．expand＿dims（img， 0）
img ＝ tf．keras．applications．resnet50．preprocess＿input（img）
extractedFeatures ＝ MyModel．predict（img）
extractedFeatures ＝ np．array（extractedFeatures）
DataFrame［＇flattenPhoto＇］．append（extractedFeatures．flatten（））
＃＃＃ with this all done lets write the iterrrative loop
def ReadAndStoreMyImages（path）：
list＿＝ os．listdir（path）
for mem in list＿：
DataFrame［＇photo＿name＇］．append（mem）
imagePath ＝ path ＋＇／＇＋ mem
LoadDataAndDoEssentials（imagePath， 224， 224）
＃＃＃ lets give the address of our Parent directory and start
path ＝＇enter your data＇s path here＇
ReadAndStoreMyImages（path）
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
＃ lets now do clustering ＃
＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃
Training＿Feature＿vector ＝ np．array（DataFrame［＇flattenPhoto＇］， dtype ＝＇float64＇）
from sklearn．cluster import AgglomerativeClustering
kmeans ＝ AgglomerativeClustering（n＿clusters ＝ 2）
kmeans．fit（Training＿Feature＿vector）
A little explanation for the above code：
上面的代码使用Resnet50（一种经过预先训练的CNN）进行特征提取，我们只需移除其头部或用于预测类别的神经元的最后一层，然后将图像输入到CNN并获得特征向量作为输出，实际上，这是我们的CNN在Resnet50的倒数第二层学习到的所有特征图的扁平数组。可以将此输出向量提供给进行图像聚类的任何聚类算法。让我向你展示通过这种方法创建的簇。

该可视化的代码如下＃＃ lets make this a dataFrame
import seaborn as sb
import matplotlib．pyplot as plt
dimReducedDataFrame ＝ pd．DataFrame（Training＿Feature＿vector）
dimReducedDataFrame ＝ dimReducedDataFrame．rename（columns ＝｛ 0：＇V1＇， 1 ：＇V2＇｝）
dimReducedDataFrame［＇Category＇］＝ list （df［＇Class＿of＿image＇］）
plt．figure（figsize ＝（10， 5））
sb．scatterplot（data ＝ dimReducedDataFrame， x ＝＇V1＇， y ＝＇V2＇，hue ＝＇Category＇）
plt．grid（True）
plt．show（）
结论本文通过解释如何使用深度学习和聚类将视觉上相似的图像聚在一起形成簇，而无需创建数据集并在其上训练CNN。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：磐创AI

0 0

参与评论

登录后参与讨论 0/1000

下一篇在 Python 中使用机器学习进行人体姿势估计

姿态检测是计算机视觉领域的一个活跃研究领...

2021-12-27

使用Python+OpenCV+Tensorflow实现图像聚类

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

使用Python+OpenCV+Tensorflow实现图像聚类

参与评论

为你推荐

视觉 Transformer 研究的关键问题: 现状及展望

CNN结构演变总结（一）经典模型

图神经网络入门

建立卷积神经网络模型

padding在深度学习模型中重要吗？

一文读懂语义分割与实例分割

基于卷积神经网络的图像分类

EfficientNet通过AutoML模型缩放提高准确效率

使用 CNN 进行图像分类 - 理解计算机视觉

使用卷积神经网络进行图像分类

出门处处离不开刷脸，人脸识别到底安不安全？

计算机视觉专业术语/名词总结(一)构建知识体系

2022年最新深度学习入门指南

seam-carving算法:一种有效的图像大小调整方法

ICCV2021 | MicroNet：以极低的 FLOPs 改进图像识别

计算机视觉中的特征金字塔技术总结

使用卷积神经网络和 Python 进行图像分类

亚马逊机器学习总监Alex Smola：TensorFlow、Caffe等已经存在，为何还需要MXNet？

轻量化模型系列--GhostNet：廉价操作生成更多特征

Google利用卷积神经网络创造一个新世界模型，可用于指导现实中的导航

自动驾驶：基于PCL的激光雷达感知

更复杂的体系结构能保证更好的模型吗？

2020人工智能十大风云人物！

2021年需要关注的十个关键深度学习算法

深兰科技|一文了解基于ST-GCN的人体动作识别与生成

用于大规模图像缩放识别的Vision Transformer

如何使用卷积神经网络从梅尔谱图检测 COVID-19 咳嗽

人工智能和大数据

卷积神经网络系统智能化升级！能从照片中识别狗的品种，准确率达到 98%

Residual, BottleNeck, Linear BottleNeck, MBConv解释

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区