橙色云资讯 - 工业互联网行业信息门户

Siamese network总结

CV技术指南 2021-06-28

text-indent

1616 字丨阅读本文需 6 分钟

前言:

本文介绍了Siamese (连体)网络的主要特点、训练和测试Siamese网络的步骤、Siamese网络的应用场合、Siamese网络的优缺点、为什么Siamese被称为One-shot分类,以及Siamese的损失函数。

更多内容请关注公众号CV技术指南,专注于计算机视觉的技术总结,最新技术跟踪。

Siamese Network的主要特点

1． Siamese 网络采用两个不同的输入,通过两个具有相同架构、参数和权重的相似子网络。

2．这两个子网互为镜像,就像连体双胞胎一样。因此,对任何子网架构、参数或权重的任何更改也适用于其他子网。

3．两个子网络输出一个编码来计算两个输入之间的差异。

4． Siamese 网络的目标是使用相似度分数对两个输入是相同还是不同进行分类。可以使用二元交叉熵、对比函数或三元组损失来计算相似度分数,这些都是用于一般距离度量学习方法的技术。

5． Siamese 网络是一种one-shot分类器,它使用判别特征从未知分布中概括不熟悉的类别。

训练 Siamese 神经网络

1．加载包含不同类的数据集

2．创建正负数据对。当两个输入相同时为正数据对,当两个输入不同时为负数据对。

3．构建卷积神经网络,它使用全连接层输出特征编码。我们将通过姊妹 CNN传递两个输入。姐妹 CNN 应该具有相同的架构、超参数和权重。

4．构建差分层以计算两个姐妹 CNN 网络编码输出之间的欧几里得距离。

5．最后一层是具有单个节点的全连接层,使用 sigmoid 激活函数输出相似度分数。

6．使用二元交叉熵作为损失函数。

测试 Siamese 神经网络

1．向训练模型发送两个输入以输出相似度分数。

2．由于最后一层使用 sigmoid 激活函数,它输出一个范围在 0 到 1 之间的值。接近 1 的相似度得分意味着两个输入是相似的。接近 0 的相似度得分意味着两个输入不相似。一个好的经验法则是使用 0．5 的相似性截止阈值。

Siamese 神经网络的应用

1．签名验证

2．面部识别

3．比较指纹

4．根据临床分级评估疾病严重程度

5．工作资料的文本相似度以恢复匹配

6．用于配对相似问题的文本相似度

为什么Siamese神经网络被称为one-shot分类?

1． one-shot分类模型仅使用每个新类别的单个训练样本即可正确进行预测。

2． Siamese 网络使用有监督的训练方法来学习通用输入特征,然后根据训练数据对未知的类分布进行预测。

3．受过训练的 Siamese 网络使用一次性学习来预测两个输入之间的相似性或不相似性,即使这些新分布中的样本很少。

Siamese 网络的优点

1． Siamese 网络是一种one-shot分类模型,只需一个训练样本即可进行预测。

2．对类别不平衡更鲁棒,因为它需要很少的信息。它可以用于某些类的样本很少的数据集。

3． Siamese 网络的one-shot学习特性不依赖于特定领域的知识,而是利用了深度学习技术。

Siamese 网络的缺点

仅输出相似性分数而不输出概率。:互斥事件的概率总和为 1。而距离不限于小于或等于 1。

为什么姐妹网络一定要一样?

两个姐妹卷积网络((sister convolutional network))的模型架构、超参数和权重必须相同。它确保它们各自的网络不会将两个极其相似的图像映射到非常不同的特征空间,因为每个网络计算相同的函数。

Siamese 网络使用的损失函数

1． Siamese 网络使用相似度分数来预测两个输入是相似还是不同,使用度量学习方法,该方法找到其输入之间的相对距离。

2．可以使用二元交叉熵、对比函数或三重损失计算相似度分数。

3． Siamese 网络执行二元分类,将输入分类为相似或不相似;因此,默认使用二元交叉熵损失函数。

对比损失函数

1．对比损失函数通过对比两个输入来区分相似和不同的图像。当你在训练时不了解所有类别并且训练数据有限时,它会有所帮助。它创建了一种数据编码,可以在将来有新类时使用。

2．对比损失需要一对正负训练数据。正对包含一个anchor样本和一个正样本,负对包含一个anchor样本和一个负样本。

3．对比损失函数的目标是使正对具有较小的距离,对负对具有较大的距离。

在上面的等式中,当输入来自同一类时,Y 为 0;否则,Y 的值为 1。

m 是定义半径的余量,以指示超出此余量的不同对不会造成损失,并且始终大于 0。

Dw 是姐妹 siamese 网络输出之间的欧几里得距离。

Triplet Loss

在 Triplet loss 中,我们使用数据的三元组而不是二元对。三元组由anchor、正样本和负样本组成,主要用于面部识别。

在 Triplet loss 中,anchor和正样本编码之间的距离被最小化,而anchor和负样本编码之间的距离被最大化。

Triplet loss 将 d(a,p) 推到 0 ,并且 d(a,n) 大于 d(a,p)+margin

结论

Siamese 网络受到 Siamese twins 的启发,是一种one-shot分类,用于区分相似和不同的图像。即使不知道所有训练时的类别并且训练数据有限,它也可以应用。 Siamese 网络基于度量学习方法,该方法使用二元交叉熵或对比损失或三重损失找到其输入之间的相对距离。

在公众号中回复关键字 “技术总结” 可获取以下文章的汇总pdf。

更多内容请关注公众号CV技术指南,专注于计算机视觉的技术总结,最新技术跟踪。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：CV技术指南

0 0

参与评论

登录后参与讨论 0/1000

下一篇中国平安代理人一年流失42万，重注地产投资打开“潘多拉魔盒”

文｜吴理想来源｜博望财经继去年全年股价下...

2022-06-07

Siamese network总结

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

Siamese network总结

参与评论

为你推荐

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

围剿滴滴，华为腾讯入局网约车

专注金属注射成形技术，鑫迪科技获得逾千万元人民币融资

锚定未来，利尔达综合性定位系统亮相深圳LoRa创新应用论坛

E拆解：萤石精灵球新C6，4MP智能家居摄像机

滴滴背后股权复杂：高精度地图为何引起纷争？| 贾新光汽车评论

重磅消息 | 机智云入选广州市工业软件产品资源池入库名单

【IT之家评测室】荣耀 MagicBook 16 Pro 体验：轻薄性能全都要，多屏协同再升级

小米、OV扎堆“造芯”，只是为了不被时代淘汰？

Windows 11：套苹果的皮、摸安卓的鱼

vivo S10正式发布！这后盖工艺，把我看呆了！

基于Docker的交互式人脸识别应用

政策重拳出击！公共场所人脸识别或全面被禁，基于AI的生物识别都犯了哪些“罪状”？

CNN结构演变总结（一）经典模型

图神经网络入门

被低估的容联云

小米汽车计划2024年出车；亚马逊关闭大量刷单电商店铺；特斯拉生产面临挑战……

工业相机主要接口类型分类

使用 HSV 颜色模型和 openCV 构建昼夜分类器

苹果曝出严重安全漏洞：黑客可完全接管设备，涉及 iPhone / iPad / Mac 等

重磅！苹果AR/VR芯片更多细节曝光

喧宾夺主的Air，续航会更优？苹果MacBook Air M2开箱评测

真无线蓝牙耳机品牌排行榜，综合实力强的蓝牙耳机

台积电芯片代工涨价仅对苹果涨3%；五部门联合约谈11家网约车平台公司

信创下的数据中心建设与数据交换

二十年嬗变，零售SaaS的中国式进化

我国近视人数超6亿！液晶电视、激光电视到底该如何选？终于明白了

估值15亿美元的独角兽被爆裁员，又一赛道遇冷？

机智云物联网开发平台与达梦数据库完成兼容性互认证

20年行业老兵的启示：教育智能硬件，机器一响黄金万两？

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区