橙色云资讯 - 工业互联网行业信息门户

赛道|CVPR2021深兰科技冠军方案解读——低分辨率视频行为识别挑战赛

AI世界 2021-06-30

739 字丨阅读本文需 3 分钟

导读近日，全球三大计算机视觉顶级会议之一CVPR如期举行，深兰科技DeepBlueAI团队斩获TinyAction Challenge(低分辨率视频行为识别挑战赛)的冠军。

TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一，该系列竞赛由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主办，旨在推动视频理解的进一步发展。
冠军方案解读
赛题介绍
TinyAction Challenge使用TinyVirat-v2[1]数据集,旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注，每个视频片段中可能含有多个动作，本质是一个多标签的行为识别任务，比赛结果采用precision、recall、F1-score等多个指标来评测。

赛题难点
视频分辨率很低，最小只有10x10像素尺度；视频尺度多样，从10x10到128x128不等；视频质量较差，含有大量噪声；视频场景多样，行为多样，每个视频可能含有多个行为。
解决方案
在算法选择上，团队广泛尝试了TSM[2]、TPN-Slowonly[3]等经典算法，最终采用交互移除的CSN[4](ir-CSN)模型，在保证性能的前提下适当减少计算量，同时减轻对数据的过拟合。
数据增强方面，训练时团队首先随机调整尺度裁剪，再统一调整尺度到128x128，最后再随机翻转。而在测试时，通过Tencrop，即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均，有效提高了inference时单模型性能。

测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的，因而对最终的结果添加了后处理规则，使得F1指标进一步提高0.6个点。通过一步步优化，DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447，并最终达到0.4782，实现大幅度领先。

总结
在本次比赛中，团队对任务及数据做了仔细的分析，合理地选择了模型算法，进行了精细的模型训练，同时在数据的后处理上做了大量的优化，有效实现了低分辨率高噪声视频中行为识别，并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展，行为识别等视频理解问题能够得到更好的解决，并获得越来越广泛的实际应用。
参考文献：
[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR). IEEE, 2021: 7387-7394[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE, 2019.[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：AI世界

0 0

参与评论

登录后参与讨论 0/1000

赛道|CVPR2021深兰科技冠军方案解读——低分辨率视频行为识别挑战赛

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

赛道|CVPR2021深兰科技冠军方案解读——低分辨率视频行为识别挑战赛

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

半年融资827亿，1.2万字看懂新能源汽车产业图谱

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(3月第三周) | 工信部将开展汽车软件在线升级管理试点；湖南发布智能网联汽车产业“十四五”规划

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

新材料七国的竞争版图：热门行业分布大集锦，未来10年的市场机会或许在这

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

SiC迎来“奇点时刻”，盘点近期产能、需求量、交易等行业大事件

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

每个细分方向都是万亿级市场，超6000家公司携资本入局建筑业数字化 | 年度行业

CES 2022汽车科技最全总结：展会很冷、汽车很热

万里牛B轮融资过亿，电商SaaS究竟有多吸金？

拟上市公司早知道|衡源智能启动A股IPO辅导 优必选、必贝特等150家更新进展

210618|1398家:内蒙古公布可再生能源消纳责任主体清单

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

“赢在南京·创业金陵”科技创新创业大赛圆满举行|北京·活动

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

虚拟股权？科创板定位在哪里？华勤技术IPO三答问询

中国芯片设计公司有哪些？北京上海广州等地芯片设计企业名单汇总

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

Facebook改名换运？扎克伯格画出元宇宙10年大饼，连甩13个XR眼镜黑科技

收购欧菲光一年后，闻泰科技迅速打入果链，靠的是什么?

声迅股份参股成立交通科技公司，持股68%

智能家居“起风”，家电、科技企业纷纷跨界，低端需求“养活”了这些低门槛芯片企业

金心异解开“深圳创新密码”42：Tencent这棵树

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总

拟上市公司早知道|衡源智能启动A股IPO辅导优必选、必贝特等150家更新进展

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资