前言
FYT视觉组培训,针对RoboMaster的深度学习速成课。
预备知识:
- 学习完前面的C++培训知识,有基本的编程能力。
- 掌握Python的基本语法。
参考书籍:
- Deep Learning with Python Second Edition (主要讲tensorflow)
- DIVE INTO DEEP LEARNING (主要讲pytorch)
- 了解CV与RoboMaster视觉组 (视觉组圣经)
讲解人
计科2205 蔡明辰
1. 计算机视觉
计算机视觉(Computer Vision,CV)是指让计算机理解和处理图像、视频、声音、文字等信息的能力。
CV的应用场景有:
- 图像识别:识别图像中的物体、场景、人脸、logo等。
- 目标跟踪:跟踪目标的移动轨迹。
- 图像超分辨率:提高图像的清晰度。
- 图像修复:修复图像中的缺失、污染、模糊等。
- 图像合成:合成图像的不同视角。
作业
在自己电脑上配置好深度学习环境,部署YOLOv5目标检测算法。使用官方的模型权重,提交一个YOLOv5的推理视频(测试视频随意)。