计算机视觉深度学习入门

Uncategorized
266 words

前言

FYT视觉组培训,针对RoboMaster的深度学习速成课。

预备知识:

  • 学习完前面的C++培训知识,有基本的编程能力。
  • 掌握Python的基本语法。

参考书籍:

  • Deep Learning with Python Second Edition (主要讲tensorflow)
  • DIVE INTO DEEP LEARNING (主要讲pytorch)
  • 了解CV与RoboMaster视觉组 (视觉组圣经)

讲解人

计科2205 蔡明辰


1. 计算机视觉

计算机视觉(Computer Vision,CV)是指让计算机理解和处理图像、视频、声音、文字等信息的能力。

CV的应用场景有:

  • 图像识别:识别图像中的物体、场景、人脸、logo等。
  • 目标跟踪:跟踪目标的移动轨迹。
  • 图像超分辨率:提高图像的清晰度。
  • 图像修复:修复图像中的缺失、污染、模糊等。
  • 图像合成:合成图像的不同视角。

作业

在自己电脑上配置好深度学习环境,部署YOLOv5目标检测算法。使用官方的模型权重,提交一个YOLOv5的推理视频(测试视频随意)。