计算机视觉深度学习入门

2024-11-16

Uncategorized

266 words

前言

FYT视觉组培训，针对RoboMaster的深度学习速成课。

预备知识：

学习完前面的C++培训知识，有基本的编程能力。
掌握Python的基本语法。

参考书籍：

Deep Learning with Python Second Edition (主要讲tensorflow)
DIVE INTO DEEP LEARNING (主要讲pytorch)
了解CV与RoboMaster视觉组 (视觉组圣经)

讲解人

计科2205 蔡明辰

1. 计算机视觉

计算机视觉（Computer Vision，CV）是指让计算机理解和处理图像、视频、声音、文字等信息的能力。

CV的应用场景有：

图像识别：识别图像中的物体、场景、人脸、logo等。
目标跟踪：跟踪目标的移动轨迹。
图像超分辨率：提高图像的清晰度。
图像修复：修复图像中的缺失、污染、模糊等。
图像合成：合成图像的不同视角。

作业

在自己电脑上配置好深度学习环境，部署YOLOv5目标检测算法。使用官方的模型权重，提交一个YOLOv5的推理视频(测试视频随意)。