Uncategorized
404 words
MTCNN是一种用于人脸检测和对齐的多任务卷积神经网络(Multi-task Cascaded Convolutional Networks)。它是一种高效且准确的人脸检测算法,能够同时检测出图像中的人脸位置、人脸边界框的大小以及人脸关键点(如眼睛、鼻子、嘴巴等)的位置。 MTCNN由三个级联的卷积神经网络组成:P-Net(Proposal Network)、R-Net(Refine Network)和O-Net(Output Network)。 P-Net:P-Net是第一个级联的网络,它通过滑动窗口和候选框回归来生成一组候选人脸框。P-Net用于快速筛选候选框,检测可能包含人脸的区域。 R-Net:R-Net是第二个级联的网络,在P-Net的基础上进一步筛选候选框,通过分类和回归来提高人脸检测的准确性。R-Net会对候选框进行更准确的定位和边界框回归,排除不包含人脸的框并提供更准确的人脸位置和边界框。 O-Net:O-Net是第三个级联的网络,对R-Net输出的候选框进行最后的筛选和精细化调整。O-Net不仅检测人脸位置和边界框,还检测关键点,如眼睛、鼻子和嘴巴等。...
Uncategorized
421 words
CNN-LSTM是一种混合模型,结合了卷积神经网络(Convolutional Neural Network,CNN)和长短期记忆网络(Long Short-Term Memory,LSTM)。它常被用于处理具有时空特性的数据,如图像序列、文本序列等。 CNN是一种主要用于处理图像数据的神经网络架构。它通过卷积层和池化层来提取输入数据中的局部特征,然后通过全连接层进行分类或回归等任务。CNN在图像处理领域取得了很大的成功,因为它能够自动学习和提取图像中的特征。 LSTM是一种递归神经网络(Recurrent Neural Network,RNN)的变体,专门用于处理序列数据。相比于传统的RNN,LSTM能够更好地处理长序列依赖关系,避免了梯度消失或梯度爆炸等问题。LSTM通过使用称为“门”的结构来选择性地遗忘和更新信息,以捕捉序列中的长期依赖关系。 将CNN和LSTM结合起来,可以利用CNN在提取局部特征方面的优势,并将这些特征输入到LSTM中进行序列建模。这种混合模型常被用于处理文本分类、情感分析、语音识别等任务,其中CNN用于提取文本或语音中的局部特征,而LSTM用于对这些特...
Uncategorized
418 words
无论是视频还是摄像头,YOLO的目标检测实际上都是对图像进行预测的因此对于电脑屏幕的实时检测。我们可以不断地截屏,将图片逐张推理,再把推理结果返回窗口。 过程分为三步: ①截屏。此处可以使用MSS来进行实时的截屏; ②使用YOLO进行推理。这里我们调用run()方法即可,有的YOLO版本没有run()方法,需要自己改。 ③展示推理结果。将推理结果展示到窗口上。 参考原文链接:https://blog.csdn.net/shopkeeper_/article/details/124578725 screenDetect.py的代码 12345678910111213141516171819202122232425262728293031323334353637383940import cv2import numpy as npfrom mss import mssimport detectimport osimport sysfrom pathlib import Path# 截图区域bounding_box = {'top': 0, 'le...
Uncategorized
214 words
人为什么要写博客我时常会想我最近过的怎么样,有没有收获,学到了什么。 没有学习的时候我会回想今天玩了什么,玩也是一种体验,这种体验会转瞬即去,我要让这种体验成为心灵中的记忆。 有学习的时候,我会总结今天的收获,闲的时候写个博客记录一下,忙的时候记个笔记,接着盘算着明天的学习,让这种学习成为生理上的习惯。 我看着自己搭建的博客像一个小窝,小窝里有以前的许多旧照片,旧照片上有我拼搏的身影。 我写博客是为了当我越走越远的时候,回头望去,我不会因为感到碌碌无为而后悔。 我思故我在!!!