个人技术分享

报错：CMake Error OpenCVConfig.cmake opencv-config.cmake

报错：CMake Error OpenCVConfig.cmake opencv-config.cmake。

香橙派 AIpro开发体验：使用YOLOV8对USB摄像头画面进行目标检测

YOLOv8 作为最新的目标检测算法，以其高精度、高速度和易用性，成为许多开发者首选。而香橙派 AIpro 作为一款高性能嵌入式开发板，采用昇腾AI技术路线，集成图形处理器，拥有8GB/16GB LPDDR4X，8/20 TOPS AI算力，为 AI 应用提供了坚实的硬件基础。本篇文章将分享使用香橙派 AIpro 和 YOLOv8 结合 USB 摄像头进行物体检测的实战经验，并探讨其在实际应用中的价值。昇腾CANN框架的优势推理速度显著提升。

深度学习论文: YOLOv10: Real-Time End-to-End Object Detection

YOLO在实时物体检测领域因计算成本与检测性能的平衡而领先。尽管研究人员在架构、优化目标和数据增强方面取得显著进展，但YOLO对NMS的依赖影响了其端到端部署和推理速度。此外，YOLO组件设计的不足导致计算冗余和性能限制。为此，YOLOv10专注于后处理和模型架构，提出了无NMS训练的一致对偶分配方法，实现高性能和低延迟。同时，YOLOv10采用效率-准确度驱动的策略，全面优化YOLO组件，降低计算成本并提高性能。

opencv进阶 ——（九）图像处理之人脸修复祛马赛克算法CodeFormer

CodeFormer是一种基于深度学习的人脸复原模型，由南洋理工大学和商汤科技联合研究中心联合开发，它能够接收模糊或马赛克图像作为输入，并生成更清晰的原始图像。

解决OpenCV读取目标图像，cv2.imshow出现闪退的问题

本文是该专栏的第17篇，后面将持续分享OpenCV计算机视觉的干货知识。最近有粉丝朋友询问到OpenCV读取目标图像出现的一个问题，在基于python语言“使用OpenCV读取目标图像的时候，利用cv2.imshow函数出现闪退”的情况。而本文，笔者将详细介绍针对上述问题，给出一个详细的应对思路以及解决方法。废话不多说，具体的细节部分以及详细的解决方案，跟着笔者直接往下看正文详细内容。

计算机视觉与模式识别实验1-2 图像的形态学操作

opencv实现图像的形态学操作

目标检测基础初步学习

在动手学习深度学习中对目标检测任务有如下的描述。图像分类任务中，我们假设图像中只有一个主要物体对象，我们只关注如何识别其类别。然而，很多时候图像里有多个我们感兴趣的目标，我们不仅想知道它们的类别，还想得到它们在图像中的具体位置。在计算机视觉里，我们将这类任务称为目标检测（object detection）或目标识别（object recognition）通过边界框给出了物体的相关位置信息我们通常使用边界框（bounding box）来描述对象的空间位置。边界框是矩形的，由矩形左上角的以及右下角的。

【OpenCV 基础知识 20】计算积分图像

WriteLn(Format(‘[i] 图像: %s’, [filename]));

opencv的findContours()函数

来自WaTab AI Pro是 OpenCV 中用于检测图像轮廓的函数。轮廓可以看作是将连续的点（沿边界）连接在一起的一条曲线，具有相同的颜色或强度。该函数常用于图像处理和计算机视觉中的对象检测和识别。下面是的详细解释及其用法。

RT-DETR：端到端的实时Transformer检测模型（目标检测+跟踪）

博主一直一来做的都是基于的目标检测领域，相较于基于卷积的目标检测方法，如YOLO等，其检测速度一直为人诟病。终于，RT-DETR横空出世，在取得高精度的同时，检测速度也大幅提升。那么RT-DETR是如何做到的呢？在研究RT-DETR的改进前，我们先来了解下DETR类目标检测方法的发展历程吧DETRNMSDAB-DETRDETR100DETRDAB-DETRH-DETR然而，上述方法尽管已经大幅提升了检测精度，降低了计算复杂度，但其受本身高计算复杂度的制约，DETR。

opencv——cmake编译参数解释

【代码】opencv——cmake编译参数解释。

用 OpenCV 实现图像中水平线检测与校正

图像加载与预处理：加载图像，转换为灰度图，然后使用 Canny 算法检测边缘。线条检测：应用霍夫变换来识别图像中的线条。水平线条筛选：过滤出接近水平的线条。线条可视化：在图像上绘制检测到的水平线。计算需要的旋转角度：计算线条的加权平均角度，以确定图像应旋转的角度。图像旋转校正：根据计算出的角度旋转图像，以校正线条至水平。

【pip安装】YOLOv8目标检测初步上手

Ultralytics YOLOv8 是一个尖端的、最先进的（SOTA）模型，它建立在以前 YOLO 版本的成功基础之上，并引入了新功能和改进，以进一步提高性能和灵活性。YOLOv8 旨在快速、准确且易于使用，使其成为广泛的对象检测和跟踪实例分割图像分类和姿态估计任务的极佳选择。

opencv实现图片的膨胀腐蚀

在OpenCV中，膨胀和腐蚀是两种基本的图像处理操作，通常用于二值图像中以提取特定的特征。它们是基于图像的形态学操作，使用一个称为结构元素或核的模板来改变图像的形状。cv2.erode函数则用于进行腐蚀操作，同样通过迭代次数参数来指定腐蚀的次数。然后我们定义了一个5x5的结构元素（核），这是一个常用的选择，实际上可以根据需要选择任何大小的核。膨胀后的图像将使图像中的白色区域（前景）扩张，而腐蚀后的图像将使图像中的白色区域缩小。最后，我们将膨胀和腐蚀后的图像保存到文件中。

使用opencv 进行车牌位置检测的源代码

函数的流程是：读取图像 -> 缩放 -> 灰度化 -> 去噪 -> 边缘检测 -> 形态学操作 -> 轮廓检测 -> 筛选可能的车牌轮廓 -> 矫正车牌图像 -> 颜色定位 -> 返回结果。这个过程为车牌识别算法提供了预处理后的图像和颜色信息，以便于更准确地识别车牌。

[数据集][目标检测]轮胎检测数据集VOC+YOLO格式439张1类别

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理标注。图片数量(jpg文件个数)：439。标注数量(xml文件个数)：439。标注数量(txt文件个数)：439。标注类别名称:["tire"]使用标注工具：labelImg。tire 框数 = 1008。标注规则：对类别进行画矩形框。

视觉检测实战项目——九点标定

整个步骤：先识别圆，提取圆心坐标；然后根据对应的机械坐标计算转换矩阵；最后读取测试图片，提取圆心坐标，转换到机械坐标，计算圆心距。已知 9 个点的图像坐标和对应的机械坐标，直接计算转换矩阵，核心原理即最小二乘拟合。假定图像坐标、机械坐标如下，Matlab 测试一下。校正图，圆直径 1.5cm，圆心距 2cm。准备两张图，一张用来校正，一张用来测试。测试图，圆直径 2cm，圆心距 3cm。结果如下，识别的圆心坐标会有一定误差。图像坐标系和机械坐标定义如下。

AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.05.01-2024.05.10

医学图像识别任务因存在多种不同的病理指征而明显复杂化，这给未见标签的多标签分类带来了独特的挑战。这种复杂性凸显了对采用多标签零点学习的计算机辅助诊断方法的需求。预训练视觉语言模型（VLMs）的最新进展展示了医疗图像零镜头分类的显著能力。然而，这些方法在利用来自更广泛图像数据集的大量预训练知识方面存在局限性，而且通常依赖于放射科专家的手动提示构建。通过自动调整提示过程，提示学习技术已成为使 VLM 适应下游任务的有效方法。