人脸匹配——OpenCV 2024-06-13 计算机视觉, 人工智能, opencv 53人 已看 人脸匹配:导入所需的库,加载dlib的人脸识别模型和面部检测器,读取图片并转换为灰度图,比较两张人脸,选择图片并显示结果,比较图片,创建GUI界面,运行GUI主循环,运行显示,全部代码
G5 - Pix2Pix理论与实战 2024-06-07 机器学习, 计算机视觉, 深度学习, 人工智能 46人 已看 通过对Pix2Pix模型的学习,最让我印象深刻的特点是它把判别器由CGAN那种统一压缩完直接预测的逻辑转换成了分成一个Patch,这样提升了模型生成的精度。在了解了这个修改后,我对之前GAN和CGAN产生的斑点很多的生成有了更加深入的理解。应该是由于模型对特征的压缩,导致部分像素失去代表性,产生斑点。还有一个印象深刻的点是完全随机的噪声zzz。
什么是计算机视觉? 2024-06-13 计算机视觉, 人工智能 42人 已看 计算机视觉 (CV) 是人工智能 (AI) 的一个分支领域,是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。如果说人工智能赋予计算机思考的能力,那么计算机视觉就是赋予发现、观察和理解的能力。计算机视觉的工作原理与人类视觉类似,只不过人类起步更早。人类视觉系统的优势是终身可以在适当的环境下训练分辨物体、物体距离、物体动静与否以及图像是否存在问题等能力。
图像处理:Python使用OpenCV进行图像锐化 (非锐化掩模、拉普拉斯滤波器) 2024-06-12 python, 计算机视觉, 图像处理, 人工智能, opencv 76人 已看 在图像处理中,锐化操作用于增强图像的边缘和细节,使图像看起来更清晰。常见的图像锐化方法包括非锐化掩模(Unsharp Masking)和拉普拉斯滤波器(Laplacian Filter)。
sam_out 中风预测 2024-06-10 机器学习, 计算机视觉, 深度学习, 人工智能 42人 已看 保存模型参数到文件"zhong_feng_yu_ce.params"中。这段代码是一个使用GPT模型训练和测试的示例。对测试集进行预测,并输出预测结果。
《解锁创意无限:Stable Diffusion 详细教程指南》 2024-06-05 计算机视觉, stable diffusion, 深度学习, 人工智能 46人 已看 Stable Diffusion 是一款基于 Diffusion 模型的 AI 绘画工具,它能够根据文本描述或已有的图像生成逼真或富有创意的新图像。它的出现为艺术创作带来了全新的可能性,让即使没有专业绘画技能的人也能轻松实现自己的创意想象。在当今数字艺术的浪潮中,Stable Diffusion 以其强大的功能和创新性成为了众多创作者的新宠。Stable Diffusion 为我们打开了一扇通往创意世界的大门,让我们能够以前所未有的方式表达自己的艺术想法。首先,你需要找到合适的安装资源,按照步骤进行安装。
基于OpenCV+QT开发超实用的视频编辑器 2024-06-06 编辑器, 音视频, 计算机视觉, 人工智能, opencv 56人 已看 视频画面添加水印;视频画面亮度调整;视频画面对比度调整;视频画面旋转;视频画面镜像;视频尺寸调整;视频图像模糊;两路视频融合。Mat类是Opencv中储存图像的一种数据结构。Mat类可以看做是存放矩阵的容器,他包含了两部分,分别是用来存放图片信息的信息头,和一个指向图片储存矩阵的指针。信息头往往占用空间比较小,而且各个图片之间的信息头是完全独立的。而图片储存矩阵往往占用较大的空间,并且可以多个图片的矩阵指针指向同一个内存空间。下面主要减少利用Mat创建矩阵。
香橙派安装 opencv 4.9.0 2024-06-04 webpack, 计算机视觉, 前端, 人工智能, opencv 62人 已看 然后使用make -j2或者make -j4来进行编译,这个编译时间比较长,j后面的数字可以修改成4,6,8,视你的机器的处理核心数来定,越高的话越快,我是make -j2,因为香橙派Orange AI Pro 总共四个核,如果全部占满,直接会卡死。配置c++了,先在/etc/ld.so.conf.d/文件夹下新建一个opencv4.conf,里面写入/usr/local/lib。这样子就可以了,接下来使用命令安装Opencv,这样会安装Opencv以及生成的pkg-config文件。
YOLOV3总结 2024-06-07 yolo, 计算机视觉, 目标检测, 深度学习, 神经网络 71人 已看 第二个输出的26*26特征图,输出维度26*26--通过conv2d,将x由512通道数转换成256通道数--通过2倍的上采样,将13*13结构,转换26--13*13获取的感受野与中等大小目标做融合拼接。:就是通过3*3卷积核进行卷积得到2个特征图,其中第二个特征图由第一个特征图的3*3卷积区域所决定,这个时候可以说,第二个特征图的(一个函数网格)这个未知的感受野就是第一个特征图中的3*3卷积的区域。特征提取--->使用2个concat--->融入特征信息更加丰富,融入多持续特征图信息来预测。
【Node.js快速部署opencv项目】图像分类与目标检测 2024-06-09 node.js, 计算机视觉, 目标检测, 人工智能 56人 已看 在现代Web开发中,JavaScript通过Node.js得以进入后端编程领域,带来了许多前所未有的开发便利。opencv4nodejs 是一个将OpenCV的强大功能直接绑定到Node.js的库,它允许开发者在一个统一的JavaScript环境中实现复杂的图像和视频分析任务。
【YOLOV8】2.目标检测-训练自己的数据集 2024-06-06 yolo, 计算机视觉, 目标检测, 人工智能 63人 已看 Yolo8出来一段时间了,包含了目标检测、实例分割、人体姿态预测、旋转目标检测、图像分类等功能,所以想花点时间总结记录一下这几个功能的使用方法和自定义数据集需要注意的一些问题,本篇是第二篇,目标检测功能,自定义数据集的训练。YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于 2015 年推出,因其高速度和高精确度而迅速受到欢迎。
基于Gabor小波特征提取和PSO-SVM的胃溃疡分类(MATLAB R2018a) 2024-06-09 matlab, 计算机视觉, 图像处理, 人工智能, 分类 60人 已看 研究者们常常把各种各样的图像当做是二维的离散序列,正因为如此,在研究中常用二维的Gabor函数所形成的二维的Gabor滤波器来进行图像的纹理特征提取。另外还有一个特别重要的原因就是Gabor函数与人类还有其他的哺乳动物的视觉表皮皮层细胞的感受视野相似,再加上非常好的空间局部特性和方向选择特性,可以捕捉到纹理图像在不同的频率不同的方向上的边缘和局部特性。鉴于此,采用Gabor小波特征提取和PSO-SVM方法对胃溃疡进行分类,运行环境为MATLAB R2018a。
OpenCV图像裁剪:使用&运算符在OpenCV图像裁剪时进行边界检查 2024-06-04 计算机视觉, 人工智能, opencv 46人 已看 一般来讲,冗长的代码不易于维护,可读性不会太强。另外以上面这段实现为例,由于反复使用同一变量,仅仅为了对其不同的成员做类似的操作,非常容易导致低级错误。属于位运算,是按位与的功能。cv::Rect类型重载了它,可以想象它的功能就是取矩形的相交区域。所以要对图像ROI的cv::Rect进行边界限制,那么将ROI和表示图像区域的Bounding Box求相交区域即可。如果roi的坐标超出了图像的合法区域,会引发运行时错误,导致程序崩溃。这样写代码,看上去不太直观,而且有些冗长,更谈不上优雅或者可读性。
每天五分钟计算机视觉:基于KNN算法完成图片分类任务 2024-06-04 计算机视觉, 人工智能 19人 已看 KNN算法是一种基于实例的学习,或者说是局部逼近和将所有计算推迟到分类之后进行的惰性学习。它的工作原理是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。在KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。对于图片分类任务,我们可以将每张图片看作是一个高维空间中的点,这个点由图片的像素值或其他特征向量表示。
opencv 并行加速 2024-06-04 计算机视觉, 人工智能, opencv 34人 已看 parallel_for_ 对应的循环函数会被重复执行,因此对变量的赋值声明操作也会被重复执行,需注意。多重循环体的并行加速。