【Python高级编程】pickle`文件处理:序列化与反序列化 2024-06-17 python, 计算机视觉, 人工智能, opencv, 开发语言 104人 已看 以上示例展示了如何使用pickle保存和加载数据。保存数据到pickle文件打开一个文件以二进制写模式。使用函数将数据保存到文件中。从pickle文件加载数据打开一个文件以二进制读模式。使用函数从文件中加载数据。这可以应用于各种数据类型,包括字典、列表以及处理后的视频帧数据等。通过这种方式,数据的持久化和后续处理变得非常方便。
【笔记】打卡01 | 初学入门 2024-06-20 笔记, 机器学习, 计算机视觉, 深度学习, 人工智能 78人 已看 MindSpore Data(数据处理层)ModelZoo(模型库)MindSpore Science(科学计算),包含了业界领先的数据集、基础模型、预置高精度模型和前后处理工具MindSpore Insight(可视化调试调优工具),能够可视化地查看训练过程、优化模型性能、调试精度问题、解释推理结果。
OpenCV特征匹配 2024-06-13 计算机视觉, 人工智能, opencv 74人 已看 OpenCV BFMatcher匹配器基本使用方法,包括match方法与knnMatch方法的基本使用方法
图像的高频和低频细节 2024-06-19 计算机视觉, 人工智能 193人 已看 在图像处理和计算机视觉中,"高频"和"低频"是用来描述图像中不同类型细节的术语。这些术语源自信号处理领域,其中频率的概念用于描述信号随时间变化的,但在图像处理中,它们被用来描述图像随空间变化的,即图像中像素值的变化率。
[C#] opencvsharp对Mat数据进行序列化或者反序列化以及格式化输出 2024-06-18 c#, 计算机视觉, 人工智能, opencv, 开发语言 86人 已看 【简要介绍】在OpenCVSharp中,类用于将数据(包括OpenCV的Mat类型数据)序列化为XML或YAML格式的文件,以及从这些文件中反序列化数据。以下是关于。
目标检测—Fast RCNN 2024-06-18 计算机视觉, 目标检测, 人工智能 68人 已看 R-CNN是Ross Girshick大神的一大杰作,14年发表在CVPR上,目前已有超过2万的引用量,在目标检测领域有着里程碑式的意义。
OpenCV 4.10 发布 2024-06-08 计算机视觉, 人工智能, opencv 88人 已看 JPEG 解码速度提升 77%,实验性支持 Wayland、Win ARM64根据 “OpenCV 中国团队” 介绍,从 4.10 开始 OpenCV 对 JPEG 图像的读取和解码有了 77% 的速度提升,超过了 scikit-image、imageio、pillow。
【机器学习】生成对抗网络 (Generative Adversarial Networks | GAN) 2024-06-11 生成对抗网络, 机器学习, 计算机视觉, 深度学习, 人工智能 54人 已看 生成对抗网络 (Generative Adversarial Networks,简称GAN) 是一种强大的深度学习模型,用于生成具有逼真感的图像、音频和文本等内容。GAN 的核心理念是通过训练两个神经网络,生成器 (Generator) 和判别器 (Discriminator),它们相互对抗、相互学习,以提高生成器生成数据的质量。本文将介绍GAN的基本原理、工作流程以及应用场景,旨在为新手小白提供一个简单易懂的入门指南。
OpenCV学习(4.9) OpenCV中的轮廓 2024-06-10 计算机视觉, 人工智能, opencv 77人 已看 通常我们使用函数来检测图像中的对象,对吗?有时对象位于不同的位置。但是在某些情况下,某些形状位于其他形状内。就像嵌套的数字一样。在这种情况下,我们将外部的一个称为父级,将内部的一个称为子级。这样,图像中的轮廓彼此之间就具有某种关系。并且我们可以指定一个轮廓如何相互连接,例如是其他轮廓的子轮廓,还是父轮廓等。这种关系的表示称为层次结构。
多模态LLM 跨越语言与视觉的边界 2024-06-17 算法, 机器学习, 计算机视觉, 深度学习, 人工智能 77人 已看 在数字时代的浪潮中,我们被由语言和视觉等多种模态构成的信息海洋所包围。人类大脑以其卓越的多模态上下文理解能力,在日常任务中游刃有余。然而,在人工智能领域,如何将这种能力赋予机器,尤其是如何在语言模型的成功基础上扩展到视觉领域,成为了当前研究的热点和难点。
大模型基础——从零实现一个Transformer(3) 2024-06-12 python, 计算机视觉, 深度学习, pytorch, 人工智能 52人 已看 之前两篇文章已经讲了Transformer的Embedding,Tokenizer,Attention,Position Encoding,本文我们继续了解Transformer中剩下的其他组件.
探索AI视频生成技术的原理 2024-06-13 机器学习, 计算机视觉, 音视频, 深度学习, 人工智能 77人 已看 AI视频生成技术利用人工智能算法,自动生成视频内容。这些算法通过学习大量的视频数据,能够理解和模拟视频中的视觉和声音元素,从而生成高度逼真的视频内容。AI视频生成技术的核心包括生成对抗网络(GANs)、自回归模型和变分自编码器(VAEs)等。AI视频生成技术正在改变我们制作和消费视频内容的方式。通过深入理解其原理,并不断探索其应用,我们可以更好地利用这一技术,创造出更加丰富和多样的内容。希望这篇文章能为你提供一些启发和帮助,助你在AI视频生成领域取得更多的突破。
C# OpenCvSharp 代数运算-add、scaleAdd、addWeighted、subtract、absdiff、multiply、divide 2024-06-15 c#, 计算机视觉, 人工智能, ide, opencv, 开发语言 56人 已看 1.add-将两幅图像进行相加,可以达到图像融合的目的。2.scaleAdd-将两幅图像进行相加,第一幅图像乘上比例因子加上第二幅图像。3.addWeighted-将两幅图像进行相加,每幅图像可以设置自己的权重。4.subtract-将两幅图像进行相减,可以得到图像差分结果,凸显某些细节特征。5.absdiff-将两幅图像进行相减并取绝对值,可以得到图像差分结果,凸显某些细节特征。6.multiply-将两幅图像进行相乘运算。7.divide-将两幅图像进行相除运算。
使用Stream实现Web应用,使用YOLOv8模型对图像进行目标检测为例。 2024-06-12 yolo, 计算机视觉, 目标检测, 人工智能 66人 已看 Streamlit是一个开源的Python框架,专门设计用于快速构建和共享数据应用程序。它使数据科学家和机器学习工程师能够通过编写简单的Python脚本,轻松创建美观、功能强大的Web应用程序,而无需具备前端开发的经验。其他框架或web应用可以看下面两篇博客介绍1.2.
计算机视觉(CV)技术的优势和挑战 2024-06-12 计算机视觉, 人工智能 43人 已看 解释鲁棒性(Robustness)是指系统或算法在面对不可预见的变化或干扰时,仍能保持其功能和性能的能力。在计算机科学和工程领域,鲁棒性是评估一个系统或算法在实际应用中能否应对各种不确定性和不理想条件的重要指标。