个人技术分享

虚拟现实（VR）技术在AI去衣应用中的创新作用

特别是AI去衣技术，这一领域虽然充满争议，但不可否认的是，其背后的算法和技术对于图像识别、编辑以及合成等方面具有重要的研究价值。在这篇技术博客中，我们将深入探讨VR在AI去衣中所扮演的角色，及其带来的技术挑战和未来可能的发展方向。虚拟现实（VR）技术在AI去衣应用中提供了新的可能性，不仅增强了用户的交互体验，还为数据训练和模型优化提供了新的途径。将VR技术与AR结合，可以在现实世界中叠加虚拟信息，比如在试衣应用中利用AI去衣技术展示穿着不同服装的虚拟形象，从而提供一种新的购物体验。一、AI去衣技术简介。

[数据集][目标检测]抽烟喝酒检测数据集VOC+YOLO格式1026张2类别

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理标注。标注类别名称:[“drinking”,“smoking”]图片数量(jpg文件个数)：1026。标注数量(xml文件个数)：1026。标注数量(txt文件个数)：1026。使用标注工具：labelImg。标注规则：对类别进行画矩形框。

黑猩猩算法改进的深度极限学习机DELM的回归预测

与传统深度学习算法相同，DELM 也是用逐层贪婪的训练方法来训练网络，DELM每个隐藏层的输入权重都使用ELM-AE初始化，执行分层无监督训练，但是与传统深度学习算法不同的是DELM不需要反向微调过程。由上述原理可知原始DELM中的，权重采用随机初始化的方式进行初始化，而初始权重对于整个模型的预测结果影响比较大，于是采用黑猩猩算法对DELM的初始权重进行优化。综上，ELM-AE是一个通用的逼近器，特点就是使网络的输出与输入相同，而且隐藏层的输入参数。这里DELM采用2层结构，每层的节点数分别为2，3。

SB2B2C商城系统如何挑选？开发语言、功能模块、商城优势分析

为满足不断增长的市场需求，SB2B2C商城模式应运而生，以此将供应商、企业客户、消费者紧紧连接在一个平台上，从而为各方提供便利和增加商业价值。上述开发语言拥有各自的特性，考虑到商城软件的特殊性，所以现在90%企业都是采用java语言来搭建商城平台，因为java语言的安全、稳定性方面非常突出，在一定程度上更适合企业应用到电商项目上来。一种动态脚本语言，具有丰富的语法特性和灵活的语言结构，因为php语言简单易学，许多人在网上通过下载教程进行学习，这也造成函数命名不规范等问题。

安全+大模型应用系列之RSAC的Dropzone AI的分析

从Dropzone AI广泛的认可度来看，国外对该思路的认可度较好，前期在国内项目验证的时候客户也非常感兴趣。但是目前国内的安全产品、安全平台较为封闭、无法像国外产品能够广泛直接对接、或许是当前制约国内的安全GPT广泛推广的一个阻碍；安全+大模型的产品的逐渐按照多能力的安全专家(全能)的能力和价值去规划、应该是一个受客户认可的正确方向。

基于threejs开发自动驾驶模拟系统视图计算

在工作中，经常会遇到车辆视角问题，比如正视角，侧视角，后世界等等，这样来回切换，让展示的效果更炫酷一些。从事自动驾驶开发也有几年了，一直在做基于webgl+three三维引擎开发。通过数学计算和three相关的接口结合，计算相关的角度问题。

Rust：编写 CUDA 程序的示例

请注意，这个示例代码是一个简化的例子，用于演示 Rust 中 CUDA 编程的基本概念。在实际应用中，你可能需要处理更复杂的场景和错误处理逻辑。核函数的 CUDA 模块，并设置核函数的参数。最后，我们执行核函数，将结果从设备复制回主机，并验证结果的正确性。函数中，我们首先初始化 CUDA 运行时，然后分配设备内存，并将数据从主机复制到设备。以下是一个简单的 Rust CUDA 源代码例子，它展示了如何在 Rust 中调用 CUDA 核函数。应该是一个包含编译后的 CUDA 核函数的 PTX 文件。

基于threejs开发自动驾驶模拟系统视图计算

在工作中，经常会遇到车辆视角问题，比如正视角，侧视角，后世界等等，这样来回切换，让展示的效果更炫酷一些。从事自动驾驶开发也有几年了，一直在做基于webgl+three三维引擎开发。通过数学计算和three相关的接口结合，计算相关的角度问题。

Stable Diffusion 3 发布吹爆｜更好的细节、多元素控图、生成文字

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

百度智能云参与信通院多项边缘计算标准编制，「大模型时代下云边端协同 AI 发展研讨会」成功召开

大模型开启了 AI 原生时代，云边端协同 AI 构建了「集中式大规模训练」、「边缘分布式协同推理」新范式，有效降低推理时延和成本，提升数据安全和隐私性，也逐渐成为云边端协同发展新方向。近期，中国信通院联合业界制定、发布了边缘 AI 等系列标准化成果：Q/KXYTEI-EAIP-2024《边缘 AI 计算平台能力要求》Q/KXYTEI-EAIH-2024《边缘 AI 智算一体机能力要求》Q/KXY TEI-EAIB-2024《边缘 AI 计算设备技术能力要求》

FLAML：智能自适应AI的引擎

大家好，尽管创建机器学习模型相对容易，但实现高准确率却是每个数据科学家梦寐以求的目标。常常我们会不断进行参数调整、尝试不同的算法，以及应用各种优化技术来提升模型的性能，但这些过程耗费了大量时间和精力。2019年学术界和业界逐步实现了AutoML（自动机器学习）框架，可以帮助自动化这些繁琐的过程，在这些AutoML框架中，FLAML备受推崇。FLAML不仅能够简化参数调整、算法选择和优化技术的应用，同时还能够显著减少时间消耗，并提供高准确率的机器学习模型。

【保姆级】基于matlab自动识别车辆号牌设计与实现

在当今世界，出于多种原因，我们需要识别各种车辆的号牌。例如，不必在停车场入口处设置警卫，而是可以在出入口放置摄像头，以便摄像头扫描车辆号码，从而自动计算应支付的停车时间。然后，我使用了‘regionprops’函数，该函数返回每个边界框的‘boundingboxes’向量，配置如下：每个边界框的[left top horizontal vertical]。该系统的目标是提供一个高效、可定制的车牌识别算法，能够在不同条件下准确识别车牌，并通过提供的性能分析帮助用户理解算法的局限性和潜在改进方向。

SB2B2C商城系统如何挑选？开发语言、功能模块、商城优势分析

为满足不断增长的市场需求，SB2B2C商城模式应运而生，以此将供应商、企业客户、消费者紧紧连接在一个平台上，从而为各方提供便利和增加商业价值。上述开发语言拥有各自的特性，考虑到商城软件的特殊性，所以现在90%企业都是采用java语言来搭建商城平台，因为java语言的安全、稳定性方面非常突出，在一定程度上更适合企业应用到电商项目上来。一种动态脚本语言，具有丰富的语法特性和灵活的语言结构，因为php语言简单易学，许多人在网上通过下载教程进行学习，这也造成函数命名不规范等问题。

【长春理工大学主办 | EI检索稳定 | SPIE独立出版】第五届计算机视觉和数据挖掘国际学术会议（ICCVDM 2024）

此前，ICCVDM系列会议于2020年在中国西安、2021年在中国长沙（线上）、2022年在中国呼伦贝尔（线上+线下）、2023年在中国长春（线上+线下）皆已成功举办。ICCVDM为世界各地该领域的专家、学者、研究人员及相关从业人员提供一个共享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和探讨，促进学术成果产业化合作的平台。大会诚邀国内外高校、科研机构专家、学者，企业界人士及其他相关人员参会交流。

cv2 复制视频踩坑

总结，复制视频时需要获取宽高，自己设置的会导致视频复制不了。通过视频获取的视频的宽高，可以正常复制。自己设置的高度，不能正常复制。

【Python】理解分类变量和连续变量

凡是血肉的东西都难与灵魂一样高扬。在数据分析和建模过程中，变量可以分为不同的类型，其中最常见的两种类型是分类变量和连续变量。理解这两种变量类型及其处理方法对于数据分析和建模的成功至关重要。本文将介绍分类变量和连续变量的概念，并通过实例说明如何处理和分析这些变量。

加载完整pytorch .pt模型可能出现的问题

现在我们兴致勃勃的昭告天下，我们产生了最牛逼的模型，然后想要在别的地方使用它。在加载完整模型的时候，很可能出错，特别是当我们对模型里面数据流经的途径进行了更改的时候。如果我们不对Net（）进行更改，那么没问题，但是当我们更改了Net()的数据流时，就很有可能发生问题。我们在保留训练好的模型model时，可以保留model的参数，也可以直接将完整model全部保留下来。那么现在再load .pth使用时就会出问题，所以要注意，一定要保证数据流的形式没问题，要不然直接加载使用也会出问题。

Hello GPT-4o

这款模型支持多种输入（文本、音频、图像）和输出（文本、音频、图像）模式，其响应音频的速度极快，最快可达 232 毫秒，平均响应时间为 320 毫秒，与人类在对话中的反应速度相当。无论是处理英语文本还是代码，GPT-4o 的表现堪比 GPT-4 Turbo，而在处理非英语文本方面则有了显著提升，同时运行速度更快，API 成本也减少了 50%。根据传统的基准测试，GPT-4o 在文本处理、逻辑推理和编程能力方面与 GPT-4 Turbo 相当，而在多语言处理、音频和视觉技术方面则设立了新的最高标准。

scikit-learn机器学习要点总结

2024-05-20
python, 机器学习, scikit-learn, 人工智能, sklearn
190人已看

《数据采集与分析》课程sklearn机器学习部分重要知识点，复习总结sklearn库的相关内容。

Hello GPT-4o

这款模型支持多种输入（文本、音频、图像）和输出（文本、音频、图像）模式，其响应音频的速度极快，最快可达 232 毫秒，平均响应时间为 320 毫秒，与人类在对话中的反应速度相当。无论是处理英语文本还是代码，GPT-4o 的表现堪比 GPT-4 Turbo，而在处理非英语文本方面则有了显著提升，同时运行速度更快，API 成本也减少了 50%。根据传统的基准测试，GPT-4o 在文本处理、逻辑推理和编程能力方面与 GPT-4 Turbo 相当，而在多语言处理、音频和视觉技术方面则设立了新的最高标准。