个人技术分享

【猫狗识别系统】图像识别Python+TensorFlow+卷积神经网络算法+人工智能深度学习

本研究中，我们开发了一个基于深度学习的猫狗识别系统，使用了TensorFlow框架下的MobileNetV2轻量级卷积神经网络模型。MobileNetV2模型以其高效的结构和较低的计算成本而闻名，非常适合在移动和嵌入式设备上使用。通过对数千张标记好的猫狗图片进行训练，最终生成了一个准确率较高的模型文件（H5格式），可以有效地区分猫和狗的图像。此外，为了提高用户体验和系统的实用性，我们使用Django框架搭建了一个简洁的Web应用界面。该界面允许用户上传图片，并即时显示模型的识别结果。

chap5 CNN

利用卷积神经网络，实现对MNIST数据集的分类问题。

自动驾驶仿真（高速道路）LaneKeeping

自动驾驶和战术决策任务环境的集合开发和维护.环境公路在这项任务中，自我车辆在充满其他车辆的多车道高速公路上行驶。智能体的目标是达到高速，同时避免与相邻车辆发生碰撞。在道路右侧行驶也会触发。此外，还提供更快的变体，其模拟精度降低，可提高大规模训练的速度。合并在这项任务中，自我车辆在主干道上起步，但很快接近入口匝道上驶入车辆的路口。代理商现在的目标是保持高速，同时为车辆腾出空间，以便它们可以安全地并入交通。环形交叉在这项任务中，自我车辆如果接近交通畅通的环形交叉路口。

基于深度学习的CT影像肺癌检测识别

本文介绍了一种基于深度学习的CT影像肺癌检测识别系统。该系统使用TensorFlow和Keras深度学习框架，通过迁移学习技术，以EfficientNetB3为基础模型，构建了一个卷积神经网络。通过对数据集进行扩充，利用扩充后的数据集进行模型训练，并进行模型性能评估，并利用 Flask + Bootrap + Ajax 搭建交互式分析框架，实现脑部 MRI 扫描影像上传和在线预测，模型给出是否包含脑部肿瘤及肿瘤类型，整体准确率达到90.27%。

深度学习的模型剪枝

模型剪枝是深度学习中一种重要的优化技术，通过移除冗余参数和连接，减少模型复杂度，提升计算和存储效率。剪枝方法包括权重剪枝、神经元剪枝、卷积核剪枝和通道剪枝等。尽管剪枝带来了减少计算成本、降低存储需求和提升能效等优势，但也面临性能恢复、剪枝策略选择、稀疏矩阵计算和普适性等挑战。模型剪枝在计算机视觉、自然语言处理、语音识别、自动驾驶和物联网等领域展现了广泛的应用前景。

Keras深度学习框架实战（5）：KerasNLP使用GPT2进行文本生成

本文是一个关于如何使用KerasNLP库加载、微调GPT-2模型并进行文本生成的教程。它先指导用户设置Colab的GPU加速环境，然后介绍KerasNLP库，包括其预训练模型和模块化构建块。教程展示如何加载GPT-2模型，并基于用户输入生成文本。还包括了一个使用Reddit数据集微调模型的示例，以及探讨了Top-K、Beam等采样方法，并演示了在中文诗歌数据集上微调模型。通过这些步骤和代码示例，用户可以学习如何使用KerasNLP和GPT-2模型完成多种文本生成任务。

如何评价GPT-4o?

最近，GPT-4o横空出世，引发了AI界的轩然大波。作为OpenAI最新推出的语言模型，GPT-4o简直就是AI界的“爱马仕”。那么，GPT-4o到底有多牛？让我们从版本对比、技术能力和个人感受三个方面来聊聊它的厉害之处。总体而言，GPT-4o在各个方面都表现得“技惊四座”。作为一款先进的AI语言模型，它不仅提升了用户体验，还大大提高了生产力。无论是技术能力还是使用体验，GPT-4o都无愧于其“新一代AI天花板”的称号。期待未来GPT系列继续“乘风破浪”，为我们的生活和工作带来更多便利和惊喜。

Attention as an RNN

论文地址：https://arxiv.org/pdf/2405.13956是有附录的论文。

Attention as an RNN

论文地址：https://arxiv.org/pdf/2405.13956是有附录的论文。

pytorch执行报错cuda版本不匹配

安装的torch版本是cuda11.8，但是机器环境指向的是11.1版本bashrc是全局变量文件，source后会在所有的虚拟环境里面生效。export导入多个cuda文件，最后生效的是最后一次export的cuda版本。cuda11.8执行完上述命令后，脚本不再报错。

Pytorch 叶子节点和非叶子节点的理解

PS：注意这里的描述“非叶子节点的梯度会被释放掉”。这其实暗含了非叶子节点必须是要参与梯度计算的，也就是requires_grad=True，同时也意味着requires_grad=False的节点一定是叶子节点，因为这样的tensor压根不参与求导，也没梯度，自然不需要“释放掉梯度”。这就成为了判别叶子节点和非叶子节点的第一个标准，见下。叶子节点是用户创建的节点，不依赖其它节点；它们表现出来的区别在于反向传播结束之后，非叶子节点的梯度会被释放掉，只保留叶子节点的梯度，这样就节省了内存。

用大白话讲解下 CNN和卷积核( 百度 AI 回答 )

DRIVEN｜15分的CNN+LightGBM怎么做特征分类，适用于转录组

呼吸暂停和呼吸不足是常见的睡眠障碍，其特征是气道阻塞。多导睡眠图 (PSG) 是一种睡眠研究，通常用于计算呼吸暂停-呼吸不足指数 (AHI)，即一个人每小时睡眠中呼吸暂停或某些类型的呼吸不足的次数，并诊断睡眠障碍的严重程度。及早发现和治疗呼吸暂停可以显著降低发病率和死亡率。然而，长期 PSG 监测是不可行的，因为它对患者来说既昂贵又不舒服。为了解决这些问题，我们提出了一种名为DRIVEN的方法，通过可穿戴设备在家中估计 AHI，并检测整个晚上何时发生呼吸暂停、呼吸不足和清醒期。

歌声合成算法流程和基于lstm的算法实例

歌声合成（Singing Voice Synthesis, SVS）是一项复杂的任务，旨在生成具有自然音质和情感的歌声。实现这种效果的算法通常涉及多个步骤，包括音高预测、音素时长预测、声学特征生成和波形生成等。基于LSTM（Long Short-Term Memory）网络的歌声合成算法是其中一种常见的方法。

基于tensorflow的咖啡豆识别

在本次咖啡豆识别项目中，我们通过设置GPU、导入并预处理数据、构建深度学习模型，以及对模型进行训练和评估，实现了对咖啡豆图像的自动识别。整个过程涵盖了数据加载与可视化、数据集配置、模型构建与优化等关键步骤，最终显著提升了图像分类的准确性，同时也加深了我们对深度学习技术的实践理解。关于卷积的相关知识可以参考文章：https://mtyjkh.blog.csdn.net/article/details/114278995。在准备对模型进行训练之前，还需要再对其进行一些设置。方法将磁盘中的数据加载到。

深度学习PyTorch代码模板

个人用深度学习pytorch代码模板

LSTM 循环神经网络原理深度解读与网络结构精细剖析

LSTM是一种巧妙应对RNN固有挑战的架构创新，它并未直接对RNN的权重矩阵进行特征值调整以解决梯度消失/爆炸问题，而是通过引入参数化的门控单元以及细胞状态这一特殊结构，构建了一条非权重依赖的线性信息传播路径，从而绕开了传统RNN中导致长期依赖学习困难的权重参数W。

jetson nano onnxruntime 安装

但可能会出现jetpack中的cuda和cudnn的版本无法查找到对应版本的onnxruntime的问题。onnxruntime 依赖cuda、cudnn版本，可。下载相应的whl包直接安装。

【深度学习】Transformer梳理

对于transformer，网上的教程使用记号、术语不一。最关键的一点，网上各种图的简化程度不一，所以我打算自己手画一次图。**注意：**全连接层在概念上输入必须是一维向量，但是实际实现的时候我们会采用批处理将多个样本的向量组拼成矩阵，用矩阵乘法加速运算。如果用单一样本的向量来标注全文可能更清晰，但是为了更贴近实用，约定全文的输入长这个样子而不是向量：其实，输入也不是矩阵。。。输入是3维张量，三个维度分别是batch_size, number（当前用到的词数）, dimension（特征维度）

神经网络与深度学习——第14章深度强化学习

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第14章深度强化学习深度强化学习强化学习（Reinforcement Learning，RL），也叫增强学习，是指一类从与环境交互中不断学习的问题以及解决这类问题的方法，强化学习可以描述为一个智能体从与环境交互中不断学习以完成特定目标（比如取得最大奖励值）。和深度学习类似，强化学习中的关键问题也是贡献度分配问题（即一个系统中不同的组件（component）对最终输出结果的贡献或影响），每一个动作并不能直接得到监督