从数字化营销与运营视角:看流量效果的数据分析 2024-07-07 数据分析, 数据挖掘 94人 已看 基于数据打通的“全链路”营销是当下的“时髦”,应用它的前提是什么?深度营销和运营的关键数据如何获得?如何利用数据进行更精准的营销投放?如何利用数据优化投放的效果?如何促进消费者的转化,以及激活留存的客户,并不断提高他们的忠诚度?应该采用什么样的数据战略?宋星老师在《数据赋能:数字化营销与运营实战》中给出了以上问题的答案,最近正在读这本书,所以项采用框架拆解方式进行记录,一来通过梳理读书笔记倒逼自己...
机器学习——逻辑回归 2024-07-06 算法, 机器学习, 人工智能, 逻辑回归, 数据挖掘 110人 已看 逻辑回归是一个二分类算法,本文主要介绍了逻辑回归流程以及逻辑回归的损失评估,报考精确率和召回率,F1-score,ROC曲线和AUC指标,最后以癌症预测为案例并查看各种评估指标。
每天一个数据分析题(三百九十六)- 回归分析 2024-06-28 数据分析, 数据挖掘 74人 已看 内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,Spark八个方向的专项练习题库,数据分析从业者刷题必备神器!C. 可用岭回归或Lasso回归降低多重共线性对回归结果的影响。D. 存在多重共线性的变量所求参数将有可能变得不显著。如果回归分析中存在多重共线性,下列说法错误的是( )。A. 所求出的参数的含义将变得不合理。B. 不会影响模型的预测结果。
竞赛选题 python+大数据校园卡数据分析 2024-06-25 python, 数据分析, 大数据, 数据挖掘, 开发语言 88人 已看 近年来,大数据的受关注程度越来越高。如何对大数据流进行抽取转换成有用的信息并应用于各行各业变得越来越重要。如今,校园一卡通系统在高校应用十分广泛,大部分高校主要利用校园一卡通对校园中的各类消费阅、补助领取等进行统一管理。通过数据分析算法,对大学生校内消费记录进行整理、分类、预测,从而整体反应学生在校消费情况,形成量化的评判标准,同时也为今后的贫困生资助管理工作提供可靠的数据支持,辅助完成贫困生的相关工作。🧿。
每天一个数据分析题(三百八十二)- 聚类 2024-06-21 聚类, 数据分析, 机器学习, 人工智能, 数据挖掘 88人 已看 内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,Spark八个方向的专项练习题库,数据分析从业者刷题必备神器!如果不考虑外部信息,聚类结构的优良性度量应当采用。D. 离散系数。A. 中位数。B. 均方差。C. 平均数。
数据挖掘常见算法(聚类) 2024-06-24 算法, 聚类, 机器学习, 人工智能, 数据挖掘 63人 已看 K-均值算法(K-means算法)方法:首先选择K个随机的点,称为聚类中心.对于数据集中的,每一个数据,按照距离K个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类PAM(k-中心点算法算法分析:k-中心点算法消除了k-平均算法对孤立点的敏感性;比k-平均算法更健壮。算法分析:k-中心点算法消除了k-平均算法对孤立点的敏感性;比k-平均算法更健壮。
支持向量机 (SVM) 算法详解 2024-06-18 支持向量机, 算法, 机器学习, 人工智能, 数据挖掘 58人 已看 支持向量机的目标是找到一个最佳的决策边界(或称超平面)来最大限度地分隔不同类别的数据点。对于线性可分的数据,SVM 通过一个线性超平面进行分类;对于线性不可分的数据,SVM 可以通过核方法(Kernel Trick)将数据映射到高维空间,使其在高维空间中线性可分。支持向量机是一种强大的监督学习算法,适用于处理复杂的高维和非线性数据。本文详细介绍了 SVM 的原理、数学公式、应用场景以及 Python 实现。虽然 SVM 在某些方面有其局限性,但通过合理选择参数和核函数,可以在许多实际应用中取得优异的效果。
回归洛伦兹变换 2024-06-19 算法, 机器学习, 人工智能, 回归, 数据挖掘 49人 已看 因为我们已经看到,长度这个概念,在不同的条件下,对应了不同的基本物理量:在宏观低速条件下它对应的是周期的重复次数,而在微观高速的条件下对应的是频率的差异总量。代表的频差或者周期比率的意义,所以说,确实可以有光速上限,但并不影响“超光速”的实现。只是在“超光速”的前提下,这种周期和频率互为倒数的对称性不再保持。
大数据-11-案例演习-淘宝双11数据分析与预测 (期末问题) 2024-06-12 数据分析, 大数据, 数据挖掘 64人 已看 Hadoop 是一个开源的分布式计算框架,设计用于在大规模数据集上实现高效、可靠和可扩展的数据处理。HDFS是 Hadoop 项目的一个核心组件,它是一个针对大数据处理而设计的分布式文件系统。YARN 是一个通用的、可伸缩的资源管理平台,它允许在同一个集群上运行多种不同类型的应用程序。都是帮助处理和分析大规模数据集Spark Core主要提供分布式任务调度、内存计算、故障恢复等基本功能,Spark SQL主要用于处理结构化和半结构化数据,Spark Streaming主要实时对数据流进行处理。
【长春理工大学主办 | EI检索稳定 | SPIE出版 | 过往4届均检索 】第五届计算机视觉和数据挖掘国际学术会议(ICCVDM 2024) 2024-06-18 计算机视觉, 人工智能, 数据挖掘 61人 已看 此前,ICCVDM系列会议于2020年在中国西安、2021年在中国长沙(线上)、2022年在中国呼伦贝尔(线上+线下)、2023年在中国长春(线上+线下)皆已成功举办。ICCVDM为世界各地该领域的专家、学者、研究人员及相关从业人员提供一个共享科研成果和前沿技术,了解学术发展趋势,拓宽研究思路,加强学术研究和探讨,促进学术成果产业化合作的平台。大会诚邀国内外高校、科研机构专家、学者,企业界人士及其他相关人员参会交流。
逻辑回归(Logistic Regression)及其在机器学习中的应用 2024-06-21 算法, 机器学习, 人工智能, 逻辑回归, 数据挖掘 61人 已看 逻辑回归是一种广泛应用于机器学习和数据分析领域的分类算法,特别适用于二分类问题。尽管名字中包含“回归”,但逻辑回归实际上是一种分类方法,它通过对数据进行线性回归分析,并使用一个逻辑函数(通常是Sigmoid函数)将线性回归的连续输出转换为二分类问题所需的概率值。
神经网络 #数据挖掘 #Python 2024-06-20 python, 深度学习, 人工智能, 神经网络, 数据挖掘 56人 已看 神经网络是一种受生物神经元系统启发的人工计算模型,用于模仿人脑的学习和决策过程。它由大量互相连接的节点(称为神经元)组成,这些节点处理和传递信息。神经网络通常包含输入层、隐藏层(可有多个)和输出层,每个层中的神经元之间通过权重相连。
数据分析必备:一步步教你如何用matplotlib做数据可视化(10) 2024-06-23 数据分析, 信息可视化, 数据挖掘 120人 已看 箱形图也称为须状图,显示包含最小值,第一四分位数,中位数,第三四分位数和最大值的一组数据的摘要。在方块图中,绘制从第一个四分位数到第三个四分位数的方框。垂直线穿过中间的框。须状从每个四分位数到最小值或最大值。
大数据开发流程解析 2024-06-16 数据仓库, 人工智能, 数据挖掘 50人 已看 大数据开发是一个复杂且系统的过程,涉及需求分析、数据探查、指标管理、模型设计、ETL开发、数据验证、任务调度以及上线管理等多个阶段。本文将详细介绍每个阶段的内容,并提供相关示例和代码示例,帮助理解和实施大数据开发流程。本文中的示例只是一个简单的工具,实际中可能用到很复杂的工具,但核心思想不变。
大数据开发流程解析 2024-06-16 数据仓库, 人工智能, 数据挖掘 66人 已看 大数据开发是一个复杂且系统的过程,涉及需求分析、数据探查、指标管理、模型设计、ETL开发、数据验证、任务调度以及上线管理等多个阶段。本文将详细介绍每个阶段的内容,并提供相关示例和代码示例,帮助理解和实施大数据开发流程。本文中的示例只是一个简单的工具,实际中可能用到很复杂的工具,但核心思想不变。
博客摘录「 YOLOv5模型剪枝压缩」2024年5月11日 2024-06-13 算法, 机器学习, 人工智能, 剪枝, 数据挖掘 50人 已看 语义边缘检测和语义分割的关系调研结果为,语义信息可以用来增强语义分割的效果,也有一定的优点和采用理由,但此类论文的数量并不是很多,语义分割的多数方法还是使用深度学习直接做像素分类。在对比两者的性能时发现,两者的performance指标不一样,所以无法进行对比。添加L1正则来约束BN层系数。
18.9k star!一个高性能的嵌入式分析型数据库,主要用于数据分析和数据处理任务 2024-06-14 数据分析, r语言, 数据库, 数据挖掘, 开发语言 56人 已看 DuckDB是一个嵌入式的分析型数据库,它提供了高性能的数据分析和数据处理能力。DuckDB的设计目标是为数据科学家、分析师和数据工程师提供一个快速、灵活且易于使用的数据分析工具。它支持SQL查询语言,并提供了一系列高级功能,如窗口函数、时间序列分析、地理空间数据处理等。