809669515

自组织映射

自组织映射(SOM)用于高维数据集的可视化和分析。SOM有助于将高维数据集呈现为较低维度的数据集,通常是1-D,2-D和3-D。它是一种无监督的学习算法,并且不需要目标向量,因为它学会了在没有监督的情况下对数据进行分类。SOM由输入数据所呈现的节点或单元的网格形成。每个节点都连接到输入,节点之间没有连接。SOM是一种拓扑保留技术,可以将邻域关系保留在其映射表示中。 算法1-使用0到1之间的

0.0000 0 2
  • 关注作者
  • 收藏
809669515

K-Means聚类

K-Means聚类旨在将n个对象划分为k个聚类,其中每个对象属于具有最近均值的聚类。该方法产生恰好具有最大可能区别的k个不同簇。导致最大间隔(距离)的最佳簇数k不是先验的,必须根据数据计算。K-Means聚类的目标是最小化总簇内方差,或平方误差函数: a算法将数据聚集到k个 组中,其中k 是预定义的。 随机选择k 点作为聚类中心。根据欧几里德距离函数将对象分配到其最近的聚类中心 。

0.0000 0 3
  • 关注作者
  • 收藏
809669515

K-Means聚类

K-Means聚类旨在将n个 对象划分为k个聚类,其中每个对象属于具有最近均值的聚类。该方法产生恰好 具有最大可能区别的k个不同簇。导致最大间隔(距离)的最佳簇 数k 不是先验的,必须根据数据计算。K-Means聚类的目标是最小化总簇内方差,或平方误差函数: 算法将数据聚集到k个 组中,其中k 是预定义的。 随机选择k 点作为聚类中心。根据欧几里德距离函数将对象

0.0000 0 4
  • 关注作者
  • 收藏
809669515

模糊C均值聚类

算法模糊c均值(FCM)是一种聚类方法,它允许一个数据属于两个或多个聚类。这种方法(由Dunn于1973年开发,1981年由Bezdek改进)经常用于模式识别。它基于以下目标函数的最小化:a     ,     a其中m 是大于1的任何实数,u ij是聚类j中x i的隶属度,x i 是d维测量数据的第i个,c j是聚类的d维中心,和|| * || 是表示任何测量数据与中心之间相似性的

6.8974 1 4
  • 关注作者
  • 收藏
809669515

双变量分析

堆积柱形图堆积柱形图是一个有用的图形,用于可视化两个分类变量之间的关系。它比较了来自一个变量的每个类别对第二个变量的类别的总和所占的百分比。 a组合图组合图表使用两种或更多图表类型来强调图表包含不同类型的信息。在这里,我们使用条形图显示一个分类变量的分布和折线图,以显示第二个分类变量中所选类别的百分比。组合图是最好的可视化方法,用于演示预测器(X轴)对目标(Y轴)的可预测性。 a

6.8974 1 5
  • 关注作者
  • 收藏
809669515

什么是分箱?

分箱或离散化是将数值变量转换为分类对应物的过程。例如,将Age的值分为20-39,40-59和60-79等类别。数值变量通常在基于频率表(例如,决策树)的建模方法中离散化。此外,分箱可以通过降低噪声或非线性来提高预测模型的准确度。最后,分箱可以轻松识别异常值,数值变量的无效值和缺失值。a有两种类型的分箱,无监督和监督。

6.8974 1 2
  • 关注作者
  • 收藏
809669515

处理缺失值的策略

缺少值是常见的,您需要有一个策略来处理它们。缺失值可以表示数据中的许多不同内容。也许数据不可用或不适用或事件未发生。可能是输入数据的人不知道正确的值,或者错过填写。数据挖掘方法在处理缺失值的方式上有所不同。通常,它们会忽略缺失值,或者排除包含缺失值的任何记录,或者使用均值替换缺失值,或者从现有值中推断缺失值。a缺少值替换策略:忽略缺少值的记录。用全局常量替换它们(例如,“?”)。根据

0.0000 0 2
  • 关注作者
  • 收藏
809669515

如何处理决策树的过度拟合问题?

对于决策树模型和许多其他预测模型,过度拟合是一个重要的实际难题。当学习算法继续开发以增加测试集错误为代价来减少训练集错误的假设时,发生过度拟合。有几种方法可以避免在构建决策树时过度拟合。 在完全对训练集进行分类之前,预先修剪停止生长树。后修剪,允许树完美地对训练集进行分类,然后修剪树。 实际上,后修剪过度拟合树的第二种方法更成功,因为不容易精确估计何时停止生长树。 树修剪的重要步骤是使用以

6.8974 1 3
  • 关注作者
  • 收藏
啊啊啊啊啊吖

AUC计算--基于R

除了Logistic回归能够计算预测值与真实值的综合一致程度,也即AUC外,生存分析同样能计算AUC。但生存分析假设不同,生存函数的构建也就不尽相同。因而,不同方法计算得到的生存资料的AUC也不尽相同。同时,生存函数ROC曲线的绘制也更加复杂。下面提供几种常用的基于R计算生存资料AUC的方法,并提供两种时间依赖的生存函数的AUC计算示例。但目前来说,还没有方法可以直接比较两个生存函数的AUC是否

0.0000 0 2
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R实现生存分析

R进行生存资料分析的相对优势体现在:1、能够更加方便快捷绘制Kaplan-Meier曲线,2、能够相对更加美观地绘制Kaplan-Meier曲线3、相对容易给出中位生存时间及其置信区间4、检测比例风险假设的方法更加灵活且完善5、易于构建时间依赖模型library(stats)library(survival)## Information of datadata(p

138.1834 2 5
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(6)

0.0000 0 3
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(5)

0.0000 0 2
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(4)

12 矩阵QR分解A为m×n矩阵可以进行QR分解,A=QR,其中:Q'Q=I,在R中可以用函数qr()进行QR分解,例如:> A=matrix(1:16,4,4)> qr(A)$qr[,1] [,2] [,3] [,4][1,] -5.4772256 -12.7801930 -2.008316e+01 -2.738613e+01[2,] 0.3651484 -3.2659863 -

0.0000 0 1
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(3)

9矩阵的特征值与特征向量矩阵 A 的谱分解为 A=UΛU',其中 Λ 是由 A 的特征值组成的对角矩阵,U 的列为 A 的特征值对应的特征向量,在 R 中可以用函数 eigen()函数得到 U 和 Λ,> args(eigen)function (x, symmetric, only.values = FALSE, EISPACK = FALSE)其中:x 为矩阵,symmetric 项

0.0000 0 5
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(2)

5数与矩阵相乘A 为 m×n 矩阵,c>0,在 R 中求 cA 可用符号:“*”,例如:> c=2> c*A[,1] [,2] [,3] [,4][1,] 2 8 14 20[2,] 4 10 16 22[3,] 6 12 18 246 矩阵相乘A 为 m×n 矩阵,B 为 n×k 矩阵,在 R 中求 AB 可用符号:“%*%”,例如:> A=matrix(1:12,nrow=

0.0000 0 2
  • 关注作者
  • 收藏
啊啊啊啊啊吖

用R进行矩阵运算(1)

最近整理了一份R中矩阵运算的笔记:创建一个向量在 R 中可以用函数 c()来创建一个向量,例如:> x=c(1,2,3,4)> x[1] 1 2 3 42 创建一个矩阵在 R 中可以用函数 matrix()来创建一个矩阵,应用该函数时需要输入必要的参数值。> args(matrix)function (data = NA, nrow = 1, ncol = 1, byrow =

0.0000 0 3
  • 关注作者
  • 收藏
啊啊啊啊啊吖

关于white异方差检验的问题

看econometrics in R里面异方差检验用的就是bptest()那么white异方差检验有啥函数没啊?当然有!bptest() 也可以检验white test的,Applied Econometrics with R  这本书里面提到的就是用bptest(fit, ~x1 x2 I(x1*x1) I(x2*x2) I(x1*x2))bptest是white test的一个一次

6.8974 1 1
  • 关注作者
  • 收藏
啊啊啊啊啊吖

【新手向】安装rstudio的问题

安装一个包,就一直下载相关包,停不下来a如果是安装 tidyverse,屏幕一直下载相关包是正常的,不必担心耐心等待安装完成就行,因为 tidyverse 的依赖包比较多,耗时长。如果包下载的网络不好,想要更换镜像安装,可以选择清华大学的镜像install.packages('tidyverse', repos="http://mirrors.tuna.tsinghua.edu.cn/

0.0000 0 1
  • 关注作者
  • 收藏
291294878

Office2016的安装进度在 90% 时挂起解决

你正在尝试安装 Office 365、Office 2016 或 Office 2013,安装在完成标记大约为 90% 时,变为无响应(挂起或冻结)。如果 Windows Installer 繁忙,则可能会发生此问题。 如果 Windows 更新正在使用 Windows Installer,则 Office 安装必须等到使用 Windows Installer 完成更新进程。此外,如果 Wi

0.0000 0 4
  • 关注作者
  • 收藏
291294878

手动卸载 Office

开始手动步骤之前,确定 Office 安装类型,以便可选择正确的方式将其卸载:确定安装类型 1,打开 Office 应用程序,如 Outlook 或 Word。,2,转到“文件”>“帐户”或“Office 帐户”。3,如果出现“更新选项”项,则为即点即用安装。如果未显示该项,则为基于 MSI 的安装。步骤 1:删除 Windows Installer 程序包 找到 Office 16

0.0000 0 3
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
CDA持证人阿涛哥
480.0000
02
85691082
320.0000