有福有德

问卷题目设计

“晚饭后,您通常喜欢饮用什么饮料?”这段话,如果作为问卷的题目的话,有问题吗? 如果受访者认真看待这个问题,我想他一定会思考如下场景: 1.晚饭后:指的是多久,是一会功夫,还是睡觉前。 2.您:指代我自己还是可以一起指代家庭成员。 3.饮料:是什么牌子吗?水算不算呢? 解决以上问题的关键是:具体化,概念具有可操作性。 晚饭后:使用晚饭后的2个小时内代替,或规定好具体时间。 您:使用您自己代替,

有福有德

2018-10-28

243.6102 2 3
  • 关注作者
  • 收藏

sas结构方程原来也很强

sas结构方程很美,但图形好像很难调整,不知是不是我没找对地方。 spss的amos图形调整起来好像很便利,不知sas能不能通过语法调整。 结构方程技术为社会科学计量分析工作者所钟爱。结构方程有效地整合了各种统计方法,可以实现复杂变量间的路径关系,尤其是多因变量的问题。可以认为这种技术是解决面的问题的一种特有的方法。 1)先验理论性 SEM模型的“一边”是先验理论导出的协方差结构,“一边”是样

有福有德

2018-10-15

186.7074 6 1
  • 关注作者
  • 收藏

核密度工作原理及实现

SAS的KDE过程实现核密度估计,功能及其说明如下: 可以对单变量和双变量进行核密度估计,所谓的核(kernel)估计是一种非参数方法,是指从原始数据中观测到的概率密度函数(PDF)——平均的通过数据点,从而创建平滑曲线。 KDE过程使用高斯密度做为核,并假设其方差决定平滑的结果。 其工作原理:选择带宽(bandwith),进而核密度估计,但完成这些工作前提是完成数据的分箱

有福有德

2018-10-14

209.4487 10 7
  • 关注作者
  • 收藏

岭回归问题和SPSS的实现

线性回归形式可以表达为 存在岭参数k>=0,如果k=0,β ̂就是最小二乘估计。较大的岭迹参数k将增加估计偏差,但会减小方差,而k存在无穷多个可能,因此,我们需要选择某个k值使估计偏差和方差达到最优平衡。 岭回归方法是一种有偏估计,主要是以损失少部分信息和精度的前提下,拟合更符合实际情况的回归方程。当自变量存在严重共线性时,也许并不一定导致矩阵的行列式等于零,

有福有德

2018-10-10

267.1141 6 1
  • 关注作者
  • 收藏

统计变换技术有感

正好刚刚学了点变换技术,希望同仁能给予批评和交流,共同学习。 有些公式不好编辑所以截图分享。 Spline与MSpline变换 变量缺失部分的变换,Spline、MSpline变换与Linear、Monotone、Opscore、Untie的变换相同。 变量非缺失部分的变换,即最优变换(Spline变换),为b-spline基向量的线性组合,而b-spline基可以精确(数量少,没有共线性)、有效

有福有德

2018-10-09

883.9545 6 0
  • 关注作者
  • 收藏

共线性及危害

广义上说共线性指的自变量之间的相关性,那么相关性有双变量间的相关,也有多变量间的相关,由此可以进一步区分为共线性和多重共线性。下文首先从共线性的阐述逐步过渡到多重共线性。假设我们需要拟合包含了两个影响因素线性回归,并且假设x_1和x_2的相关系数为r_12, k 表示自变量数。可见参与β ̂计算的是由3部分统计量组成,分子的残差平方和、分母的自变量方差、自变量间的相关性。残差

有福有德

2018-10-08

345.6661 8 0
  • 关注作者
  • 收藏