一种用于前向多层的反向传播学习算法
RBF神经网络,是一种对局部逼近的神经网络。
一种自组织特征映射网络SOM,又称Kohonen网络。
主要对布尔类型的数据聚类
贝叶斯网络也称为因果概率网络
粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。
数据集中显著不同于其它数据的对象。孤立点又叫离群点。
CART既可以用于分类计算,也可以用于回归
是一种解决含有隐含变量优化问题的有效方法
一种挖掘频繁项集的方法。
广义序列模式(简称GSP)算法是Apriori类算法,
协同过滤算法的主要功能是预测和推荐。
一种层次聚类算法,主要应用于对样本数据进行聚类
采用后缀序列转前缀序列的方式来构造频繁序列
用于衡量特定网页相对于搜索引擎中的其它页面的重要程度
是基于概率近似正确的学习模型下提出的一种提升算法
是一个基于关联规则进行分类的算法
K最近邻算法是一种基于类比的分类方法。
一种具有动态自反馈的非线性映射
是应用于分类的一种树结构。
是对于统计数据分析的一门技术,在许多领域受到广泛应用
用于从庞大的数据库中寻找有用或有趣的模式和规则。
主要思想是针对两分类问题
相关分析就是分析变量之间是否存在某种因果关系
检验一个或两个样本是否来自于具有指定均值的总体
单样本K-S检验是一种拟合优度的非参数检验方法
将调查样本中的包含的大量数据资料进行整理、概况和计算
对变量的极差、标准差、偏度、峰度等统计量进行计算
秩和检验用来检验两个不成对数据样本的差异性
均值分析是指计算指定变量的综合描述统计量
样本比例检验主要包含单样本比例检验和双样本比例检验
可通过样本的方差来推断总体方差是否等于指定的值
检验两个相关的样本是否来自具有相同均值的总体
一种用途很广的计数资料的假设检验方法
用来检验变量的取值在一定程度下是否是随机的
通过两个相关样本的每队数据之差的符号进行检验
检验样本是否来自于同一总体
检验两个或多个相关样本的总体分布是否存在显著性差异
向量自回归(VAR)是基于数据的统计性质建立模型
生存分析用来研究追踪时间的分布规律及相关因素的方法
判别分析为未知类别的样本判别其归类的一种统计方法。
主成分分析的本质就是一种简化数据集的技术
通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型
移动平均法是一种简单平滑预测技术
因子分析是主成分分析的推广
方差分析又称为“变异数分析”或“F检验”
取多个截面,在这些截面上同时选取样本观测值构成数据
用来描述变量之间的多项因果关系
用于分析经济变量之间的因果关系
可用于对给定时间序列的平稳性进行检验
用于检验回归方程所描述的因果关系是否是伪回归
系统使用约翰逊约束极大似然算法,区分是否含有常数项和趋势项
利用函数对一个或多个自变量和因变量之间进行建模的一种回归分析
广义的线性回归是指参数线性回归,而解释变量并不一定是线性的。
根据回归方程预测某个结果出现的概率。
用于分析实验的刺激强度和反应比例之间的关系。
描述变量之间的非线性关系的一种回归模型。
专门用于共线性数据的有偏估计回归方法。
主成分分析方法用在多元线性回归中的一种回归分析方法。
又称为自回归移动平均模型,是时间序列分析中最常用的模型之一
适用于拟合与预测没有明显趋势和季节波动的序列
一般用于季节性时间序列分析
HP滤波方法是一种比较常用的时间序列分解方法
对数据进行分析和加工的技术过程
把数据进行分组,可分为对数值型变量和字符型变量编码。
对数据(包含数值和非数值类型)进行分析和加工的技术过程
可以对一个或多个变量进行各种组合计算
根据一个或多个变量对全体记录的数据按一定的条件进行排序
针对带有缺失值的数据进行处理
对任意数据进行抽样
修改变量类型、插入变量、删除变量等
两个或两个以上的数据进行合并
分类汇总可以对数值型数据按字段分类汇总
随机数生成主要用在构造数据上
用直线、折线、曲线等来表示变量之间的线性关系
一种描述数据总体离散的统计图形
是时间序列的一种图形观察工具
查询任意界限值时对疾病的识别能力,可以选择最优的分类器
利用等宽的条形的长短或高低表现统计数据大小及变化的统计图
是一种反映现象的部分对总体的比例关系的统计图
面积图可以用来绘制所有变量值的总和和各变量相对于整体的关系
盒状图是描述数据分布的统计图形
一种常用的考察变量分布的方法
是找出影响产品质量主要因素的一种简单而有效的图表方法
散点图用于表现记录数据的原始分布状况
根据统计量的线图对应于上下控制线的情况来反映生产是否处...
分析事物之间的“原因与结果”等的关系图