您确定要删除吗?

取消
首页 算法大全 应用模型 分析软件 算法学院数据中心 关于本站
在线咨询
400-820-6981
意见反馈
返回顶部

数据重构

数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。

数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。

计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。

算法描述

对同一批数据往往需要从各种不同的侧面进行研究,因为采用不同的统计方法进行分析,对数据的结构要求不尽相同,所以数据重构是很有必要的。数据重构就是对数据文件的结构进行重新调整或转换,以便适合相应的统计方法使用。

相关应用

数据重构主要用于当分析字段包含很多分析侧面时,需要把该分析字段按照侧面展开,进而分析每个侧面对目标变量的影响。

参考资料

马克威分析系统使用教程,http://www.tenly.com

实例

现在有两个商店,其营业时间以及营业额的变化如下,单位:小时

编号 商店 营业额 营业时间
1 1 50000 6
2 2 48000 6
3 1 55000 8
4 1 65000 10
5 2 53000 8

基于分析需要,我们想观察时间对两个商店营业额的影响,数据重构后如下表:

商店 营业额-6 营业额-8 营业额-10
1 50000 55000 65000
2 48000 53000
输入输出

输入变量类型:整型、浮点型,数据要求没有缺省。

输入数据尺度:标量型

输出结果:数据架构后的结果有整型、浮点型。

相关条目

重新构成、分类汇总

优缺点

优点:当分析维度包含很多分析面时,按照业务需要把所需要的分析维度按照侧面展开,能清晰地分析出每个侧面对目标变量的影响程度。

确定