数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。
数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。
对同一批数据往往需要从各种不同的侧面进行研究,因为采用不同的统计方法进行分析,对数据的结构要求不尽相同,所以数据重构是很有必要的。数据重构就是对数据文件的结构进行重新调整或转换,以便适合相应的统计方法使用。
三相关应用数据重构主要用于当分析字段包含很多分析侧面时,需要把该分析字段按照侧面展开,进而分析每个侧面对目标变量的影响。
四参考资料马克威分析系统使用教程,http://www.tenly.com
五实例现在有两个商店,其营业时间以及营业额的变化如下,单位:小时
编号 | 商店 | 营业额 | 营业时间 |
1 | 1 | 50000 | 6 |
2 | 2 | 48000 | 6 |
3 | 1 | 55000 | 8 |
4 | 1 | 65000 | 10 |
5 | 2 | 53000 | 8 |
基于分析需要,我们想观察时间对两个商店营业额的影响,数据重构后如下表:
商店 | 营业额-6 | 营业额-8 | 营业额-10 |
1 | 50000 | 55000 | 65000 |
2 | 48000 | 53000 |
输入变量类型:整型、浮点型,数据要求没有缺省。
输入数据尺度:标量型
输出结果:数据架构后的结果有整型、浮点型。
七相关条目重新构成、分类汇总
八优缺点优点:当分析维度包含很多分析面时,按照业务需要把所需要的分析维度按照侧面展开,能清晰地分析出每个侧面对目标变量的影响程度。