数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。
数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。
数据计算可以对一个或多个变量进行各种组合计算,计算的结果生成一列新的数据。对变量的计算可以使用不同的函数处理,主要包括:绝对值、三角函数、取对数、取平方等各类处理的方法。
三相关应用变量的计算应用非常广泛;主要是针对特定的应用环境,或对数据有特殊的要求,如需要对数据进行标准化、正交化;或要对数据进行无量纲化处理等;这时就必须对数据进行特定的处理才能用于计算。对数据的应用之前需进行处理的例子还有许多,这里就不一一列举,根据实际情况进行相应的操作。
四参考资料1 数据计算—百度百科
2 马克威分析系统使用教程,http://www.tenly.com
五实例示例是某商品在华东、华南、华西、华北及华中五个地区的四个季度的销售额(单位为:万元)
区域 | 第一季度 | 第二季度 | 第三季度 | 第四季度 |
华东 | 50.4 | 47.4 | 90.0 | 60.4 |
华南 | 50.6 | 48.6 | 55.6 | 41.6 |
华西 | 45.9 | 46.9 | 53.1 | 53.9 |
华北 | 32.3 | 37.6 | 56.5 | 41.9 |
华中 | 42.6 | 49.7 | 60.8 | 43.2 |
1)对销售额按区域求平均销售额
计算公式:平均销售额=(第一季度+第二季度+第三季度+第四季度)/4
计算结果:华东区:62.05;华南区:49.1;华西区:49.95
华北区:42.075;华中区:49.075
结果图表形式:
区域 | 第一季度 | 第二季度 | 第三季度 | 第四季度 | 平均销售额 |
华东 | 50.4 | 47.4 | 90.0 | 60.4 | 62.05 |
华南 | 50.6 | 48.6 | 55.6 | 41.6 | 49.1 |
华西 | 45.9 | 46.9 | 53.1 | 53.9 | 49.95 |
华北 | 32.3 | 37.6 | 56.5 | 41.9 | 42.075 |
华中 | 42.6 | 49.7 | 60.8 | 43.2 | 49.075 |
2)对销售额按季度计算平均销售额
计算公式:平均销售额=(华东+华南+华西+华北+华东)/5
计算结果:第一季度:44.36;第二季度:46.04
第三季度:63.2;第四季度:48.2
结果图表形式:
区域 | 第一季度 | 第二季度 | 第三季度 | 第四季度 |
华东 | 50.4 | 47.4 | 90.0 | 60.4 |
华南 | 50.6 | 48.6 | 55.6 | 41.6 |
华西 | 45.9 | 46.9 | 53.1 | 53.9 |
华北 | 32.3 | 37.6 | 56.5 | 41.9 |
华中 | 42.6 | 49.7 | 60.8 | 43.2 |
平均 | 44.36 | 46.04 | 63.2 | 48.2 |
3)计算第一季度与第二季度的环比
计算公式:环比=第二季度/第一季度
计算结果:华东:94.05%;华南:96.05%;华西:102.18%;
华北:116.41%;华中:116.67%
一二季度环比结果:
区域 | 第一季度 | 第二季度 | 环比 |
华东 | 50.4 | 47.4 | 96.05% |
华南 | 50.6 | 48.6 | 96.05% |
华西 | 45.9 | 46.9 | 102.18% |
华北 | 32.3 | 37.6 | 116.41% |
华中 | 42.6 | 49.7 | 116.67% |
输入变量类型:数值型数据;如整型、浮点型、日期型等
输入数据尺度:标量型、名义型、有序型
输出结果:输出符合运算条件的数据表
七相关条目多维查询、记录选择、计算函数
八优缺点优点:根据用户的需求能直观地得到所需要的结果。