数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。
数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。
数据查询根据用户的需求,求得变量满足某种条件或者变量之间满足某种逻辑关系,生成一个条件表达式,根据此条件表达式在原始数据表中选择出满足条件的数据子集。
数据查询目的:通过设置查询条件,在原始数据中筛选出用户所需的符合查询条件的数据子集,并将获得的数据应用与分析。
三相关应用数据查询可以应用于任何领域,只要用户有特定需求的数据,即可从原始的数据集中通过查询选择出所需的数据子集。
四参考资料1 数据查询—百度百科
2 马克威分析系统使用教程,http://www.tenly.com
五实例示例是某商品在华东、华南、华西、华北及华中五个地区的四个季度的销售额(单位:万元)
区域 | 第一季度 | 第二季度 | 第三季度 | 第四季度 |
华东 | 50.4 | 47.4 | 90.0 | 60.4 |
华南 | 50.6 | 48.6 | 55.6 | 41.6 |
华西 | 45.9 | 46.9 | 53.1 | 53.9 |
华北 | 32.3 | 37.6 | 56.5 | 41.9 |
华中 | 42.6 | 49.7 | 60.8 | 43.2 |
1)现在要查询华东和华南各季度的销售额
用软件(如EXCEL等)对原始数据进行选择,得到的结果如下所示:
区域 | 第一季度 | 第二季度 | 第三季度 | 第四季度 |
华东 | 50.4 | 47.4 | 90.0 | 60.4 |
华南 | 50.6 | 48.6 | 55.6 | 41.6 |
2)现在要查询第一和第二季度五个区域的销售额
经过专业的软件对原始数据的查询得到的结果如下所示:
区域 | 第一季度 | 第二季度 |
华东 | 50.4 | 47.4 |
华南 | 50.6 | 48.6 |
华西 | 45.9 | 46.9 |
华北 | 32.3 | 37.6 |
华中 | 42.6 | 49.7 |
还可以按照用户需求,设定查询条件,从原始数据中获得所需数据子集。
六输入输出输入变量类型:整型、浮点型、布尔型、字符型、日期型
输入数据尺度:标量型、名义型、有序型
输出结果:输出符合查询条件的数据表。
七相关条目数据清理、数据集成、数据变换
八优缺点优点:根据用户的需求能直观地得到所需要的结果。