数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。
数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。
在应用算法计算数据时,有时候需要原始数据服从某种分布,但数据并不满足这种性质;则可由随机数生成算法得到服从各种分布的数据,以便进行统计分析建模操作。
三相关应用随机数生成主要用在构造数据上。如果想要构造服从某种分布的数据,则可直接由随机数生成得到,方便且有依据。
四参考资料1 随机数生成—百度百科
2 马克威分析系统使用教程,http://www.tenly.com
五实例例如,在Excel中,直接使用函数rand()即可得到一列随机数,要构造服从某种分布的数据,可用专业的软件实现随机数生成。
序号 | 随机数 |
1 | 0.910 |
2 | 0.050 |
3 | 0.209 |
4 | 0.200 |
5 | 0.904 |
6 | 0.552 |
7 | 0.682 |
8 | 0.788 |
9 | 0.131 |
10 | 0.808 |
输出数据类型:数值型数据
输出结果:给出服从特定分布的一列随机数据
七相关条目随机数生产函数、随机数生成软件
八优缺点优点:如果想要得到一种服从某种分布的数据,通过生成随机数的方法可直接得到,方便且有依据,有利于统计分析建模。