统计学有三大原理,即正态分布、大数定律和中心极限定理。
其中“大数定律”解决了样本和总体的关系问题,其核心思想就是当样本量足够大的时候,样本的分布(均值)与总体的分布(真实均值)充分接近,也就是可以把二者看作是相等的。
大数定律告诉我们只要获取适合的数据样本量就可以把握住事物的分布规律,而不需要所谓的海量数据。关键是数据样本的代表性、数据的真实性有效性以及适合的样本量。
其实,大数据的“大”包括两方面的含义,其一是指数据的数量,其二是指数据的种类。在获取数据手段技术不断创新、成本下降的情况下,可以增加指标库,把我们过去无法获得或获取成本较高的指标数据纳入到我们的数据库。
比如说,过去人才库只有性别、年龄、学历、工龄等基本数据,现在我们可以通过测评把一个人的能力、个性、动力等特征数据放进去,这些数据能够帮助管理者实现更精准的人岗匹配,降低用人风险,优化人才结构,控制人力成本,提升人力资源的价值贡献度。
经相关查询,统计学的三大原理是统计工作、统计资料、统计学。
它们之间的关系:
(1)统计工作:即统计实践活动,是指从事统计业务的机关、单位利用科学的统计方法,搜集、整理分析和提供有关客观现象的数据资料、研究数据的内在特征,并预测事物的发展方向等一系列工作过程的总称。
(2)统计资料:是统计实践过程的取得的各项数据资料以及与它相联系的其他资料的总称。
(3)统计学:统计工作与统计资料的关系是统计活动即过程与统计成果的关系,统计工作与统计学的关系是统计实践与统计理论的关系