上QQ阅读APP看书,第一时间看更新
2.1 统计分析
统计学是研究如何搜集资料、整理资料和进行量化分析、推断的一门科学,在科学计算、工业和金融等领域有着重要应用。统计分析是机器学习的基本方法。例如,确定某种癌症的诱发因素、垃圾邮件检测、财务预测、遗传学、市场分析、识别手写数字等,都与统计分析有着紧密的联系。与统计分析相关的基本概念有以下几个。
(1)总体:根据一定目的确定的所要研究事物的全体。
(2)样本:从总体中随机抽取的若干个体构成的集合。
(3)推断:以样本所包含的信息为基础,对总体的某些特征做出判断、预测和估计。
(4)推断可靠性:对推断结果从概率上的确认,是决策的重要依据。
统计分析分为描述性统计和推断性统计。描述性统计是通过对样本进行整理、分析并就数据的分布情况获取有意义的信息,从而得到结论。推断性统计又分为参数估计和假设检验,参数估计是对样本整体中某个数值进行估计,如推断总体平均值等;而假设检验是通过对所做的推断进行验证,从而选择行动方案。