《统计学基础》
统计学的知识包括了图形信息化、数据的集中趋势、概率计算、排列组合、连续型概率分布、离散型概率分布、假设检验、相关和回归等知识,对于具体的知识点,我们会在这个课程一一呈现。参加的伙伴也可以结合书籍《深入浅出统计学》、《统计学:从数据到结论》进行学习。

统计学分为描述性统计学和推断性统计学。
一、描述性统计
定义:使用特定的数字或图表来体现数据的集中程度和离散程度。
简单而言,描述性统计分析是用几个关键的数字来描述数据集的整体情况。描述数据集常用4个指标:平均值、四分位数、标准差、标准分,利用这些指标可以进行数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。
通常我们拿到一份数据集,首先对获取的数据进行清洗,整理成我们业务所需要的新数据,然后再对新数据进行描述性统计分析,常用的是 Excel 中自带的分析分析工具(描述性统计分析),Excel加载后即可使用。

描述统计分为集中趋势分析、离中趋势分析、相关分析三大部分。
集中趋势分析
集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。

离中趋势分析
离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。

相关分析相关分析探讨数据之间是否具有统计学上的关联性。

二、推断性统计
定义:根据样本数据推断总体的数据特征。


统计学是数据分析必须掌握的基础知识,它是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域,而在数据量极大的互联网领域也不例外,因此扎实的统计学基础是一个优秀的数据分析师必备的技能。
  • 100+
    服务行业
  • 5000+
    落地项目
邮箱:contact@digitalpredict.cn
地址:上海市浦东新区博霞路Y座大楼303

  • 关注我们
描述
  • 联系我们