统计学简答题1、统计的含义与本质是什么?(1)“统计”一词可以有三种含义:统计活动、统计数据、统计学统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段;统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。(2)统计的本质是关于为何统计,统计什么,和如何统计的思想。2、统计学的学科性质:1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。3、统计学就其研究方式而言,具有描述性和推断性的特点。3、总体、样本、个体三者关系如何?试举例说明。总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体;样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。(1)总体与个体的关系(可变性)总体容量随着个体数的增减可变大或变小;随着研究目的的不同,总体中的个体可发生变化;随着研究范围的变化,总体与个体的角色可以转换(2)样本与总体的关系样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。样本是用来推断总体的。总体和样体的角色是可以改变的。4、理解标志、指标、变量三者的含义?标志与指标的联系与区别?标志是用以描述或体现个性特征的名称;统计指标简称指标,是反映现象总体数量特征的概念及其数值;从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。(1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。(2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。5、什么是统计指标体系?有哪些表现形式?同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式:数学等式关系:若干统计指标之间可以构成一个等式关系相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征相关关系:各个指标之间的存在着一定的相关关系原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果6、如何设计统计数据收集方案?(1)统计数据的收集包括四个环节:确定数据收集目的;设计数据收集方案;开展数据收集活动;评估数据收集质量。(2)统计数据收集方案包括以下一些方面:数据收集目的;数据及其类型;数据收集对象和观测单位;观测标志和调查表;数据收集方式和方法;数据所属时间和数据收集期限;数据收集地点;数据收集的组织。7、统计数据整理有哪些基本步骤?整理方案的设计;数据项处理;统计分组和汇总;整理数据的显示;整理数据的保存与公布。8、简述统计分组的含义、性质和作用。(1)含义:统计分组就是根据统计研究的目的和事物本身的特点,选择一定的标志(一个或多个),将研究现象总体划分为若干性质不同的组或类的一种统计研究方法。(2)性质:统计分组兼有分与合的双重功能,是分与合的对立统一;统计分组必须遵循“穷尽原则”和“互斥原则”;统计分组的目的是要在同性质的基础上研究总体的内在差异性;统计分组在体现分组标志的组间差异的同时,却可能掩盖了其他标志的选择是核心问题。(3)作用:揭示现象所属类型;解剖总体内在结构;分析现象之间关系。9、在统计数据收集过程中,可能存在哪些误差?(1)观测性误差也叫登记性误差或调查性误差。它是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符合的误差。(2)代表性误差是指在抽样调查中,因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。系统性代表性误差,是由于抽样框不完善、抽样时违反随机原则、被调查者无回答等因素引起的误差。观测性误差与系统性代表性误差合在一起称为非抽样误差。偶然性代表性误差,是由于抽样的随机性引起的样本结构与总体结构不完全相符而产生的估计结果与总体真值不一致的误差,这种误差在随机抽样中不可避免,但可以计算和控制。10、什么是变量分布的集中趋势、离中趋势和分布形状?集中趋势:反映变量分布中各个变量值向中心值靠拢或聚集的程度;离中趋势:反映变量分布中各个变量值远离中心值的程度;变量分布的形状:反映变量分布的偏斜程度和尖陡程度。11、什么是平均指标?有什么作用?常用的平均数有哪些?(1)平均指标是将变量的各个变量值差异抽象化、以反映变量值一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。(数值平均数、位置平均数)(2)平指标的作用:通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观的认识;利用平均指标可以对不同空间的发展水平进行比较,消除因总体规模不同而不能直接比较的因素,以反映他们之间总体水平上存在的差距,进而分析产生差距的原因;利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象发展变化的趋势或规律性;利用平均指标可以分析现象之间的依存关系或进行数量上的推算;平均指标还可以作为研究和评价事物的一种数量标准或参考。(3)常用的平均数:数值平均数(算术平均数、调和平均数、几何平均数);位置平均数(中位数与分位数、众数)12、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征?中位数、算术平均数、众数三者完全相等时,变量分布完全对称(正态分布)中位数、算术平均数、众数三者存在差异时,变量分布不对称在轻微偏态时,众数与算术平均数的距离约等于中位数与算术平均数距离的3倍13、什么是离散指标?有什么作用?常用的离散指标有哪些?(1)离散指标就是反映变量值变动范围和差异程度的指标,即反映变量分布中各个变量值远离中心值或代表程度的指标,亦称为变异指标或标志变动度指标。(2)离散指标的作用:可以用来衡量比较平均数的代表性;可以用来反映各种现象活动过程的均衡性、节奏性或稳定性;为统计推断提供依据(3)全距(亦称极差)、四分位差、异众比率、平均差、标准差、离散系数等。14、什么是总体分布和样本分布?两者有什么联系?总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布;样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。联系:抽样估计,就是要以可知但非唯一的样本统计值去估计唯一却未知的总体参数的值。15、什么是抽样分布?它首哪些因素影响?(1)抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。(2)影响因素:①总量分布;②样本容量;③抽样方法;④抽样组织形式;⑤估计量构造。抽样误差与非抽样误差有什么区别?抽样误差是由抽样的非全面性与随即性所引起的偶然性误差非抽样误差是随即抽样的偶然性因素以外的原因所引起的误差16、影响抽样误差的因素有哪些?(1)所谓抽样误差是由于抽样的非全面性和随机性所引起的偶然性误差,即因抽样估计值随样本不同所造成的误差。抽样误差的表现形式一般有三种:抽样实际误差,抽样标准误差,抽样极限误差。(2)影响抽样标准误差的因素,就是影响抽样分布的因素:①总量分布;②样本容量;③抽样方法;④抽样组织形式;⑤估计量构造。17、序时平均数(动态平均数)与静态平均数(一般平均数)有何异同?共性:都反映现象的一般水平或者代表性水平,都是平均数。差别:①一般平均数把同质总体某一数量标志在某一时间上的水平抽象化,从静态反映现象的一般水平或代表性水平,而序时平均数则把同一现象在不同时间上的差异抽象化,从动态上反映现象的一般水平或代表性水平;②静态平均数是根据变量数列计算的,而序时平均数则根据时间数列来计算【回忆:动态指标和静态指标】①静态指标是反映现象总体在某一时点或相对静止时间上数列特征的指标,包括一般的总量指标、静态相对指标和一般水平指标②动态指标是反映现象总体在不同时期或者时点上发展变化情况的指标,包括增长量指标、动态相对指标和序时平均指标等。18、简述时期数列与时点数列的概念和区别。(1)时期数列是指同类的时期指标按时间先后顺序形成的数列,数列中的各期指标值反映社会经济现象在一堆时期内累计达到的总量。(2)时点数列是指时点指标按时间时间先后顺序排列而行成的统计数列,其指标反映经济现象在某一时点或某一瞬间所达到的水平。(3)区别:①时期数列中不同时间的指标数值可以累计;时点数列中不同时点上数值不可以累计(或相加没有意义)。②时期数列指标值的大小和时期长短有直接关系。一般来说,时期越长,数值越大;时点数列指标数值的大小和时间长短无直接关系。【时期指标与时点指标有哪些区别?】①时期数列指标值一般是通过连续登记获取的;时点数列时点指标的数值一般是通过不连续登记取得的。②时期指标是反映现象在意的时期内累计达到的总量,其数值大小与时间长短有直接短信,不同时间上的数值可以累加,数值需要通过连续登记取得(企业产量、地区GDP)。③时点指标是反映现象在某一时点(时刻、瞬间)所达到的总量,其数值大小时间长短无直接关系,不同时间上的数值不可以累加,数值通常不需要通过连续登记取得(企业人数、地区居民存款余额)。环比发展速度与定基发展速度之间有什么关系?定基发展速度等于个期环比发展速度的连乘积;相邻两个定基发展速度的商等于相应的环比发展速度19、什么是数量指标指数和质量指标指数?试举例说明。(1)数量指标指数就是指数化指标为某一数量指标的指数,也即反映总体某种数量指标变动的指数,如产品产量指数、商品销售量指数、能源消耗量指数等。(2)质量指标指数就是指数化指标为某一质量指标的指数,也即反映总体某种数量指标变动的指数,如商品零售价格指数、产品单位成本指数、股票价格指数、劳动生产率指数等。什么是同度量因素?它与指数化因素有什么关系?该如何选择同度量因素?同度量因素:计算综合指数的分子和分母都是由两个或两个以上因素所决定的总量指标,其中一个因素就是指数化因素或指数化指标,其他因素则是把不能直接相关的指数化因素转化为能直接相加的量的因素关系:他们互为同度量因素;在编制综合指数时,同度量因素的时间或空间必须固定,才能反映指数化因素的变化情况;同度量因素起到同度量的同时,也起到一定的加权作用。20、什么是统计指数体系?它有哪些构建的基本原则?有什么作用?(1)所谓统计指数体系就是由三个或三个以上具有内在本质联系的统计指数所组成的有机整体。(2)基本原则:①统计指数体系中的各个指数之间必须保持等式关系,以便从相对数和绝对数两方面进行因素分析。一般地,相对数之间是乘除的关系,绝对数之间是加减的关系。②在利用统计指数体系进行多因素分析时,必须分清各个因素(指标)性质,即科学区分数量指标和质量指标,以便选择合适的方法来编制各相关的指数。③为了保持与统计指数一般编制原则的一致性,在一个统计指数体系中,质量指标指数采用派氏形式,数量指标指数采用拉氏形式。(3)作用:①利用统计指数体系对复杂现象总体的数量变化,从相对数和绝对数两方面进行因素分析,说明现象总变动中各个影响因素的变动方向和影响程度;②利用指数体系中各个指数之间的数量关系,由已知的统计指数去推算为之的指数。统计学简答题
一、统计总体和总体单位1.统计总体:
概念:统计总体是由客观存在的,具有某种共同性质但又有差别的许多个别单位所构成的整体,当这个整体作为统计研究对象时称为统计整体,简称总体。
分类:无限总体(单位数是无限的)、有限总体,
静态总体(各单位属同一时间)、动态总体。
特征:(1)大量性:总体的量的规定性,指总体的形成要有一个相对规模的量,仅仅由个别单位或极少量的单位不足以构成总体。
(2)同质性:总体的质的规定性,指构成总体的各个单位至少有一种性质是共同的,同质性是将总体各单位结合起来构成总体的基础。
(3)变异性:总体各个单位除了具有某种或某些共同的性质外,在其他方面则各不相同,具有质的差别和量的差别,这种差别称为变异。2.总体单位
(概念:构成总体的每一个事物或基本单位称为总体单位。)
3.区别与联系:
总体和总体单位是相对而言的,在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。但随着统计研究目的及范围的变化,统计总体和总体单位可以相互转化。同一事物在不同情况下,可以作为总体,也可以作为总体单位。
二、统计描述和统计推断
在统计研究过程中,能直接搜集到总体数据,用统计描述的方法达到认识总体数量特征的目的;无法直接(或无须)搜集到总体数据,则必须采用统计推断的方法。
1.统计描述:指搜集由试验或调查所获得的资料进行整理归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。统计描述的主要内容包括资料的搜集、数据的加工处理、数据的显示、数据分布特征的概括与分析。
2.统计推断:统计推断是利用概率论的理论,根据试验或调查获得的样本信息科
学地推断总体的数量特征。可以用于对总体数量特征的估计,也可以用于对总体某些假设的检验。统计推断方法包括参数估计法和假设检验法。
三、统计数据的类型
1.统计数据的度量:统计数据是采用某种计量尺度对客观现象进行计量的结果,采用不同的计量尺度会得到不同类型的统计数据。将计量尺度由低级到高级,由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度、定比尺度。
(1)定类尺度:也称类别尺度或列名尺度,是最粗略、最低层次的计量尺度。只能按照事物的某种属性对其进行平行的分类或分组,只能反映事物之间的类别差。其主要数学特征是“=”或“≠”。
(2)定序尺度:又称顺序尺度,是对客观现象之间等级差别或顺序差别的一种测度。可以将客观现象分成不同的类别,可以确定这些类别的优劣或顺序,不能测量出类别之间的准确差值。其主要数学特征是“<”或“>”。
(3)定距尺度:也称间隔尺度,是对现象类别或次序之间间距的测度,可以用数表示现象各类别的不同和顺序大小的差异,可用确切的数值反映现象之间在量方面的差异。其主要数学特征是“+”或“—”。没有绝对零点,相对比较意义不明确。
(4)定比尺度:亦称比率尺度,是在定距尺度的基础上,确定相应的比较基数,将两种相关的数加以对比而形成相对数,用于反映现象的结构、比例、速度、密度等数量关系。其主要数学特征是“X”或“÷”。2.数据的类型:
(1)按收集方法分为观察数据和实验数据。观察数据是通过调查或者观测而收集到的数据(社会经济现象),实验数据指在实验中控制实验对象而收集到的数据(自然科学领域)。
(2)按被描述对象与时间之间的关系分为截面数据和时间序列数据。截面数据是指在相同或近似相同的时间点上所收集的数据,用来描述现象在某一时刻的变化情况。时间序列数据是指在不同时间上所收集到的数据,用来描述现象随时间而变化的情况。由一系列时间序列数据排列而得出的一组数据成为时间序列,又称为动态数列。
3.数据的表现形式(绝对数、相对数、平均数):
(1)绝对数:现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位(自然/物理计量单位)或价值单位(货币形式),有时也采用复合单位。
(2)相对数:相对数是由两个绝对数对比而得的,常用的相对数有结构相对数、动态相对数、比较相对数、比例相对数、强度相对数、利用程度相对数、计划完成相对数等。
(3)平均数:统计平均数是用于反映现象总体的一般水平或分布的集中趋势,数值平均数是由总体标志总量对比总体单位数而计算的。
五、统计平均数:
1.概念:统计平均数也称平均指标,是用来表示社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平。
2.作用:(1)反映总体各单位变量分布的集中趋势和一般水平;(2)比较同类现象在不同单位的发展水平;(3)比较同类现象在不同时期的发展变化趋势或规律;(4)分析现象之间的依存关系。