|
马上注册,所有资料全部下载!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
预
测
本部分主要包括以下一些内容:时间序列分析、回归分析、敏感性分析、模拟模型。这一部分的内容都比较重要,国和都要给予足够的重视。
预测的最简单形式是用过去趋势预测未来——叫做推测法。建立模型是分析技术的一种。
要注意的是,所有涉及概率的预测模型都有一个关键概念,就是期望值。期望值等于事情的各种可能的值与其相应概率乘积的和(例:股票;现价15,80%涨到20,20%跌到10,该不该买?80%*20+20%*10=18)。
1.时间序列分析
时间序列分析是分析一段时间内所测得的数据集的一种技术。尽管未来是不确定的,但过去的数据经常能够提供对未来很好的预测(例:GDP股票)。
时间序列数据通常分为四个部分:长期趋势、季节性组成部分、周期性组成部分以及随机或不规则组成部分。这四个组成部分可以帮助解释数据的变化。时间序列分析的目的在于使用这些组成部分来解释过去的数据中总的变化。问题是怎样能最好地将每一个组成部分与其它部分分离开来,从而将每一部分都能够分析清楚。
(1)长期趋势
趋势因素指的是一段时间内观测到的一个变量长期的增加(增长)或减少(衰退)趋势。例如,耐克公司过去10到15年内的年度销量。
拟合长期趋势曲线最简单的方法是画出数据点并徒手画出趋势曲线。另一种途径是用回归的方法。
(2)季节性因素
季节性因素代表了时间序列中每年的同一时期都会发生的那些变化。例如,销售高峰在每年春季和秋季都会发生一次。
季节指数是一种移动平均比率,可以用来衡量时间序列中的季节性波动。一年4个季度的季度指数之和为400%,4个季度季节指数平均数为100%。季节变动表现为各季的季节指数围绕着100%上下波动,表明各季销售量与全年平均数的相对关系。如某种商品第一季度的季节指数为125%,这表明该商品第一季度的销售量通常高于年平均数25%,属旺季,若第三季度的季节指数为73%,则表明该商品第三季度的销售量通常低于年平均数27%,属淡季。将原始的时间序列数据除以对应的季节指数就可以消除季节影响。
(3)周期性因素
除了季节性因素之外,数据也可能含有一定的周期性影响。时间序列中的周期性影响表现为围绕着长期趋势的波动。周期性波动在长期的图形中会重复出现,不是数据中的随机因素。但是并不会像季节性因素那样,有规律的定期反复出现,而是会以不同的频率和强度发生。因此,他们可以被分离出来,但是无法全部预测。
受周期性因素影响最大的组织是那些产品的购买与可随意支配的收入有关的公司(如,贵重消费品,例如家用电器和汽车)。消费者可以推迟购买这些商品,因此,这些组织受经济的衰退影响最大。
(4)随机或不规则因素
随机或不规则因素是不属于以上三种因素中任何一种的因素——即长期趋势、季节性和周期性因素。随机波动可能由许多因素引起,例如天气(印尼海啸)和政治事件(科威特海湾战争)。
不规则因素可以分为次要不规则因素和主要不规则因素。
次要不规则因素会显示出围绕长期趋势的锯齿状图样。就每个次要的不规则因素而言,他们并不显著,但是整体上却可能很显著,并且可能会给许多组织带来问题。
主要不规则因素是时间序列中显著的一次性、不可预测的变化,例如战争、石油禁运、夏季干旱或严重的冬季冰雪灾等不可控的因素。
总结一下,时间序列分析是分析一段时间内所测得的数据集的一种流程。在时间序列数据中,趋势因素指的是一段时间内观测到的一个变量长期的变化趋势。季节性因素代表了时间序列中每年的同一时期都会发生的变化。周期性影响表现为围绕着长期趋势的波动。随机或不规则因素是不能归于以上三种因素的因素。
2.回归分析
在回归分析中,我们会复习以下内容:回归分析的概述,简单线性回归分析,多元回归分析,回归模型中存在多重共线性的症状,回归模型中的哑元变量,计量经济学。
(1)回归分析的概述
回归分析中涉及的主要名词有:
因变量:可以由一个或多个其它变量预测或导致其变化的变量。它会显示出其它变量的“影响”。
自变量:被认为可以预测或引起因变量波动的变量。
回归分析:测定因变量和一个或多个自变量之间关联性的一种方法。
回归系数:当一单位的自变量发生变化,对与之相关联的因变量变化的度量;
方差分析:分析两组或多组样本均值差异的一种方法。
相关性:相关性是指两组数字集之间的相互依赖性或两个量之间的关系,例如当一个变化时,另一个也随着变化。两个量同时增加或减少称为“正相关性”;当一个量增加而另一个减少时,称为“负相关性”。
经理在决策之前,或因为要进行预测和计划,或因为要分析问题,经常需要判断两个或更多变量之间的关系。若分析仅涉及一个因变量和一个自变量,这种方法是简单回归分析;若涉及两个或多个自变量,这种方法叫做多元回归分析。
散点图可以用来描述因变量Y(例如,销售量)和自变量X(例如,广告)之间的潜在关系。自变量是用来解释因变量变化的。自变量也叫解释变量。散点图可能出现三种可能的关系:(1)线性的,(2)曲线的,和(3)无关的。
线性的。当X变化时,Y倾向于成直线或近似直线变化。可能是正的变化(X增加,Y增加),也可能是负的变化(X增加,Y减少)。
曲线的。X增加,Y以指数速率增加(例如,当生产增加时,加班以指数速率增加)。或者X增加,Y以递减速率增加(例如,当广告过于庞大时,销售量回报将递减)。
无关的。当X增加时,Y有时减少,有时增加。
除了定性度量,有时还需要使用相关系数来定量度量两个变量间的相关强度。相关系数范围从绝对正相关(+1.0)到绝对负相关(-1.0)。如果两个变量没有线性关系,那么他们之间的相关系数是零。因此,相关系数离零越远,两个变量之间的线性关系就越强。相关系数的符号显示了关系的方向,但是同其强度无关。
为了判断变量之间线性关系是否显著,我们会先假设相关系数为零,然后检验样本数据是支持还是拒绝相关系数为零的假设。我们通常使用“t”统计量来检验总体相关性为零的假设。
相关性同因果关系无关,因为两个看起来没有联系的变量经常可能是高度相关的。比如,最近的20年,国和的年纪越大,我们国家的国民生产总值越高,但是这两者并不存在着因果关系。
总结一下,回归分析是测定因变量和一个或多个自变量之间关联性的一种方法。若分析仅涉及一个自变量,这种方法是简单回归分析;若涉及两个或多个自变量,这种方法叫做多元回归分析。相关系数可以定量度量两个变量间的相关强度。相关系数范围是从绝对正相关(+1.0)到绝对负相关(-1.0)。如果两个变量没有线性关系,那么他们之间的相关系数是零。相关系数离零越远,两个变量之间的线性关系就越强。相关系数的符号显示了关系的方向,但是同其强度无关。相关性同因果关系无关。
(2)简单线性回归分析
当因变量和一个自变量之间成直线、线性关系时,用来进行预测和估计的方法就叫做简单线性回归模型。比如身高(因变量)和年龄(自变量)之间的关系。
以下方程描述了简单线性回归模型:
Yi= β0 +β1Xi + ei
这里,Yi是因变量值,Xi是自变量值,β0是Y截距,β1是回归线的斜率,ei是误差或残差,是一种随机因素,是实际Y值和模型预测Y值之间的差。
人们通常使用样本数据确定回归模型,以此估计自变量与因变量之间真实的线性关系。
因变量能够被自变量解释的程度用百分比表示出来就叫做判定系数(R2)。
R2的值是在0到1之间。R2表示了线性回归方程是否符合实际情况。符合的越好,R2越接近1。两个变量之间存在完全的线性关系时,R2等于1.0。两个变量间的相关性很弱或它们间不存在线性关系时,R2接近于0。
使用回归分析作为一种预测工具时,需要考虑以下几个注意事项:
两个变量间存在显著的线性相关性并不能说明一个变量变化导致了另一个变量变化,即不能说明这两个变量存在因果关系。
不过,回归分析用于预测时,两个变量的因果关系这一条件并不是必要的。重要的是回归模型能够准确地反映两个变量间的关系,并且这种关系是稳定的(天气-股市)。
回归分析的应用
总结一下,因变量和一个自变量之间成直线、线性关系时,用来进行预测和估计的方法就叫做简单线性回归模型。基本模型为Yi= β0 +β1Xi + ei。因变量能够被自变量解释的程度用百分比表示出来就叫做判定系数(R2)。R2的值是在0到1之间。模型设定的越好,R2越接近1。
(3)多元回归分析
多元回归分析是分析一个因变量同两个或更多变量之间关系的方法,同时也是简单回归分析的扩展。在简单回归分析中,只存在一个自变量(独立变量)。而在多元回归分析中存在一个以上的自变量(独立变量)。
比如,房屋的价格是因变量,而自变量很多,例如房屋所占平方大小、房屋建造距今时间、房屋所在的地段和周围配套设施等等。
从理论上说,用于计算回归模型样本的容量至少要比自变量的数量多一个。也是说,对于一个拥有四个自变量的模型,必须的最小样本的数量是五个。实务中,样本数量应该至少是自变量数量的四倍。否则,模型是毫无意义的。
与简单回归类似,多元回归也使用多元判定系数R2。如果R2是0.75,表明因变量中75%的差异能够被模型中所有的自变量所解释。
并不是所有的自变量都能够解释因变量的差异。t检验能够检验每个自变量作用是否显著。t检验可以检验任何一个自变量的显著性。而F检验可以检验整体回归模型的显著性。
用于预测的回归模型应只包含显著的自变量。如果不显著的自变量存在,必须移除这些自变量后才能用回归模型进行预测。
总结一下,因变量同一个以上的自变量的回归分析是多元回归分析。回归时,样本数量应该至少是自变量数量的四倍。
(4)回归模型中存在多重共线性的症状
当模型中的自变量之间存在强相关性时(总资产,销售收入),就会出现多重共线性的状况。多重共线性对回归模型具有负面的影响——回归系数的符号与预期的符号相反,并会对t检验产生影响。
导致多重共线性的自变量对于模型不是必须的,因此可以移除出去同时不会对模型产生任何削弱作用。
(5)回归模型中的哑元变量
当回归模型的自变量是名义变量或序数变量时,我们称之为定性自变量。例如,在一个预测利润的模型中,客户的性别(男性或女性)就是名义变量。
为了给定性变量分配数值,我们在回归模型中加入了哑元变量。加入哑元变量的规则是:如果定性变量有两个类型(例如,男性或女性),那么增加一个哑元变量;对于两个以上的类型,需要增加的哑元变量数为类型数减一(例如,对于4个类型,增加3个哑元变量)。哑元变量的取值是零或一,他们在回归模型中将反映定性变量对因变量的影响。比如对于性别,加入一个哑元变量,男性取1,女性取0。
(6)计量经济学
将统计方法应用到经济数据中的学科被称为计量经济学。它分析经济变量之间的关系。计量经济学中通常使用多元回归分析。
比如,最近发生的事件使一个电力公司已有的时间序列模型无法用于预测目前的实际情况。这个公司需要建立一个新的经济计量模型,以在各个因素的基础上预测电力的需求。这些因素有:(1)气候,(2)人口,以及(3)工业总产值。因为存在三个自变量,所以使用多元回归。
3.敏感性分析
敏感性分析用于评估输入值的变化如何影响模型或系统的输出值。
例如,基金经理使用敏感性分析方法,可以判断某只股票价格变化一个百分点,资产组合最优比例会相应发生什么变化。
敏感性分析还可以应用于制造、线性规划、财务、网络以及存货等方面。
4.模拟模型
模拟模型的主要目标是描述真实系统的行为。
计算机模拟模型的步骤包括:
建立一个计算机模拟模型,“模仿”或模拟真实世界的系统(降雨量、防汛)。
进行一系列的计算机运行或试验,了解模拟模型的行为。
改变模型的设计,确定修改是否有助于改进系统绩效。在这一步中会提出“如果”问题。因此,模拟模型有助于经理预测未来。
通常情况下,计算机模拟器被用来执行计算机的模拟程序。计算机程序中运行的模拟器会实施数学运算,追踪模拟的结果。例如,可以:
模仿繁忙街道交叉路口的交通流量,确定改进交通情况所需要的交通信号的数量。
模仿存货系统的性态,确定最优订货数量和再订货点。
计算机模拟最重要的是蒙特卡罗模拟。蒙特卡罗方法的基本思想是,当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,并用它们作为问题的解。在该模拟中,模型的输入值,例如到达一个服务中心的顾客数目,是通过随机数产生的。
总结一下,模拟是用来描述现实世界系统的行为的方法。当模型的输入值是运用随机概率分布产生的时,这一模拟被称为蒙特卡罗模拟。
|
|