线性回归分析方法在税收收入预测中的应用
郭东颖
税收收入预测是根据历史数据信息和现实客观条件,运用科学的方法和逻辑推理手段,对未来收入状况进行分析、估计、推断。税收收入预测的结果虽然含有主观成份,但并不是毫无科学根据的主观臆测。构建地方税收入预测模型,对于地税机关科学编制税收计划,提高税收征管质量,发现税收管理的科学规律,具有十分重要的参考价值。
一、基本理论
影响地方税收入的决定因素主要包括三个方面,一是经济发展水平,表现为经济总量、增长趋势、产业和行业结构布局;二是税收政策,表现为国家税制及局部性、区域性的税收优惠政策;三是税收征管力度。实证分析表明,税收收入增长与上述三个方面因素有着基本对应的量化关系。税收收入预测的基本思路就是鉴往知来,依托这种量化关系,对宏观税源及征管效能进行测算,进而预知未来税收收入数量。考虑其他影响因素后,即可建立如下地方税收入的线性预测模型:
y=f(经济发展水平,税收制度,征管力度,其他随机因素……)
二、指标与变量
为使上述关系式模型能够实际计算,必须确定各项要素与税收收入的关联指标。经济发展水平是核心因素,总体上决定可能的税收收入规模;一般认为,宏观经济税源用GDP代表。各税种收入均可用与其计税依据相关的指标进行测算,但受指标体系自身和调查统计手段的限制,目前尚不能取得各项指标的精确数据,仅能指出一些与之密切相关的代表性指标,如:地方税收入总量与国内生产总值(GDP)、营业税与第三产业及建筑业营业额、企业所得税与利润总额、个人所得税与城乡居民可支配收入、土地增值税与房地产开发业销售额等。
征管力度因素难以具体量化,并且作用机理依附于经济发展水平,实践中可用回归分析的方法予以确定。在国家税制没有发生根本性变革的情况下,局部性、区域性的优惠税收政策效应在各税种收入之间存在互补关系,对税收总量的影响不大,在较长时期(大于一个年度)内税收政策因素可作为一个常量对待。
据此,将税收收入的线性预测模型转化为:
y=abxµ
其中:x是自变量,表示预测期间的经济税源数量;y是因变量,表示预测期间税收收入的估计值;µ表示影响地方税收入的随机变量。ab是待定的未知参数,a又称为截距(Intercept),表示因变量不受自变量影响时的期望结果,b又称为斜率或回归系数(X Variable),表示因变量受自变量影响的程度。ab的值可用普通最小二乘法求得,其计算公式为:
b(nΣxyΣxΣy)/[nΣx2(Σx)2]
a(ΣybΣx)/n
其中:Σ是求和符号,xy分别表示选取样本中自变量和因变量的观察值,n表示观察样本的容量。
三、假设与检验
模型是对现实世界的简化和抽象,模型化方法便于抓住事物内在本质,是定性与定量分析的
基本方法。任何模型背后都有一些假设,这些假设通常需要用实际数据加以检验。地方税收入线性预测模型的假设,是税收收入确实来源于经济,作为衡量经济发展成果的总指标——GDP数据真实可靠,并且地税征管秩序保持平稳协调,不会因为各种干扰而大起大落或者突然中断。只是因为这个假设太平常,人们往往认为它理所当然,不去深思把它当作理论模型的前提假设,但它对于预测未来税收收入却是必不可少的。
模型检验的主要内容有:变量相互关系的表现形式,一般通过绘制散点图观察其数据点分布是否呈直线趋势,以确定构建线性或非线性预测模型。线性预测模型主要检验变量间的相关系数(Multiple R)、判定系数(R Square地税税种及税率)以及回归系数显著性(t)检验、F检验、卡方(χ2)检验等。一元线性回归模型的相关系数、t检验、F检验及卡方(χ2)检验结果是一致的,相关系数的检验方法是比较其t统计量在给定显著性水平α下自由度为n-2的概率度tα/2n2),如果|t> tα/2n2),就认为变量之间总体相关各项检验都涉及一些复杂数学公式,我们可以利用软件工具处理。
下面,借助电子数据表工具软件Microsoft Excel,设置信度95%,即显著性水平α5%,对安徽省20002008年度经济和地方税收入进行线性回归预测。
分析结果的解释共三个部分。 “回归统计部分给出的相关系数为0.992,接近于1100%),表示因变量与自变量高度相关;判定系数为0.984,表示地方税收入的98.4%是由自变量GDP引起的;标准误差指出因变量估计值与实际值之间的平均平方误差,是对测量数据可靠性的估计。 方差分析部分的F统计量432.12远远大于其临界值(Significance F1.498F检验的显著性水平检验通过,证明回归方程确有合理的线性相关关系,预测模型从整体上适用。 “参数估计部分给出回归方程的截距和斜率的置信区间(95%)的上限和下限范围;截距为-86.12886,表示当经济发展水平不变时税收来源于经济的数量关系,截距为负值,揭示有些GDP成份没有为地方税收入作出贡献;斜率为0.05368,表明宏观边际税收负担率约为5.37%,即:在现有税制和征管水平条件下,平均每增加100GDP将导致地方税增收5.37元;t检验的P-value值(0.0005)远远小于α5%),t检验的显著性水平也获得通过。从以上回归分析结果,得到方程式:
y=-86.128860.05368x
利用回归方程计算的预测值是一个确定数,称为点预测。点预测结果可能不准确,必须进一步指出允许围绕点预测值上下波动的置信区间。以下是区间预测(95%置信度)近似的简易计算公式:
预测区间=y±概率度×标准误差
式中:y表示点预测值,概率度tα/2n2) 可以通过查t分布表求得。为简洁起见,这里以点预测值与实际值进行拟合比较,结果如图所示。
注:数据来源于各年度《安徽省国民经济和社会发展统计公报》、《安徽地税年鉴》。
四、应用
(一)预测未来若干时期地税收入。首先,求得全省20002008年的GDP年均增长率为11. 8%,据此计算2009年全省预期GDP9921.28亿元。然后将估计GDP值代入回归方程,则2009年全省地方税收入预测为446.45亿元,可信的预测区间为412.07480.82亿元。根据税收周期与经济周期相伴而生且基本同向波动的原理,可以判定在经济发展回升时期,税收收入只可能增长,不会出现下滑,故舍弃预测区间下限数额。实际运行的结果,2009年全省GDP10052.9亿元,增长12.9%地税收入485.4亿元,与预测上限值的误差仅有4.58亿元。
各地征管力度可能存在一定差异,但从各地自身情况观察,各年度之间征管力度的差异则是平滑变动的。因此,各地具体预测地方税收入时,应根据本地GDP和地税收入的历史数据进行回归分析,并以分析结果为预测依据。税收收入预测是一个逐步深化分析、不断完善模型的过程,不能仅靠一个公式、方程去解决全部问题。
(二)改进税收计划方法。长期以来,我们一直采用基数+增长系数法编制税收收入计划,这种方法虽然简易直观,可操作性强,但它基本上是从地方财政预算需要出发,就税论
税,割裂了税收与经济的必然联系。而运用回归分析法得出的预测结果,综合考虑了经济发展、税收政策、征管水平等各种影响因素及其变动趋势,更有利于指导税收计划编制过程中的科学决策。
(三)评价税源宏观质量。税源宏观质量是指经济税源适合实现税收收入的结构与增长趋势形态,具体来讲,就是由税收制度决定的可税GDP的比重。回归方程的截距主要就是反映静态经济结构与发展水平。不同经济结构的地区之间同等规模GDP产生的税收会有很大差异,原因在于并非所有GDP都可成为地方税的税基,第一产业GDP几乎不能提供任何地方税收入,第三产业中的政府部门、科教文卫及社会福利事业的增加值基本不能征税,非市场化的GDP产值(例如:固定资产折旧、库存商品货物等)也无法征税。GDP的结构与增量是构成税收收入增长的客观基础和必要条件。因此,要有效增加地方税收入,一要切实服务经济发展大局,积极培植税源,壮大税基。二要大力推动调整经济税源结构,发展含税量高的第三产业,提高GDP的地方税含量。
(四)考核税收征管质量。进一步拓展模型应用领域,研究制定一套标准化方法,分行业分税种剔除GDP中的不可税成分,分别进行回归分析,观察回归方程的截距是否大于零,用来
判断一个行业和税种的征收强度。同时利用代表性税基和法定税率相结合的方法估算各行业和税种的地方税收入能力,用估算的预期税收负担率对照回归系数,用来判断一个地区地税部门的征税努力程度。上述两项指标可以在较大时间跨度上对征管质量作出宏观评价,弥补现行征管质量 “六率考核办法与税源管理结合不够紧密的问题。