风险识别是对系统中特定范围的数据进行扫描,依照指标体系中设定的公式或规则对被扫描的系统数据计算和分析,将计算和分析的结果与分析模型库中的数值和区间进行比较,将风险设定值或区间范围内的纳税人信息生成风险信息库。这里的风险设定值或区间的边界,就是预警值。
预警值决定风险识别对象是否有风险。预警值的设置是否合理,直接决定了风险识别的效果,因此需要科学合理的设置。以下以增值税税负率为风险指标,以纳税人为风险识别对象,分析常用的预警值的设置方法。
增值税税负率=sum(当期应纳增值税额)/sum(当期按适用税率征税货物与劳务销售额)*100%
(一)人工定义预警值
根据经验人工设置预警值。如定义4%为风险预警值,则增值税税负率<4%的纳税人识别为风险。 这种方法过于简单,不能反映真实的情况,例如不同的行业,增值税税负率的风险标准不一样,识别出来的管户可能在某些行业过度集中,不具有代表性。
(二)按行业定义预警值
标准差怎么算按照国标行业,划定不同的风险预警值。如商业批发0.9%商业零售2.5%,卷烟加工12.5%。。。
这种方法有一定的普适性,但行业划分比较细的时候,人工设置的工作量比较大。而且在纳税人识别条件比较复杂(按行业,企业类型,隶属管理,地理位置等条件)的情况下,适用性会降低。
(三)统计学方法定义预警值
首先根据识别条件确定样本。通过计算样本内指标的平均值、标准差、离散系数进一步测算出预警值。
1.平均值。平均值即样本的指标平均水平,计算公式为:平均值=avg(增值税税负率i)
2.标准差。标准差体现样本的指标的最高值与最低值。计算公式为:
标准差^2=sum(样本i税负率-平均值税负率)^2/(n-1)
3.离散系数。体现标准差与平均值的偏离程度。计算公式为:
离散系数=标准差/平均税负。
4.预警值设置
①|离散系数|≤0.4 预警值下限=平均值-标准差,预警值上限=平均值+标准差。
②当|离散系数|>0.4
a.当平均值≥0时 预警值下限=平均值×(1-0.4),预警值上限=平均值×(1+0.4)。
b.当平均值 <0时 预警值下限=平均值×(1+0.4),预警值上限=平均值×(1-0.4)。
也就是说,如果离散度绝对值比较小的时候,说明增值税税负率比较集中,这样就可以以平均值-标准差作为预警值,从样本取出的结果作为风险;反之,如果离散度绝对值比较大的时候,说明增值税税负率比较分散,这样就可以以平均值×(1+或-0.4)作为预警值,从样本取出的结果作为风险。
统计学方法因为是以样本的平均值和离散程度来确定预警值,因此可以从识别对象中获取有效数据,保证识别结果有代表性,不受人为因素的影响。当然缺点是算法比较复杂,不易理解。
发布评论