2019年第24期(总第240期)经济纵横
高华川
(天津财经大学统计学院,天津300222)
摘要:随着大数据时代的到来,机器学习在经济学中的应用越来越广泛。本文梳理了机器学习的含义、机器学习与计量经济学模型的区别以及机器学习在宏观经济预测以及因果推断中的应用。
关键词:机器学习;经济学;大数据时代
大数据时代的迅猛发展,在全球范围内掀起了前所未有的浪潮。克拉克奖得主Susan Athey断言:我相信机器学习将在短期内对经济学领域产生巨大的影响。事实上,机器学习已经开始对经济学产生影响。目前机器学习方法在经济学中的应用主要包括两部分:预测与政策评估。
目前我国对大数据机器学习方法在宏观经济领域的应用研究与国外相比还有较大差距。因此,探索大数据机器学习方法在我国宏观经济实时预测以及因果推断、政策评估中的应用,不仅具有重要的学术价值和应用价值,并且对实时预测我国整体经济运行状况、经济周期转折点的确定以及政府及时准确地选择宏观调控政策也具有重要意义。
一、什么是机器学习
(一)机器学习的含义
刘真的老公人类的学习过程,是通过对经验的归纳总结,从而能够在面对新情况时做出有效的判断或决策。而机器学习研究如何通过计算机模拟或实现人类的学习行为,通过对经验(在计算机系统中以“数据”的形式存在)的利用来改善系统自身的性能。
数据中反映事件或对象在某方面的表现或性质的事项,称为“属性”或“特征”,通常用X表示;数据中有关结果变量的信息,称为标记,通常用Y表示。根据数据中是否拥有标记信息,机器学习任务可大致划分为两大类:“有监督学习”和“无监督学习”。
有监督学习研究的是预测问题,利用数据集中特征变量X 和结果变量Y的信息构建μ(x)=E(Y|X=x)的估计量μ(x),以更好地预测独立数据集中Y的真实值。若结果变量Y是定性变量或分类变量等离散型变量,则称此类学习任务为分类;若结果变量Y是连续性变量,则称此类学习任务为回归。在分类的情况下,目标是准确地分类样本。
尹天照身高在无监督学习中没有标记信息Y,目标是通过对无标记样本的学习来解释数据的内在性质与规律,为进一步的数据分析提供基础,常见的无监督学习包括聚类、密度估计、异常检测等。
黄宗泽唐嫣
二、机器学习与普通宏观经济预测模型的区别陈键锋林心如
(一)机器学习并不涉及识别问题
机器学习方法仅关注预测准确性问题,因而在使用数据来选择函数形式方面具有很大的优势。而宏观经济模型主要关注模型参数的识别问题以及因果推断问题,因此通常对模型形式做一定的假设。
(二)机器学习将经验分析视为估计和比较多个备选模型的“算法”重庆师范大学2019年录取分数线
这一方法与宏观经济学不同,宏观经济学家基于经济理论选定一个模型,且只估计一次。相反,机器学习将“调参”作为算法的一部分。调参实际上就是模型选择,并且在机器学习算法中是数据驱动的。这种方法有很多优点,包括性能的改进,以及使研究人员能够系统和全面地描述他们选择模型的过程。当然,交叉验证在历史上也被用于经济学,例如为核回归选择带宽,但是它被看作是机器学习算法的基础部分。
三、机器学习在宏观经济预测中的应用
实证的政策研究往往侧重于因果推断。由于政策选择依赖于反事实的估计,因果关系和政策的紧密联系似乎是自然的。虽然许多情况下都存在这种联系,但也有许多政策应用,因果推断并不重要,甚至不是必要的。
(一)机器学习在宏观经济预测中的难点
众所周知,大多数机器学习方法均要求样本是独立同分布的,即从总体中简单随机抽样,然而,经济变量,尤其是宏观经济变量通常是时间序列变量,其必然不满足独立同分布要求。这是目前限制机器学习在宏观经济预测中应用的主要难点。
(二)机器学习在宏观经济实时预测中的应用
目前的研究热点为实时预测。实时预测的意思是预测经济变量的当前值,例如,预测当前季度GDP增长率。由于经济数据的发布具有不同程度的滞后,中央银行与各政府部门经常是在不了解当前经济状态的情况下做出政策决策,有时甚至不知道上一期的经济状态。因此预测当前或前一期的经济状态便成为非常重要的任务。实时预测的关键在于如何处理由于数据发布时间不同所造成的样本尾部“参差不齐”以及混频问题。
国外存在大量应用机器学习方法进行实时预测的文献,例如:Giannone et al.(2009)开创了大数据动态因子模型在宏观经济预测领域的先河。Chakraborty(2017)研究了机器学习方法在中央银行事务中的应用。
其他机器学习用于预测的例子包括:(i)在教育中,预测哪位教师将具有最大的附加价值;(ii)在劳动力市场政策中,预测失业期长度,以帮助工人决定储蓄率和求职策略;(iii)针对健
*基金项目:本文得到天津市哲学社会科学研究规划项目“大数据背景下的宏观经济实时预测”(TJTJ16-001Q)资助。152
发布评论