高度结构化的ESG数据是开展ESG投资的重要基础设施,但是目前国内ESG数据质量较差,整体信息披露率较低,部分关键指标更是严重缺失,例如碳排放披露率不足5%,同时由于ESG评分结果需要具备可解释性,使得ESG数据治理工作难度较大。围绕ESG数据治理,我们通过实战案例对数据获取、体系搭建与资产沉淀等不同环节进行介绍与探讨,并对中信证券ESG通用评级体系的39个指标进行了数据治理剖析。
▍ESG数据披露标准不一,完善程度有待提升,数据治理扮演重要角色。
上市公司CSR报告是ESG评分最重要的数据源之一,报告在信披维度上直接受到ESG 信披标准影响。国际信披体系发展成熟,多项标准互为补充;国内强调本土国情,但在规范与执行层面均有较大提升空间。2021年,仅有约30%的A股上市公司披露了CSR报告。数据缺失、透明度低等现状容易导致ESG理念难以量化与指标失真等问题,因此在完善的披露体系与标准化披露落地形成之前,数据治理将持续扮演重要角色。
▍ESG数据治理方法:因“数”制宜,强调“逻辑”与“理念”的双重可解释性。
本质是在披露体系与数据质量不完善的基础上,为了得到更准确结果的处理手段。与其他应用数据治理方法相比,ESG数据治理更加突出强调可解释性,具体包括但不限于以下维度:底层数据处理逻辑可解释、指标处理流程对ESG理念可解释、指标处理结果与公司实际情况可解释、行业间可比的处理逻辑可解释以及最终结果对应用方向可解释。
▍ESG框架搭建中数据治理难点在于,对数据与行业的理解缺一不可。
ESG原始数据来源多、形式广,另类数据占比可45%,需要专业的数据团队或供应商提供有效的数据获取支持;数据标准化难度高,单纯依赖人工处理数据的成本高昂,需要借助机器学习等金融科技手段提升数据处理效率;ESG框架的可解释性与数据处理的每个环节息息相关,需要研究团队具备足够的ESG概念理解、行业理解和数据理解,才能自下而上保证流程的合理性和结果的科学性。
▍中信证券ESG评分体系数据治理方法: 贴近国情、聚焦实战。
本文结合A股ESG数据现状,分析了中信证券以实战需求为导向的ESG评分体系下39个指标对应的数据治理框架。在数据上我们新引入了第三方数据源,并对指标进行合理调整。在量化方法上,我们对指标按属性进行分类,并依据自身特点选择合适的缺失值补充方案和量化方案。最后以“安全生产处罚”指标的详细过程为例,凸显ESG数据处理的可解释性。
▍ESG数据治理过程中的资产沉淀,可以为不同场景引入新数据、新指标。
ESG框架搭建可以分为多个环节,每个环节的数据处理流程都会产生不同维度的数据结果。通过将这些中间数据资产化,可以对ESG体系形成可以解释性,也可以对基本面与量化研究形成不同维度的支持。数据治理不同环节的输出,可以通过标准化数据库存储的方式形成结构化的数据资产。
▍风险因素:
ESG相关政策落地不及预期;ESG数据供应商竞争格局剧变。