以八闽健康码为例,分析健康码系统的技术路线及运维管理策略
作者:***
来源:《中国信息化》2022年第02期
        新冠肺炎疫情发生以来,我国在党中央的坚强领导下,坚持人民至上、生命至上,按照“坚定信心、同舟共济、科学防治、精准施策”总体要求,万众一心,攻坚克难,较短时间内就取得疫情防控重大战略胜利。在此过程中,信息化技术为提高疫情防控工作水平发挥了重要作用,其中健康码系统在支撑疫情流调溯源、促进人员安全有序流动等方面作用明顯,成为各省疫情防控信息化标配的建设内容,但由于实现技术、运维管理等因素影响,健康码系统卡慢、服务停摆、生成码不准确等影响众出行的事件时有发生。当前,在奥密克戎变异毒株横行肆虐,疫情持续反复,防控形势依然严峻复杂的情况下,切实根据健康码系统应用特点,做好系统优化提升和运维保障工作,确保系统安全稳定运行,显得尤为重要。
        健康码系统主要由健康码APP和健康码后端系统组成,健康码APP可以独立建设,也可以依托已有的已广泛安装使用的APP,如政务服务APP建设。其常用功能包括:实名认证领
筒骨汤的做法
苏志燮女友取健康码;出示代表健康信息的二维码,用于安全出行证明,其颜代表用户健康状态,绿码表示未见异常,可正常通行,黄码表示需要开展排查或需要进行健康监测,红码表示要采取定点医疗机构隔离或隔离医学观察;扫描健康码系统生成的粘贴码,用于记录用户到访轨迹,便于疫情流调溯源;预约疫苗接种的地点和时间;出示医保电子凭证,用于就医购药;查看本人疫苗接种、核酸检查、行程卡等健康信息;为家里老人和小孩代领健康码,此外还提供机构组织和个人申领粘贴码功能。
        健康码后端系统主要为前端APP提供功能支撑,通过汇聚确诊人员、初筛阳性人员、密接次密接人员、发热人员、封控管控区人员、区域协查人员、潜在风险人员等信息,以及交通出行信息、位置轨迹信息、出入境信息、核酸检测信息等,并查询对接的全国一体化政务服务平台防疫健康信息、省内疫苗接种信息系统等相关数据,按照卫生主管部门制订的健康码生成和转化规则,自动进行核查推算,实时生成健康码和相关信息,为健康码APP提供应用支撑。
        健康码作为疫情期间人员安全出行的凭证,系统在应用上明显表现出如下特点。
        (一)健康码APP成为出行必备应用,注册用户数规模庞大
        疫情期,在交通出行、返岗复工、医院就诊、景区旅游、商超入口等场景都需要查验健康码,健康码APP成为人们必须在手机下载安装的应用之一,用户数量庞大。如包含健康码功能的闽政通APP注册用户数已超4000万。
        (二)每天高峰时段相对固定,疫情期日访问量较高
        以八闽健康码为例,省内发生本地疫情时,系统一天活跃用户高时可达到1200万人,高峰时每秒并发超过3000人,有时甚至超过5000人,疫情散发点越多越严重,访问量也就越大。而长时间无疫情期时,一天活跃用户只有400万人,高峰时每秒并发访问量不到200人。系统每天的访问高峰通常发生在单位上班和学生上学等主要时间段里。应用访问量表现出波峰波谷明显的特点。
        (三)应用服务中断,将严重影响出行
        当健康码APP出码卡慢时,易造成交通场站、医院入口堵塞排队,降低通行效率,造成不便。若发生服务中断,且没有替代方案,将无法判断健康状态,严重影响人员流动,若放弃核查健康码,让人员随意流动,将面临病毒传播扩散风险。
        (四)系统数据质量高低,影响健康码应用成效
        为能准确生成健康码,健康码系统需要汇聚处理多个部门、多个系统的涉疫情数据,这些数据能否从源头开始全面、准确、快速地汇聚到健康系统数据库,将直接影响生成健康码的及时性和准确性,影响健康码应用成效。若健康码不准确,把本是绿码的赋成黄码或红码,将造成出行活动严重受阻,招致用户投诉,反之把本是黄码或红码的赋成绿码,或者没有及时赋码,也会造成病毒传播扩散风险。
        从上述应用特点可以看出,健康码系统是典型的高并发、高可用、高可扩展应用,在整个系统设计中,应围绕无单点故障宕机,支持快速横向扩展,支持限流、服务降级熔断等能力要求进行设计。主要采用如下技术。
        (一)充分拆分业务,构建分布式应用架构
        要实现高可用、高并发和高可扩展目标,需采用分布式架构。健康码系统业务包括用户认证、健康码生成、扫粘贴码、核酸数据处理、第三方接口调用等业务,按照依赖最少,独立性最强的原则,将系统业务拆分,形成可以独立部署的子业务,子业务应用基于
虚机云或容器云进行部署,确保具备弹性伸缩,横向扩展的能力,并结合采用集技术消除单点故障,提高系统容错能力。
        (二)采用应用层负载均衡,自动管理集中服务节点
        负载均衡一般有网络层负载均衡和应用层负载均衡,而应用层负载均衡能更好判断识别系统和应用出现故障或异常的节点,并及时将它剔除出集,避免拖跨整个系统。通过搭建应用层负载均衡服务器,接入后端系统集服务节点,由应用层负载均衡服务器根据节点系统与应用的状况,按照预设的算法分配请求负载,从而实现高可用应用。
        (三)搭建数据库集,确保数据库连续可用
        采用数据库集技术,提高数据库处理能力,同时避免出现单点故障,导致数据库系统不可用。
        (四)利用缓存技术,减轻数据库访问压力
        健康码采用实时查询计算方式生成,高峰期数据库压力大,数据库连接数存在上限,
需利用缓存技术,将不经常变化的数据保存到缓存系统,通过访问缓存系统获得数据,以便大幅减轻数据库的压力,提高系统并发能力。如用户基础信息、疫苗接种信息、认证状态等数据变化频率小,可以通过缓存技术提高整个数据访问效率。也有省份健康码系统将生成的健康码进行缓存,有效期一天。好处是数据库压力大幅减小,但健康码实时性不够强。
        (五)采用全过程全节点监控技术,第一时间发现系统潜在问题
        分布式系统完成一个请求的处理,往往需要调用多个节点的服务,访问量高峰时间段,流量所经过的任何节点的异常,都有可能快速引发链式异常反应,若发往上游的请求得到不处理和释放,必将导致下游接收请求的堆积,直到所有节点被请求堵满,资源耗尽系统崩溃。因此,需构建全链路运维监控系统,实现对健康码系统网络、服务器、数据库、中间件、应用系统和缓存服务器以及第三方关联系统全面监控和日志采集,达到系统运行全局可视、自动告警、快速定位和处置故障,避免系统整体失效和服务停摆。
        健康码系统安全稳定运行,既要靠良好的系统设计、高质量的开发建设,以及持续的迭代完善,也要靠扎实有效的日常运维保障和管理工作。应根据健康码系统的应用特点和
技术环境,制订相适应的运维管理策略和办法,并加以落实。
        (一)组建技术团队,加强系统值班值守
        成立健康码运维保障工作专班,成员包含网络、基础云平台、数据库、软件系统等技术人员,同时实行集中办公,便于应急会商和处置。省内发生疫情,需加强日常值班值守,中小学开学、重大会议、重大活动和省内突发疫情等重保时期,应开展24 小时现场保障,上班高峰时段,运维人员应现场通过监控系统,密切关注监控信息,出现异常,迅速组织技术人员做好分析研判,果断处置,把造成的影响降到最小。
        (二)强化测试验证工作,确保系统迭代升级平稳
dnf极限的祭坛攻略
        因生成和转化码规则调整等原因,健康码系统软件需经常更新迭代。为确保修改后的软件上线能正常运行,避免因各种bug导致生产系统故障。需搭建准生产环境,按实际生产环境20%-30%配比,配置资源,上线前先在准生产环境做好验证测试,通过后再更新上线。同时还可以在准生产环境,开展高并发仿真压力测试,评估系统并发能力,诊断系统性能瓶颈,为提升系统性能提供参考依据。
        (三)加强源头数据治理,提高系统汇聚的涉疫数据质量
        健康码的应用成效与健康码系统汇聚的疫情相关数据的质量息息相关,这些数据主要来自卫建、公安、工信、交通等部门。要通过建立各类数据流转处理的机制,明确各环节数据处理操作任务、处理时限、接收和发送的数据格式等内容,并固化到工作流程或平台代码中,确保数据准确及时地汇聚到健康码系统,从而提高健康码的应用成效。
        (四)加强部门间协作沟通,提早做好应对访问高峰的准备李国毅
        若出现学校开学或重大活动需要查验健康码,对系统可能产生访问量高峰情况,要及时向教育部门等单位了解查验健康码方式、时限要求等,根据情况,及时扩展增加系统资源,提高系统承载能力,并加强系统现场值班工作。
        (五)开通健康码客服热线,加强使用过程中服务
        依托运营商专业团队,开通健康码,为使用中出现的各种健康码问题提供咨询和处理服务。同时,及时根据业务变化,梳理健康码系统知识,对客服人员进行业务培训,提高服务质量,减少因健康码问题,给众出行造成不便。
彭怀安
        (六)利用健康码互认机制,做好系统应急预案
        由于信息系统的复杂性,有时出现系统崩溃服务中断是难以避免的,需提前制订好应急预案。利用国家出台的有关健康码互认机制,万一出現本省健康码系统服务中断情况下,可以通过页面提示或直接跳转方式,引导用户使用或支付宝中的国家政务服务平台防疫健康信息码,避免影响众出行。同时,为确保国家政务服务平台生成的防疫健康信息码的准确性,日常需按相关要求,做好本省涉疫情数据向国家政务服务平台的推送工作。
        由于健康码系统的重要性,运维保障工作要全力做到访问量低时系统稳定高效运行,访问量超出系统并发设计能力时,系统也要能提供能力范围内的服务,不出现整体系统崩溃,服务全面中断,影响疫情防控工作的情况。健康码系统的安全稳定运行,不但能有力支撑疫情防控工作,而且也在一定程度上体现出省域范围整合开发利用政务数据的能力和水平。