浅谈政务服务热线的数据分析研判思路

    |     2021年4月19日   |   2021年, 客世原创   |     评论已关闭   |    2623

在“以一个号码服务企业和群众为目标,推动地方政务服务便民热线归并优化”的指导要求下,作为政府总客服的12345服务热线数据增长快速,服务热线积累了大量重要的数据,蕴含了市民对政府和社会公共服务方方面面的诉求、意见和建议,如果能够对这些数据进行整合和充分挖掘,对于改善政务服务工作质量、提升政府服务效率具有重要意义。然而目前热线数据挖掘利用的技术手段较为单一,热线数据的价值尚未得到充分挖掘,尚不能满足数字政府主张的“用数据对话、用数据决策、用数据服务、用数据创新”的目标。本文由笔者基于实际热线数据挖掘项目的验证总结而来,阐述如何利用文本分类、文本匹配、实体提取等AI技术模型,对非结构化的热线语音和文本数据进行精准化和精细化分析,为提升政府的社会治理工作能力、更准确地进行宏观决策和靶向治理提供关键数据支撑。

以数据驱动治理现代化是大势所趋

于2021年1月6日,为进一步优化地方政务服务便民热线,提高政府为企便民服务水平,国务院发办公厅布了《国务院办公厅关于进一步优化地方政务服务便民热线的指导意见》(以下简称《意见》),指出“以一个号码服务企业和群众为目标,推动地方政务服务便民热线归并优化,进一步畅通政府与企业和群众互动渠道,提高政务服务水平,建设人民满意的服务型政府,推进国家治理体系和治理能力现代化,不断增强人民群众的获得感、幸福感、安全感。”

日前,中国信息通信研究院发布《数字时代治理现代化研究报告——数字政府的实践与创新(2021年)》,报告指出,数据是数字政府的基础性要素,数字政府主张“用数据对话、用数据决策、用数据服务、用数据创新”,以数据引领各方面改革。

由此可见国家对于提高政府为企便民服务水平,以及通过数据驱动治理现代化的重视程度。

早在《意见》发布前,大部分城市已实施热线合并的工作,从合并后的结果来看,数据的量级、维度、复杂度大幅度提升。数据的变化对于负责热线运营的职能部门来说是挑战,同样也是机遇,挑战是要发挥数据的价值,在流程管理、数据规范、技术支撑上都需做出改变。机遇是政务服务热线作为“政府总客服,市民好帮手”,是连接政府与群众的主要渠道,肩负着了解社情民意的使命,热线运行过程中积累的海量数据包含了丰富的城市民生信息,经过分析挖掘后将能成为城市治理的宏观决策、靶向治理的有力支撑。

政府服务热线的数据分析和应用现状 

目前,政务服务热线12345的数据来源大概分为以下几种:12345电话热线、微信公众号、APP、门户网站、市长信箱、人民网留言板等渠道,主要为公众提供查询、咨询、投诉、求助、公共服务、意见建议征集、民意调查等非紧急类政务服务。目前,作者所服务的热线单位非常重视数据分析工作,组织了专门的数据分析人员对来电量、分类、解决率、处理时长等热线数据进行分析,并形成定期的数据分析报告,用于评估热线的服务质量、改善热线联动单位的服务能力。然而,在实际工作中,对热线数据的分析由于技术手段和数据质量的原因,仍然存在较大的提升优化空间。目前,作者所服务的热线单位针对热线数据进行分析和应用大概有以下几种潜在问题:

1、热线数据源头质量控制问题

在热线实际工作中,除了电话热线之外,其他渠道都会提供简要的表单给公众填写案件内容,电话热线则由热线座席人员在接线的过程中询问案件情况并填入工单。但不管什么渠道,都会存在数据质量方面的问题,尤其是案件分类质量不够准确,对后续的数据分析影响很大。案件分类不准确的原因,一种是市民自己填的时候,不清楚所反馈的情况属于哪一分类,存在分类选择错误的情况,特别是类别描述较为相近的情况下,市民大多是分不清楚的,市民也没有耐心去认真选择类别。对于座席人员来说,座席人员流动性较高,能力参差不齐,经验不足的座席人员也存在分类不准确的情况,以上两种情况都会给后期的统计分析工作带来数据质量问题,从而影响分析的结果。

特别是在热线合并之后,工单的类别的数量相比合并前增加了十几倍,分类不准确的情况会更为凸显。

2、对非结构化的热线数据缺乏有效分析手段

热线的工单数据一般由结构化字段和非结构化文本构成,工单的描述部分是非结构化文本,一般由市民自己编写(微信、APP、Web等线上渠道),或通过电话热线口述后由座席人员录入系统,这部分内容其实包含了非常重要的线索信息,如涉事主体:公司名称、商场、出租车车牌(关联出租车公司)等信息,传统的统计手段主要是通过工单系统、Excel按工单的类别、分布情况做简单的统计,忽略了非结构化文本部分所包含的信息,以至于分析仅停留在浅层,对于潜在的社会事件因素发现不充分、不及时,以至问题的治理治标不治本。

3、缺少支撑多元需求的热线数据分析研判平台

对于负责热线的职能部门来说,除了要把工单派发给相应的处理单位之外,还存在定期向上级部门汇报的工作要求,目前主要以人工进行热线数据分析、手工编写周报、月报、季度报、半年报、年报的方式向上呈报,报告的观点和结论由数据统计的结果支撑。虽然目前的工单系统也能提供数据统计和可视化服务,但缺少对数据进行深度分析、线索发现、报告生动生成等能力,不足以支撑职能部门的线索分析发现、向上汇报和管理决策等多元需求。

既然要通过数据支撑城市治理工作的宏观决策和靶向治理,那么工单数据归类的准确性、分析要素的精细程度、分析结果的展现和应用等方面的工作都尤为重要,缺一不可。

热线数据分析和应用技术解决思路

我们基于对目前热线数据分析和应用存在的问题,结合文本分类、文本匹配、实体提取等AI技术模型,提出以下技术解决思路。

思路1:做准工单分类,助力工单数据的精准化分析。

如前文所言,工单的类别随着热线的合并后增长好几十倍,市民提交时容易选错类别,座席人员受理和分派时也存在因为经验不足、业务变化等因素导致分类错误,以至于后期对工单数据进行统计分析时得出不够准确的结论。

下面将基于两种情况来阐述如何做好工单分类的工作。

第一种情况是座席人员人员流动较频繁,新员工经验不足导致分派错误的情况,虽然新的座席人员经验不足,但是长年下来积累的数据就是很好的经验。因此,我们可以通过基于正确的历史数据训练智能案件分类模型,训练好的模型一方面可以在录入工单时为座席人员或市民推荐合适的工单分类,如果分类推荐不正确,则在后期被工作人员修正后,再重新基于修正后的工单数据学习,以提升准确率。另一方面,可以供工作人员做数据分析时,对数据做分类准确性的核查,如果识别到可能错误的分类,则反馈给工作人员确认,确认的结果同样可以作为模型学习的数据提升模型的准确率。

另一种情况是业务发生变化的情况,此种情况下一是没有历史数据,二是座席人员经验不丰富,最典型的就是2020年初新冠肺炎爆发后,关于疫情防控的话务量剧增,且短时间内座席人员对新业务的类别识别能力尚未建立起来,这给后期的热线数据分析工作带来了很大的压力。针对此种情况,可由人工先对一定量的工单进行分类标注,再基于标注好的工单数据训练文本分类模型,逐渐提升准确率,从而降低对人工分类的依赖,降低运营人员的压力同时提升数据分析的效率。

保障工单分类正确,是数据分析研判精准化的前提,相较于人工分类,通过深度学习模型推荐分类更具有稳定性、经济性等优势,同时也是数据价值的一种体现。

除了通过文本分类模型支持工单分类之外,未来还可以尝试通过知识图谱辅助对工单内容进行语义理解提升分类的准确率,有知识图谱作为背景知识,可进一步降低依赖人工标注数据的需求。

思路2:做实精细化分析,助力工单的深层线索发现。

市民在投诉的时候,往往会在工单的详细描述部分描述事件发生的经过、涉事主体、场所,细节较多。如市民来电投诉某某CBD有传销组织、xxx公司提前复工、xxx公司拖欠员工工资,统计的时候,大多是按能标准化的字段统计到区县或社区,由于做不到做精细化分析,分析的结论可能会是xxx行政区拖欠员工工资的事件较多,但是没有分析出具体的位置和涉事主体信息,如到底是哪一个具体的位置或哪一家公司的情况比较突出。

基于以上提到的精细化分析需求,可基于文本匹配模型和实体抽取模型对非结构化的文本进行计算和分析,通过文本匹配模型计算工单的相似度,来预测在某一细类下的工单的相似情况,对工单进行聚类,发现新的工单分类。实体抽取模型则可以在抽取工单所涉及的实体信息方面发挥作用。

通过文本匹配模型发现案件的相似性:比如通过模型发现过去几个月里,每个月都有大量的相似案件产生,但是目前并没有相应的更细的类别,但此类案件的发生又是常态,那么预测的结果就可以给到职能部门作为参考,是否有必要增加新的细类,完善治理领域的分类框架。

通过实体抽取模型建立案件的相关性 :基于文本匹配模型分析后,进一步发现了相似案件的发生情况,但挖掘同一涉事主体的相似案件,依然存在困难,这主要是因为涉及主体基本上都是在非结构化的工单描述部分体现。在文本匹配模型输出的结果之上,通过实体抽取模型,可以更好地发现相似案件里更深层次的相关性,比如过去几个月里发生的相似案件里,其描述内容里都体现了xxx公司、xxx商场,如此一来,分析的结果有了更为明确的指向,这也是支撑职能部门进行靶向治理的有力线索。

思路3:做好数据分析研判平台,支撑热线服务的多元化需求。

数据研判平台一方面可以把预分析好的数据进行可视化展现和提醒预警、自动生成报告。另一方面,还需能支持热线数据分析运营人员做自定义、更深层次的关联性分析,对数据进行深度的探索,以此支持新的发现。比如火车站边上经常发生非法营运事件,发生的频率还不低,且都处理已处理的状态,但是经过与GIS系统进行关联性分析,发现附近就有一个执法单位,那么是否存在执法不力的情况呢?

数据可视化:基于底层模型的分析能力,搭建上层的数据可视化平台,为职能部门提供了全方位的数据可视化能力。如图1所示,通过全景视图,结合职能部门的GIS地图呈现各区域的案件情况,可展示案件类别占比、重点行业数据分析、案件趋势、热点事件词云图、预警提示等信息。

图 1:数据分析研判可视化

线索发现:基于文本匹配模型、实体抽取模型做精细化分析后的结果,可供工作人员快速筛选和查看线索。如图2所示,尽管第一行和第三行数据的类别都一样,但通过文本匹配模型计算后得出分别属于两种不同性质的案件,且在某几个月里频繁发生了许多次。基于线索的提示,职能部门就能指向性地研判该类案件背后发生的原因,从本质上解决问题。

图 2:治理线索发现

专题报告:专题报告是职能部门向上汇报工作情况的文件材料,可分为周报、月报、季度报、半年报、年报,内容主要是周期内的数据总览、各类问题的占比情况、案件变化趋势、TOP K的数据统计、各行政区案件统计、高频热点问题统计、突出案件统计、重点领域数据统计等。如图3所示,报告的模板可在平台里定制,系统会基于模板配套数据后按生成策略,在对数据进行分析后,自动生成报告,并将报告提供给目标用户进行深度分析,除了辅助领导研判以外,还可以推送给行业、区域的主管领导,以达到行业整治、服务提升的效果。相比以往的手工数据分析和报告生成,自动化的数据分析和报告生成工具有效地提升了工作效率和数据分析研判的及时性,大大降低了热线数据分析的成本,并让数据分析结果产生了更多的价值。

图 3:数据分析研判报告定制

数据分析研判的价值  

随着政府数字化转型的推进,数据孤岛的情况将会得到改善,除了合并后的热线数据之外还可以与其他政务数据进行融合,数据量也会越来越大,以数据为基础资料,以数据智能化技术为抓手,构建政务服务热线的数据分析研判平台,能有效地激活数据、发挥数据的价值。

对于工作人员来说,能提升数据分析工作效率,减轻工作量,可以及时向决策领导反馈热线运营情况。

对于职能部门来说,可考核职能部门的民生问题治理情况,防止执法不力的情况,可作为绩效评价依据,助力治理水平提升。

对于社会公众来说,能切实发现人民群众生活中所遇到的难题,靶向治理,提升市民的生活水平。

对于管理决策来说,能及时获取民生问题反馈,通过精准化、精细化的数据分析研判,辅助决策的科学化、治理的精细化、服务的高效化。

 

作者:杨小龙;就职于贵州小爱机器人有限公司;

本文刊载于《客户世界》2021年4月刊。

 

转载请注明来源:浅谈政务服务热线的数据分析研判思路

相关文章

噢!评论已关闭。