1、养老保险养老保险联网数据应用联网数据应用分析框架分析框架联网数据应用联网数据应用联网数据应用联网数据应用综合查询综合查询公众服务公众服务业务支持业务支持测算支持测算支持模型数据模型数据支持支持联网数据分析联网数据分析联网数据分析联网数据分析分类分类归纳归纳比较比较关联关联预测预测数据分析数据分析数据挖掘数据挖掘数据统计数据统计对数据进行有效的组织对数据进行有效的组织(排列组合)、整理及(排列组合)、整理及特征提取,常用于用户特征提取,常用于用户查询,交互性强查询,交互性强深层次的数据分析,找出深层次的数据分析,找出数据中潜在的规律和趋势,数据中潜在的规律和趋势,常用于决策分析系统(如常用于决策
2、分析系统(如精算领域中模型的建立和精算领域中模型的建立和应用)应用)数数据据仓仓库库技技术术一、联网数据指标结构一、联网数据指标结构一、联网数据指标结构一、联网数据指标结构交换库指标交换库指标期别类期别类地区代码类地区代码类单位信息类单位信息类职工信息类职工信息类离退休人员信息类离退休人员信息类一、联网数据指标结构一、联网数据指标结构单位信息类单位信息类单位自然属性单位自然属性单位社会属性单位社会属性单位参保属性单位参保属性单位基金属性单位基金属性一、联网数据指标结构一、联网数据指标结构单位自然属性单位自然属性第第3 3项:项:单位编号单位编号第第4 4项:项:单位名称单位名称单位社会属性单位
3、社会属性第第5 5项:项:单位类型单位类型第第6 6项:项:组织机构代码组织机构代码第第7 7项:项:经济类型经济类型第第8 8项:项:隶属关系隶属关系第第9 9项:项:所属行业所属行业一、联网数据指标结构一、联网数据指标结构单位参保属性单位参保属性第第10项:项:征缴方式征缴方式第第11项:项:单位参保缴费状态单位参保缴费状态第第12项:项:参保日期参保日期第第13项:项:单位缴费基数单位缴费基数一、联网数据指标结构一、联网数据指标结构单位基金属性单位基金属性第第14项:项:本月应缴金额合计本月应缴金额合计第第15项:本月单位应缴金额项:本月单位应缴金额第第16项:本月个人应缴金额合计项:本
4、月个人应缴金额合计第第17项:本月实缴金额合计项:本月实缴金额合计第第18项:本月单位实缴金额项:本月单位实缴金额第第19项:本月个人实缴金额合计项:本月个人实缴金额合计第第20项:本月补缴金额合计项:本月补缴金额合计第第21项:本月单位补缴金额项:本月单位补缴金额第第22项:本月个人补缴金额合计项:本月个人补缴金额合计第第23项:本月补缴滞纳金项:本月补缴滞纳金第第24项:本月补缴利息项:本月补缴利息第第25项:累计欠缴金额合计项:累计欠缴金额合计第第26项:单位累计欠缴金额项:单位累计欠缴金额第第27项:个人累计欠缴金额合计项:个人累计欠缴金额合计一、联网数据指标结构一、联网数据指标结构职
5、工信息类职工信息类在职职工自然属性在职职工自然属性在职职工社会属性在职职工社会属性在职职工参保属性在职职工参保属性在职职工基金属性在职职工基金属性一、联网数据指标结构一、联网数据指标结构在职职工自然属性在职职工自然属性第第32项:姓名项:姓名第第33项:性别项:性别第第34项:公民身份号码项:公民身份号码第第35项:民族项:民族第第36项:出生日期项:出生日期在职职工社会属性在职职工社会属性第第30项:项:所在单位编号所在单位编号第第31项:项:个人编号个人编号第第37项:户口性质项:户口性质第第38项:个人身份项:个人身份第第39项:从事特殊工种月数项:从事特殊工种月数第第40项:参加工作日
6、期项:参加工作日期一、联网数据指标结构一、联网数据指标结构在职职工参保属性在职职工参保属性第第41项:项:建立个人帐户日期建立个人帐户日期第第42项:个人缴费状态项:个人缴费状态第第43项:中断或终止缴费原因项:中断或终止缴费原因第第44项:个人缴费基数项:个人缴费基数第第52项:累计缴费月数项:累计缴费月数在职职工基金属性在职职工基金属性第第4545项:项:本月个人应缴金额本月个人应缴金额第第4646项:个人身份参保职工本月个人应缴统筹金额项:个人身份参保职工本月个人应缴统筹金额第第4747项:本月单位缴费应划入个人帐户金额项:本月单位缴费应划入个人帐户金额第第4848项:本月个人实际缴费金
7、额项:本月个人实际缴费金额第第4949项:本月单位缴费实际划入个人帐户金额项:本月单位缴费实际划入个人帐户金额第第5050项:个人帐户中个人缴费部分累计本息项:个人帐户中个人缴费部分累计本息第第5151项:个人帐户中单位划入部分累计本息项:个人帐户中单位划入部分累计本息一、联网数据指标结构一、联网数据指标结构离退休人员信息类离退休人员信息类离退休人员自然属性离退休人员自然属性离退休人员社会属性离退休人员社会属性离退休人员参保属性离退休人员参保属性离退休人员基金属性离退休人员基金属性一、联网数据指标结构一、联网数据指标结构离退休人员自然属性离退休人员自然属性第第57项:姓名项:姓名第第58项:性
8、别项:性别第第59项:公民身份号码项:公民身份号码第第60项:民族项:民族第第61项:出生日期项:出生日期离退休人员社会属性离退休人员社会属性第第55项:项:原单位编号原单位编号第第62项:项:个人编号个人编号第第63项:参加工作日期项:参加工作日期第第64项:离退休日期项:离退休日期第第65项:退休前个人身份项:退休前个人身份第第66项:原单位类型项:原单位类型第第67项:离退休类别项:离退休类别 一、联网数据指标结构一、联网数据指标结构离退休人员参保属性离退休人员参保属性第第68项:项:社会化管理形式社会化管理形式第第69项:停发养老金原因项:停发养老金原因第第70项:本人长期生活地项:本
9、人长期生活地离退休人员基金属性离退休人员基金属性第第71项:项:本月应发养老金合计本月应发养老金合计第第72项:本月应发基础养老金项:本月应发基础养老金第第73项:本月应发过渡性养老金项:本月应发过渡性养老金第第74项:本月应发个人帐户养老金项:本月应发个人帐户养老金第第75项:本月应发补贴金额合计项:本月应发补贴金额合计第第76项:本月应发基本离退休退职费项:本月应发基本离退休退职费第第77项:本月实发养老金合计项:本月实发养老金合计第第78项:本月实际补发当年待遇调整养老金项:本月实际补发当年待遇调整养老金第第79项:本月实发其他养老保险待遇金额合计项:本月实发其他养老保险待遇金额合计第第
10、80项:本月末个人帐户余额项:本月末个人帐户余额二、联网数据统计表功能二、联网数据统计表功能固定表:固定表:固定表:固定表:1616大类大类大类大类4040张表张表张表张表第第0类(类(4):汇总):汇总本月本月缴费、补欠、个人帐户、发放情况缴费、补欠、个人帐户、发放情况第第1类(类(3):分单位类型、隶属关系、经济类型的单位个数):分单位类型、隶属关系、经济类型的单位个数第第2类(类(4):分单位类型、隶属关系、经济类型的分性别的参):分单位类型、隶属关系、经济类型的分性别的参 保人数、缴费人数、中断人数、终止人数以及分中断终保人数、缴费人数、中断人数、终止人数以及分中断终 止原因的分性别的
11、参保人数止原因的分性别的参保人数第第3类(类(5):分经济类型的、分退休前个人身份的、分离退休):分经济类型的、分退休前个人身份的、分离退休 类别的、分社管形式的、分长期生活地的离退休人数类别的、分社管形式的、分长期生活地的离退休人数第第4类(类(1):参保职工年龄分组):参保职工年龄分组第第5类(类(1):离退休人员年龄分组):离退休人员年龄分组第第6类(类(1):离退休时间分组):离退休时间分组第第7类(类(1):分停发养老金原因人数):分停发养老金原因人数二、联网数据统计表功能二、联网数据统计表功能固定表:固定表:固定表:固定表:1616大类大类大类大类4040张表张表张表张表第第8类(
12、类(3):分单位类型、隶属关系、经济类型的应缴实缴):分单位类型、隶属关系、经济类型的应缴实缴第第9类(类(3):分单位类型、隶属关系、经济类型的欠费情况):分单位类型、隶属关系、经济类型的欠费情况第第10类(类(3):分单位类型、隶属关系、经济类型的补缴情况):分单位类型、隶属关系、经济类型的补缴情况第第11类(类(1):职工个人平均缴费基数):职工个人平均缴费基数第第12类(类(4):分单位类型的、分退休前个人身份的、分退休类):分单位类型的、分退休前个人身份的、分退休类 别的、分性别的人均养老金别的、分性别的人均养老金第第13类(类(1):职工个人帐户平均储存额):职工个人帐户平均储存额
13、第第14类(类(4):离退休人员个人帐户平均储存额、终止领取养老):离退休人员个人帐户平均储存额、终止领取养老 金人员按性别年龄分组、按应发养老金水平分类、按金人员按性别年龄分组、按应发养老金水平分类、按 年龄分组的平均养老金水平年龄分组的平均养老金水平第第15类(类(1):按中断缴费原因分类人数和平均年龄情况):按中断缴费原因分类人数和平均年龄情况二、联网数据统计表功能二、联网数据统计表功能临时表:手工操作临时表:手工操作临时表:手工操作临时表:手工操作当期停止领取养老金人员年龄分组当期停止领取养老金人员年龄分组新增退休人员应发养老金水平新增退休人员应发养老金水平终止领取养老金人员年龄情况终
14、止领取养老金人员年龄情况分性别和单位类型参保职工实际缴费年限分组分性别和单位类型参保职工实际缴费年限分组二、联网数据统计表功能二、联网数据统计表功能统计表上报情况:统计表上报情况:统计表上报情况:统计表上报情况:l不全面不全面l不及时不及时l不连续不连续l不对应不对应严重影响:严重影响:严重影响:严重影响:l数据应用数据应用l数据分析数据分析三、联网数据应用框架三、联网数据应用框架四、联网数据分析框架四、联网数据分析框架数据分析数据分析数据分布数据分布单位缴费单位缴费情况情况在职职工在职职工情况情况对比分析对比分析离退休人员离退休人员情况情况四、联网数据分析框架四、联网数据分析框架数据分布数据
15、分布数量数量负担水平负担水平性别分析性别分析参保单位参保单位离退休人员离退休人员在职职工在职职工四、联网数据分析框架四、联网数据分析框架单位缴费情况单位缴费情况缴费状态缴费状态缴费情况缴费情况补缴情况补缴情况补欠情况补欠情况四、联网数据分析框架四、联网数据分析框架在职职工情况在职职工情况缴费状态缴费状态缴费情况缴费情况缴费基数缴费基数中断缴费中断缴费情况情况个人帐户个人帐户四、联网数据分析框架四、联网数据分析框架离退休人员情况离退休人员情况人员类别人员类别分析分析停发待遇停发待遇原因原因年龄、性别年龄、性别分析分析个人帐户个人帐户养老金水平养老金水平四、联网数据分析框架四、联网数据分析框架停发
16、待遇原因停发待遇原因年龄分组年龄分组平均余命平均余命四、联网数据分析框架四、联网数据分析框架离退休人员年龄、性别分析离退休人员年龄、性别分析年龄分组年龄分组提前退休提前退休人员人员平均余命平均余命四、联网数据分析框架四、联网数据分析框架养老金水平养老金水平新增人员新增人员全部人员全部人员提前退休提前退休人员人员四、联网数据分析框架四、联网数据分析框架对比分析对比分析当期收支比较当期收支比较缴费水平和养老金水平比较缴费水平和养老金水平比较五、联网数据应用演示五、联网数据应用演示1.1.分析中断缴费人员的流失,分地区、分企业分析中断缴费人员的流失,分地区、分企业经济类型(国有、集体、外资、其他企业
17、)、经济类型(国有、集体、外资、其他企业)、分性别、分年龄段参保人员中断缴费人员数量分性别、分年龄段参保人员中断缴费人员数量2.2.分析参保人员中未来分析参保人员中未来3 3年的预测退休人数(女年的预测退休人数(女5050男男6060,不包括提前退休),不包括提前退休)数据范围一:联网省份部分数据数据范围一:联网省份部分数据数据范围一:联网省份部分数据数据范围一:联网省份部分数据五、联网数据应用演示五、联网数据应用演示3.3.当期停止领取养老金人员年龄分组,从当期停止领取养老金人员年龄分组,从中可算出平均余命中可算出平均余命4.4.分地区分性别分析离退休人员退休时平分地区分性别分析离退休人员退
18、休时平均年龄,分正常退休和提前退休均年龄,分正常退休和提前退休5.5.分地区、分单位类型(企业和机关事业)分地区、分单位类型(企业和机关事业)分性别、养老金水平差异分性别、养老金水平差异五、联网数据应用演示五、联网数据应用演示数据范围二:地方运用联网数据开展分数据范围二:地方运用联网数据开展分数据范围二:地方运用联网数据开展分数据范围二:地方运用联网数据开展分析应用的实例析应用的实例析应用的实例析应用的实例六、联网数据质量评价六、联网数据质量评价数据质量的评价:三个方面(一个指标)数据质量的评价:三个方面(一个指标)数据质量的评价:三个方面(一个指标)数据质量的评价:三个方面(一个指标)一是数
19、据格式正确一是数据格式正确一是数据格式正确一是数据格式正确 二是数据内容准确二是数据内容准确二是数据内容准确二是数据内容准确 三是与相关指标逻辑关系对应三是与相关指标逻辑关系对应三是与相关指标逻辑关系对应三是与相关指标逻辑关系对应目标目标目标目标建立质量评价体系建立质量评价体系建立质量评价体系建立质量评价体系六、联网数据质量评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)通过指标项数据错误率进行判定通过指标项数据错误率进行判定通过指标项数据错误率进行判定通过指标项数据
20、错误率进行判定 空项缺项空项缺项空项缺项空项缺项 错误率错误率错误率错误率 准确程度准确程度准确程度准确程度 逻辑对应逻辑对应逻辑对应逻辑对应 六、联网数据质量评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:第一步:计算数据错误率第一步:计算数据错误率第一步:计算数据错误率第一步:计算数据错误率第二步:根据指标的数据错误率分类,确定指第二步:根据指标的数据错误率分类
21、,确定指第二步:根据指标的数据错误率分类,确定指第二步:根据指标的数据错误率分类,确定指标的类别和可用度标的类别和可用度标的类别和可用度标的类别和可用度第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率六、联网数据质量评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:第一步:计算数据错误率第
22、一步:计算数据错误率第一步:计算数据错误率第一步:计算数据错误率数据错误率数据错误率 空项缺项率空项缺项率or准确率准确率or逻辑对应正确率逻辑对应正确率 (or指或运算)指或运算)六、联网数据质量评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:第二步:根据指标的数据错误率分类,确定指标第二步:根据指标的数据错误率分类,确定指标第二步:根据指标的数据错误率分类,确定
23、指标第二步:根据指标的数据错误率分类,确定指标的类别和可用度的类别和可用度的类别和可用度的类别和可用度 第一类:指数据错误率在第一类:指数据错误率在第一类:指数据错误率在第一类:指数据错误率在1%1%以下,以下,以下,以下,可用度可用度可用度可用度=1=1 第二类:指数据错误率在第二类:指数据错误率在第二类:指数据错误率在第二类:指数据错误率在1 120%20%之间,之间,之间,之间,可用度可用度可用度可用度=2=2 第三类:指数据错误率在第三类:指数据错误率在第三类:指数据错误率在第三类:指数据错误率在20205050之间,之间,之间,之间,可用度可用度可用度可用度=3=3 六、联网数据质量
24、评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:数据可用率计算方法及公式:第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率第三步:根据分类计算数据的可用率每类指标的数据可用率每类指标的数据可用率每类指标的数据可用率每类指标的数据可用率 该类指标的数据总量该类指标的数据总量该类指标的数据总量该类指标的数据总量全部数据总量全部数据总量全部数据总量全
25、部数据总量 100%100%数据总量数据总量数据总量数据总量 单位库数据量单位库数据量单位库数据量单位库数据量 单位库指标总量单位库指标总量单位库指标总量单位库指标总量 在职库数据量在职库数据量在职库数据量在职库数据量 在职库指标总量在职库指标总量在职库指标总量在职库指标总量 离退休库数据量离退休库数据量离退休库数据量离退休库数据量 离退休库指标总量离退休库指标总量离退休库指标总量离退休库指标总量 六、联网数据质量评价六、联网数据质量评价联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)联网指标的可用程度:(用于应用和分析)对北京
26、、天津、河北、辽宁、吉林、上海、福建、对北京、天津、河北、辽宁、吉林、上海、福建、对北京、天津、河北、辽宁、吉林、上海、福建、对北京、天津、河北、辽宁、吉林、上海、福建、陕西陕西陕西陕西8 8 8 8省的数据质量进行了评价。省的数据质量进行了评价。省的数据质量进行了评价。省的数据质量进行了评价。1 1 1 1可用程度较高的是上海、北京、天津。可用程度较高的是上海、北京、天津。可用程度较高的是上海、北京、天津。可用程度较高的是上海、北京、天津。2 2 2 2离退休库的指标可用度最高。离退休库的指标可用度最高。离退休库的指标可用度最高。离退休库的指标可用度最高。六、联网数据质量评价六、联网数据质量
27、评价联网指标的可用程度排名(第一类)联网指标的可用程度排名(第一类)联网指标的可用程度排名(第一类)联网指标的可用程度排名(第一类)六、联网数据质量评价六、联网数据质量评价联网指标的可用程度综合排名(第二类)联网指标的可用程度综合排名(第二类)联网指标的可用程度综合排名(第二类)联网指标的可用程度综合排名(第二类)六、联网数据质量评价六、联网数据质量评价联网指标的可用程度综合排名(第三类)联网指标的可用程度综合排名(第三类)联网指标的可用程度综合排名(第三类)联网指标的可用程度综合排名(第三类)规范整理数据规范整理数据建设优质数据环境建设优质数据环境 是支持事业发展的当务之急!是支持事业发展的当务之急!谢谢!谢谢!