刘慧--大数据在CPI统计中的应用研究_第1页
刘慧--大数据在CPI统计中的应用研究_第2页
刘慧--大数据在CPI统计中的应用研究_第3页
刘慧--大数据在CPI统计中的应用研究_第4页
刘慧--大数据在CPI统计中的应用研究_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、秦丽萍秦丽萍 孔黎明孔黎明 刘刘 慧慧 朱朱国众国众 以以1 1号店价格指数为例号店价格指数为例2022-4-212主要内容居民消费价格(居民消费价格(CPI)统计简介)统计简介大数据物价统计的应用现状大数据物价统计的应用现状1号店价格指数编制方法研究及实例号店价格指数编制方法研究及实例数据比较评估数据比较评估 城乡居民购买并用于日常生活消费的商品和服务项目的价格。城乡居民购买并用于日常生活消费的商品和服务项目的价格。 调查内容按用途划分为八大类、调查内容按用途划分为八大类、262262个基本分类。个基本分类。 包括食品、烟酒、衣着、家庭设备用品及维修服务、医疗保健包括食品、烟酒、衣着、家庭设

2、备用品及维修服务、医疗保健 和个人用品、交通和通信、娱乐教育文化用品及服务、居住。和个人用品、交通和通信、娱乐教育文化用品及服务、居住。2022-4-213居民消费价格(居民消费价格(CPICPI)统计简介)统计简介调查内容调查内容分类固定分类固定国家规定国家规定代表品抽样代表品抽样地方自定地方自定 消费量较大的消费项目。消费量较大的消费项目。 价格变动具有较强的代表性。价格变动具有较强的代表性。 同基本分类下代表品异质性越大越好。同基本分类下代表品异质性越大越好。 合格产品。注册商标、产地、规格等级等标识齐全。合格产品。注册商标、产地、规格等级等标识齐全。2022-4-214居民消费价格(居

3、民消费价格(CPICPI)统计简介)统计简介抽样原则抽样原则20142014年,上海年,上海CPICPI代表品共抽选代表品共抽选13001300多种多种 调查方法:采用定人、定点、定时的方法直接采集代表品价格。调查方法:采用定人、定点、定时的方法直接采集代表品价格。 调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。 一般性商品(服务),每月一般性商品(服务),每月2-32-3次。次。 政府统一定价或价格稳定的商品(服务),每月一次。政府统一定价或价格稳定的商品(服务),每月一次。 报告周期:月度,每月报告周期:月度,每月1

4、010日前公布上月数据。日前公布上月数据。2022-4-215居民消费价格(居民消费价格(CPICPI)统计简介)统计简介方法频率方法频率20142014年,上海每月采集价格笔数为年,上海每月采集价格笔数为3500035000多笔多笔 权数测算:主要根据居民家庭消费支出资料,辅以典型调查。权数测算:主要根据居民家庭消费支出资料,辅以典型调查。 权数五年固定不变。权数五年固定不变。 计算方法:先计算代表品月度计算方法:先计算代表品月度时点平均价格时点平均价格变动幅度,代表品之间变动幅度,代表品之间 几何平均几何平均得出基本分类月度变动幅度,基本分类以上按得出基本分类月度变动幅度,基本分类以上按

5、逐级逐级拉氏加权平均拉氏加权平均得出各级分类月度变动幅度。得出各级分类月度变动幅度。 2022-4-216居民消费价格(居民消费价格(CPICPI)统计简介)统计简介计算方法计算方法 抽样代表性:代表品、网点抽选仍以重点、典型性为主。抽样代表性:代表品、网点抽选仍以重点、典型性为主。 抽多少,怎么抽?抽多少,怎么抽? 权数变动性:五年固定,拉氏加权计算。权数变动性:五年固定,拉氏加权计算。 消费结构变动如何体现?消费结构变动如何体现? 计算科学性:代表品之间几何平均计算。计算科学性:代表品之间几何平均计算。 相当与等权计算?相当与等权计算? 数据及时性:月度指数存在滞后性。数据及时性:月度指数

6、存在滞后性。 如何反映短期波动?如何反映短期波动? 2022-4-217居民消费价格(居民消费价格(CPICPI)统计简介)统计简介疑惑和挑战疑惑和挑战2022-4-218大数据物价统计的应用现状及比较大数据物价统计的应用现状及比较应用现状应用现状 每日网上价格指数:每日网上价格指数:美国麻省理工学院对全世界海量网上零售美国麻省理工学院对全世界海量网上零售 价格进行价格指数计算,每天抓取价格进行价格指数计算,每天抓取7070多个国家的多个国家的5050万条价格信息。万条价格信息。 淘宝网价格指数:淘宝网价格指数:阿里巴巴公司基于淘宝网、天猫网、支付宝等阿里巴巴公司基于淘宝网、天猫网、支付宝等

7、网络平台的数据,推出网络购物消费价格指数。网络平台的数据,推出网络购物消费价格指数。 谷歌搜索数据谷歌搜索数据CPICPI:国内学者通过谷歌搜索平台选取对国内学者通过谷歌搜索平台选取对CPICPI相关系数相关系数 高的几十个关键词,跟踪测算出搜索高的几十个关键词,跟踪测算出搜索CPICPI指数。指数。2022-4-219大数据物价统计的应用现状及比较大数据物价统计的应用现状及比较应用比较应用比较统计方法比较统计方法比较 指数名称指数名称每日网上价格指数每日网上价格指数淘宝网淘宝网ISPIISPI谷歌搜索数据谷歌搜索数据CPICPI官方官方CPICPI分类分类主要包括食品饮料、主要包括食品饮料、

8、家居用品、家具、服家居用品、家具、服装、鞋类、卫生、能装、鞋类、卫生、能源源等。等。食品、衣着、家庭设食品、衣着、家庭设备用品及服务、医疗备用品及服务、医疗保健护理、交通和通保健护理、交通和通讯、教育文化娱乐服讯、教育文化娱乐服务、居住等九大类。务、居住等九大类。分为宏观形势指数和分为宏观形势指数和供求关系指数。宏观供求关系指数。宏观形势指数主要与货币形势指数主要与货币政策、经济走势相关;政策、经济走势相关;供求关系指数主要与供求关系指数主要与关注和购买商品相关。关注和购买商品相关。食品、烟酒及用品、食品、烟酒及用品、衣着、家庭设备用品衣着、家庭设备用品及维修服务、医疗保及维修服务、医疗保健和

9、个人用品、交通健和个人用品、交通和通信、娱乐教育文和通信、娱乐教育文化用品及服务、居住化用品及服务、居住等。等。权重权重成交额的比重成交额的比重成交额的比重成交额的比重根据关键词搜索数据根据关键词搜索数据与与CPICPI的相关性大小的相关性大小根据居民总消费支出根据居民总消费支出中所占的比重,五年中所占的比重,五年固定。固定。计算方法计算方法采用链式加权的拉氏采用链式加权的拉氏指数指数采用链式加权的拉氏采用链式加权的拉氏指数指数综合指数合成法综合指数合成法链式拉氏指数链式拉氏指数数据来源数据来源全球网上商品服务交全球网上商品服务交易易淘宝网、天猫网、支淘宝网、天猫网、支付宝等网络平台交易付宝等

10、网络平台交易数据数据谷歌解析平台搜索数谷歌解析平台搜索数据据全国全国3131个省市个省市500500个个市县,市县,6.36.3万个价格调万个价格调查点查点2022-4-2110大数据物价统计的应用现状及比较大数据物价统计的应用现状及比较应用比较应用比较统计功能比较统计功能比较 指数名称指数名称每日网上价格每日网上价格指数指数淘宝网淘宝网ISPIISPI谷歌搜索数据谷歌搜索数据CPICPI官方官方CPICPI指数用途指数用途物价变动趋势物价变动趋势网络零售价格变动网络零售价格变动趋势和变化程度趋势和变化程度预测物价变动趋预测物价变动趋势势居民消费价格变动居民消费价格变动趋势和变化程度趋势和变化

11、程度发布频率发布频率日、周、月、日、周、月、年年日、周、月、年日、周、月、年日、周、月、年日、周、月、年月、年月、年预警能力预警能力领先官方领先官方CPICPI领先官方领先官方CPICPI预测官方预测官方CPICPI转转折点折点预测经济形势预测经济形势感受符合度感受符合度较高较高很高很高较高较高一般一般2022-4-2111大数据物价统计的应用现状及比较大数据物价统计的应用现状及比较应用比较应用比较不足比较不足比较 指数名称指数名称存在的主要不足存在的主要不足网络零售网络零售CPICPI1 1不能反映服务消费价格情况不能反映服务消费价格情况2 2不能综合性反应价格变动情况不能综合性反应价格变动

12、情况搜索数据搜索数据CPI CPI 1 1不能反映价格变动程度不能反映价格变动程度2 2不能反映价格的变化结构不能反映价格的变化结构官方官方CPICPI1 1不能提供日、周等短周期数据不能提供日、周等短周期数据2 2不能及时体现消费市场结构变化不能及时体现消费市场结构变化3 3数据发布滞后时间偏长数据发布滞后时间偏长 以现行以现行CPICPI编制框架为基础,确保数据可比性和衔接性编制框架为基础,确保数据可比性和衔接性 充分利用大数据,改进现行充分利用大数据,改进现行CPICPI不足:不足: 抽样代表性?抽样代表性? 代表品抽选更有依据代表品抽选更有依据 权数变动性?权数变动性? 权数设置更为灵

13、活权数设置更为灵活 计算科学性?计算科学性? 计算方法更加多样计算方法更加多样 数据及时性?数据及时性? 指数周期更趋高频指数周期更趋高频 2022-4-21121 1号店价格指数编制方法及实例号店价格指数编制方法及实例编制思路编制思路2022-4-21131 1号店价格指数编制方法及实例号店价格指数编制方法及实例分类体系分类体系 方法:方法: 以以1 1号店现有号店现有的的后台商品分类体系后台商品分类体系(三级分类目录)(三级分类目录)为基础为基础 两大原则:两大原则: 代表性代表性 体现营运状况及线上销售特点体现营运状况及线上销售特点 稳定性稳定性 不应频繁变动,确保指数延续性不应频繁变动

14、,确保指数延续性 实例:实例:分类筛选过程:分类筛选过程: 第三级目录第三级目录数量较大数量较大(15001500多个)多个)、稳定性不高、稳定性不高 不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等 消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等 消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、 厨卫清洁厨卫清洁 、家居用品等、家居用品等 研究初期,不宜纳入过大规模的分类目录研究初期,不宜纳入

15、过大规模的分类目录 2022-4-21141 1号店价格指数编制方法及实例号店价格指数编制方法及实例分类体系分类体系实例:实例:分类筛选结果:分类筛选结果:1010个一级分类个一级分类4545个二级分类个二级分类2022-4-21151 1号店价格指数编制方法及实例号店价格指数编制方法及实例分类体系分类体系一级分类一级分类二级分类二级分类一级分类一级分类二级分类二级分类食品食品休闲零食休闲零食家居家居厨具锅具厨具锅具厨房调料厨房调料床上用品床上用品干货干货收纳洗晒收纳洗晒方便面方便面/ /速食速食装饰装饰/ /日用日用粮油粮油餐具水具餐具水具糖果糖果/ /巧克力巧克力美容护理美容护理口腔护理口

16、腔护理罐装食品罐装食品女性护理女性护理饼干饼干/ /糕点糕点男士护理男士护理进口食品进口食品进口乳制品进口乳制品缤纷彩妆缤纷彩妆进口休闲零食进口休闲零食美容工具美容工具进口果干进口果干/ /坚果坚果身体护理身体护理进口饮用水进口饮用水/ /饮料饮料面部护肤面部护肤饮料饮料乳制品乳制品生活电器生活电器个人个人 护理护理冲调饮品冲调饮品厨房电器厨房电器酒酒大家电大家电饮料饮料生活电器生活电器厨卫清洁厨卫清洁一次性用品一次性用品电器附件电器附件 家庭清洁护理家庭清洁护理手机手机手机通讯手机通讯清洁用具清洁用具手机配件手机配件纸制品纸制品数码数码数码影像数码影像衣物清洁护理衣物清洁护理数码影音数码影音

17、母婴母婴奶粉系列奶粉系列数码配件数码配件母婴营养品母婴营养品2022-4-21161 1号店价格指数编制方法及实例号店价格指数编制方法及实例代表品选取代表品选取 方法:方法: 将各二级将各二级分类分类下所有在下所有在报告期报告期有销售的有销售的商品按销售额大小商品按销售额大小排序排序 几种方案:几种方案: 全部选取全部选取 可比性问题,带入奇异值可比性问题,带入奇异值 固定数量固定数量 排位前排位前n n个的选取为代表品个的选取为代表品 固定金额固定金额 累加销售额达到该类别总销售额固定比例的前累加销售额达到该类别总销售额固定比例的前n n个个 选取为代表品选取为代表品 实例:实例: 使用固定

18、金额的方法,比例定为七成。使用固定金额的方法,比例定为七成。 优点:优点:有足够的代表性有足够的代表性 有足够的稳定性有足够的稳定性 留出一定数量作为备用留出一定数量作为备用 最终选取结果:各二级分类下的平均代表品数量在最终选取结果:各二级分类下的平均代表品数量在 100 100个左右,个左右, 食品、厨卫清洁等商品繁多的分类在食品、厨卫清洁等商品繁多的分类在200-300200-300个。个。 2022-4-21171 1号店价格指数编制方法及实例号店价格指数编制方法及实例代表品选取代表品选取2022-4-21181 1号店价格指数编制方法及实例号店价格指数编制方法及实例权数设置权数设置 方

19、法:方法: 代表品权数代表品权数:该商品在报告期该商品在报告期或基期的或基期的销售额销售额占同分类下占同分类下 所有代表品销售额的所有代表品销售额的比重比重 分类权数:分类权数:该该分类分类在报告期在报告期或基期的或基期的销售额销售额占上级分类总占上级分类总 销售额的比重销售额的比重 2022-4-21191 1号店价格指数编制方法及实例号店价格指数编制方法及实例计算过程计算过程 方法:方法: 代表品代表品平均价格平均价格 : ,t t期均价期均价= =销售总额销售总额/ /销售量销售量 代表品环比指数:代表品环比指数: ,t t期指数期指数=t=t期均价期均价/t-1/t-1期均价期均价 n

20、jtijnjtijtijtiqqpp11%1001 ittitippG2022-4-21201 1号店价格指数编制方法及实例号店价格指数编制方法及实例计算过程计算过程 方法:方法: 基本分类环比指数基本分类环比指数 : 派氏指数,报告期权数派氏指数,报告期权数 拉氏指数,基期权数拉氏指数,基期权数 费雪指数,综合权数费雪指数,综合权数mitimititiLtjSSGk11miitmiittiPtjSSGk1111PtjLtjFtjkkk2022-4-21211 1号店价格指数编制方法及实例号店价格指数编制方法及实例计算过程计算过程 方法:方法: 逐级逐级分类环比指数:分类环比指数: 派氏指数,

21、报告期权数派氏指数,报告期权数 拉氏指数,基期权数拉氏指数,基期权数 费雪指数,综合权数费雪指数,综合权数hjtjhjtjLtjLtQQkK11hjjthjjtPtjPtQQkK1111PtjLtjFtjKKK实例:实例: 2022-4-21221 1号店价格指数编制方法及实例号店价格指数编制方法及实例计算过程计算过程代表品代表品 环比环比 权数权数拖把拖把 92.3 4092.3 40百洁布百洁布 101.5 15101.5 15扫帚扫帚 100.2 25100.2 25脸盆脸盆 103.4 10103.4 10浴帘浴帘 104.8 10104.8 10加权平均加权平均二级分类二级分类 环比

22、环比 权数权数清洁卫浴清洁卫浴 98.0 3098.0 30代表品代表品 环比环比 权数权数保鲜膜保鲜膜 102.5 30102.5 30垃圾袋垃圾袋 105.3 25105.3 25纸杯纸杯 90.9 2090.9 20牙签牙签 95.7 1595.7 15鞋套鞋套 107.6 10107.6 10加权平均加权平均二级分类二级分类 环比环比 权数权数一次性用品一次性用品 100.4 20100.4 20二级分类二级分类 环比环比 权数权数纸制品纸制品 102.8 20102.8 20二级分类二级分类 环比环比 权数权数厨具餐具厨具餐具 104.9 30104.9 30加权平均加权平均一级分类

23、一级分类 环比环比 权数权数厨卫清洁厨卫清洁 101.2 30101.2 30一级分类一级分类 环比环比 权数权数 食品食品 105.4 30105.4 30一级分类一级分类 环比环比 权数权数 母婴母婴 108.7 40108.7 40几何平均几何平均100.3100.32022-4-21231 1号店价格指数编制方法及实例号店价格指数编制方法及实例计算过程计算过程 方法:方法: 链式法推算其他指数链式法推算其他指数 定基指数定基指数t-1t-1期定基指数期定基指数 t t期环比指数期环比指数 同比指数同比指数t t期定基指数期定基指数 / t-x/ t-x期定基指数,期定基指数, x x为

24、周期为周期 2022-4-21241 1号店价格指数编制方法及实例号店价格指数编制方法及实例数据筛选数据筛选 方法:方法: 指标筛选指标筛选产品编码、分类编码、商品名、计量单位、规格信息产品编码、分类编码、商品名、计量单位、规格信息 销售时间、销售价格、销售量销售时间、销售价格、销售量 奇异剔除奇异剔除赠品价格、极低极高价格等赠品价格、极低极高价格等 2022-4-21251 1号店价格指数编制方法及实例号店价格指数编制方法及实例数据处理数据处理 方法:方法: 主要是代表品缺失或变动时的价格延续性处理,一般需要寻找新代主要是代表品缺失或变动时的价格延续性处理,一般需要寻找新代 表品继续进行价格

25、跟踪,但新老代表品间的价格需要进行过渡处理。表品继续进行价格跟踪,但新老代表品间的价格需要进行过渡处理。 现行现行CPICPI统计中常用方法:替代法、备用虚拟法统计中常用方法:替代法、备用虚拟法 大数据物价统计方法:后备代表品更替法大数据物价统计方法:后备代表品更替法 其他方法:主要特征折算法、成本因素分解法、其他方法:主要特征折算法、成本因素分解法、 HedonicHedonic回归法等回归法等 实例:实例:现行现行CPICPI备用虚拟法备用虚拟法2022-4-21261 1号店价格指数编制方法及实例号店价格指数编制方法及实例数据处理数据处理商品商品第一期价第一期价格格第二期价第二期价格格第

26、二期环第二期环比指数比指数第三期价格第三期价格第三期环比第三期环比指数指数第四期价第四期价格格第四期环比第四期环比 指数指数A A80808585106.3 106.3 828296.5 96.5 8484102.4 102.4 B B90909595105.6 105.6 9797102.1 102.1 939395.9 95.9 C C100100105105105.0 105.0 缺失缺失100(100(虚拟虚拟) )缺失缺失102.9(102.9(虚拟)虚拟)DD70707272实例:实例:1 1号店价格指数后备代表品更替法号店价格指数后备代表品更替法2022-4-21271 1号店价

27、格指数编制方法及实例号店价格指数编制方法及实例数据处理数据处理商商品品第一期价第一期价格格第二期价第二期价格格第二期环第二期环比指数比指数第三期价格第三期价格第三期环比第三期环比指数指数第四期价第四期价格格第四期环比第四期环比 指数指数A A80808585106.3 106.3 828296.5 96.5 8484102.4 102.4 B B90909595105.6 105.6 9797102.1 102.1 939395.9 95.9 C C100100105105105.0 105.0 缺失缺失缺失缺失DD7474707094.694.67272102.9102.9 签署战略合作协议

28、,数据保密协议。签署战略合作协议,数据保密协议。 统计局提供编制方法,统计局提供编制方法,1 1号店负责实际测算操作号店负责实际测算操作。 测算结果由统计局负责评估。测算结果由统计局负责评估。 定期以定期以1 1号店名义发布指数,统计局协助数据分析,宣传推广。号店名义发布指数,统计局协助数据分析,宣传推广。2022-4-2128数据比较评估数据比较评估合作模式合作模式 利用利用1 1号店的销售数据号店的销售数据测算测算8 8个月个月有关商品分类的有关商品分类的环比环比价格指数。价格指数。 分别分别使用使用拉氏指数、派氏指数、费雪指数拉氏指数、派氏指数、费雪指数方法方法测算测算出三套结果。出三套

29、结果。 其中其中乳制品、饮料、厨房调料、大家电、奶粉系列乳制品、饮料、厨房调料、大家电、奶粉系列等等1212类与现行类与现行 CPICPI口径一致,可进行比较。口径一致,可进行比较。2022-4-2129数据比较评估数据比较评估测算情况测算情况拉氏和派氏指数结果比较拉氏和派氏指数结果比较2022-4-2130数据比较评估数据比较评估指数比较指数比较分分 类类相关系数相关系数涨跌不同(个月)涨跌不同(个月)乳制品乳制品0.94620.94622 2饮料饮料0.97790.97791 1厨房调料厨房调料0.97220.97222 2大家电大家电0.96210.96211 1奶粉系列奶粉系列0.94

30、540.94542 2床上用品床上用品0.82060.82063 3手机通讯手机通讯0.97530.97530 0糖果糖果/ /巧克力巧克力0.82040.82042 2缤纷彩妆缤纷彩妆0.94430.94430 0美容工具美容工具0.95130.95130 0酒酒0.83300.83300 0饼干饼干/ /糕点糕点0.97710.97711 1波动一致性很高波动一致性很高涨跌一致性不高涨跌一致性不高 拉氏指数权数固定为基期,无法体现权数结构变化。拉氏指数权数固定为基期,无法体现权数结构变化。 派氏指数使用报告期权数,结构变化较大时会影响指数平稳性。派氏指数使用报告期权数,结构变化较大时会影响指数平稳性。 费雪指数综合使用基期和报告期权数,充分汲取两者优势。费雪指数综合使用基期和报告期权数,充分汲取两者优势。2022-4-2131数据比较评估数据比较评估指数比较指数比较拉氏、派氏、费雪指数与拉氏、派氏、费雪指数与CPICPI差异度比较差异度比较2022-4-2132数据比较评估数据比较评估指数评估指数评估分分 类类与与CPICPI差异度绝对值(差异度绝对值(%)拉氏指数拉氏指数派氏指数派氏指数费雪指数费雪指数乳制品乳制品1.1781.1781.3051.3051.1651.165饮料饮料1.1601.1601.7751.7751.4531.453厨房调

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论