1. 数据说明
由于数据涉及京东公司关键商业机密等问题,价格、销量等数据的输出并非真实值,而是经过了指数化的计算。
计算公式采用了 log 函数和 pow 函数(幂函数)。
1)log(DOUBLE base, DOUBLE a)。以 base 为底的对数,base 为固定值, a 是指标数据真实值。
2)pow(DOUBLE a, DOUBLE p)。返回 a^p, 计算a的p次幂。
指数化计算公式中有两类函数的嵌套使用,同时增加部分固定系数的加减乘除计算,使指数化后的数据达到隐藏真实值的目的,但又不改变真实值的趋势,能够相对正确的反应真实数据情况。
2. 表命名规范
数据库中,数据以表(Table)的形式提供,表的命名规范为:“模型层次_功能_表类型_后缀”。例如:疫情相关商品的销售情况指数英文表名为:dws_yiqing_yqxgsp_xszs_i_m.
1)模型层次:汇总数据层统一为DWS;
2)功能:使用拼音+拼音首字母+下划线形式说明汇总功能;
3)表类型:增量(I),全量(A);
4)后缀:
a. 按照采集策略,增量表后缀为D/M/H/W分别表示按天/月/小时/周更新;
b. 全量表不设后缀;
c. 如果某张表有版本变更,则原始表名称变更为:原始名称_his。
商品销售
1. 商品销售情况
按月增量,含销量、单量、销售额、客单价指数,22-01起,目前更新至23-10。表英文名:dws_shangpin_xiaoshou_i_m
字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、销售量指数、订单量指数、客单价指数、月份
2. 三级品类月均价和销量
按月增量,含交易均价、中位数、销量指数,18-01起,目前更新至23-10。表英文名:dws_sanji_pinlei_lishijiage_xiaoliang_i_m
字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、中位数价格指数、销售量指数、平均交易价格指数、月份
商品销售X画像
1. 商品销售画像分布
按月增量,18-01起,目前更新至23-10。表英文名:dws_shangpin_xiaoshou_huaxiang_i_m
画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含消费量、消费金额、订单数、客单价
字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、销售量指数、订单量指数、客单价指数、月份
2. 商品消费画像分布
按月增量,18-01起,更新至23-10。表英文名:dws_shangpin_xiaofei_huaxiang_i_m
画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含消费者数量、消费量、消费金额、订单数、客单价
字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、消费者数量指数、销售额指数、销售量指数、订单量指数、客单价指数、月份
3. 药品购买画像
按月增量,自19-01起,目前更新至23-08。表英文名:dws_yaopin_huaxiang_i_m
一级品类仅有医药,画像包括年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标包括销售额、画像分布情况(人数百分比)
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、画像分布、月份
4. 各一级品类消费者画像
按月增量,自18-01起,目前更新至23-10。表英文名:dws_yiji_pinlei_huaxiang_i_m
画像包括年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标只有画像分布情况(人数百分比)
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、画像分布、月份
特定城市商品销售情况
1. 省会+湖北地级市,一级品类商品销售情况
按月增量,18-01起,更新至23-07。表英文名:dws_shenghui_hubei_yiji_pinlei_xiaoshou_i_m
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、订单量指数、销售量指数、月份
2. 省会城市,一级品类商品销售情况及用户数
按月增量,18-01起,更新至23-07。消费情况指的是某地购买商品的情况,即城市指用户归属,用户数可用于评估用户忠诚度。表英文名:dws_shenghui_yiji_pinlei_xiaofei_zhongchengdu_i_m
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称(空)、三级品类名称(空)、四级品类名称(空)、销售额指数、订单量指数、销售量指数、用户数量指数、月份
3. 成交用户量前20城市+苏州,客单价指数情况
按月增量,指标含销售额和单量(无现成客单价情况),18-01起,目前更新至23-09。表英文名:dws_suzhou_yonghuliangqian20_kedanjia_i_m
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、销售额指数、订单量指数、月份
4. 成交用户量前20城市+苏州,八大品类销售情况
按月增量,指标含销售额、单量、人均消费额、品类商品均价,18-01起,目前更新至23-07。表英文名:dws_suzhou_yonghuliangqian20_badaxiaofeipin_kedanjia_i_m
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、二级品类编码、二级品类名称、销售额指数、订单量指数、人均消费额指数、平均单价指数、月份
特定城市X用户画像
1. 一线城市+苏州,药品销售与用户画像情况
按月增量,一级品类为医药,18-12起,目前更新至23-09。表英文名:dws_suzhou_yixian_yaopin_xiaoshou_i_m
画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含销售额、单量
字段:主键、省份、地市、省份编码、地市编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、订单量指数、月份
2. 成交用户量前20城市+苏州,销售情况,用户数与用户画像情况
按月增量,18-10起,目前更新至23-09。表英文名:dws_suzhou_yonghuliangqian20_xiaoshou_huaxiang_i_m
画像:年龄分布、性别分布、学历分布,指标含城市总用户数、各画像用户数、各画像用户占比
字段:主键、省份、地市、省份编码、地市编码、用户总数指数、画像名称、画像枚举值、数量指数、占比、月份
特定品类商品销售情况
1. 部分城市白酒口罩避暑产品销售情况
按月增量,销售情况是指某地售卖的情况,即城市为发货地,自18-01起,目前更新至23-07。表英文名:dws_baijiu_kouzhao_kongtiao_i_m
部分城市指订单产生城市,包含北京、苏州+所有省会城市、湖北省所有地级市,品类包含酒/口罩等疫情物资/空调等抗暑商品,指标包含销售额、单量和件数
字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、订单量指数、销售量指数、月份
特定品类商品销售情况X用户画像
1. 辐射、海鲜水产品类商品,销售情况及用户画像
按月增量,含日期字段,自20-01起,目前更新至23-10。表英文名:dws_fushe_haixian_xiaoshou_huaxiang_i_m
画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含销售额和单量
字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、销售量指数、日期、月份