京东数据库开放免费使用申请

发布时间:2024-12-27


京东作为国内领先的电商平台,拥有庞大且稳固的用户基础。截至2023年,京东平台年度活跃用户数已超过5.8亿,覆盖全国各个省市和地区,持续吸引大量稳定的消费人群。京东用户群体结构多样,既包括一线城市的高消费用户,也涵盖二三线城市及农村市场的新兴消费群体,市场影响力广泛。

国家治理大数据和人工智能创新平台与京东展开合作,京东将部分业务数据进行了脱敏处理,供我校师生研究使用。本次开放的数据内容包含京东商品销售情况、商品销售X画像、特定城市/特定品类商品销售情况、特定城市X用户画像、特定品类商品销售情况X用户画像等,时间跨度为2018年至2023年。具体数据结构信息简介如下,欢迎有需求的师生踊跃申请!

01

申请使用流程  

1. 下载数据库使用申请表

数据库使用申请表.docx

京东数据明细_一期&二期.pdf


2. 填写完整后,发送至创新平台公邮:brain@ruc.edu.cn

使用时注意数据安全,切勿将数据分享到互联网或其他平台,否则发现后将停止该用户使用权限。

更多数据集、模型库与知识库,请关注国家治理大数据和人工智能创新平台云端大数据平台:https://datahub.ruc.edu.cn/org-portal/RUC/

02

数据介绍 

数据模型设计与命名规范

1. 数据说明

由于数据涉及京东公司关键商业机密等问题,价格、销量等数据的输出并非真实值,而是经过了指数化的计算。

计算公式采用了 log 函数和 pow 函数(幂函数)。

1)log(DOUBLE base, DOUBLE a)。以 base 为底的对数,base 为固定值, a 是指标数据真实值。

2)pow(DOUBLE a, DOUBLE p)。返回 a^p, 计算a的p次幂。

指数化计算公式中有两类函数的嵌套使用,同时增加部分固定系数的加减乘除计算,使指数化后的数据达到隐藏真实值的目的,但又不改变真实值的趋势,能够相对正确的反应真实数据情况。

2. 表命名规范

数据库中,数据以表(Table)的形式提供,表的命名规范为:“模型层次_功能_表类型_后缀”。例如:疫情相关商品的销售情况指数英文表名为:dws_yiqing_yqxgsp_xszs_i_m.

1)模型层次:汇总数据层统一为DWS;

2)功能:使用拼音+拼音首字母+下划线形式说明汇总功能;

3)表类型:增量(I),全量(A);

4)后缀:
    a. 按照采集策略,增量表后缀为D/M/H/W分别表示按天/月/小时/周更新;
    b. 全量表不设后缀;
    c. 如果某张表有版本变更,则原始表名称变更为:原始名称_his。


表结构信息

商品销售

1. 商品销售情况

按月增量,含销量、单量、销售额、客单价指数,22-01起,目前更新至23-10。表英文名:dws_shangpin_xiaoshou_i_m

字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、销售量指数、订单量指数、客单价指数、月份

2. 三级品类月均价和销量

按月增量,含交易均价、中位数、销量指数,18-01起,目前更新至23-10。表英文名:dws_sanji_pinlei_lishijiage_xiaoliang_i_m

字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、中位数价格指数、销售量指数、平均交易价格指数、月份


商品销售X画像

1. 商品销售画像分布

按月增量,18-01起,目前更新至23-10。表英文名:dws_shangpin_xiaoshou_huaxiang_i_m

画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含消费量、消费金额、订单数、客单价

字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、销售量指数、订单量指数、客单价指数、月份

2. 商品消费画像分布

按月增量,18-01起,更新至23-10。表英文名:dws_shangpin_xiaofei_huaxiang_i_m

画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含消费者数量、消费量、消费金额、订单数、客单价

字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、消费者数量指数、销售额指数、销售量指数、订单量指数、客单价指数、月份

3. 药品购买画像

按月增量,自19-01起,目前更新至23-08。表英文名:dws_yaopin_huaxiang_i_m

一级品类仅有医药,画像包括年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标包括销售额、画像分布情况(人数百分比)

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、画像分布、月份

4. 各一级品类消费者画像

按月增量,自18-01起,目前更新至23-10。表英文名:dws_yiji_pinlei_huaxiang_i_m

画像包括年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标只有画像分布情况(人数百分比)

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、画像分布、月份


特定城市商品销售情况

1. 省会+湖北地级市,一级品类商品销售情况

按月增量,18-01起,更新至23-07。表英文名:dws_shenghui_hubei_yiji_pinlei_xiaoshou_i_m

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、订单量指数、销售量指数、月份

2. 省会城市,一级品类商品销售情况及用户数

按月增量,18-01起,更新至23-07。消费情况指的是某地购买商品的情况,即城市指用户归属,用户数可用于评估用户忠诚度。表英文名:dws_shenghui_yiji_pinlei_xiaofei_zhongchengdu_i_m

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称(空)、三级品类名称(空)、四级品类名称(空)、销售额指数、订单量指数、销售量指数、用户数量指数、月份

3. 成交用户量前20城市+苏州,客单价指数情况

按月增量,指标含销售额和单量(无现成客单价情况),18-01起,目前更新至23-09。表英文名:dws_suzhou_yonghuliangqian20_kedanjia_i_m

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、销售额指数、订单量指数、月份

4. 成交用户量前20城市+苏州,八大品类销售情况

按月增量,指标含销售额、单量、人均消费额、品类商品均价,18-01起,目前更新至23-07。表英文名:dws_suzhou_yonghuliangqian20_badaxiaofeipin_kedanjia_i_m

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、二级品类编码、二级品类名称、销售额指数、订单量指数、人均消费额指数、平均单价指数、月份


特定城市X用户画像

1. 一线城市+苏州,药品销售与用户画像情况

按月增量,一级品类为医药,18-12起,目前更新至23-09。表英文名:dws_suzhou_yixian_yaopin_xiaoshou_i_m

画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含销售额、单量

字段:主键、省份、地市、省份编码、地市编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、订单量指数、月份

2. 成交用户量前20城市+苏州,销售情况,用户数与用户画像情况

按月增量,18-10起,目前更新至23-09。表英文名:dws_suzhou_yonghuliangqian20_xiaoshou_huaxiang_i_m

画像:年龄分布、性别分布、学历分布,指标含城市总用户数、各画像用户数、各画像用户占比

字段:主键、省份、地市、省份编码、地市编码、用户总数指数、画像名称、画像枚举值、数量指数、占比、月份



特定品类商品销售情况

1. 部分城市白酒口罩避暑产品销售情况

按月增量,销售情况是指某地售卖的情况,即城市为发货地,自18-01起,目前更新至23-07。表英文名:dws_baijiu_kouzhao_kongtiao_i_m

部分城市指订单产生城市,包含北京、苏州+所有省会城市、湖北省所有地级市,品类包含酒/口罩等疫情物资/空调等抗暑商品,指标包含销售额、单量和件数

字段:主键、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、销售额指数、订单量指数、销售量指数、月份


特定品类商品销售情况X用户画像

1. 辐射、海鲜水产品类商品,销售情况及用户画像

按月增量,含日期字段,自20-01起,目前更新至23-10。表英文名:dws_fushe_haixian_xiaoshou_huaxiang_i_m

画像:年龄分布、性别分布、学历分布、职业分布、购买力分布、收入能力分布、消费水平分布,指标含销售额和单量

字段:主键、指标分类、省份、地市、区县、省份编码、地市编码、区县编码、一级品类名称、二级品类名称、三级品类名称、四级品类名称、画像名称、画像枚举值、销售额指数、销售量指数、日期、月份




邮箱:brain@ruc.edu.cn
官网:http://brain.ruc.edu.cn

地址:中国人民大学公共教学一楼三层1301

扫码关注