• 跨境桥

    扫面微信二维码,及时联系我们

【电商数据】电子商务数据初探

摘要:数据分析只是一种手段、一种工具,用来对相应行业的现状或未来做一些有针对性的分析,为当前活动和未来预测的讨论提供理论依据。所以在分析数据之前,我们需要了解分析的原因是什么,我们需要从数据分析中得出什么结论,什么数据有助于我们分析,在分析数据的过程中有哪些负面影响,如何选择我们需要的数据,以及如何让大家在***的结论中理解和理解我们的结论。这是主要数据分析需要考虑的。我们将这些步骤总结为

【电商数据】电子商务数据初探

数据分析只是一种手段、一种工具,用来对相应行业的现状或未来做一些有针对性的分析,为当前活动和未来预测的讨论提供理论依据。所以在分析数据之前,我们需要了解分析的原因是什么,我们需要从数据分析中得出什么结论,什么数据有助于我们分析,在分析数据的过程中有哪些负面影响,如何选择我们需要的数据,以及如何让大家在***的结论中理解和理解我们的结论。这是主要数据分析需要考虑的。我们将这些步骤总结为

提出了理解数据清洗数据和建立模型数据可视化的问题。

在对***级数据的初步探索中,我们获得了巴西部分电子商务公共数据集的olist。在观察了相应的字段之后,我们提出了以下问题:

数据源中有很多字段,其中关键字段有:订购产品价值、订购产品数量、订购销售商数量、客户所在城市、产品类别名称和得分。

当我们得到数据集时,它的头是英文的。我们通过谷歌翻译得到对应字段的中文解释:

我们选择整个表,在数据页签中使用删除重复项的功能,

在数据清理过程中,我们可以看到与日期相关的列中的数据有一些异常。它们都是带小数点的数字。那是因为数据格式错误。我们可以右击设置单元格格式或删除空间来修改数据。结果如下:

开始时,使用“查找并选择”工具查找缺少的空白单元格。在这个数据集中,丢失的数据是日期,而不是关键数据,这对我们的数据分析过程没有影响,所以我们不会处理它。

对于我们想要得到的结论,我们需要透视表中的数据来得到相应的结论。

透视后的数据如下:

通过透视图,我们可以清楚地看到我们刚才提出的问题的答案:

购买多的三个城市是圣保罗、里约热内卢和新奥尔良。

销售额***的三个项目是床上用品、手表礼品和电脑配件。

销量***的三大商品是床上用品、家具装饰和美容保健

前三项是鲜花、床垫、软垫家具和进口书籍。

经过一系列的数据分析,得出了相应的结论。但在这个时代,数据往往是上百万的,所以很难让公众看到一系列的数据,因为数量太大。分析数据后,我们可以将数据转换成一个易于理解和表达的图表。

将数据做成饼图,可以直观地看到部分商品的销售情况,预测下一阶段的销售计划。