數(shù)據(jù)簡介
- 此次分析的數(shù)據(jù)來自于城市數(shù)據(jù)團對2016年雙11天貓數(shù)據(jù)的采集和整理,原始數(shù)據(jù)為.xlsx格式
- 包括update_time/id/title/price/店名,共5個字段,其中id為商品的唯一標識,店名為品牌名。
分析工具
-
主要使用了Python中的Pandas庫進行數(shù)據(jù)處理,利用matplotlib繪制分析圖表,利用bokeh進行了可視化展示。
-
當前使用版本:Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)]
說明
- 本次數(shù)據(jù)分析主要供學習使用,目的在于熟悉Python及相關(guān)庫,同時練習數(shù)據(jù)分析的思維方式。
- 本次分析主要基于描述性統(tǒng)計,暫不包含預測模型。
- 文字說明會涉及實現(xiàn)的具體細節(jié),而不僅是分析結(jié)果的展示。
- bokeh制圖為交互式圖表,此處截圖展示
- 數(shù)據(jù)每日只采集一次,對于一日之內(nèi)的變化無法進行分析
分析目標
-
商品銷售時間分析
- 統(tǒng)計出商品總數(shù)和品牌總數(shù)
- 計算雙十一當天在售商品占比
- 未參與雙十一當天活動的商品,雙十一之后的去向
- 參加雙十一活動的品牌及其商品數(shù)量的分布
-
價格折扣分析
- 針對每個商品,分析其價格變化,判斷是否打折
- 針對在打折商品,計算其折扣率
- 按照品牌分析,不同品牌的打折力度
- 分析商家打折套路
-
構(gòu)建商品id/品牌的匯總表
- 商品id資料表格
- 品牌匯總資料表格
- 假打折商品詳情
正文
相關(guān)模塊導入
'''
想要學習Python?Python學習交流群:1004391443滿足你的需求,資料都已經(jīng)上傳群文件,可以自行下載!
'''
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
# 不發(fā)出警告
from bokeh.io import output_notebook
output_notebook()
# 導入notebook繪圖模塊
from bokeh.plotting import figure,show
from bokeh.models import ColumnDataSource
# 導入圖表繪制、圖標展示模塊
# 導入ColumnDataSource模塊
import os
加載數(shù)據(jù)和數(shù)據(jù)預處理
設(shè)置工作路徑,pandas導入數(shù)據(jù)
檢查數(shù)據(jù)是否有缺失值
檢查數(shù)據(jù)類型
對數(shù)據(jù)進行基本預處理
查看數(shù)據(jù)
?
Part1 商品銷售時間分析
統(tǒng)計出商品總數(shù)和品牌總數(shù)
計算雙十一當天在售商品占比
未參與雙十一當天活動的商品,雙十一之后的去向
參加雙十一活動的品牌及其商品數(shù)量的分布
統(tǒng)計商品總數(shù)和品牌總數(shù) :
得到商品總數(shù):3502,品牌總數(shù):22
計算雙十一當天在售商品占比 :
得到雙十一當天在售商品占比為:66.68%,約1/3的商品在雙十一當天沒有上架
商品銷售情況分類
為了分析沒參加雙十一的產(chǎn)品去向,我們首先對所有商品id依據(jù)其上架時間進行分類。
根據(jù)date字段,統(tǒng)計每件商品的最早和最遲銷售時間;再統(tǒng)計雙11當天是否銷售;最后進行分類。
A. 11.11前后及當天都在售 → 一直在售
B. 11.11之后停止銷售 → 雙十一后停止銷售
C. 11.11開始銷售并當天不停止 → 雙十一當天上架并持續(xù)在售
D. 11.11開始銷售且當天停止 → 僅雙十一當天有售
E. 11.5 - 11.9 → 雙十一前停止銷售
F. 僅11.11當天停止銷售 → 僅雙十一當天停止銷售
G. 11.12開始銷售 → 雙十一后上架
H. 11.10下架 → 可能11.11售罄 以后單獨分析
?
未參與雙十一活動的商品去向分析
暫時下架
改名上架
預售
未參與活動
未參與雙十一當天活動的商品中:
暫時下架商品的數(shù)量為242個,更名上架商品的數(shù)量為110個,預售商品數(shù)量為453個,未參與活動商品數(shù)量為200個
參加雙十一活動的品牌及其商品數(shù)量的分布
真正參與雙十一活動的商品 = 雙十一當天在售的商品 + 預售商品
對暫時下架/更名上架/售罄商品 后續(xù)可以研究其價格變化再確定
繪制堆疊圖進行可視化
?
補充品牌數(shù)據(jù)匯總
?
Part2 價格折扣分析
1. 針對每個商品,分析其價格變化,判斷是否打折2. 針對在打折商品,計算其折扣率3. 按照品牌分析,不同品牌的打折力度4. 分析商家打折套路
針對每個商品,評估其打折情況
真打折:商品的價格在10天內(nèi)有波動,雙11價格為10天內(nèi)最低價,無提前漲價
假打折:雙十一之前存在漲價現(xiàn)象
不打折:商品價格無變化
?
觀察數(shù)據(jù)可知
假打折商品的品牌集中于妮維雅和美加凈(各6件),美寶蓮有1件
蘭蔻有一件商品在雙十一前漲價后,雙十一當日下架
SKII和薇姿各有一件商品漲價后,雙十一當天維持該價格
大牌套路深,深知法律風險,但這四件商品依舊被劃分在假打折!
真打折的商品約占比24.27%,不打折的商品數(shù)量約占比75.27%,假打折的商品約占0.46%
針對在打折商品,計算其折扣率
去除假打折商品
考慮雙十一價格對比其前后的折扣率,主要考慮前折扣率
只計算九五折以上折扣
?
?
?
觀察上圖可知,商品折扣率主要集中在五折和九折,二者共占50%以上
根據(jù)商品id匯總數(shù)據(jù)
包括商品銷售時間和價格折扣數(shù)據(jù)
?
根據(jù)品牌匯總數(shù)據(jù)
包括品牌商品銷售時間和價格折扣數(shù)據(jù)
計算品牌折扣商品比例
按照品牌分析,不同品牌的打折力度?
利用bokeh繪制浮動散點圖
y坐標為品牌名,x坐標為折扣力度
?
分析商家打折套路
篩選各品牌的折扣商品比例和平均折扣率
劃分四個象限,利用bokeh制圖
?
打折套路解析
少量大打折:雅詩蘭黛、蘭蔻、薇姿、悅詩風吟、歐珀萊
大量少打折:歐萊雅、玉蘭油、美寶蓮、妮維雅、蜜絲佛陀、美加凈
大量大打折:自然堂、相宜本草、佰草集
不打折:SKII、倩碧、蘭芝、嬌蘭、植村秀、資生堂、雅漾、雪花秀
假打折現(xiàn)象:妮維雅和美加凈各有6件商品
Part3 匯總表格導出
商品id資料表格
品牌匯總資料表格
假打折商品詳情
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
