當前位置 > 首頁 > 案例分析 > 阿里巴巴數據分析實戰:超詳細的母嬰電商分析流程

阿里巴巴數據分析實戰:超詳細的母嬰電商分析流程

來源:中國數據分析行業網 | 時間:2020-05-21 | 作者:數據委

隨著科技互聯網的發展,電子商務在現代商務企業的發展中占有越來越重要的地位,而數據分析作為電商行業非常重要的一種運營手段,在營銷管理、客戶管理等環節都需要應用到數據分析的結果。本文以阿里巴巴天池的嬰兒用品購買數據為例,進行相關分析并提出建議。

 

數據理解

1. 數據來源

筆者在阿里巴巴天池下載的數據,這部分幫大家整理好了,可以在文末添加客服領取。

 

2. 字段含義

 

 

 

分析思路

1. 問題
  • 年齡段的分布情況
  • 哪一類商品最受歡迎
  • 不同性別對商品的選擇情況
  • 同一商品大類下不同分類的暢銷程度
  • 用戶購買商品的季節性偏好
2. 思路
產品、用戶兩個維度展開:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 數據清洗
1.在此次的數據分析中不需要用到表1的“物品編號”、“商品屬性”列,隱藏該列。
2.修改列名,改成中文。
3.表1為用戶購買記錄,不能排除同一位用戶在同一天重復購買相同商品的情況,所以不做重復值剔除,表2用戶ID無重復值。
4.表1各列計數均為29972,表2各列計數均為954,未發現缺失值。
5.生日、購買日期通過分列功能轉化成日期格式,性別通過if函數轉換成文本“女、男、未知”,通過vlookup函數多表關聯查詢功能及datedif函數求得購買年齡。
6.通過排序和篩選功能,將購買年齡為28歲的數據進行異常值剔除。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 問題分析
1. 產品維度
(1)一級商品種類按季度匯總銷量如下
發現2012年只有三、四季度的銷量數據,2015年只有一季度的銷量數據且并不完整。為了保持數據完整性,故選取2013、2014年進行分析。
從年度銷量數據來看,28居銷量第一,其次是50014815,但2014年50014815銷量激增反超28奪得銷量榜首,28增長率在品類中倒數第一?,F通過假設檢驗分析方法進行具體分析。
假設一:少數客戶購買銷量巨大,對各品類商品總銷量有明顯影響
對購買量進行描述性分析,如下圖:
大多數的訂單購買量為1,最大單筆購買量為10000,標準差為63.99,說明存在少量客戶大量購買導致銷量劇增的情況,剔除與平均值偏差超過3倍標準差的異常值,即購買數量大于192的數據樣本。
進行剔除前后年度銷量數據比較如下:
由上圖可以看出,2014年50008168的銷量激增很大一部分原因來自個別客戶的大量購買,剔除異常數據后,28依舊為用戶最受歡迎的選擇,假設一成立。
假設二:促銷活動有帶動作用
進行剔除前后季度銷量數據比較如下:
由上圖可以看出,122650008、50022520、38季度銷量比較穩定,28、50008168和50014815銷量最多主要在四季度,考慮到大客戶訂單對銷量影響明顯,提取這三個品類剔除異常值的四季度日銷量進行分析。
可以看出28、50008168和50014815的銷量峰值主要集中在11月11日和12月12日前后,推測為雙十一和雙十二促銷活動帶動銷量的增長,假設二成立。
(2)對一級商品種類內銷量前十的二級細分商品銷量進行分析
由上圖可知,50014815和38中二級商品細類銷量排第一的分別是50018831、211122,都在60%以上,各商品銷量差距大;而一級商品種類中28、50008168、50022520和122650008購買量排名前2的二級細類商品占比均在40%左右,各商品銷量較為均衡。
(3)為了保證數據的完整性和排除個別客戶大量訂單對數據造成影響,選取2013-2014年異常修正后的數據進行分析。
商品銷量在二季度、四季度有增長峰值,對這兩個季度進行月銷量分析。
二季度和四季度月銷量最多的分別是5月和11月,對這兩個月份進行日銷量和細化一級種類商品銷量分析。
由此可以得出,5月銷量集中在11日之后和月底,查詢當年節日正值母親節之際和兒童節前期,而11月份銷量主要集中在11日前后,為雙十一購物狂歡節時期。除此之外,無論是5月還是11月,銷量貢獻主要集中在一級品類商品28、50008168、38。
(4)復購率
總用戶數為29943人,重復購買的用戶數一共25人,復購率為0.083%,不到千分之一可以忽略,可能原因有①產品不被客戶認可,缺乏用戶年度②產品為耐用型。這部分需要額外的數據支撐,這里不再研究。
2. 用戶維度
(1)年齡分布情況如下:
提出假設:嬰兒年齡越小用戶購買需求越大
進行相關分析:
年齡與購買人數的相關系數為-0.86,高度負相關,證明假設成立。
其中,各年齡層偏愛的一級商品種類前三分別是50014815、50008168、28。
(2)性別比例
在總銷量中,女嬰購買量占52.75%,相比男嬰購買量的47.25%高出5.5%,說明女嬰的購買需求大于男嬰。
由上圖可知,50014815最受女嬰用戶歡迎,50008168最受男嬰用戶歡迎。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? 結論建議
1.用戶的購買量相差大,少數客戶下單量巨大對銷量有明顯影響,建議做好大客戶的服務,保持長期合作關系。
2.節日性活動對銷量提升有明顯促進作用,重點關注母親節、兒童節、雙十一和雙十二。
3.銷量貢獻主要集中在一級品類商品28、50008168、38,根據商品的過往銷量情況做好庫存管理。
4.5歲以內是購買主力,隨年齡增長購買需求下降,而女嬰消費比例略高于男嬰,后續策劃促銷活動可側重借鑒此類用戶畫像。
5.復購率極低,要重點了解原因,如不是因為商品本身特性如耐用品,會有很高的提升空間。
腾讯分分彩图标 海南体彩新环岛赛 广东11选五怎么中 福建快三走势图50期 做网页赚钱的平台有哪些 真钱打牌类游戏 新时时彩软件 云南时时彩玩法 炒股380万剩60万破产 股票财经网址大全 福建快三遗漏基本走势图