01 Python 電商數據分析10 所有文章

[數據分析] 如何利用 Google Trend (搜尋趨勢) 挑選爆款商品

Google Trend 預測爆款商品

每個月要從 4000 件商品挑出 3~5 件商品出來打廣告,銷售的好壞其實很考驗投手的挑品能力;此篇利用 Python 串 Google Trend API 爬取過去大量資料,Pandas合併和整理,再利用 Decision Tree、KNN、Logistic Regression…等 8 種模型進行機器學習來預測未來搜尋熱度,最後利用這些數據輕鬆地挑選商品來進行推廣。

大綱:如何從 4000 件商品挑出 3~5 件商品來投放廣告?

第一步:Python爬取資料
第二步:資料清理
第三步:資料篩選
第四步:建立預測模型
結論:Google Trend 與 Google Analytics 數據交叉比較

如果想了解更多爬蟲可以閱讀:[學習筆記] Python爬蟲_Selenium爬取商品庫存

第一步:Python爬取資料

Google Trend 有開放 API,所以在Python 爬資料的部分比較簡單,但每次拿取資料最多不能超過五筆,所以在這邊多寫了 for 迴圈,再合併到 pList 裡面,就輕鬆拿到 5 年內的關鍵字搜尋熱度資料囉!

API連結 : https://github.com/GeneralMills/pytrends

GoogleTrendPython_GetData
(利用 Python 串 Google Trend API 獲得過去搜尋量資料)

第二步:資料清理

先把缺失值(沒有搜尋熱度的關鍵字)都設定為0後,利用 numpy、pandas來整理商品熱度和日期,最後利用 update 合併兩份資料,接下來就可以進行資料處理的部份囉!

GoogleTrendPython_DataCleaning
(將過去五年的Google Trend搜尋量整理成表格)

第三步:資料篩選

因為很多產品(像是冷氣、電暖爐),這種都會有季節性趨勢,故在篩選時特地用每一季來做區隔,並且只與過去相同的季度進行比較,最後就從四千多樣商品裡面,挑出了目前搜尋熱度上升最大的 10 件商品,和目前搜尋熱度下降最多的 10 件產品。

GoogleTrendPython_Data_top
(Google Trend 搜尋熱度上升幅度最大的前10件商品)
GoogleTrendPython_Data_last
(Google Trend 搜尋熱度下降幅度最大的10件商品)

第四步:建立預測模型

建立八種模型進行預測,其中包含 Decision Tree、KNN、Logistic Regression、Random Forest、Naive Bayes …等模型,並取其預測分數最高的三種模型的預測值進行平均,即可獲得未來一個月的搜尋熱度預測。

GoogleTrendPython_Machine Learning
(建立八種模型,進行機器學習預測未來搜尋趨勢)
GoogleTrendPython_Machine Learning2
(取前三名的模型,將預測熱度進行平均)

再將預測資料和剛剛篩選出來前 Top15 進行合併,可以觀察出環保餐具、環保吸管、便當盒和保鮮盒都是未來相當適合推廣的產品,且也很適合推出組合包進行銷售。

GoogleTrendPython_Data_result
(與先前的搜尋排名較高產品進行資料合併,可看出近期環保議題相當受到重視,建議組合產品包銷售)

結論:Google Trend 與 Google Analytics 數據交叉比較

利用 Google Analytics 的資料將不重複購買數量和購買金額與 Google Trend 的搜尋熱度資料合併;測試了家電、食品和美妝不同產業的 Data,大致數據都如下圖呈現,當 Google Trend 搜尋熱度上升時隔幾天後交易數量和金額都有明顯上升。

GoogleTrend_GoogleAnalystic
(這邊 X 軸是 month,因為總共資料是五年,所以是 5×12=60)

▍數據分析相關延伸閱讀:

那 [學習筆記] 如何利用 Google Trend (搜尋趨勢) 挑選爆款商品 就到這邊感謝收看,如文章內容有誤請不吝指正!

有關 Max行銷誌的最新文章,都會發佈在 Max 的 Facebook 粉絲專頁,如果想看最新更新,還請您按讚或是追蹤唷!
Max行銷誌:https://www.facebook.com/maxlist25/

在〈[數據分析] 如何利用 Google Trend (搜尋趨勢) 挑選爆款商品〉中有 3 則留言

  1. 您好 不好意思 最後的結論不太能夠理解@@

    環保餐具、環保吸管、便當盒和保鮮盒的 Pre_Diff 值 皆為負數
    不是代表未來搜尋熱度會下降?@@

    再麻煩解惑了,
    謝謝您 Orz

  2. 環保餐具、環保吸管、便當盒和保鮮盒的 Pre_Diff 值 皆為負數
    不是代表未來搜尋熱度會下降?
    -> 還需要搭配DIFF指標來檢視
    環保系列產品在過去的搜尋熱度平均偏低,預測值Pre_Diff偏低,而DIFF偏高,代表是當期突然串紅的商品,故會建議關注此系列產品;而Pre_Diff偏高,DIFF偏低的商品,則較屬於季節性產品,也會建議推廣。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *