[數據分析] 剖析Google Analytics:從報表理解到實作筆記

發佈於 1 則留言分類: 01 Python 電商數據分析10 所有文章

最近剛啃完這本『剖析Google Analytics:從報表理解到實作』- 作者Harris先生,因此對Google Analytics的每則分頁有更深入的了解;這是本很適合初學者入門GA的書籍,以下是筆記心得提供參考~ 延伸閱讀:[數據分析] Google Analytics疑難雜症大解惑筆記 C1.網站分析對企業產生的價值 受眾:更暸解網站使用者的性別、興趣和年紀 流量:可觀察使用者是從何而來。 行為:使用者在網站的瀏覽路徑、停留時間…等。 轉換:在網站上發生的交易次數和金額。 C2.認識網站指標與維度 在Google Analytics上有很多名詞,而已下是最常見的幾個維度和指標:跳出率/離開率、工作階段/使用者/瀏覽量。 使用者:埋設Cookie在瀏覽器上進行追蹤,使用不 […]

[爬蟲筆記] Python Selenium 爬蟲教學:實作商品庫存爬取

發佈於 發佈留言分類: 03 Python 爬蟲教學10 所有文章

利用 Python 寫 Selenium 爬蟲來爬取網站的商品狀態,其中使用到 Selenium 等待網頁載入完畢,BeautifulSoup 解析爬取資料,和 Smtplib 將結果寄信給我和同事,最後用 Linux 內建的 Crontab 排程於每日早上執行這件事情,就這樣每天進公司前就可以在信箱裡面看到這份資料了~ 第一步:Python Selenium自動開啟瀏覽器! 這部分原本是使用 implicitly_wait(): 隱式等待的方法,但因為 WebDriver 常常等到超出時間設定造成回拋異常,所以這邊改成先讓他沈睡 5 秒鐘,再進行爬取資料!   第二步:BeautifulSoup解析網頁 這部分嘗試了 findall() 但最後還是選擇用 selcet() 將 # […]