[百日馬拉松] 機器學習-特徵工程
最近參加了機器學習 百日馬拉松的活動,單純記錄下這100天python機器學習中每日覺得最有收穫的地方,如果有想參加這活動的朋友,真心推薦參加!此次機器學習-百日馬拉松的相關代碼放置於:https://github.com/hsuanchi/ML-100-days 相關文章:[百日馬拉松] 機器學習-資料清理https://www.maxlist.xyz/2019/03/03/ml_100days/ 一. 標籤編碼 ( Label Encoding ) 類似於流⽔號,依序將新出現的類別依序編上新代碼,已出現的類別編上已使⽤的代碼 確實能轉成分數,但缺點是分數的⼤⼩順序沒有意義 二. 獨熱編碼 ( One Hot Encoding ) 為了改良數字⼤⼩沒有意義的問題,將不同的類別分別獨立為⼀欄 […]