Skip to content

YoweioY/104_webcrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 

Repository files navigation

104網站之資料分析職缺分析

一、目的

  1. 了解該職缺在各地區的職缺數分布情況
  2. 探討職缺數是否會隨時間而有變化
  3. 學經歷對職缺數的影響

二、方法

  1. 利用selenium爬蟲程式抓取104網站搜尋關鍵字「資料分析」的結果資料
  2. 每個月抓取一次,每次共150頁(約3000筆資料),持續5個月,抓取「標題、公司名稱、地區、經驗、學歷、網址」作為特徵。
  3. 前處理: 職缺標題須包含「資料、數據、Data、商業分析」等關鍵字,地區限於台灣地區,薪資換算以月薪為單位並取平均,待遇面議以45000取代。
  4. 將前處理過後之資料利用tableau做視覺化分析。
  5. 根據104_crawler.py執行可得到結果,需更新chrome版本,如欲更改目標職缺可在搜尋條件更改與資料處理部份更改篩選條件。

三、結果

  1. 職缺數從3月微伏增加至6月,在6月時最多,但無論職缺數或薪資5個月均無明顯差異。
  2. 台灣各地區的職缺數統計顯示,台北市該職缺的數量最多,明顯多於其他縣市,接續為新北市與新竹。
  3. 台北市的職缺數以信義區、內湖區、中山區較多。
  4. 無論在哪個時間點,皆有約八成的比例要求應徵該職缺需有大學以上學歷。
  5. 沒有工作經歷的求職者約有30%以上的職缺滿足條件。

Tableau網址:https://reurl.cc/G4Zbxy 

四、應用與改善方向

  1. 此分析能讓求職者更了解目標職缺的狀況與地域分布,幫助求職者做更合適的選擇。

  2. 有關資料分析的職缺名稱較多元,可能造成去除符合條件的職缺或納入不符合條件的職缺。

  3. 許多薪資顯示待遇面議,導致可能無法統計出精確的數值,因此薪資條件僅供參考。

About

104網站之資料分析職缺分析

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages