AI for Lawyers系列
已開課
2021-07-27
報名僅開放線上名額, 確認席位時給予直播連結
Python 網路爬蟲:
執行流程(用戶請求流程、程式請求流程)、爬蟲的禮貌、爬蟲的應用場域、法律觀點
Python 資料正則化:
組成字元(普通字元、特殊字元、數量字元)、正規表達法常用函式(group、findall、sub、split、compile)
「有效率地取得可信、完整度高、合於時效、不偏頗的高品質資料」是進行資料分析的重要前提,在開放資料(Open Data)有益提高資料透明度、滿足產業需求、促進價值共創的浪潮之下,許多資料取得來源開始側重線上政府官方統計或權威性組織單位資訊,網路爬蟲作為現今常見且易於取得網路資料的方式之一,其藉由網頁鏈接的URL或API向目標網站伺服器發送HTTP請求並獲得響應,解析伺服器回傳的內容以取得所需資料。而爬蟲所取得的原始資料透過資料正則化後,可篩選出資料中所需的重要關鍵因子,以達成分析及進一步的跨領域運用。
財團法人理律文教基金會著作權所有,非經同意不得翻印轉載或以任何方式重製.
© Lee and Li Foundation., All rights reserved.
Tel: +886- 2-2760-6111 / Fax: +886-2-2756-5111
E-mail: [email protected]
Tel: +886- 2-2760-6111 / Fax:
+886-2-2756-5111
E-mail:
[email protected]