完成資料的爬蟲之後,大量的原始資料(raw data)未經清整及分析的情況下,無法提供簡潔而兼具信度及效度的分析結果。本課程以車禍案件中,當事人有無注意車前狀況為例,示範如何從巨量資料中依循邏輯篩選所需要的特徵因子、歸納整理表格的一系列資料清整流程。在資料清整後,若進一步將整理過的表格進行資料視覺化,使文字轉換為圖形,將有助於直觀理解資料的分布、比例、趨勢。Plotly作為Python資料視覺化的開源模組,得編輯不同類型圖表的相應程式碼,並調整變數設定後完成資料視覺化。最後,模組化的設定則可以讓使用者與程式進行互動,完善整個專案的布局。

講座影片:

資料清整及視覺化 陳偉傑助教

專案進行期間經常需要向其他團隊進行協商、溝通、研討,然而要在每一階段實際做出成果將耗費許多時間、金錢,且成果也不一定盡如人意。Figma為最熱門的線上介面設計工具之一,能協助使用者進行UI(user interface)、UX(user experience)、網頁、App應用程式的介面設計,讓不同團隊能夠直觀了解程式運作及未來與使用者互動的模擬情況。除內含元件庫系統外,Figma更支援多人協作,可在不同時間地點共同編輯繪製,提升團隊協力創作的效率。本課程說明Figma基礎畫面設計及其運作原理,作為程式專案的發表工具之一。

講座影片:

Figma 畫面設計 陳偉傑助教

Python因易於理解、學習,並擁有廣泛支援的套件及開源擴充程式庫而備受開發專案所青睞;然而,其執行效率卻遠低於編譯語言(如C++)。NumPy作為Python的擴充程式庫,支援維度陣列與矩陣運算,並提供大量數學函式,提升Python平行處理能力,兼容高效開發及執行效率。不過,巨量資料縱然經過NumPy運算處理,卻仍可能因為數量過於龐大導致無法正確而快速的理解所代表的意涵。因此,透過Python的另一個擴充程式庫Matplotlib支援List及NumPy資料的圖像化,可將數值以曲線趨勢圖、直方圖、散佈圖、圓餅圖等方式呈現,便於理解數值背後的意義。本課程從NumPy與 Matplotlib的引用(import)開始,學習NumPy的矩陣建立、數值提取、四則運算、數值檢查;並將NumPy生成的資料以Matplotlib進行視覺化。

講座影片:

程式實作3:Python語法入門(邏輯運算與條件式語法、陣列宣告與操作、流程控制)