在做資料視覺化時,經常會遇到因資料量過大而無法簡單進行處理,或是執行速度過慢的問題。本文章將介紹一套Python上的資料視覺化工具datashader,能將數億個點的大資料快速生成視覺化圖形,並以New York Taxi Trip資料集為範例說明如何使用datashader繪製乘車位置分佈圖。

Continue reading

Isomap,全名為Isometric Mapping, 是一種基於Classical MDS所產生的非線性降維演算法(Nonlinear Dimensional Reduction)。 一般來說,如果資料有著線性分佈的性質,如PCA與MDS這類計算整體資料(Global)之間的關係後再進行降維的線性演算法, 都會有不錯的效果。但如果資料本身為非線性分佈,古典PCA與MDS則時常無法在降維後正確展現出資料間的關係。

Continue reading

Author's picture

Cheng-Shiang Li

Senior software developer. Mastering Android/iOS application development and machine learning algorithm.

Software Enginner

Taiwan