@clkao 同學最近很熱血地辦了個台灣零時政府第零次動員戡亂黑客鬆,還寫了篇動員戡亂活動速記,那麼筆者也來描述一下在遠端參加所做的一些項目吧。

這次黑客鬆有個「Open data」(開放資料)的重點主題在,由於對資料的處理及呈現較有興趣,也在過去的工作中有點心得,以前的碩士論文內容也多少有點關係,自然就延續這樣的想法繼續做下去看看。

如果說一般資料處理可以分成「1. 取得 2. 匯整 3. 呈現」三個主要步驟,並且以此來判別政府各處網站(也就是網址結尾為 .gov.tw 的)的「資料開放性」的話,幾乎每一個網站都只有直接提供「3. 呈現」這點。以行政院原子能委員會輻射偵測中心這頁表格來說,民眾看到的是各偵測站數值在當下的狀態,沒有更前一步驟,較原始型態的資料可以看。

其他像是環保署水質監測,或是氣象局天氣預報, 以及最近的實價登錄網站也都是類似的情況。

「雖然這些數值資料有公開出來,不過在呈現方面,受了原始設計的限制」,這是政府各處網站普遍存在的現象。

說起來,如果能將資料以更原始的形式公開出來,方便其他設計師採用的話,想必會有許多美觀、達意而出色的結果才是。

用比喻來說明的話,原能員會輻射偵測中心給的表格就好比是一碗剛煮好、食材豐富的拉麵,已經是很不錯的呈現了。但數據已經被包裝、處理過變成了網頁中的表格,正如豬肉被烤成叉燒、昆布被晒成海帶、大骨被熬成高湯一樣,已經看不到食材原先的風貌了。

但設計師們必需得到原始數據後,才方便進行不同視覺呈現的工作。廚師也需要更青的食材,才能做出不同的菜色。

雖然政府各處都有花心力做資料呈現,但卻沒有提供原始型態的資料。因此在黑客鬆活動中,有不少心力都花費在拆解網頁內容了,實在是相當的可惜。想像一下,為了做出新菜,還必需要先從拉麵還原出豬肉、海帶、豆芽等食材,就會覺得時間都花在不必要的地方上了。

政府的公開資料必需要提供更的原始型態,這是世界的趨勢。台灣政府還沒有跟上。

筆者在這次的活動中所完成的其中一件事,就是是去拆解原能會的輻射偵測數值,並定時丟進graphite 系統記錄。這系統主要是開發來記錄網路流量、系統負載等數值,但其實只要是跟時間相關,可以量化的事件,都可以被記錄,像是氣溫、濕度等等的也很合適。

過了兩、三天後,正好出現一段有意思的變化。

下圖的線為近兩天所有監測站的數值平均線,紫色線為當天(十二月五日),綠色為前一天。從圖左方循綠色線開始看,可以看到本來大致上都在 0.06 上下變化的平均線,過了晚上九點後,一口氣上升到了 0.062 附近,並且持繼了 24 小時後再度下降。

而利用 graphite 的函式可以方便找出「走勢最怪的線」,因此以下是五條最怪的線。分別為陽明山、苗栗、石崩山、蘭嶼、大平,這五個監測站:

可以看到這些線的起落也大致符合整體平均。

由於不是物理領域的專家,筆者不便對這樣的變化下結論,相信有專業人士看了圖表之後能夠解釋。但唯有在動手做了時序記錄之後,這樣的變化才能被呈現出來。光是去讀原能會網頁中大表格上的一堆數字,是很難感覺出來的。

除了這個項目之外也做了一些有的沒有,源碼全部公開在 github g0v 這個組織的名目之下,包括其他人的作品。

如果你認同我們這些黑客為了台灣的人民而正在做的事,有些想法,也許你可以利用 立法委員通訊資料明細 上登錄的聯絡方式,打電話給你的立委,跟他/她聊聊 Open data 這個概念。並非像陽光法案要公開立委薪水,只是要公佈利用稅金完成治國項目後所衍生出的原始資料而已。對於實際上有做功有辛勞的官員、公務員來說,也是能夠充份表達業績的一種方式。

嗯,如果想跟我們些黑客聊聊的話,可以透過 g0v.tw 聊天室,目前各項工作,仍在加速進行中。