First Transformation and Job
接下來就開始試著建立第一個 Transformation 與 job 吧!
First Transformation
在第一個 Transformation 中,我們要在 Kettle 中產生資料,並驗證資料,最後在加入序列碼 (Sequence)。
首先,點上方功能列的 File,再點擊 New,選擇 Transformation,以新增一個新的 Transformation,如下圖所示。
接下來,在右方的 Design 中,拖曳 Input 中的 Generate Rows 圖示到設計區域,結果如下圖所示。
對於設計區域的步驟點擊左鍵後,可看到四個按鈕,如下圖所示。 最左邊的圖示可設定步驟的前一步,最右邊的圖示可設定步驟的下一步。第二個圖示是編輯步驟 (Edit Step)。第三個圖示是其他可對此步驟的操作。
首先編輯 Generate Rows,設定要產生的資料型態與格式。 Limit 為欲產生的資料筆數。點擊 Fields 中的空白欄位後,可建立變數名稱、型態、欲產生值與其他格式。例子如下圖所示,注意日期格式。
接下來,加入 Checksum 資料驗證步驟。在 Design,拖曳在 Transformation 中的 Add a checksum 的圖示到設計區域。將資料來源設定為 Generate Rows 。
編輯此步驟,設定範例如下圖。其中 Get Field 可直接全選前步驟的欄位。並設定 Result field ,也就是欄位的名稱。 Compatibility Mode 是使與較舊版本相容,可見說明。最後點擊 Help 旁的空白部分,以完成設定 (介面無顯示,應為 Bug)。
最後,加入 Add sequence 新增序列號。在右方的 Design中,拖曳在 Transformation 中的 Add sequence 圖示到設計區域。設定資料來源為 Add a checksum,編輯此步驟,主要設定 Name of value (欄位名稱) 即可。
以上步驟都設定好後,就可以點選執行,如下圖所示。
若無設定錯誤,點擊 Add sequence後,下方的 Execution Results 中的 Preview data 應如下圖所示。 最後將此 Transformation 另存新檔,以利設定下面的 job 。
First Job
在第一個 Job 中,我們要將上面的 Transformation 再進一步包裝。首先新增一個新的 Job。(File -> New->job)
在 Design ,拖曳在 General 中的 START 到設計區域,編輯此步驟可以制定排程,如下圖所示。
接著再拖曳 在 General 中的 Transformation 到設計區域,並編輯此步驟,主要是 Transformation filename 要指定上面所設定的 Transformation 檔案的路徑。
最後再拖曳General 中的 SUCCESS 到設計區域,作為 Job 的結束點。
點選執行,以執行此 Job。
這樣,第一個 Transformation 和 Job 就完成了!