Apache Kudu 1.11.0 發布了,Kudu 是一個支持結構化數據的開源存儲引擎,具有低延遲隨機讀取與高效分析讀取模式。它基於 Apache Hadoop 生態系設計,並支持與 Apache 軟體基金會其它數據分析項目集成。
此版本帶來的新特性包括:
- Kudu 現在支持維護平板電腦伺服器。在此模式下,如果平板電腦伺服器的副本失敗,將不會重新複製它。僅在退出維護時,才會對任何剩餘的複製不足的平板電腦進行複製。新增了 kudu 伺服器狀態 enter_maintenance 和 kudu 伺服器狀態 exit_maintenance 工具來編排平板電腦伺服器維護,並且 kudu tserver 列表工具已修改為「狀態」列選項,以顯示每個平板電腦伺服器的當前狀態 (see KUDU-2069)。
- Kudu 現在具有內置的 NTP 客戶端,該客戶端維護用於生成 HybridTime 時間戳的內部牆上時鐘時間。啟用后,不再需要運行 Kudu 的節點的系統時鐘同步。這對於容器化部署很有用,在其他情況下,如果在 Kudu 群集的每個節點上維護正確配置的系統 NTP 服務很麻煩時,它也很有用。使用 --builtin_ntp_servers 標誌指定要同步的 NTP 伺服器列表。默認情況下,Kudu 主伺服器和平板電腦伺服器使用 NTP 池項目託管的公共伺服器。要使用內置 NTP 客戶端,請設置 --time_source=builtin 並在必要時重新配置 --builtin_ntp_servers (see KUDU-2935)。
- 現在,可通過 Kudu Java 客戶端中的 KuduClient.getTableStatistics() 和KuduTable.getTableStatistics() 法以及 Kudu C++ 客戶端中的 KuduClient.GetTableStatistics() 向 Kudu 客戶端提供匯總表統計信息。這允許進行各種查詢優化。例如,Spark 現在使用它來執行聯接優化。統計信息可通過 C++ 和 Java Kudu 客戶端的 API 獲得。此外,可通過 kudu 表統計信息 CLI 工具獲得每個表的統計信息。還可以通過主機的 Web UI 在 master:8051/metrics and master:8051/table?id=<uuid> URI上獲得統計信息 (see KUDU-2797 and KUDU-2921)。
- kudu CLI 工具現在支持更改表列。使用新引入的子命令,例如
kudu table column_set_default
, kudu table column_remove_default
, kudu table column_set_compression
, kudu table column_set_encoding
,和 kudu table column_set_block_size
來更改指定表的列。
- kudu CLI 工具現在支持刪除表列。 使用新引入的 kudu table delete_column 子命令刪除指定表的列。
- kudu CLI 工具現在支持獲取和設置表的其他配置屬性。 使用
kudu table get_extra_configs
和 kudu table set_extra_config
子命令執行相應的操作 (see KUDU-2514)。
- kudu CLI 工具現在支持為表創建和刪除範圍分區。 使用
kudu table add_range_partition
和 kudu table drop_range_partition
子命令來執行相應的操作 (see KUDU-2881)。
更新說明:https://kudu.apache.org/releases/1.11.0/docs/release_notes.html