博客
Databend 开源周报第 72 期
Databend Labs12月 19, 2022
英文版移步:https://www.databend.com/blog/2022-12-14-databend-weekly
Databend 是一款强大的云数仓。专为弹性和高效设计。自由且开源。即刻体验云服务:https://app.databend.cn 。
What's New
探索 Databend 本周新进展,遇到更贴近你心意的 Databend。
Features & Improvements ✨
Multiple Catalogs
- 拓展 show databases SQL (#9152)
Stage
- 支持 select from URI (#9247)
Streaming Load
- 在 streaming load API 的 insert sql 中支持 语法 (#9063)
file_format
Planner
- 将 下推至
limit
(#9210)union
Query
Storage
-
使用 xor 哈希函数辅助计算 distinct count (#9159)
-
在读数据之前先读取元信息 (#9154)
read_parquet
-
将 filter 下推至 parquet reader (#9199)
-
在读取前裁剪 row groups (#9228)
Open Sharing
- 实现 open sharing 原型并添加 sharing stateful tests (#9177)
Code Refactoring 🎉
*
- 化简全局数据注册逻辑 (#9187)
Storage
- 重构删除逻辑 (#8824)
Build/Testing/CI Infra Changes 🔌
Bug Fixes 🔧
Format
- 支持使用 ASCII 控制字符的 hex 表示作为格式字段分隔符 (#9160)
Planner
-
如果 prewhere_column 为空,则 logic.prewhere_column 设置为 get.columns 中的最小列 (#9116)
-
当合并子项为
时,不要将 topk 向下推到Aggregate
(#9183)Merge
-
修复可空列的内部列长度和有效性的不一致问题 (#9220)
Query
- 解决 test_insert 导致单元测试挂起 (#9242)
Storage
What's On In Databend
请持续关注 Databend 的最新动态。
Breaking Change: 统一文件格式选项
为了简单起见,我们为 COPY INTO 命令、Streaming Load API 和所有其他用户需要描述其文件格式的情况提供了一组统一的文件格式选项:
[ FILE_FORMAT = ( TYPE = { CSV | TSV | NDJSON | PARQUET | XML} [ formatTypeOptions ] ) ]
-
请注意,当前以
作为前缀的设置将会被弃用。format_*
-
出于兼容性考虑,
... FORMAT CSV ...