digoal
2022-11-24
PostgreSQL , PolarDB , DuckDB
https://duckdb.org/2022/11/14/announcing-duckdb-060.html
https://duckdb.org/2022/10/28/lightweight-compression.html
DuckDB 数据存储支持轻量级列压缩框架, 已内置多种压缩算法, 0.6.0 新增了FSST, Chimp, Patas压缩算法, 分别用于字符串和浮点类型的压缩.
FSST 对于唯一值较多, 但是样式类似的字符串存储, 例如邮箱地址, 压缩效率很不错.
Compression | Size |
---|---|
Uncompressed | 761MB |
Dictionary | 510MB |
FSST + Dictionary | 251MB |