Skip to content

Files

Latest commit

Dec 15, 2023
f400df2 · Dec 15, 2023

History

History
53 lines (26 loc) · 2.08 KB

20221124_01.md

File metadata and controls

53 lines (26 loc) · 2.08 KB

DuckDB 0.6.0 压缩算法增加: FSST, Chimp, Patas 提升字符串和浮点数压缩能力

作者

digoal

日期

2022-11-24

标签

PostgreSQL , PolarDB , DuckDB


背景

https://duckdb.org/2022/11/14/announcing-duckdb-060.html

https://duckdb.org/2022/10/28/lightweight-compression.html

DuckDB 数据存储支持轻量级列压缩框架, 已内置多种压缩算法, 0.6.0 新增了FSST, Chimp, Patas压缩算法, 分别用于字符串和浮点类型的压缩.

FSST 对于唯一值较多, 但是样式类似的字符串存储, 例如邮箱地址, 压缩效率很不错.

Compression Size
Uncompressed 761MB
Dictionary 510MB
FSST + Dictionary 251MB

digoal's wechat