xxUTF
github.com原文 ↗
xxUTF 用 SIMD 加速 Unicode normalization。Unicode normalization 是 tokenizer、搜索索引、数据库比较、输入清洗和多语言文本处理里的基础热路径,但常被当作库函数黑盒;这个项目把性能优化目标放在规范化本身。值得看的是它是否在 correctness、平台 SIMD 分支和 Unicode edge cases 之间取得可维护的平衡。
–浏览
github.com原文 ↗
评论 · Comments