程序开发 · 2024年11月29日

压缩输出与 Go to Ruby 实现不同

当前位置: > > > > 压缩输出与 Go to Ruby 实现不同

来源:stackoverflow
2024-05-01 10:18:35
0浏览
收藏

你在学习Golang相关的知识吗?本文《压缩输出与 Go to Ruby 实现不同》,主要介绍的内容就涉及到,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

问题内容

我正在实现一个程序,将文件压缩为 git blob 并适当存储它。

我有一个基于 git 书中的文章的 ruby​​ 参考实现

我正在尝试在此处实现此功能

但是,我遇到了一个问题,即每个实现中存储的压缩数据略有不同。

vbindiff 显示前 2 个字节是相同的(从这个测试脚本运行)(如果我没读错的话)。这些字节分别存储压缩方法和标志以及标志(根据 https://www.rfc-editor.org/rfc/rfc1950)。第三个字节是差异开始的地方,它要么是字典 ID,要么是原始输入数据的开始。数据保持相似,直到接近文件末尾。我假设这可能是 ADLER32 校验和的差异。

默认情况下,zlib 的 go 和 Ruby 实现似乎都不会向 zlib 传递字典(根据 go zlib 源和 ruby​​ zlib 源)

数据看起来相同。

我不确定库中是否存在实现错误,或者我是否遗漏了某些内容。

为什么这些输出不同?

解决方案

RFC 1951 中定义的 deflate 算法(用于 RFC 1950 定义的 zlib 格式以及 RFC 1952 定义的 gzip 中)允许实现中的变化,这可能会在压缩时导致不同的结果。但这些结果仍然会解压缩到相同的值。这允许在压缩时间和压缩级别之间进行权衡,并使像 这样的程序成为可能,它比原始 zlib 库实现更好的压缩(以明显更长的压缩时间为代价)。

Go 使用自己的用 Go 编写的 deflate 算法实现,而 ruby​​ 使用 。这就是您的示例在同一输入上创建不同压缩输出的原因。但是,如果您从 Go 或 Ruby 程序中获取输出并再次解压缩(无论是使用 Ruby 还是 Go 或任何符合标准的实现),它都会得到完全相同的值。

今天关于《压缩输出与 Go to Ruby 实现不同》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注公众号!