.NET 性能优化的技巧(3)
当复杂对象包含众所周知的字段(如int,Guid,string)时,代码生成器将直接插入对这些类型的手动编码编解码器的调用,而不是调用CodecProvider来检索该类型的IFieldCodec 在运行时专门化泛型类型 与上面类似,代码生成器可以生成在运行时使用专门化的代码。 预先计算常数值以消除某些分支 在序列化期间,每个字段都带有一个标头,通常是一个字节。它会告诉解串器哪个字段是编码的。此字段标题包含3条信息:字段的规格(固定宽度、长度前缀、标记分隔、引用等),字段的模式类型(预期、众所周知、以前定义的、编码)用于多态,并将最后3位专用于编码字段id(如果它小于7)。在许多情况下,可以确切地知道在编译时这个标头字节是什么。如果字段具有值类型,那么我们就知道运行时类型永远不能与字段类型不同,并且始终知道字段id。 因此,我们通常可以保存计算标头值所需的所有工作,并可以直接将其作为常量嵌入到代码中。这样可以节省分支并且通常会消除大量的中间语言代码。 选择适当的数据结构 通过切换到结构数组,很大程度上消除了索引和维护集合的成本,并且参考跟踪不再出现在基准测试中。这有一个缺点,对于大型对象图,这种新方法可能较慢。 选择合适的算法 Hagar花费大量时间对可变长度整数进行编码/解码,这种方法被称为varints,varints是用一个或多个字节序列化整形的一种方法,以减小有效载荷的大小。许多二进制序列化器使用这种技术,包括协议缓冲区。甚至.NET的BinaryWriter也使用这种编码。下面是参考资料的一小段:
我想指出ZigZag编码对于包含负值的有符号整数可能更有效,而不是强制转换为uint。 这些序列化器中的变量使用称为Little Endian Base-128或LEB128的算法,该算法每字节编码多达7位。它使用每个字节的最高有效位来指示是否跟随另一个字节(1 =是,0 =否)。这是一种简单的格式,但可能不是最快的。不过PrefixVarint更快,使用PrefixVarint,所有来自LEB128的1都是在有效载荷的开头一次性写入的。这可能让我们使用硬件内在函数来提高这种编码和解码的速度。通过将大小信息往前移,我们也可以从有效载荷中一次读取更多字节,从而减少内部压力并提高性能。
(编辑:ASP站长网) |