Erlang的比特语法(Erlang Bit Syntax)提供了一种方法来匹配二进制数据,这使得Erlang二进制对象在某种程度上等同于其他Erlang对象,如元组和列表。也因为其快速高效,使得在Erlang中,二进制对象被广泛使用,尤其是在协议编程方面。(官方文档)
Erlang的比特语法表达式:
<<>> <<E1,...,En>>
每个元素Ei指定了一段二进制串(bit string)。每个元素Ei都是一个值,后面可以带有可选参数Size、typespecifierList
Ei = Value | Value:Size | Value/typespecifierList | Value:Size/typespecifierList
Size表示前一个Value数据存储的位数,默认是8位,也就是一个字节。
typespecifierList可以是以下几种类型及其组合,组合以 - 相连
Type = integer | float | binary | bytes |bitstring | bits | utf8 | utf16 | utf32
默认值是integer。bytes是binary的简写,bits是bitsring的简写
Signedness = signed | unsigned
只有当type为integer时有用,默认是unsigned
Endianness = big | little | native
当type为integer,utf16,utf32,float有用,默认是big
Unit = unit:IntegerLiteral
有效范围是1-256,integer、float和bitstring默认是1,binary默认是8
例如:
-define( UINT,32/unsigned-little-integer). -define( INT,32/signed-little-integer). -define( USHORT,16/unsigned-little-integer). -define( SHORT,16/signed-little-integer). -define( UBYTE,8/unsigned-little-integer). -define( BYTE,8/signed-little-integer). -define( CHAR,1/binary-unit:8).
1> Bin1 = <<1,17,42>>. <<1,42>> 2> Bin2 = <<"abc">>. <<97,98,99>> 3> Bin3 = <<1,42:16>>. <<1,42>> 4> <<A,B,C:16>> = <<1,42>> 5> C. 42 6> <<D:16,E,F>> = <<1,42>> 7> D. 273 8> F. 42 9> <<G,H/binary>> = <<1,42>> 10> H. <<17,42>> 11> <<G,H/bitstring>> = <<1,42:12>>. <<1,2,10:4>> 12> H. <<17,10:4>>
例子说明:
1、例子1和2:从一组常量或一个字符串来构造二进制对象
1> Bin1 = <<1,42>>. 2> Bin2 = <<"abc">>.
以上生成的二进制大小为3。binary_to_list(Bin1) 得到 [1,42],binary_to_list(Bin2) 得到[97,99]。数字常量是在0-255之间的整数,用8位存储,如果超过这个范围后面加:Size来说明,如<<256:16>>。字符则会转化为ASCII码。
2、例子3:从一组限定边界的变量来构造二进制对象
3> Bin3 = <<1,42:16>>.
以上生成的二进制大小为4。
上面,我们给42指定了16位的大小来储存,所以在内存中的数据为0000 0000 0010 1010,这样构成出来的对象就是<<0,42>>
3、例子4、6:按照某种形式匹配二进制对象
4> <<A,42:16>>. 6> <<D:16,42:16>>.
例子4很好理解,这里说一下例子6吧,为何D会得到273的结果?
<<1,42:16>>生成的二进制数据前面说过了,为<<1,42>>
D:16表示匹配内存中16位的二进制数据,所以的到就是<<1,17>>在内存中的数据,为0000 0001 0001 0001,结果就是256 + 16 + 1,也就是273
4、例子11:也是从一组限定边界的变量来构造二进制对象,和例子3不同的是大小不是8的倍数。
<<1,42:12>>.
上面,我们给42指定了12位的大小来存储,所以在内存中的数据为0000 0010 1010,
这样构造出来的对象就是<<2,10:4>>
在erlang 二进制中,对象默认以8位为一个单位来表示,不足就向后面借位,比如:<<42:12,1,17>>生成的二进制对象是<<2,160,1:4>>,其实两者表达的是一段相同的二进制数据。
注意:
"B=<<1>>" 在erlang中被解释成 "B =< <1>>",这会引起一个语法错误“Syntax error before: '<'”。正确的做法是写成 "B = <<1>>"
binary与bitstring的区别?
erlang文档有说明:
A bitstring is a sequence of zero or more bits,where the number of bits does not need to be divisible by 8. If the number of bits is divisible by 8,the bitstring is also a binary.
就是说,binary也是bitstring的一种,当二进制串大小能被8整除,就是binary
什么情况下会区分?
如模式匹配:
foo(<<A:8,Rest/binary>>) -> {binary,A,Rest}; foo(<<A:8,Rest/bitstring>>) -> {bitstring,Rest}.
2015/7/17 补充binary与bitstring的区别
参考:http://blog.csdn.net/mycwq/article/details/11529755