《Perl语言入门》之一――标量数据

数字
在Perl内部,所有数字按照双精度浮点数来保存和运算。
对于非十进制的整数直接量――八进制以0开头(如0377),十六进制以0x开头,二进制以0b开头。对于非常长的数字(例如 0x00411137和987654321),可以用下划线分割(如0x0041_1137和987_654_321)


字符串
Perl的字符串没有长度限制,而且完全支持Unicode,可以在字符串中使用任意的Unicode字符。不过由于历史原因。它不会自动将源代码当作Unicode编码的文本读入,所以如果想要使用Unicode书写的直接量,必须手工加上utf8编译指令。
字符串有两种书写方式:单引号内的字符串和双引号内的字符串――单引号内所有的字符都代表它们自己,除了部分由反斜线表示的转意字符;双引号中的反斜线更为强大,可以转意很多控制字符。为了更清楚地区分如何使用单引号和双引号,可以在由单个字符组成的简单字符串中使用单引号,其他包括转意、插入变量等情形都使用双引号。

'barney' #单引号内的简单字符串 
"Hello world\n $version \x{2668}" #双引号内的字符串

进行变量内插时,Perl会尽可能使用最长且合法的变量名称,要是你想在内插的值后面紧接着输出字母、数字和下划线,可能会碰上麻烦。同其他shell脚本一样,Perl里我们可以用一对花括号将变量名围起来以避免歧义,或者可以先把字符串拆成两半,再利用连接操作符拼接起来。
常用的字符串操作符有两种――字符串连接(".")和字符串重复("x")

'hello' . 'world' #等同于"helloworld" 
'fred' x 3 #等同于'fredfredfred'


标量变量
所谓变量,就是存储一个或多个值得容器的名称。而标量变量,就是只存储一个值得变量,还有其他类型变量,例如数组和哈希,它们都可以存储多个值。
Perl程序里面大部分变量名称都习惯使用小写,如果变量名不止一个单词,可以使用下划线分开($underscores_are_cool)或者驼峰命名法($giveMeInitialCaps)


布尔值
Perl没有专用的Boolean数据类型,它是靠一些简单的规则来判断的:

  • 如果是数字,0为假,其他为真

  • 如果是字符串,空字符串为假,其他为真('0'比较特殊,值为假)

  • 如果既不是数字也不是字符串,就先转换成数字或字符串再行判断。

这里还有个小技巧,由于'!'可以颠倒真假值,而Perl有没有专门的布尔类型变量,所以人们常常把布尔值归一化到以下两个值来表示:

$still_true = !! '1' 
$still_false = !! '0'


其他常用的规则
惯例一:任何需要变量的地方,都可以用赋值运算表达式代替。实际上Perl会先做复制运算,然后返回复制后的变量。

chomp($test = <STDIN>); # 读入文字,略过最后的换行符

惯例二:除非去掉括号会改变表达式的意义,否则括号可以省略。

$text = <STDIN>;
chomp $text;

惯例三:Perl程序员常常根据需要把新变量当作零或空字符串来用。

# 累加一些奇数 
$n = 1; 
while ($n < 20) { 
    $sum +=$n; 
    $n += 2; #准备下一个奇数 
}

相关文章

1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(...
最近写了一个perl脚本,实现的功能是将表格中其中两列的数据...
表的数据字典格式如下:如果手动写MySQL建表语句,确认麻烦,...
巡检类工作经常会出具日报,最近在原有日报的基础上又新增了...
在实际生产环境中,常常需要从后台日志中截取报文,报文的形...
最近写的一个perl程序,通过关键词匹配统计其出现的频率,让...