第 5 章操作符和表达式

# 操作符和表达式

主要内容

C 提供了所有你希望编程语言应该拥有的操作符
- 它甚至提供了一些你意想不到的操作符
- 事实上， C 被许多人所诉病的一个缺点就是它品种繁多的操作符
  - C 的这个特点使它很难精通
- 但另一方面， C 的许多操作符具有其他语言的操作符无可抗衡的价值
  - 这也是 C 适用千开发范围极广的应用程序的原因之一
在介绍完操作符之后，将讨论表达式求值的规则，包括操作符优先级和算术转换。

书本内容

5-0-2021-08-20-00-02-57

# 操作符

书本内容

5-1-2021-08-20-00-02-32

# 算术操作符

书本内容

5-1-1-2021-08-20-02-10-09

# 移位操作符

书本内容

5-1-2-2021-08-20-02-10-33

# 位操作符

书本内容

5-1-3-2021-08-20-02-10-45

笔记

标准说明无符号数所有的移位操作均为逻辑移位

# 赋值

书本内容

5-1-4-2021-08-20-02-11-56

EOF

EOF 在 stdio.h 中按如下语句定义，其字面值的默认类型为 int
```
#define EOF (-1)
```
1
在终端中输入 EOF (opens new window)
- Linux 下为 Ctrl + D, Windows 下为 Ctrl + Z
- 可能要输入 Enter 才会生效
getchar() 的返回值为 int
- 当其读入 EOF 后，返回值为 -1
- 如果 int 有 32 位，则 -1 的十六进制为 0xFFFF FFFF
对于下列语句
```
char ch;
...
while ((ch = getchar()) != EOF)...
```
1
2
3
- char 用八位二进制储存
- 当 char 为 signed char 时，当读入字符 \377(0xFF) 时，ch=0xFF
  - 其与 EOF 进行比较时，ch 会被提升为 int，有符号的提升会保留符号位的 1，因此 0xFF 会被提升为 0x FFFF FFFF
  - 此时满足判断条件，与程序的本意不符
- 当 char 为 unsigned char 时，当读入 EOF 时， getchar() 返回 0xFFFF FFFF(-1)，其会被截短为 0xFF， ch=0xFF
  - 当与 EOF(-1) 进行比较时， ch 被提升为 int，无符号提升时直接在左边添0，结果为 0x0000 00FF，其不与 EOF 相同，结果就是造成死循环

# 单目操作符

书本内容

5-1-5-2021-08-20-02-21-31

#

& 取地址操作符

& 取地址操作符，其结果是一个与操作数同类型的指针
```
int a, *b;
b = &a;
```
1
2
- 说明 &a 与 b 的类型相同，均为 int *
- 由此说明 &a 的运算与指针运算遵守同一套规则
& 操作符要求操作数是一个左值
- 操作符的属性

# 关系操作符

书本内容

5-1-6-2021-08-20-02-21-51

# 逻辑操作符

书本内容

5-1-7-2021-08-20-02-22-29

# 条件操作符

书本内容

5-1-8-2021-08-20-02-22-51

# 逗号操作符

书本内容

5-1-9-2021-08-20-02-31-16

# 下标引用, 函数调用和结构成员

书本内容

5-1-10-2021-08-20-02-31-46

# 布尔值

书本内容

5-2-2021-08-20-02-32-08

# 表达式求值

书本内容

5-4-2021-08-20-02-32-55

# 隐式类型转换

书本内容

5-4-1-2021-08-20-02-33-22

# 算术转换

书本内容

5-4-1-2021-08-20-02-33-37

# 操作符的属性 -- 优先级及结合性

书本内容

5-4-3-2021-08-20-02-33-59

按操作符类别大致的划分优先级

聚组 >
函数调用 > 下标引用 > 结构成员访问 >
单目操作符 >
算术操作符 > 移位操作符 >
关系操作符 > 位操作符 > 逻辑操作符 > 条件操作符 >
赋值操作符 >
逗号操作符

注意

对于关系运算符
- > > >= > < > <= > == > !=
对于位运算符
- & > ^(位异或) > |
对于逻辑操作符
- && 的优先级要大于 ||
自增++与自减--操作符
- 后缀形式的优先级要大于前缀形式

结果类型为左值的操作符

[] 下标引用
- rexp[rexp]
. 访问结构体成员
- lexp.member_name
-> 访问结构指针成员
- rexp.member_name
* 间接访问
- *rexp
() 可能产生左值
- 如 (*rexp) 产生的为左值
- 而 (rexp) 却为右值

用于前缀操作的单目操作符和各种赋值操作符的结合顺序为从右向左

其余均为从左向右

# 优先级和求值的顺序

书本内容

5-4-4-2021-08-20-02-36-27

逻辑操作符的求值顺序问题

对于表达式 if (x < 100 || x > 200 && x != y)
- 由于 && 的优先级比 || 高，所以表达式等价于 if (x < 100 || (x > 200 && x != y))
- 但是如果 x < 100 成立，则不再对 (x > 200 && x != y) 进行判断，符合 || 运算符的短路求解原则
- ⌛tag+todo 补上编译原理中的翻译过程
- ⌛tag+todo 查标准中关于此处的定义

# 总结

书本内容

5-5-2021-08-20-02-36-45

# 问题

#

问题 3

你认为位操作符和移位操作符可以用在什么地方？

答案

主要用于修改或测试特定的位
- 具体参照位的操纵

#

问题 6

哪些操作符具有副作用？它们具有什么副作用？

答案

函数调用 ()
- 可能会产生副作用
单目运算符中的 ++ 和 --
- 其前缀和后缀形式均会修改操作数的值
赋值运算符
- 包括 = 和所有的复合赋值符
- 其会修改作为左值的操作数的值

#

问题 9

下面的循环能够实现它的目的吗？

non_zero = 0;
for( i = 0; i < ARRAY_SIZE; i += 1 )
  non_zero += array[i];
if( !non_zero )
  printf( "Values are all zero\n" );
else
  printf( "There are nonzero values\n" );

1
2
3
4
5
6
7

答案

不能，因为不知道 non_zero 的类型
- 如果其为有符号数 signed 整数，则可能出现正负非零值相加等于 0 的情况

#

问题 10

根据下面的变量声明和初始化，计算下列每个表达式的值。如果某个表达式具有副作用（也就是说它修改了一个或多个变量的值），注明它们。在计算每个表达式时，每个变量所使用的是开始时给出的初始值，而不是前一个表达式的结果

int a = 10, b = -25;
int c = 0, d = 3;
int e = 20;

1
2
3

a. b
b. b++
c. –a
d. a / 6
e. a % 6
f. b % 10
g. a << 2
h. b >> 3
i. a > b
j. b = a
k. b == a
l. a & b
m. a ^ b
n. a | b
o. ~b
p. c && a
q. c || a
r. b ? a : c
s. a += 2
t. b &= 20
u. b >>= 3
v. a %= 6
w. d = a > b
x. a = b = c = d
y. e = d + ( c = a + b ) + c
z. a + b * 3
aa. b >> a – 4
bb. a != b != c
cc. a == b == c
dd. d < a < e
ee. e > a > d
ff. a – 10 > b + 10
gg. a & 0x1 == b & 0x1
hh. a | b << a & b
ii. a > c || ++a > b
jj. a > c && ++a > b
kk. ! ~ b++
ll. b++ & a <= 30
mm. a – b, c += d, e – c
nn. a >>= 3 > 0
oo. a <<= d > 20 ? b && c++ : d—

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

答案

a. b                                 // -25
b. b++                               // -25 b = -24
c. --a                               // 9, c = 9
d. a / 6                             // 1
e. a % 6                             // 4
f. b % 10                            // -5
g. a << 2                            // 40
h. b >> 3                            // -4
i. a > b                             // 1
j. b = a                             // 10, b = 10
k. b == a                            // 0
l. a & b                             // 2
m. a ^ b                             // -19
n. a | b                             // -17
o. ~b                                // 24
p. c && a                            // 0
q. c || a                            // 1
r. b ? a : c                         // 10
s. a += 2                            // 12, a = 12
t. b &= 20                           // 4, b = 4
u. b >>= 3                           // -4, b = -4
v. a %= 6                            // 4, a = 4
w. d = a > b                         // 1, d = 1
x. a = b = c = d                     // 3, a = 3, b = 3, c = 3
y. e = d + ( c = a + b ) + c         // -27, c = -15， e = -27
z. a + b * 3                         // -65
aa. b >> a – 4                       // -1
bb. a != b != c                      // 1
cc. a == b == c                      // 1
dd. d < a < e                        // 1
ee. e > a > d                        // 0
ff. a – 10 > b + 10                  // 1
gg. a & 0x1 == b & 0x1               // 0
hh. a | b << a & b                   // -25590
ii. a > c || ++a > b                 // 1
jj. a > c && ++a > b                 // 1, a = 11
kk. ! ~ b++                          // 0, b = -24
ll. b++ & a <= 30                    // 1, b = -24
mm. a – b, c += d, e – c             // 17, c = 3
nn. a >>= 3 > 0                      // 5, a = 5
oo. a <<= d > 20 ? b && c++ : d--    // 80, d = 2, a = 80

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

#

问题 11

下面列出了几个表达式。请判断编译器是如何对各个表达式进行求值的，并在不改变求值顺序的情况下，尽可能去除多余的括号

a. a + ( b / c )
b. ( a + b ) / c
c. ( a * b ) % 6
d. a * ( b % 6 )
e. ( a + b ) == 6
f. !( ( a >= '0' ) && ( a <= '9' ) )
g. ( ( a & 0x2f ) == ( b | 1 ) ) && ( ( ~ c ) > 0 )
h. ( ( a << b ) – 3 ) < ( b << ( a + 3 ) )
i. ~ ( a ++ )
j. ((a == 2) || (a == 4)) && ((b == 2) || (b == 4))
k. ( a & b ) ^ ( a | b )
l. ( a + ( b + c ) )

1
2
3
4
5
6
7
8
9
10
11
12

答案

a. a + ( b / c )                                      
// a + b / c

b. ( a + b ) / c                                      
// (a + b) / c

c. ( a * b ) % 6                                      
// a * b % 6

d. a * ( b % 6 )                                      
// a * (b % 6)

e. ( a + b ) == 6                                     
// a + b == 6

f. !( ( a >= '0' ) && ( a <= '9' ) )                  
// !(a >= '0' && a <= '9' )

g. ( ( a & 0x2f ) == ( b | 1 ) ) && ( ( ~ c ) > 0 )   
// (a & 0x2f) == (b|1) && ~ c > 0

h. ( ( a << b ) – 3 ) < ( b << ( a + 3 ) )
// (a << b) - 3 < b << a + 3

i. ~ ( a ++ )
// ~a++

j. ((a == 2) || (a == 4)) && ((b == 2) || (b == 4))
// (a == 2 || a == 4) && (b == 2 || b == 4)

k. ( a & b ) ^ ( a | b )
//  a & b ^ (a | b)

l. ( a + ( b + c ) )
//  a + (b + c)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

# 编程练习

#

编程练习 3

请编写函数

unsigned int reverse_bits( unsigned int value );

这个函数的返回值是把 value 的二进制位模式从左到右变换一下后的值。例如，在 32 位机器上， 25 这个值包含下列各个位
```
00000000000000000000000000011001
```
1
函数的返回值应该是 2 550 136 832 ，它的二进制位模式是
```
10011000000000000000000000000000
```
1

答案

代码

/*
** Reverse the order of the bits in an unsigned integer value.
*/
unsigned int reverse_bits(unsigned int value)
{
  unsigned int result;

  result = 0;

  /*
  ** Keep going as long as i is nonzero. This makes the loop
  ** independent of the machine's word size, hence portable.
  */
  for (unsigned int i = 1; i != 0; i <<= 1)
  {
    result <<= 1;
    if ((value & 1) == 1)
      result |= 1;
    value >>= 1;
  }

  return result;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

提示

用无符号整数 1 的右移来判断 unsigned int 的二进制位数大小，从而使程序具有可移植性

每个函数的第 1 个参数是个字符数组，用于实际存储所有的位。第 2 个参数用于标识需要访问的位。函数的调用者必须确保这个值不要太大，以至于超出数组的边界。第 1 个函数把指定的位设置为 1 ，第 2 个函数则把指定的位清零。如果 value 的值为 0 ，第 3 个函数把指定的位清 0 ，否则设置为 1 。至于最后一个函数，如果参数中指定的位不是 0 ，函数就返回真，否则返回假

答案

代码

/*
** Implements an array of bits in a character array.
*/

#include <limits.h>
#include "bitarray.h"

/*
** Compute the character that will contain the desired bit
*/
unsigned character_offset(unsigned bit_number)
{
  return bit_number / CHAR_BIT;
}

/*
** Compute the bit number within the desired character
** Starts at 0
*/
unsigned bit_offset(unsigned bit_number)
{
  return bit_number % CHAR_BIT;
}

/*
** Sets the specified bit to one
*/
void set_bit(char bit_array[], unsigned bit_number)
{
  bit_array[character_offset(bit_number)] |= 1 << bit_offset(bit_number);
}

/*
** Clear the specified bit to zero
*/
void clear_bit(char bit_array[], unsigned bit_number)
{
  bit_array[character_offset(bit_number)] &= ~(1 << bit_offset(bit_number));
}

/*
** Set the specified bit to zero if the "value" is zero,
** otherwise it sets the bit to one
*/
void assign_bit(char bit_array[], unsigned bit_number, int value)
{
  if (value == 0)
    clear_bit(bit_array, bit_number);
  else
    set_bit(bit_array, bit_number);
}

/*
** Return true if the specified bit is nonzero, else false.
*/
int test_bit(char bit_array[], unsigned bit_number)
{
  return (bit_array[character_offset(bit_number)] & 1 << bit_offset(bit_number)) != 0;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59

bitarray.h 的代码如下

void set_bit(char bit_array[], unsigned bit_number);

void clear_bit(char bit_array[], unsigned bit_number);

void assign_bit(char bit_array[], unsigned bit_number, int value);

int test_bit(char bit_array[], unsigned bit_number);

1
2
3
4
5
6
7

注意

注意 bit_array中存储的并不是字符 '0', '1'，而是实际的二进制位
- 因此bit_number 需要转换为 bit_array 中实际的下标
test_bit 明确要求返回 true 和 false，则尽量让其值返回为 0 和 1

#

编程练习 5

编写一个函数，把一个给定的值存储到一个整数中指定的几个位。它的原型如下：

int store_bit_field(int original_value,
                    int value_to_store,
                    unsigned starting_bit, unsigned ending_bit);

1
2
3

假定整数中的位是从右向左进行编号。因此，起始位的位置不会小于结束位的位置。为了更清楚地说明，函数应该返回下列值：

原始值	需要储存的值	起始值	结束位	返回值
`0x0`	`0x1`	`4`	`4`	`0x10`
`0xffff`	`0x123`	`15`	`4`	`0x123f`
`0xffff`	`0x123`	`13`	`9`	`0xc7ff`

提示：把一个值存储到一个整数中指定的几个位分为5个步骤。以上表最后一行为例：

创建一个掩码( mask )，它是一个值，其中需要存储的位置相对应的那几个位设置为 1 。此时掩码为 0011 1110 0000 0000
用掩码的反码对原值执行 AND 操作，将那几个位设置为 0 。原值1111 1111 1111 1111，操作后变为 1100 0001 1111 1111
将新值左移，使它与那几个需要存储的位对齐。新值 0000 0001 0010 0011( 0x123 )，左移后变为 0100 0110 0000 0000
把移位后的值与掩码进行位 AND 操作，确保除那几个需要存储的位之外的其余位都设置为 0 。进行这个操作之后，值变为 0000 0110 0000 0000
把结果值与原值进行位 OR 操作，结果为 1100 0111 1111 1111（0xc7ff），也就是最终的返回值

在所有任务中，最困难的是创建掩码。你一开始可以把 ~0 这个值强制转换为无符号值，然后再对它进行移位

答案

代码

#include <limits.h>

#define INT_BITS (CHAR_BIT * sizeof(int))

/*
** Store a value in an arbitrary field in an integer.
*/
int store_bit_field(int original_value,
                    int value_to_store,
                    unsigned starting_bit, unsigned ending_bit)
{
  unsigned mask;

  /*
  ** Step 1: creat mask
  */
  mask = (unsigned)-1;
  mask >>= INT_BITS - (starting_bit - ending_bit + 1);
  mask <<= ending_bit;

  /*
  ** Validate the bit parameters, if an error is found, do nothing.
  */
  if (starting_bit < INT_BITS && ending_bit < INT_BITS &&
      starting_bit >= ending_bit)
  {
    /*
    ** Step 2: using the one's complement of the mask, 
    ** clear all the bits in the field of original_value
    */
    original_value &= ~mask;

    /*
    ** Step 3: shift the new value left so that
    ** it is aligned in the filed on the right
    */
    value_to_store <<= ending_bit;

    /*
    ** Step 4: and the shifted value with the mask to
    ** ensure that it has no bits outside of the filed
    */
    value_to_store &= mask;

    /*
    ** Step 5: or the resulting value into the original integer
    */
    original_value |= value_to_store;
  }

  return original_value;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52

提示

具体的操作过程以题目中给出的示例进行理解，不要先入为主
标准说明无符号数所有的移位操作均为逻辑移位
#define INT_BITS (CHAR_BIT * sizeof(int))
- 此语句可得 int 类型的二进制位数
starting_bit 和 ending_bit 的含义不要弄反了，同时要对其值进行校验

编辑

上次更新: 2022/01/26, 21:01:00

← 第 4 章语句第 6 章指针→

第 5 章 操作符和表达式

# 操作符和表达式

# 操作符

# 算术操作符

# 移位操作符

# 位操作符

# 赋值

# 单目操作符

# 关系操作符

# 逻辑操作符

# 条件操作符

# 逗号操作符

# 下标引用, 函数调用和结构成员

# 布尔值

# 表达式求值

# 隐式类型转换

# 算术转换

# 操作符的属性 -- 优先级及结合性

# 优先级和求值的顺序

# 总结

# 问题

# 编程练习

第 5 章操作符和表达式