【Rust 深度剖析】语句 (Statement) 还是表达式 (Expression)？Rust 语言设计的“第一性原理”-rust-CSS教程网

【Rust 深度剖析】语句 (Statement) 还是表达式 (Expression)？Rust 语言设计的“第一性原理”

在几乎所有的编程语言教程中，我们都会学到“语句”（Statements）和“表达式”（Expressions）的区别。

语句 (Statement): 执行一个动作，不返回值。例如 C 语言中的 if (x > 0) { ... }、for (...) {...} 或 int x = 5;。它们是“指令”。
表达式 (Expression): 计算并返回一个值。例如 x + 1、my_func() 或 C 语言中的 x = 5（赋值在C中是表达式）。

然而，当你带着这种“常识”进入Rust的世界时，你会立刻碰壁。你会发现你的函数“莫名其妙”地返回了 ()，或者 if 语句无法通过编译。

核心论点：Rust 是一门“基于表达式”的语言 (Expression-Based Language)。

这个设计决策不是一个小小的语法糖，它是Rust安全性和组合性的基石。

1. “万物皆表达式”：Rust 的心智模型

在Rust中，几乎所有东西都是表达式，都会“返回”一个值。

这包括你最意想不到的控制流：if、match，甚至是一个简单的代码块 {}。

**这在 C/Java/Python 中是不可想象的。**在这些语言中，if 是一个纯粹的“语句”，它不产生值，它只控制流程。

但在Rust中，if 是一个表达式。这意味着 if 语句本身会“计算”出一个值。

实践深度 (1)：`if` 表达式与安全初始化

看看这个安全初始化

看看这个对比。

C / Java 的方式 (语句):

int x; // 警告：未初始化
if (condition) {
    x = 5;
} else {
    x = 10;
}
// 'x' 在这里才被使用

这种方式存在一个巨大的安全隐患：如果你忘记了 else 分支，x 就会处于未初始化状态，导致未定义行为。

Rust 的方式 (表达式):

let condition = true;
let x = if condition {
    5
} else {
    10
    // 思考：如果这里写 10.0 (f64) 会怎样？
};
// x 在声明时就必须被初始化

// 'x' 在这里被使用，它的值是 5
println!("x 的值是: {}", x);

专业的思考：

消除未初始化变量： let x = ... 强制要求 x 在声明时就必须被一个值绑定。由于 if 是一个表达式，它必须产生一个值来绑定到 x。
**强制的性：** 当 if 被用作表达式时，Rust 编译器会强制你写 else。因为如果缺少 else，当 condition 为 false 时，if 表达式该返回什么值呢？这就从根源上杜绝了C语言中“忘记 else”导致的安全漏洞。
类型安全： if 的所有分支必须返回相同的类型。你不能在一个分支返回 5 (i32)，在另一个分支返回 10.0 (f64)。编译器会立即报错，这保证了 x 的类型是单一且明确的。

match 表达式同理，它强制你“穷尽”所有可能的分支，也是这一设计哲学的体现。

2. “致命”的分号 (;)：语句的“制造者”

如果说 Rust 是一门基于表达式的语言，那么“语句”是如何产生的呢？

答案就是分号 (;)。

在Rust中，分号****像C或Java中那样的“行终止符”。分号是一个强大的操作符，它的作用是：

**将一个“表达式”转换为一个“语句”，并将其值丢弃，返回单元类型 ()。**

()（发音为 Unit Type）是Rust中的一个特殊类型，它只有一个值，也写作 ()。它在功能上等同于其他语言中的 void，但区别在于 () 是一个真实存在的类型和值。

实践深度 (2)：函数返回值之谜

这是90%的Rust新手都会犯的错误：

// 目标：一个函数，返回 i32 类型的 10
fn get_ten_wrong() -> i32 {
    let a = 5;
    let b = 5;
    a + b; // 💥 致命的分号
}

/*
编译时会得到一个惊天动地的错误：
error[E0308]: mismatched types
  --> src/main.rs:5:24
   |
5  | fn get_ten_wrong() -> i32 {
   |    -------------------   ^ expected `i32`, found `()`
   |    |
   |    expected `i32` because of return type
...
8  |     a + b;
   |          - this expression evaluates to `()`
   |
   = note: expected type `i32`
              found type `()`
*/

为什么会这样？

a + b 本身是一个表达式，其计算结果为 10 (i32)。
但是，a + b;（带分号）是一个语句。
Rust 执行 a + b，得到 10。
然后分号 ; 将这个 10 丢弃。
a + b; 这个语句本身的值变成了 ()。
函数体 {...} 也是一个表达式，它的值等于它最后一个表达式的值。
因此，get_ten_wrong 函数的返回值是 ()。
但这与函数签名 -> i32 矛盾，编译失败！

正确的写法 (表达式)：

fn get_ten_correct() -> i32 {
    let a = 5;
    let b = 5;
    a + b // ✅ 没有分号，这是一个表达式
}

现在，a + b 是函数的最后一个表达式，它的值 10 (i32) 成为了整个函数体 {...} 表达式的值，符合 -> i32 的签名，编译通过。

3. 那么，Rust 中到底有哪些“语句”？

既然“几乎所有”都是表达式，那什么是纯粹的“语句”呢？

在Rust中，只有两大类语句 (Statements)：

声明语句 (Declaration Statements):
这些语句用于声明（并可能绑定）新的项。它们本身不返回值 ()。
** let x = 5; (这是一个 LetStatement，它不返回值)
- fn my_func() {}
- struct MyStruct;
- impl ... {}
- mod ...;
- `use ...;``
表达式语句 (Expression Statements):
这就是我们刚才讨论的：一个表达式，后面跟着一个分号。
* * 1 + 1; (计算出 2，然后丢弃，返回 ())
- `my_function_l();(调用函数，丢弃其返回值（如果不是()），返回 ()`)
- `"hello".to_string;(计算出一个String，然后丢弃，返回 ()`)

几乎所有你写的、以分号结尾的“指令性”代码，都是“表达式语句”。你使用它们，不是为了它们的值，而是为了它们的副作用（Side Effects），比如打印到控制台、修改变量、或调用一个方法。

总结：专业的工程思考

Rust 的“表达式哲学”带来了什么？

**极高的组合** 表达式可以无限嵌套。你可以写出 let x = match my_enum { ... if ... { ... } ... }; 这样的代码，将复杂的逻辑组合在一个单独的、类型安全的初始化中。
强制的完备性与安全： `if/match 作为表达式，迫使开发者处理所有分支，并确保类型一致，从根本上消除了“未初始化变量”和“未处理分支”两类重大安全漏洞。
清晰的意图：
- 没有分号 (Expression): "我需要这个值，请把它作为结果。"
- 有分号 (Statement): "我只关心这个动作的副作用，请丢弃它的值。"

理解语句和表达式的区别，是Rust学习中从“会用”到“精通”的转折点。它迫使你从“我该如何一步步执行指令？”（命令式思维）转变为“我该如何组合这些值？”（函数式/表达式思维）。

一旦你跨越了这个障碍，你会发现你的代码变得前所未有的健壮、简洁和富有表现力。💪

转载请说明出处内容投诉
CSS教程网 » 【Rust 深度剖析】语句 (Statement) 还是表达式 (Expression)？Rust 语言设计的“第一性原理”

星抖云新媒体运营飞哥

分享到：