【ORM深度解析】MyBatis一级/二级缓存、#与$、动态SQL、延迟加载与JPA/Hibernate核心对比，一篇让你彻底搞懂！

本文链接：https://blog.csdn.net/weixin_57361509/article/details/148541969

文章目录

ORM

🚀 引言：为什么我们需要ORM框架？

在Java的世界里，与数据库打交道是家常便饭。传统的JDBC操作虽然直接，但充满了模板化的代码：获取连接、创建Statement、执行SQL、处理ResultSet、关闭连接… 不仅繁琐，还容易出错。为了解放生产力，ORM（Object-Relational Mapping，对象关系映射）框架应运而生。

ORM框架的核心思想是将程序中的对象与关系型数据库中的数据表进行映射，让我们能够以面向对象的方式操作数据库，而无需过多关注底层的SQL细节。今天，我们就来重点聊聊两大主流ORM框架：MyBatis 和 JPA (以Hibernate为代表)。

🎯 MyBatis：灵活的SQL掌控者

MyBatis 是一个优秀的持久层框架，它最大的特点是将SQL语句从Java代码中分离出来，存储在XML文件或注解中，让开发者可以更灵活地控制和优化SQL。

1. `#`与`$`：不仅仅是占位符那么简单！

这是MyBatis面试中几乎必问的问题，也是日常开发中需要特别注意的地方。

#{} (预编译占位符)：
- 原理：MyBatis在使用#{}时，会将其替换为JDBC PreparedStatement 中的 ? 占位符。数据库会对SQL进行预编译，然后将参数安全地设置进去。
- 优点：
  - 防止SQL注入：这是最重要的优点。参数值会被当作纯数据处理，而不是SQL指令的一部分。
  - 类型安全：MyBatis会根据参数类型进行相应的JDBC类型转换。
  - 性能提升：对于重复执行的SQL，预编译可以提高效率（尽管现代数据库驱动在这方面优化也很好）。
- 示例：
```
<select id="getUserById" resultType="com.example.User">
    SELECT * FROM users WHERE id = #{userId}
</select>
```
  如果userId传入的是一个字符串'1 OR 1=1'，最终执行的SQL会是 SELECT * FROM users WHERE id = '1 OR 1=1' (作为字符串常量)，而不是恶意的SQL注入。
${} (字符串替换/拼接)：
- 原理：MyBatis在使用${}时，会直接将参数值拼接到SQL语句中，不做任何转义或预编译处理。
- 风险：极易引发SQL注入攻击！ 必须谨慎使用，并且通常只用于动态表名、列名、ORDER BY子句等无法使用#{}的场景。
- 使用场景：
  - 动态指定表名或列名：SELECT * FROM ${tableName} WHERE id = #{id}
  - 动态指定排序字段：SELECT * FROM users ORDER BY ${columnName} ${sortOrder}
- 示例与风险：
```
<select id="getUsersByOrder" resultType="com.example.User">
    SELECT * FROM users ORDER BY ${orderByColumn}
</select>
```
  如果 orderByColumn 传入 name; DELETE FROM users; --，那么拼接后的SQL将是灾难性的。
- 防护：如果必须使用${}，务必对传入的参数进行严格的校验和过滤，或者使用白名单机制。

总结：优先使用 #{}，因为它更安全、更规范。仅在确实需要动态拼接SQL结构（如表名、列名）且无法用 #{} 替代时，才考虑 ${}，并务必做好安全防护。

2. 动态SQL：让SQL“活”起来

动态SQL是MyBatis的强大特性之一，它允许我们根据不同的条件动态地构建SQL语句，避免了在Java代码中拼接大量字符串的尴尬。

常用标签：
- <if test="...">：条件判断。
- <choose>, <when test="...">, <otherwise>：分支选择，类似Java的switch。
- <where>：智能处理AND或OR前缀。如果内部条件都不成立，则不生成WHERE子句；如果成立，则自动去掉多余的AND或OR。
- <set>：用于UPDATE语句，智能处理逗号。如果内部条件都不成立，不生成SET子句；如果成立，则自动去掉多余的逗号。
- <trim prefix="..." suffix="..." prefixOverrides="..." suffixOverrides="...">：更灵活的前后缀处理和覆盖。
- <foreach collection="..." item="..." index="..." open="..." close="..." separator="...">：遍历集合，常用于IN子句。

示例：多条件用户查询

<select id="findActiveUsers" resultType="com.example.User">
    SELECT * FROM users
    <where>
        <if test="name != null and name != ''">
            AND name LIKE CONCAT('%', #{name}, '%')
        </if>
        <if test="email != null and email != ''">
            AND email = #{email}
        </if>
        AND status = 'ACTIVE'
    </where>
</select>

这个例子中，如果name和email都为空，最终SQL会是 SELECT * FROM users WHERE status = 'ACTIVE'。<where>标签会自动处理AND。

3. 一级缓存（Local Cache）：SqlSession的私有小金库

原理：MyBatis默认开启一级缓存。一级缓存是SqlSession级别的缓存。当同一个SqlSession执行相同的SQL查询（相同的SQL语句、相同的参数、相同的RowBounds等）时，如果第一次查询的结果已经缓存，后续的查询会直接从缓存中获取，不再与数据库交互。
生命周期：一级缓存的生命周期与SqlSession相同。当SqlSession关闭（close()）或刷新（commit(), rollback()，或执行了任何增删改操作）时，该SqlSession下的一级缓存会被清空。
作用域：仅在当前SqlSession内部有效。不同的SqlSession之间不共享一级缓存。
结构：本质上是一个HashMap<CacheKey, Object>，CacheKey包含了SQL的ID、语句、参数、分页等信息。

验证：

SqlSession session = sqlSessionFactory.openSession();
try {
    UserMapper mapper = session.getMapper(UserMapper.class);
    User user1 = mapper.getUserById(1); // 第一次查询，从数据库获取，并放入一级缓存
    System.out.println("User1: " + user1);

    // 不做任何操作，再次查询
    User user2 = mapper.getUserById(1); // 第二次查询，从一级缓存获取
    System.out.println("User2: " + user2);
    System.out.println("user1 == user2: " + (user1 == user2)); // true，是同一个对象引用

    // 执行一次更新操作
    // mapper.updateUser(someUser);
    // session.commit(); // 或者 session.clearCache();

    // User user3 = mapper.getUserById(1); // 若执行了更新或清空缓存，会再次查询数据库

} finally {
    session.close();
}

注意：在Spring管理的事务中，多个Service方法如果共享同一个SqlSession（通常通过Spring的事务同步机制实现），那么一级缓存是有效的。但如果每次调用都开启新的SqlSession，则一级缓存的意义不大。

4. 二级缓存（Global Cache）：Mapper命名空间的共享宝藏

一级缓存虽然有用，但作用域太小。为了解决跨SqlSession的缓存共享问题，MyBatis提供了二级缓存。

原理：二级缓存是Mapper Namespace（即Mapper XML文件或Mapper接口）级别的缓存。当多个SqlSession操作同一个Mapper Namespace下的SQL时，它们可以共享二级缓存中的数据。
开启方式：
1. 在mybatis-config.xml中全局开启/关闭二级缓存（默认开启，但需要Mapper显式配置才生效）：
```
<settings>
    <setting name="cacheEnabled" value="true"/>
</settings>
```
2. 在对应的Mapper XML文件中使用<cache/>标签声明使用二级缓存：
```
<mapper namespace="com.example.UserMapper">
    <cache eviction="LRU" flushInterval="60000" size="512" readOnly="true"/>
    
</mapper>
```
  或者在Mapper接口上使用@CacheNamespace注解。
属性详解 (<cache/>)：
- eviction：缓存回收策略，如LRU（最近最少使用）、FIFO（先进先出）、SOFT（软引用）、WEAK（弱引用）。默认LRU。
- flushInterval：刷新间隔，单位毫秒。缓存会按照这个间隔自动清空。若不配置，则只有在执行增删改操作时才会刷新。
- size：缓存存放的引用数目。默认1024。
- readOnly：是否只读。
  - true（默认）：返回的是缓存对象的同一个实例。性能较高，但如果应用代码修改了这个对象，会影响到其他线程获取的缓存数据（脏读）。
  - false：返回的是缓存对象的一个拷贝（通过序列化和反序列化实现）。安全，但性能较低，且要求POJO类实现Serializable接口。
缓存流程：
1. 当一个SqlSession执行查询后，如果该Mapper开启了二级缓存，并且查询结果POJO实现了Serializable接口，结果会被放入二级缓存。
2. 当另一个SqlSession（或同一个SqlSession在一级缓存失效后）执行相同的查询时，会先尝试从二级缓存中获取数据。
缓存清空：
- 当在同一个Mapper Namespace下执行了任何增删改操作（insert, update, delete）并且commit()后，该Namespace下的二级缓存会被清空。
- 可以通过<select>标签的flushCache="true"属性强制清空当前查询相关的二级缓存。
注意事项：
- POJO类必须实现java.io.Serializable接口，因为二级缓存可能存储在不同的介质（如磁盘、分布式缓存）中，需要序列化。
- 脏读问题：如果readOnly="true"（默认），且业务代码修改了从缓存中取出的对象，可能导致其他线程读到脏数据。建议将readOnly设为false，或确保从缓存取出的对象不被修改。
- 关联查询的缓存失效：如果查询涉及到多个表（多个Mapper），当一个表的Mapper执行了增删改，只会清空该Mapper的二级缓存，关联表的Mapper缓存可能不会更新，导致数据不一致。需要精细设计缓存策略，或使用更专业的分布式缓存方案（如Redis）并手动管理。

一级缓存与二级缓存总结：

查询顺序：二级缓存 -> 一级缓存 -> 数据库。
一级缓存：SqlSession级别，默认开启，生命周期短，无需序列化。
二级缓存：Mapper Namespace级别，需手动配置开启，POJO需序列化，生命周期长，可能存在脏读和多表关联更新问题。

5. 延迟加载（Lazy Loading）：按需获取，提升性能

延迟加载是一种常见的性能优化手段，尤其在处理对象关联关系（一对一、一对多、多对多）时非常有用。

核心思想：当查询主对象时，不立即加载其关联的从对象数据，而是在首次实际访问这些从对象数据时才发起数据库查询。
应用场景：
- User对象关联Order列表，查询用户信息时，可能并不总是需要其订单列表。
- Order对象关联User对象，查询订单时，可能暂时不需要用户信息。

开启方式：

全局配置（mybatis-config.xml）：

<settings>
    <setting name="lazyLoadingEnabled" value="true"/> <!-- 全局开启/关闭延迟加载，默认false -->
    <setting name="aggressiveLazyLoading" value="false"/> <!-- 是否积极加载，设为false表示按需加载，默认true（在3.4.1后默认为false）-->
</settings>

aggressiveLazyLoading设为false时，即使对象的部分属性被访问（如toString(), hashCode()），也不会触发所有关联对象的加载，只有真正访问关联对象本身时才加载。

局部配置（Mapper XML的关联映射中）：
使用<association>（一对一）或<collection>（一对多）标签时，通过fetchType属性控制：

fetchType="lazy"：为此关联启用延迟加载。
fetchType="eager"：为此关联禁用延迟加载（立即加载）。

<!-- UserMapper.xml -->
<resultMap id="userResultMap" type="com.example.User">
    <id property="id" column="id"/>
    <result property="username" column="username"/>
    <!-- 一对多关联订单，使用延迟加载 -->
    <collection property="orders" ofType="com.example.Order"
                select="com.example.OrderMapper.findOrdersByUserId"
                column="id" fetchType="lazy"/>
</resultMap>

<!-- OrderMapper.xml -->
<select id="findOrdersByUserId" resultType="com.example.Order">
    SELECT * FROM orders WHERE user_id = #{userId}
</select>

原理：MyBatis使用动态代理（CGLIB或Javassist）来实现延迟加载。当查询主对象时，如果其关联对象配置了延迟加载，MyBatis会为这个关联对象属性创建一个代理对象。当应用代码首次访问这个代理对象的方法（如user.getOrders()后调用orders.size()或遍历orders）时，代理对象会拦截调用，并执行预设的SQL语句（如findOrdersByUserId）去数据库加载实际数据，然后替换掉代理对象。
注意事项：
- SqlSession必须保持打开状态：延迟加载的SQL查询是在首次访问关联对象时才执行的。如果此时主对象所在的SqlSession已经关闭，那么执行延迟加载SQL时会抛出LazyInitializationException类似的错误。在Spring集成中，通常需要确保Service方法在一个事务内，SqlSession在整个事务期间保持打开。
- N+1问题：如果在一个列表中对多个主对象进行遍历，并且每个主对象都触发了其关联对象的延迟加载，可能会导致大量的独立SQL查询（1次主查询 + N次关联对象查询），即“N+1问题”。虽然延迟加载本身是按需的，但使用不当仍可能导致性能问题。此时可以考虑使用JOIN FETCH或调整fetchType="eager"。

🏛️ JPA/Hibernate：面向对象的极致追求

JPA (Java Persistence API) 是一套Java EE规范，它定义了对象关系映射以及持久化操作的API标准。Hibernate是最著名的JPA实现之一。

1. 核心思想与特点

真正的面向对象：JPA/Hibernate致力于让开发者完全以面向对象的方式进行数据库操作。开发者主要与实体（Entity）对象打交道，Hibernate会自动生成和执行SQL。
POJO驱动：实体类是普通的Java对象（POJO），通过注解（如@Entity, @Table, @Id, @Column, @OneToMany等）来声明其与数据库表及字段的映射关系。
强大的ORM功能：
- 自动DDL：可以根据实体类定义自动创建或更新数据库表结构（生产环境慎用）。
- 丰富的关联映射：支持一对一、一对多、多对一、多对多等复杂关系映射。
- JPQL/HQL：面向对象的查询语言（Java Persistence Query Language / Hibernate Query Language），语法类似SQL但操作的是实体和属性，而非表和列。
- Criteria API：以编程方式构建类型安全的查询。
- 缓存机制：也有一级缓存（Session级别，类似MyBatis的SqlSession）和二级缓存（SessionFactory级别，可配置第三方缓存如EhCache, Redis）。
- 事务管理：与JTA（Java Transaction API）紧密集成。
数据库无关性：JPA规范旨在提供数据库无关的持久化方案。通过配置不同的数据库方言（Dialect），Hibernate可以为不同的数据库生成适配的SQL。

2. 与MyBatis的对比

特性	MyBatis	JPA/Hibernate
SQL控制	开发者完全掌控SQL，可精细优化。	SQL通常自动生成，对SQL的直接控制较弱（但可通过NativeQuery执行原生SQL）。
学习曲线	相对平缓，尤其对熟悉SQL的开发者。	较陡峭，需要理解更多ORM概念（实体生命周期、缓存、事务等）。
开发效率	SQL编写和维护可能耗时，但对复杂SQL友好。	CRUD操作和简单查询非常高效，面向对象开发体验好。
灵活性	非常灵活，易于处理复杂、动态、遗留SQL。	相对固定，对于高度优化的特定SQL或不规范的数据库设计可能不够灵活。
移植性	SQL依赖数据库方言，移植可能需修改SQL。	数据库无关性较好，切换数据库通常只需改配置。
缓存	一级、二级缓存，配置相对简单。	一级、二级缓存，支持查询缓存，可集成更丰富的第三方缓存。
适用场景	SQL优化要求高、数据库设计复杂、需要灵活控制SQL的项目、遗留系统对接。	新项目、CRUD密集型应用、追求快速开发、面向对象设计良好的项目。
延迟加载	支持，需要注意SqlSession生命周期。	支持，也需要注意Session生命周期，N+1问题同样存在。
映射	XML或注解维护SQL与对象字段映射。	主要通过注解（或XML）维护对象与表、对象间关系的映射。

3. 示例：JPA实体与基本查询 (简单示意)

// User.java (Entity)
import javax.persistence.*;
import java.util.List;

@Entity
@Table(name = "users")
public class User {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;

    private String username;
    private String email;

    @OneToMany(mappedBy = "user", fetch = FetchType.LAZY) // 延迟加载订单
    private List<Order> orders;

    // Getters and Setters
}

// Order.java (Entity)
@Entity
@Table(name = "orders")
public class Order {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;

    private String orderNumber;

    @ManyToOne(fetch = FetchType.LAZY)
    @JoinColumn(name = "user_id")
    private User user;

    // Getters and Setters
}

// UserRepository.java (Spring Data JPA)
public interface UserRepository extends JpaRepository<User, Long> {
    User findByUsername(String username); // Spring Data JPA根据方法名自动生成查询

    @Query("SELECT u FROM User u WHERE u.email LIKE %:emailKeyword%")
    List<User> findByEmailContaining(@Param("emailKeyword") String emailKeyword); // JPQL查询
}

// Service Layer Usage (大致示意)
@Service
public class UserService {
    @Autowired
    private UserRepository userRepository;

    @Transactional // 确保Session在方法执行期间打开，支持延迟加载
    public User getUserWithOrders(Long userId) {
        User user = userRepository.findById(userId).orElse(null);
        if (user != null) {
            // 当首次访问user.getOrders()时，如果配置了LAZY且Session未关闭，会触发加载
            System.out.println("User Orders size: " + user.getOrders().size());
        }
        return user;
    }
}

这个例子展示了JPA如何通过注解定义实体和关系，以及Spring Data JPA如何简化数据访问层的代码。Hibernate作为JPA的实现，会负责将这些操作转换为SQL并与数据库交互。

💡 总结与选择建议

MyBatis和JPA/Hibernate都是非常优秀的ORM框架，它们各有侧重：

选择MyBatis的理由：
- 你需要对SQL有绝对的控制权，进行深度优化。
- 项目中有大量复杂查询、存储过程或动态SQL。
- 团队成员SQL技能普遍较强，喜欢直接编写SQL。
- 对接遗留系统，数据库设计可能不完全符合ORM规范。
选择JPA/Hibernate的理由：
- 追求更高的开发效率，尤其是对于CRUD操作和标准查询。
- 希望实现更好的数据库无关性。
- 项目遵循良好的面向对象设计原则。
- 团队更倾向于面向对象的方式思考和编码，对SQL细节不那么关注。
- 生态完善，与Spring等框架集成度高（如Spring Data JPA）。

在实际项目中，甚至可以考虑混合使用（尽管不常见，且会增加复杂度），比如主要业务使用JPA/Hibernate快速开发，对于某些性能瓶颈或特别复杂的报表查询，单独使用MyBatis或原生JDBC进行优化。

无论选择哪个框架，深入理解其核心原理（尤其是缓存、延迟加载、事务管理）都至关重要。

希望这篇文章能帮助你对MyBatis和JPA/Hibernate有更清晰的认识！如果你觉得本文对你有帮助，请点赞👍、收藏🌟、关注我🔔，后续会带来更多干货分享！有任何疑问或想法，欢迎在评论区交流讨论！