时代Java，与您同行！关注微信公众号，关注前沿技术，微信搜索：nowjava或时代Java，也可点击这里扫码关注

时代Java

京东自营 618 + 国补 iPhone 历史最低价

数据库必会面试题

欢马劈雪

工程师 (已认证)

原创分享签约作者

发表于教程文章

103

1. 请解释数据库中的MVCC（多版本并发控制）机制，并说明其在MySQL InnoDB中的具体实现方式？

答案：
MVCC是一种通过维护数据的历史版本实现高并发的技术，允许读操作不阻塞写操作，写操作不阻塞读操作。在MySQL InnoDB中，MVCC通过以下机制实现：

隐藏字段：每行数据包含DB_TRX_ID（最近修改的事务ID）和DB_ROLL_PTR（回滚指针，指向Undo Log记录）。
Undo Log：存储数据的历史版本，用于构建一致性读视图。
Read View：事务执行快照读时生成，包含当前活跃事务ID列表，用于判断数据版本的可见性。

示例场景：

事务A（ID=100）更新某行数据，生成新版本并写入Undo Log。
事务B（ID=101）启动并执行查询，此时生成Read View，活跃事务为[100]。
事务B读取该行时，发现最新版本的DB_TRX_ID=100在活跃事务列表中，故通过DB_ROLL_PTR找到上一个可见版本返回。

关键点：

解决了“不可重复读”和“幻读”问题（在RR隔离级别下）。
仅在RC（读已提交）和RR（可重复读）隔离级别生效。

2. 如何处理数据库死锁？请结合MySQL说明检测与解决机制。

答案：
死锁产生条件：互斥、持有并等待、不可抢占、循环等待。
MySQL处理方式：

检测机制：使用等待图（Wait-for Graph）检测循环依赖，超时（默认50秒）后触发检测。
解决策略：选择代价最小的事务回滚（通过计算事务修改的行数、Undo Log大小等）。

示例场景：

事务A持有行1锁，请求行2锁；事务B持有行2锁，请求行1锁。
MySQL检测到循环依赖，强制回滚其中一个事务（如事务B），释放其锁，让事务A继续执行。

优化建议：

业务层保证访问顺序一致。
使用SHOW ENGINE INNODB STATUS分析死锁日志。

3. 请解释分库分表的常见策略及其优缺点，并说明如何解决跨分片查询问题。

答案：
分库分表策略：

水平拆分：

范围分片（如按时间范围）：易导致热点问题。
哈希分片（如对ID取模）：数据分布均匀，但扩容复杂。

垂直拆分：按业务模块分库（如订单库、用户库）。

跨分片查询解决方案：

全局二级索引：维护额外索引表记录数据位置。
中间件聚合：通过ShardingSphere等中间件并行查询各分片后合并结果。
冗余存储：将高频查询字段冗余到多个分片（空间换时间）。

缺点：

事务管理复杂（需分布式事务如Seata）。
聚合查询性能下降。

4. 请详细说明MySQL的Redo Log、Undo Log和Binlog的区别与作用。

答案：
| 日志类型 | 作用 | 写入时机 | 内容 |
|----------|------|----------|------|
| Redo Log | 保证事务持久性，崩溃恢复时重放操作 | 事务提交前按顺序写入 | 物理日志（数据页修改） |
| Undo Log | 支持事务回滚和MVCC，存储数据旧版本 | 数据修改前记录 | 逻辑日志（反向SQL） |
| Binlog | 主从复制和数据恢复 | 事务提交后按事件顺序写入 | 逻辑日志（SQL语句或行变更） |

协作流程：

事务执行时生成Undo Log用于回滚。
修改数据页，记录Redo Log到内存缓冲区（log buffer）。
事务提交时Redo Log刷盘（fsync），Binlog写入文件。
两阶段提交保证Redo Log和Binlog的一致性。

5. 请阐述数据库的“幻读”现象，MySQL如何通过Next-Key Lock解决幻读？

答案：
幻读：同一事务中多次范围查询返回的行数不同（由于其他事务插入/删除符合条件的数据）。
Next-Key Lock实现：

结合记录锁（行锁）和间隙锁（Gap Lock），锁定索引记录及其前面的区间。
例如：对id>10的条件加锁，会锁定(10, +∞)的间隙，阻止其他事务插入id>10的数据。

示例场景（RR隔离级别）：

事务A执行SELECT * FROM t WHERE id>10 FOR UPDATE，对id=15（现有数据）加记录锁，并对(10,15)、(15,+∞)加间隙锁。
事务B尝试插入id=12的数据会被阻塞，直到事务A提交。

注意：

仅在RR隔离级别下生效。
使用唯一索引时，Next-Key Lock降级为行锁。

6. 请描述数据库的“写倾斜”（Write Skew）问题，并给出解决方案。

答案：
写倾斜：两个事务基于同一数据集读取后更新不同部分，导致数据不一致。
示例：

医生值班系统，事务A和事务B同时查询当前值班医生数≥2，各自申请请假，导致最终值班医生<2。

解决方案：

串行化隔离级别：强制事务串行执行，但性能差。
显式加锁：使用SELECT ... FOR UPDATE锁定相关行（如所有值班医生记录）。
约束检查：数据库触发器或应用层检查（如请假后总数≥2）。

关键点：

写倾斜属于“幻读”的一种变种，需通过更严格的锁或业务逻辑解决。

以上问题覆盖了分布式事务、锁机制、日志系统等高级主题，适合考察候选人对数据库底层原理和复杂场景的处理能力。

7. 什么是数据库事务，它的ACID属性是什么？

数据库事务是一组数据库操作的逻辑单元，要么全部执行成功，要么全部回滚。ACID属性是指原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability）。

以下是对ACID属性的详细解释：

原子性（Atomicity）：原子性确保一个事务中的所有操作要么全部成功，要么全部失败回滚。如果一个操作失败，整个事务将回滚到初始状态，不会对数据库产生任何影响。
一致性（Consistency）：一致性确保事务将数据库从一个一致状态转换到另一个一致状态。在事务开始和结束时，数据库必须满足预定义的一致性规则，以保持数据的完整性和约束条件的有效性。
隔离性（Isolation）：隔离性确保并发执行的事务相互隔离，使它们看起来像是按顺序执行的。每个事务在执行期间都应该与其他事务相互隔离，以防止数据的不一致和并发问题（如脏读、不可重复读和幻读）。
持久性（Durability）：持久性确保一旦事务提交，其对数据库的更改将永久保存，即使在系统故障或崩溃后也是如此。数据库系统使用日志和其他机制来确保已提交的事务的更改持久保存，以防止数据丢失。

这些ACID属性是数据库事务的关键特性，确保了事务的可靠性、一致性和持久性。通过满足这些属性，数据库可以保证数据的完整性和可靠性，同时提供并发控制和事务管理的机制。

8. 请解释一下数据库索引的作用和优缺点。

数据库索引用于加快查询速度，通过创建索引可以快速定位到满足查询条件的数据行。

优点是提高查询性能，缺点是占用额外的存储空间和增加写操作的开销。

面试的时候我们一定要举例来说，以下是一些场景示例：

优点：提高查询性能

场景1：电子商务网站的商品列表页面。通过在商品名称字段上创建索引，可以快速定位到满足搜索关键字的商品，提高搜索响应速度。
场景2：社交媒体平台的用户关注列表。通过在用户ID字段上创建索引，可以快速获取某个用户关注的其他用户，提高社交关系的查询效率。

缺点：占用额外的存储空间和增加写操作的开销

场景1：日志记录系统。如果在每个日志记录的时间戳字段上都创建索引，将占用大量的存储空间，增加了存储成本。
场景2：高并发的写入操作。当频繁进行插入、更新或删除操作时，索引的维护会增加写操作的开销，降低写入性能。

需要根据具体的业务场景和需求来权衡使用索引的利弊。

索引的设计应该根据查询频率、数据量、写入操作的频率和数据一致性要求等因素进行综合考虑。在某些情况下，可以选择创建部分索引或使用其他优化技术来平衡查询性能和存储开销。

9. 索引失效的情况

数据库索引在某些情况下可能会失效，导致查询性能下降。

以下是一些常见的导致索引失效的情况：

不使用索引列进行查询：如果查询条件中没有使用索引列，数据库无法利用索引进行快速定位，而是需要进行全表扫描，导致索引失效。
使用函数或表达式对索引列进行操作：如果在查询条件中对索引列使用函数或表达式进行操作，例如使用UPPER函数或进行数学运算，会导致索引失效。
使用不等于（<>）或不包含（NOT IN）条件：不等于和不包含条件会导致索引失效，因为数据库无法利用索引进行快速定位。
数据类型不匹配：如果查询条件中的数据类型与索引列的数据类型不匹配，例如将字符串与数字进行比较，会导致索引失效。
数据量过小：当数据量非常小的时候，数据库可能会选择全表扫描而不是使用索引，因为全表扫描的开销更小。
索引列上存在函数或表达式：如果在索引列上存在函数或表达式，例如在索引列上使用了LOWER函数，会导致索引失效。
索引列上存在排序或分组：如果在索引列上进行排序或分组操作，数据库可能会选择全表扫描而不是使用索引。

需要注意的是，不同的数据库管理系统（DBMS）可能在索引失效的情况上有所不同。因此，在实际应用中，应该根据具体的DBMS和查询场景进行优化，以避免索引失效并提高查询性能。

10. 什么是数据库范式化，为什么要进行范式化设计？

数据库范式化是一种设计规范，用于减少数据冗余和提高数据的一致性。

范式化设计可以避免数据的重复存储，减少数据更新的复杂性，提高数据的完整性和可维护性。

以下是一些示例来说明其作用和优势：

第一范式（1NF）：确保每个数据字段都是原子的，不可再分。例如，一个学生表中的姓名字段应该是一个单独的字段，而不是将姓和名合并在一个字段中。
第二范式（2NF）：确保表中的非主键字段完全依赖于主键。例如，一个订单表中，订单项的价格和数量应该与订单号一起作为一个独立的表，而不是直接存储在订单表中。
第三范式（3NF）：确保表中的非主键字段之间没有传递依赖关系。例如，一个员工表中，员工的地址信息应该与员工号一起作为一个独立的表，而不是直接存储在员工表中。

通过范式化设计，我们可以避免数据冗余和不一致性，提高数据的完整性和可维护性。范式化设计可以减少数据的重复存储，节省存储空间，并降低数据更新的复杂性。此外，范式化设计还有助于提高数据的查询性能，因为数据被更细粒度地分解，可以更快地定位到需要的数据。

需要注意的是，范式化设计并不适用于所有情况。在某些情况下，为了提高查询性能或满足特定的业务需求，可能需要进行反范式化设计，即允许数据冗余。在实际应用中，应根据具体的业务需求和性能要求来权衡范式化和反范式化的设计选择。

11. 请解释一下数据库连接池的作用和优点。

数据库连接池用于管理数据库连接，重复使用已经建立的连接，避免频繁地创建和销毁连接。连接池可以提高性能，减少连接的创建和销毁开销。

以下是一个简单的代码示例，演示如何使用Go语言实现一个基本的数据库连接池：

package main

import (
    "database/sql"
    "fmt"
    "sync"
    "time"

    _ "github.com/go-sql-driver/mysql"
)

const (
    maxConnections = 10
)

var (
    dbPool chan *sql.DB
    mu     sync.Mutex
)

func main() {
    // 初始化连接池
    initDBPool()

    // 从连接池获取数据库连接
    db := getDBFromPool()
    defer releaseDBToPool(db)

    // 使用数据库连接进行查询操作
    rows, err := db.Query("SELECT * FROM users")
    if err != nil {
        fmt.Println("Error querying database:", err)
        return
    }
    defer rows.Close()

    // 处理查询结果
    for rows.Next() {
        // ...
    }
}

func initDBPool() {
    dbPool = make(chan *sql.DB, maxConnections)

    for i := 0; i < maxConnections; i++ {
        db, err := sql.Open("mysql", "username:password@tcp(hostname:port)/database")
        if err != nil {
            fmt.Println("Error opening database connection:", err)
            return
        }

        dbPool <- db
    }
}

func getDBFromPool() *sql.DB {
    mu.Lock()
    defer mu.Unlock()

    select {
    case db := <-dbPool:
        return db
    default:
        // 如果连接池为空，等待一段时间再尝试获取
        time.Sleep(100 * time.Millisecond)
        return getDBFromPool()
    }
}

func releaseDBToPool(db *sql.DB) {
    dbPool <- db
}

在上述示例中，我们使用了database/sql包来操作数据库，并通过sql.Open函数创建数据库连接。在initDBPool函数中，我们初始化了一个固定大小的连接池，并将每个连接放入dbPool通道中。getDBFromPool函数用于从连接池中获取数据库连接，如果连接池为空，则等待一段时间再尝试获取。releaseDBToPool函数用于将数据库连接放回连接池。

请注意，这只是一个简单的示例，主要是想让你理解设计思想。

实际的数据库连接池实现可能需要考虑更多的细节，如连接的超时处理、连接的健康检查等。此外，还应该根据具体的数据库驱动和需求进行适当的调整和优化。

12. 什么是数据库锁，MySQL中有哪些类型的锁？

数据库锁用于控制并发访问，保证数据的一致性和完整性。MySQL中常见的锁包括共享锁（Shared Lock）和排他锁（Exclusive Lock），也称为读锁和写锁。

共享锁（Shared Lock）：

使用方式：通过在事务中使用SELECT ... LOCK IN SHARE MODE语句或设置事务隔离级别为READ COMMITTED或REPEATABLE READ来获取共享锁。

适用场景：当多个事务需要同时读取同一数据时，可以使用共享锁。共享锁允许多个事务同时持有锁，但不允许其他事务对数据进行修改。

排他锁（Exclusive Lock）：

使用方式：通过在事务中使用SELECT ... FOR UPDATE语句或设置事务隔离级别为SERIALIZABLE来获取排他锁。
适用场景：当事务需要对数据进行修改时，可以使用排他锁。排他锁在事务中是独占的，其他事务无法同时持有排他锁或共享锁，保证了数据的一致性和完整性。

适用场景的示例：

共享锁：在一个论坛系统中，多个用户可以同时读取一个帖子的内容，但不允许同时对帖子进行修改。在这种情况下，可以使用共享锁来保证多个读操作的并发性。
排他锁：在一个电商系统中，当用户下单购买商品时，需要对商品库存进行减少操作。为了避免并发下的库存错误，可以使用排他锁来保证只有一个事务可以修改库存，避免冲突和数据不一致。

需要注意的是，锁的使用应该根据具体的业务需求和并发控制的要求进行。过度使用锁可能会导致性能下降和并发性降低，因此在设计和实现中需要权衡锁的使用和性能的平衡。

此外，MySQL还提供了其他类型的锁，如行级锁和表级锁，可以根据具体的需求选择适合的锁机制。在实际应用中，应根据具体的业务场景和需求来选择合适的锁机制和事务隔离级别。

13. 行级锁和表级锁

在MySQL中，除了共享锁和排他锁，还提供了行级锁和表级锁。以下是关于行级锁和表级锁的使用和适用场景的详细说明：

行级锁（Row-Level Locking）：

使用方式：通过在事务中使用SELECT ... FOR UPDATE或SELECT ... LOCK IN SHARE MODE语句来获取行级锁。
适用场景：当事务需要锁定特定行或行集合时，可以使用行级锁。行级锁允许多个事务同时访问同一表，但只有在访问同一行时才会发生冲突。

适用场景的示例：

行级锁：在一个在线商城系统中，多个用户可以同时浏览商品列表，但当用户下单购买某个商品时，需要锁定该商品的库存行，避免并发下的库存错误。在这种情况下，可以使用行级锁来保证对库存行的独占访问。

表级锁（Table-Level Locking）：

使用方式：通过在事务中使用LOCK TABLES语句来获取表级锁。
适用场景：当需要对整个表进行操作时，可以使用表级锁。表级锁会锁定整个表，阻止其他事务对表的读写操作。

适用场景的示例：

表级锁：在一个数据导入系统中，当需要导入大量数据时，可以使用表级锁来锁定整个表，防止其他事务对表进行读写操作，确保数据导入的完整性。

行级锁和表级锁的使用应该根据具体的业务需求和并发控制的要求进行。过度使用锁可能会导致性能下降和并发性降低，因此在设计和实现中需要权衡锁的使用和性能的平衡。

14. 解释一下数据库事务隔离级别，并说明它们之间的区别。

数据库事务隔离级别包括读未提交（Read Uncommitted）、读已提交（Read Committed）、可重复读（Repeatable Read）和串行化（Serializable）。它们之间的区别在于对并发事务的隔离程度和锁的使用方式。

读未提交（Read Uncommitted）：

隔离级别最低，事务之间没有隔离，一个事务可以读取到另一个事务未提交的数据。
可能出现脏读（Dirty Read）问题，即读取到未提交的数据。

读已提交（Read Committed）：

保证一个事务只能读取到已经提交的数据，读取过程中其他事务对数据的修改不可见。
避免了脏读问题，但可能出现不可重复读（Non-repeatable Read）问题，即同一事务内多次读取同一数据时，读取结果不一致。

可重复读（Repeatable Read）：

保证一个事务在执行期间多次读取同一数据时，能够得到一致的结果，不受其他事务的修改影响。
避免了不可重复读问题，但可能出现幻读（Phantom Read）问题，即同一事务内多次查询时，结果集的行数不一致。

串行化（Serializable）：

最高的隔离级别，确保事务串行执行，避免了脏读、不可重复读和幻读的问题。
通过对数据进行加锁来实现隔离，但可能导致并发性能下降。

随着隔离级别的提高，事务的隔离程度增强，但并发性能可能会下降。因此，在选择事务隔离级别时，需要根据具体的业务需求和并发控制的要求进行权衡。

在MySQL中，默认的隔离级别是可重复读（Repeatable Read），可以通过设置SET TRANSACTION ISOLATION LEVEL语句来修改隔离级别。

15. 什么是数据库分区（Partitioning），为什么要使用分区？

MySQL数据库提供了多个存储引擎，每个存储引擎都有不同的特点和适用场景。以下是一些常见的MySQL存储引擎及其特点：

InnoDB：

默认的事务性存储引擎，支持事务和行级锁。
提供高并发性能和数据完整性，适用于大部分应用场景。
支持外键约束、崩溃恢复和自动增长列等功能。

MyISAM：

不支持事务和行级锁，但具有较高的性能。
适用于读密集型应用，如数据仓库、日志分析等。
支持全文索引和压缩表等特性。

Memory（或称为 Heap）：

将数据存储在内存中，读写速度非常快。
适用于临时表、缓存和高速数据处理等场景。
数据在服务器重启或崩溃时会丢失。

Archive：

用于存储大量历史数据，具有高压缩比和快速插入速度。
不支持索引，适用于数据归档和存储。

NDB Cluster（或称为 NDB）：

集群存储引擎，提供高可用性和分布式存储。
适用于大规模的分布式应用，如云计算、实时数据处理等。

需要注意的是，不同的存储引擎在功能和性能方面有所差异，应根据具体的应用需求和场景选择合适的存储引擎。在选择存储引擎时，需要考虑事务支持、并发性能、数据完整性、可用性和存储需求等因素。

此外，MySQL还支持其他存储引擎，如CSV、Blackhole、Federated等。每个存储引擎都有其独特的特点和适用场景，开发人员应根据具体需求进行选择和配置。

16. MySQL数据库如何做索引优化？

在MySQL数据库中，索引优化是提高查询性能的重要方面。以下是一些常见的MySQL索引优化技巧：

展开阅读全文

本文系作者在时代Java发表，未经许可，不得转载。

如有侵权，请联系nowjava@qq.com删除。

编辑于 03-12 14:26:102025-03-12 14:26:10

教程文章

文章订阅