title | summary | aliases | |
---|---|---|---|
SQL 操作常见问题 |
介绍 SQL 操作相关的常见问题。 |
|
本文档介绍 TiDB 中常见的 SQL 操作问题。
支持。你可以在具有唯一二级索引的非主键列上设置 NOT NULL
约束。在这种情况下,该列用作二级键。
TiDB 在对大表执行 DDL 操作时,一般不会有什么问题。TiDB 支持在线 DDL 操作,且这些 DDL 操作不会阻塞 DML 操作。
对于添加列、删除列或删除索引等 DDL 操作,TiDB 可以快速完成这些操作。
对于添加索引等 DDL 操作,TiDB 需要进行回填 (backfill) 操作,这个过程需要较长的时间(取决于表的大小)和额外的资源消耗。对在线业务的影响可调节。TiDB 可以通过多线程进行 backfill,资源消耗可通过以下系统变量进行设置:
tidb_ddl_reorg_worker_cnt
tidb_ddl_reorg_priority
tidb_ddl_error_count_limit
tidb_ddl_reorg_batch_size
TiDB 包含一个基于成本的优化器。在大多数情况下,优化器会为你选择最优的查询计划。如果优化器工作欠佳,你可以使用优化器提示来干预优化器。
另外,你还可以使用执行计划绑定来为特定的 SQL 语句固定查询计划。
对于 v7.5.0 及以上版本,你可以使用 QUERY WATCH
语句将特定的 SQL 查询加入黑名单。具体使用方法参见管理资源消耗超出预期的查询 (Runaway Queries)。
对于 v7.5.0 之前版本,你可以使用 MAX_EXECUTION_TIME
Hint 来创建 SQL 绑定,将特定语句的执行时间限制为一个较小的值(例如 1ms)。这样,语句就会在超过限制时自动终止。
例如,要阻止执行 SELECT * FROM t1, t2 WHERE t1.id = t2.id
,可以使用以下 SQL 绑定将语句的执行时间限制为 1ms:
CREATE GLOBAL BINDING for
SELECT * FROM t1, t2 WHERE t1.id = t2.id
USING
SELECT /*+ MAX_EXECUTION_TIME(1) */ * FROM t1, t2 WHERE t1.id = t2.id;
注意:
MAX_EXECUTION_TIME
的精度大约为 100ms。在 TiDB 终止 SQL 语句之前,TiKV 中的任务可能已经开始执行。为了减少这种情况下 TiKV 的资源消耗,建议将系统变量tidb_enable_paging
的值设置为ON
。
删除该 SQL 绑定可以移除限制。
DROP GLOBAL BINDING for
SELECT * FROM t1, t2 WHERE t1.id = t2.id;
详细可参考系统变量。
这不是 bug。返回结果的顺序视不同情况而定,不保证顺序统一。
MySQL 中,返回结果的顺序可能较为固定,因为查询是通过单线程执行的。但升级到新版本后,查询计划也可能变化。无论是否期待返回结果有序,都推荐使用 ORDER BY
条件。
ISO/IEC 9075:1992, Database Language SQL- July 30, 1992 对此有如下表述:
If an
<order by clause>
is not specified, then the table specified by the<cursor specification>
is T and the ordering of rows in T is implementation-dependent.(如果未指定<order by 条件>
,通过<cursor specification>
指定的表为 T,那么 T 表中的行顺序视执行情况而定。)
以下两条查询的结果都是合法的:
> select * from t;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 2 |
+------+------+
2 rows in set (0.00 sec)
> select * from t; -- 不确定返回结果的顺序
+------+------+
| a | b |
+------+------+
| 2 | 2 |
| 1 | 1 |
+------+------+
2 rows in set (0.00 sec)
如果 ORDER BY
中使用的列不是唯一列,就无法确定该语句返回结果的顺序。在以下示例中,a
列有重复值,因此只有 ORDER BY a, b
能确定返回结果的顺序。
> select * from t order by a;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 1 |
| 2 | 2 |
+------+------+
3 rows in set (0.00 sec)
在以下示例中,order by a
能确定 a 列的顺序,但不能确定 b 列的顺序。
> select * from t order by a;
+------+------+
| a | b |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 2 | 1 |
+------+------+
3 rows in set (0.00 sec)
在 TiDB 中,你还可以使用系统变量 tidb_enable_ordered_result_mode
来指定是否对最终的输出结果进行自动排序。
支持。当 TiDB 使用悲观锁(自 TiDB v3.0.8 起默认使用)时,TiDB 中 SELECT FOR UPDATE
的行为与 MySQL 中的基本一致。
当 TiDB 使用乐观锁时,SELECT FOR UPDATE
不会在事务启动时对数据加锁,而是在提交事务时检查冲突。如果检查出冲突,会回滚待提交的事务。
详情参考 SELECT 语句语法元素说明。
TiDB 的默认字符集是 utf8mb4
,字符串是 memcomparable 格式。关于字符集的更多信息,参见字符集和排序规则。
一个事务中的语句数量,默认限制最大为 5000 条。
在使用乐观事务并开启事务重试的情况下,默认限制 5000,可通过 stmt-count-limit
调整。
TiDB 的自增 ID (AUTO_INCREMENT
) 只保证自增且唯一,并不保证连续分配。TiDB 目前采用批量分配的方式,所以如果在多台 TiDB server 上同时插入数据,分配的自增 ID 会不连续。当多个线程并发往不同的 TiDB server 插入数据的时候,有可能会出现后插入的数据自增 ID 小的情况。此外,TiDB 允许给整型类型的字段指定 AUTO_INCREMENT,且一个表只允许一个属性为 AUTO_INCREMENT
的字段。详情可参考自增 ID和 AUTO_INCREMENT。
TiDB 支持在会话或全局作用域上修改 sql_mode
系统变量。
- 对全局作用域变量的修改,设置后将作用于集群中的其它服务器,并且重启后更改依然有效。因此,你无需在每台 TiDB 服务器上都更改
sql_mode
的值。 - 对会话作用域变量的修改,设置后只影响当前会话,重启后更改消失。
用 Sqoop 批量写入 TiDB 数据,虽然配置了 --batch
选项,但还是会遇到 java.sql.BatchUpdateException:statement count 5001 exceeds the transaction limitation
的错误,该如何解决?
问题原因:在 Sqoop 中,--batch
是指每个批次提交 100 条 statement,但是默认每个 statement 包含 100 条 SQL 语句,所以此时 100 * 100 = 10000 条 SQL 语句,超出了 TiDB 的事务限制 5000 条。
解决办法:
-
增加选项
-Dsqoop.export.records.per.statement=10
,完整的用法如下:sqoop export \ -Dsqoop.export.records.per.statement=10 \ --connect jdbc:mysql://mysql.example.com/sqoop \ --username sqoop ${user} \ --password ${passwd} \ --table ${tab_name} \ --export-dir ${dir} \ --batch
-
也可以选择增大 TiDB 的单个事物语句数量限制,不过此操作会导致内存增加。详情参见 SQL 语句的限制。
有,也支持 DDL。详细参考使用 AS OF TIMESTAMP 语法读取历史数据。
在 TiDB 中使用 DELETE
,TRUNCATE
和 DROP
语句删除数据都不会立即释放空间。对于 TRUNCATE
和 DROP
操作,在达到 TiDB 的 GC (garbage collection) 时间后(默认 10 分钟),TiDB 的 GC 机制会删除数据并释放空间。对于 DELETE 操作,TiDB 的 GC 机制会删除数据,但不会立即释放空间,而是等到后续进行 compaction 时释放空间。
删除大量数据后,会有很多无用的 key 存在,影响查询效率。要解决该问题,可以尝试开启 Region Merge 功能,具体可参考最佳实践中的删除数据部分。
TiDB 采用了多版本并发控制 (MVCC) 机制,当新写入的数据覆盖旧的数据时,旧的数据不会被替换掉,而是与新写入的数据同时保留,并以时间戳来区分版本。为了使并发事务能查看到早期版本的数据,删除数据时 TiDB 不会立即回收空间,而是等待一段时间后再进行垃圾回收 (GC)。要配置历史数据的保留时限,你可以修改系统变量 tidb_gc_life_time
的值(默认值为 10m0s
)。
TiDB 中的 SHOW PROCESSLIST
与 MySQL 中的 SHOW PROCESSLIST
显示内容基本一致,不会显示系统进程号。而返回结果中的 ID 表示当前的 session ID。其中 TiDB 的 SHOW PROCESSLIST
和 MySQL 的 SHOW PROCESSLIST
区别如下:
-
由于 TiDB 是分布式数据库,TiDB server 实例是无状态的 SQL 解析和执行引擎(详情可参考 TiDB 整体架构),用户使用 MySQL 客户端登录的是哪个 TiDB server,
SHOW PROCESSLIST
就会显示当前连接的这个 TiDB server 中执行的 session 列表,不是整个集群中运行的全部 session 列表;而 MySQL 是单机数据库,SHOW PROCESSLIST
列出的是当前整个 MySQL 数据库的全部执行 SQL 列表。 -
在查询执行期间,TiDB 中的
State
列不会持续更新。由于 TiDB 支持并行查询,每个语句可能同时处于多个状态,因此很难显示为某一种状态。
TiDB 支持改变全局或单个语句的优先级。优先级包括:
HIGH_PRIORITY
:该语句为高优先级语句,TiDB 在执行阶段会优先处理这条语句LOW_PRIORITY
:该语句为低优先级语句,TiDB 在执行阶段会降低这条语句的优先级DELAYED
:该语句为正常优先级语句,TiDB 不强制改变这条语句的优先级,与tidb_force_priority
设置为NO_PRIORITY
相同
注意:
TiDB 从 v6.6.0 版本开始支持使用资源管控 (Resource Control) 实现资源隔离功能。该功能可以将不同优先级的语句放在不同的资源组中执行,并为这些资源组分配不同的配额和优先级,可以达到更好的资源管控效果。在开启资源管控功能后,语句的调度主要受资源组的控制,
PRIORITY
将不再生效。建议在支持资源管控的版本优先使用资源管控功能。
以上两种参数可以结合 TiDB 的 DML 语言进行使用,使用方法举例如下:
-
通过在数据库中写 SQL 的方式来调整优先级:
SELECT HIGH_PRIORITY | LOW_PRIORITY | DELAYED COUNT(*) FROM table_name; INSERT HIGH_PRIORITY | LOW_PRIORITY | DELAYED INTO table_name insert_values; DELETE HIGH_PRIORITY | LOW_PRIORITY | DELAYED FROM table_name; UPDATE HIGH_PRIORITY | LOW_PRIORITY | DELAYED table_reference SET assignment_list WHERE where_condition; REPLACE HIGH_PRIORITY | LOW_PRIORITY | DELAYED INTO table_name;
-
全表扫会自动调整为低优先级,
ANALYZE
也是默认低优先级。
当一张表或分区表的单个分区达到 1000 条记录,且表或分区的(修改数/当前总行数)比例大于 tidb_auto_analyze_ratio
的时候,会自动触发 ANALYZE
语句。
tidb_auto_analyze_ratio
的默认值为 0.5
,即默认开启触发 auto analyze
。注意该变量值不建议大于等于 pseudo-estimate-ratio
(默认值为 0.8
),否则优化器可能会使用 pseudo 统计信息。TiDB 从 v5.3.0 开始引入 tidb_enable_pseudo_for_outdated_stats
变量,当设置为 OFF
时,即使统计信息过期也不会使用 pseudo 统计信息。
你可以用系统变量 tidb_enable_auto_analyze
关闭 auto analyze
。
在 TiDB 中,你可以用多种方法控制查询优化器的默认行为,包括使用 Optimizer Hints 和 SQL 执行计划管理 (SPM)。基本用法同 MySQL 中的一致,还包含若干 TiDB 特有的用法,例如:select column_name from table_name use index(index_name)where where_condition;
。
本节列出了 DDL 语句执行的相关问题。DDL 执行原理的详细说明,参见 TiDB 中 DDL 执行原理及最佳实践。
假设 DDL 操作没有被阻塞,各个 TiDB server 能够正常更新 Schema 版本,DDL Owner 节点正常运行。在此情况下,各类 DDL 操作的预估耗时如下:
DDL 操作类型 | 预估耗时 |
---|---|
Reorg DDL:例如 ADD INDEX 、MODIFY COLUMN (Reorg 类型的数据更改) |
取决于数据量、系统负载以及 DDL 参数的设置 |
General DDL(除 Reorg DDL 外的 DDL 类型):例如 CREATE DATABASE 、CREATE TABLE 、DROP DATABASE 、DROP TABLE 、TRUNCATE TABLE 、ALTER TABLE ADD 、ALTER TABLE DROP 、MODIFY COLUMN (只更改元数据)、DROP INDEX |
1 秒左右 |
注意:
以上为各类操作的预估耗时,请以实际操作耗时为准。
-
在一个用户会话中,DDL 语句之前有非 auto-commit 的 DML 语句,并且该 DML 语句的提交操作比较慢,会导致 DDL 语句执行慢。即执行 DDL 语句前,会先提交之前没有提交的 DML 语句。
-
多个 DDL 语句一起执行的时候,后面的几个 DDL 语句可能会比较慢,因为可能需要排队等待。排队场景包括:
- 同一类型 DDL 语句需要排队(例如
CREATE TABLE
和CREATE DATABASE
都是 General DDL,两个操作同时执行时,需要排队)。自 TiDB v6.2.0 起,支持并行 DDL 语句,但为了避免 DDL 使用过多 TiDB 的计算资源,也有并发度限制,因此会有一定的排队情况。 - 对同一张表上执行的 DDL 操作存在依赖关系,后面的 DDL 语句需要等待前面的 DDL 操作完成。
- 同一类型 DDL 语句需要排队(例如
-
在集群正常启动后,第一个 DDL 操作的执行时间可能会比较久,可能是因为 DDL 模块在进行 DDL Owner 的选举。
-
终止 TiDB 时,TiDB 不能与 PD 正常通信(包括停电的情况),或者用
kill -9
命令终止 TiDB 导致 TiDB 没有及时从 PD 清理注册数据。 -
集群中某个 TiDB 与 PD 或者 TiKV 之间发生通信问题,即 TiDB 不能及时获取最新版本信息。
TiDB 在执行 SQL 语句时,会根据隔离级别确定一个对象的 schema
版本来处理该 SQL 语句,而且 TiDB 支持在线异步变更 DDL。那么,在执行 DML 的时候可能有 DDL 语句也在执行,而你需要确保每个 SQL 语句在同一个 schema
上执行。所以当执行 DML 时,如果遇到正在执行中的 DDL 操作,TiDB 可能会报 Information schema is changed
的错误。
从 v6.4.0 开始,TiDB 实现了元数据锁机制,可以让 DML 语句的执行和 DDL Schema 变更协同进行,可以避免大部分 Information schema is changed
错误的发生。
报错的可能原因如下:
- 原因 1:正在执行的 DML 所涉及的表和集群中正在执行的 DDL 的表有相同的,那么这个 DML 语句就会报此错。可以通过命令
admin show ddl job
查看正在执行的 DDL 操作。 - 原因 2:这个 DML 执行时间很久,而这段时间内执行了很多 DDL 语句,导致中间
schema
版本变更次数超过 1024 (此为默认值,可以通过tidb_max_delta_schema_count
变量修改)。 - 原因 3:接受 DML 请求的 TiDB 长时间不能加载到
schema information
(TiDB 与 PD 或 TiKV 之间的网络连接故障等会导致此问题),而这段时间内执行了很多 DDL 语句,导致中间schema
版本变更次数超过 100。 - 原因 4:TiDB 重启后执行第一个 DDL 操作前,执行 DML 操作,并且在执行过程中遇到了第 1 个 DDL 操作(即在执行第 1 个 DDL 操作前,启动该 DML 对应的事务,且在该 DDL 变更第一个
schema
版本后,提交该 DML 对应的事务),那么这个 DML 会报此错。
以上原因中,只有原因 1 与表有关。原因 1 和原因 2 都不会导致业务问题,相应的 DML 会在失败后重试。对于原因 3,需要检查 TiDB 实例和 PD 及 TiKV 的网络情况。
注意:
- 目前 TiDB 未缓存所有的
schema
版本信息。- 对于每个 DDL 操作,
schema
版本变更的数量与对应schema state
变更的次数一致。- 不同的 DDL 操作版本变更次数不一样。例如,
create table
操作会有 1 次schema
版本变更;add column
操作有 4 次schema
版本变更。
当执行 DML 时,TiDB 超过一个 DDL lease 时间(默认 45s)没能加载到最新的 schema 就可能会报 Information schema is out of date
的错误。遇到此错的可能原因如下:
- 执行此 DML 的 TiDB 被 kill 后准备退出,且此 DML 对应的事务执行时间超过一个 DDL lease,在事务提交时会报这个错误。
- TiDB 在执行此 DML 时,有一段时间内连不上 PD 或者 TiKV,导致 TiDB 超过一个 DDL lease 时间没有 load schema,或者导致 TiDB 断开与 PD 之间带 keep alive 设置的连接。
高并发场景下执行 DDL 语句(比如批量建表)时,极少部分的 DDL 语句可能会由于并发执行时 key 冲突而执行失败。
并发执行 DDL 语句时,建议将 DDL 语句数量保持在 20 以下,否则你需要在应用端重试失败的 DDL 语句。
在 TiDB v6.2.0 前,TiDB 按照 DDL 语句类型将 DDL 分配到两个先入先出的队列中,即 Reorg DDL 进入 Reorg 队列中,General DDL 进入 general 队列中。由于先入先出以及同一张表上的 DDL 语句需要串行执行,多个 DDL 语句在执行过程中可能会出现阻塞的问题。
例如对于以下 DDL 语句:
- DDL 1:
CREATE INDEX idx on t(a int);
- DDL 2:
ALTER TABLE t ADD COLUMN b int;
- DDL 3:
CREATE TABLE t1(a int);
由于队列先入先出的限制,DDL 3 需要等待 DDL 2 执行。同时又因为同一张表上的 DDL 语句需要串行执行,DDL 2 需要等待 DDL 1 执行。因此,DDL 3 需要等待 DDL 1 先执行完,即使它们操作在不同的表上。
在 TiDB v6.2.0 及之后的版本中,TiDB DDL 模块采用了并发框架。在并发的框架下,不再有同一个队列先进先出的问题,而是从所有 DDL 任务中选出可以执行的 DDL 来执行。并且对 Reorg worker 的数量进行了扩充,大概为节点 CPU/4
,这使得在并发框架中 TiDB 可以同时为多张表建索引。
无论是新集群还是从旧版本升级的集群,在 TiDB v6.2 及以上版本中,TiDB 都会自动使用并发框架,用户无需进行调整。
- 先排除 DDL 语句通常执行慢的可能原因。
- 使用以下任一方法找出 DDL owner 节点:
- 通过
curl http://{TiDBIP}:10080/info/all
获取当前集群的 Owner - 通过监控 DDL > DDL META OPM 查看某个时间段的 Owner
- 通过
- 如果 Owner 不存在,尝试手动触发 Owner 选举:
curl -X POST http://{TiDBIP}:10080/ddl/owner/resign
。 - 如果 Owner 存在,导出 Goroutine 堆栈并检查可能卡住的地方。
详细解读理解 TiDB 执行计划。
详细解读常规统计信息。
Count 就是暴力扫表,提高并发度能显著提升扫表速度。如要调整并发度,可以使用 tidb_distsql_scan_concurrency
变量,但调整并发度需要同时考虑 CPU 和 I/O 资源。TiDB 每次执行查询时,都要访问 TiKV。在数据量小的情况下,MySQL 的数据都在内存里,而 TiDB 还需要进行一次网络访问。
加速建议:
- 提升硬件配置,可以参考部署建议。
- 提升并发度,默认是 10,可以尝试提升到 50,但是一般提升幅度在 2-4 倍之间。
- 测试大数据量的 count。
- 调优 TiKV 配置,可以参考性能调优。
- 参考下推计算结果缓存。
通过 ADMIN SHOW DDL
语句查看当前 job 进度。操作如下:
ADMIN SHOW DDL;
*************************** 1. row ***************************
SCHEMA_VER: 140
OWNER: 1a1c4174-0fcd-4ba0-add9-12d08c4077dc
RUNNING_JOBS: ID:121, Type:add index, State:running, SchemaState:write reorganization, SchemaID:1, TableID:118, RowCount:77312, ArgLen:0, start time: 2018-12-05 16:26:10.652 +0800 CST, Err:<nil>, ErrCount:0, SnapshotVersion:404749908941733890
SELF_ID: 1a1c4174-0fcd-4ba0-add9-12d08c4077dc
从以上返回结果可知,当前正在处理的是 ADD INDEX
操作。且从 RUNNING_JOBS
列的 RowCount
字段可以知道当前 ADD INDEX
操作已经添加了 77312 行索引。
可以使用 ADMIN SHOW DDL
语句查看正在运行的 DDL 作业。
ADMIN SHOW DDL JOBS
:用于查看当前 DDL 作业队列中的所有结果(包括正在运行以及等待运行的任务)以及已执行完成的 DDL 作业队列中的最近十条结果。ADMIN SHOW DDL JOBS QUERIES 'job_id' [, 'job_id'] ...
:用于显示job_id
对应的 DDL 任务的原始 SQL 语句。此job_id
只搜索正在执行中的任务以及 DDL 历史作业队列中的最近十条结果。
是的,TiDB 基于成本的优化器 (CBO) 对代价模型、统计信息进行持续优化。除此之外,TiDB 还支持 hash join、sort-merge join 等 join 算法。
可以通过 SHOW STATS_HEALTHY
来查看 Healthy 字段,一般该字段值小于等于 60 的表需要做 analyze。
ID 没什么规律,只要是唯一就行。不过在生成执行计划时,有一个计数器,生成一个计划 ID 后序号就加 1,执行的顺序和序号无关。整个执行计划是一颗树,执行时从根节点开始,不断地向上返回数据。要理解执行计划,请参考理解 TiDB 执行计划。
目前 TiDB 的计算任务隶属于两种不同的 task:cop task 和 root task。cop task 是指被下推到 KV 端分布式执行的计算任务,root task 是指在 TiDB 端单点执行的计算任务。
一般来讲 root task 的输入数据是来自于 cop task 的,但是 root task 在处理数据的时候,TiKV 上的 cop task 也可以同时处理数据,等待 TiDB 的 root task 拉取。所以从这个过程来看,root task 和 cop task 是并行的,同时存在数据上下游关系。
在执行的过程中,某些时间段也可能是并行的,第一个 cop task 在处理 [100, 200] 的数据,第二个 cop task 在处理 [1, 100] 的数据。执行计划的理解,请参考理解 TiDB 执行计划。
详情参考 TiDB 配置参数。
要了解热点问题的场景,请参考常见热点问题。TiDB 的以下特性旨在帮助解决热点问题:
SHARD_ROW_ID_BITS
属性。设置该属性后,行 ID 会被打散并写入多个 Region,以缓解写入热点问题。AUTO_RANDOM
属性,用于解决自增主键带来的热点问题。- Coprocessor Cache,针对小表的读热点问题。
- Load Base Split,针对因 Region 访问不均衡(例如小表全表扫)而导致的热点问题。
- 缓存表,针对被频繁访问但更新较少的小热点表。
如果你遇到因热点引起的性能问题,可参考处理热点问题。
详情参考 TiKV 性能参数调优。