当向Oracle提交一个sql命令时,Oracle到底做了哪些事情?对这个问题有很好的理解,能帮助你更好的分析sql语句的优化。
执行一条sql语句从开始到结束,需要经历4个步骤:
分析--对提交的语句进行语法分析、语义分析和共享池检查。
优化--生成一个可在数据库中用来执行语句的最佳计划
行资源生成--为会话取得最佳计划并建立执行计划
语句执行--完成实际执行查询的行资源生成步骤的输出。对应DDL来说,这一步就是语句的结 束。对应SELECT来说,这一步是取数据的开始。
以上步骤,有的是可以省略的,例如优化、行资源生成器阶段。这样可以节省大量的时间。
一、分析:
语法分析,sql是否符合语法标准。
SQL> select * form tab;
select * form tab
*
ERROR at line 1:
ORA-00923: FROM keyword not found where expected
语义分析,假设sql是合法的,但是它有意义吗?你要访问的对象,你有访问权限吗?查询的列存在吗?是否存在歧义等待。
SQL> conn scott/tiger
Connected.
SQL> select x from dual;
select x from dual
*
ERROR at line 1:
ORA-00904: "X": invalid identifier
SQL> select * from dba_objects;
select * from dba_objects
*
ERROR at line 1:
ORA-00942: table or view does not exist
对于DML语句,还有第三步。
共享池检查,此语句是否被其他用户使用过?可以重用已经执行过的工作吗?如果是,就是软解析soft parse,如果否,那就是硬解析。
DDL总是硬解析,语句从不重用。
Shared pool是SGA中的一部分,用来缓存以前执行过的sql语句、PLSQL、数据字典内容的缓存(以行的形式缓存内容,而buffer cache是以block的方式缓存内容)以及其他许多信息,以供会话重用。
从技术上来说,Oracle的语句解析分为两种:
硬解析--语句通过语句执行的每一个步骤从分析到优化,到行资源生成,到语句执行。
软解析--语句通过语句执行的某些步骤,特别是跳过优化步骤(最昂贵的步骤)。为了执行软解析,必须通过两个步骤。首先Oracle必须进行语义匹配,查看提交给Oracle的语句是否已经被执行过。然后,进行环境匹配。比如一个会话的初始化参数optimizer_mode=ALL_ROWS,一个会话的初始化参数optimizer_mode=FIRST_ROWS,这两个会话的环境就不一样。
为了开始这个处理,Oracle必须在Shared pool中寻找语句。为了高效的完成此操作,oracle将每个提交的sql语句,进行hash算法,生成一个hash_values。oracle使用hash_values查找Shared pool中是否有相同的语句。
一旦找到,Oracle将进行语义和环境检查,sql语句都相同,难道还有语义不同的吗?我们看下面的例子。
建立两个用户
SQL> create user a identified by a;
User created.
SQL> create user b identified by b;
User created.
2. 赋予用户权限
SQL> grant connect ,resource to a;
Grant succeeded.
SQL> grant connect,resource to b;
Grant succeeded.
3.启用一个会话
SQL> conn a/a
Connected.
SQL> create table emp (id int);
Table created.
SQL> select * from emp;
no rows selected
4. 启用另一个会话
SQL> conn b/b
Connected.
SQL> create table emp (id int);
Table created.
SQL> select * from emp;
no rows selected
SQL> select * from emp;
no rows selected
5.启用另一会话,使用sys用户连接,进行如下查询。
SQL> SET LINESIZE 200
SQL> COL SQL_TEXT FOR A50
SQL> SELECT address, executions, sql_text
FROM v$sql
WHERE UPPER (sql_text) LIKE 'SELECT * FROM EMP';
ADDRESS EXECUTIONS SQL_TEXT
---------------- ---------- --------------------------------------------------
00000000893DF470 2 select * from emp
00000000893DF470 1 select * from emp
SQL>
可见,虽然发出的语句是一样的,但是语义不同,所以v$sql中会有两条记录。b用户下,相同的语句执行了两次,因为语义相同,所以是一条记录,但是executions是2 。
我们再看看,语义相同,但是环境不同,会是什么结果。
以上的连接全部退出,新建一个连接进行如下查询。
SQL> conn / as sysdba
Connected.
SQL> alter session set optimizer_mode=ALL_ROWS;
Session altered.
SQL> SELECT * FROM A.EMP;
no rows selected
SQL> alter session set optimizer_mode=FIRST_ROWS;
Session altered.
SQL> SELECT * FROM A.EMP;
no rows selected
查看sql解析情况
SQL> SET LINESIZE 200
SQL> COL SQL_TEXT FOR A50
SQL> select address,executions,sql_text
from v$sql
where upper(sql_text) like 'SELECT * FROM A.EMP';
ADDRESS EXECUTIONS SQL_TEXT
---------------- ---------- --------------------------------------------------
0000000091CD7810 1 SELECT * FROM A.EMP
0000000091CD7810 1 SELECT * FROM A.EMP
可见,虽然语义相同,但是环境不同,Oracle也会当成2条语句来解析。
分析总结:
分析阶段做了如下操作,语法检查、计算散列值、语义检查、环境检查、计算子游标的散列值等。 此外Oracle还可能做了如下步骤:
在Shared pool中查找匹配的hash_value,如果能找到,确认访问对象的权限、检查环境。生成子游标hash_value。如果子游标hash_value也能匹配。那么将跳过优化和行资源生成。(此部门我们将在游标中详细讨论)
二、优化和行资源生成
当所有的DML语句第一次提交给Oracle时,在它的生命周期中至少被优化一次。优化发生在硬解析中。语义和语法完全相同,并且执行环境也相同的语句的执行可以利用以前的硬解析工作。这种情况下,对他们将进行软解析。
优化是一个费劲的、CPU密集型的处理,可能花在优化上的时间比实际执行还要长。优化不单耗cpu,还是导致Shared pool 高栓锁率。优化的规则有两种
1. 基于规则的优化法则(RBO)
2. 基于成本的优化法则(CBO)
优化就是根据优化法则,生成各种各样的执行计划,并且选择一个最好的执行计划。
行资源生成器是一个软件,就是将执行计划转化成其他部分可以利用的数据结构。
三、执行
利用行资源生成器输出的执行计划结构,执行具体的步骤。