`
newleague
  • 浏览: 1472199 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类

oracle分区表

阅读更多
oracle分区表
Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。

Oracle的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。

分区提供以下优点:

由于将数据分散到各个分区中,减少了数据损坏的可能性;
可以对单独的分区进行备份和恢复;
可以将分区映射到不同的物理磁盘上,来分散IO;
提高可管理性、可用性和性能。

Oracle提供了以下几种分区类型:

范围分区(range);
哈希分区(hash);
列表分区(list);
范围-哈希复合分区(range-hash);
范围-列表复合分区(range-list)。

Oracle的普通表没有办法通过修改属性的方式直接转化为分区表,必须通过重建的方式进行转变,下面介绍三种效率比较高的方法,并说明它们各自的特点。

方法一:利用原表重建分区表。

步骤:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已创建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已创建29733行。

SQL> COMMIT;

提交完成。

CREATE TABLE T_NEW (ID, TIME) PARTITION BY RANGE (TIME)
    (PARTITION P1 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),
    PARTITION P2 VALUES LESS THAN (TO_DATE('2006-1-1', 'YYYY-MM-DD')),
    PARTITION P3 VALUES LESS THAN (TO_DATE('2007-1-1', 'YYYY-MM-DD')),
    PARTITION P4 VALUES LESS THAN (TO_DATE('2008-1-1', 'YYYY-MM-DD')),
    PARTITION P5 VALUES LESS THAN (MAXVALUE))
    AS SELECT ID, TIME FROM T;

表已创建

SQL> RENAME T TO T_OLD;
表已重命名。

SQL> RENAME T_NEW TO T;
表已重命名。


SQL> SELECT COUNT(*) FROM T;

  COUNT(*)
----------
      29733

SQL> SELECT COUNT(*) FROM T PARTITION (P1);

  COUNT(*)
----------
     29504
SQL> SELECT COUNT(*) FROM T PARTITION (P2);

  COUNT(*)
----------
      0

SQL> SELECT COUNT(*) FROM T PARTITION (P3);

  COUNT(*)
----------
        0

SQL> SELECT COUNT(*) FROM T PARTITION (P4);

  COUNT(*)
----------
       229

SQL> SELECT COUNT(*) FROM T PARTITION (P5);

  COUNT(*)
----------
        0

优点:方法简单易用,由于采用DDL语句,不会产生UNDO,且只产生少量REDO,效率相对较高,而且建表完成后数据已经在分布到各个分区中了。
不足:对于数据的一致性方面还需要额外的考虑。由于几乎没有办法通过手工锁定T表的方式保证一致性,在执行CREATE TABLE语句和RENAME T_NEW TO T语句直接的修改可能会丢失,如果要保证一致性,需要在执行完语句后对数据进行检查,而这个代价是比较大的。另外在执行两个RENAME语句之间执行的对T的访问会失败。
适用于修改不频繁的表,在闲时进行操作,表的数据量不宜太大。


方法二:使用交换分区的方法。

步骤:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已创建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已创建29733行。

SQL> COMMIT;

提交完成。



SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)
    (PARTITION P1 VALUES LESS THAN (TO_DATE('2007-12-12', 'YYYY-MM-DD')),
    PARTITION P2 VALUES LESS THAN (MAXVALUE));


表已创建。

SQL> ALTER TABLE T_NEW EXCHANGE PARTITION P1 WITH TABLE T;

表已更改。

SQL> RENAME T TO T_OLD;

表已重命名。

SQL> RENAME T_NEW TO T;

表已重命名。

SQL> SELECT COUNT(*) FROM T;

  COUNT(*)
----------
    29733

SQL> SELECT COUNT(*) FROM T partition(p1);

  COUNT(*)
----------
     29733

SQL> SELECT COUNT(*) FROM T_OLD;

  COUNT(*)
----------
         0

优点:只是对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,效率最高。如果对数据在分区中的分布没有进一步要求的话,实现比较简单。在执行完RENAME操作后,可以检查T_OLD中是否存在数据,如果存在的话,直接将这些数据插入到T中,可以保证对T插入的操作不会丢失。
不足:仍然存在一致性问题,交换分区之后RENAME T_NEW TO T之前,查询、更新和删除会出现错误或访问不到数据。如果要求数据分布到多个分区中,则需要进行分区的SPLIT操作,会增加操作的复杂度,效率也会降低。
适用于包含大数据量的表转到分区表中的一个分区的操作。应尽量在闲时进行操作。

方法三:Oracle9i以上版本,利用在线重定义功能

步骤:

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

表已创建。

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

已创建29733行。

SQL> COMMIT;

提交完成。

SQL> EXEC DBMS_REDEFINITION.CAN_REDEF_TABLE(USER, 'T', DBMS_REDEFINITION.CONS_USE_PK);

PL/SQL procedure successfully completed


SQL> EXEC DBMS_REDEFINITION.START_REDEF_TABLE(USER, 'T', 'T_NEW', 'ID ID, TIME TIME', DBMS_REDEFINITION.CONS_USE_PK);

PL/SQL procedure successfully completed

SQL> EXEC DBMS_REDEFINITION.FINISH_REDEF_TABLE(user, 'T', 'T_NEW');

PL/SQL procedure successfully completed

SQL> SELECT COUNT(*) FROM T;

  COUNT(*)
----------
    29733

SQL> SELECT COUNT(*) FROM T partition(p1);

  COUNT(*)
----------
     29733

优点:保证数据的一致性,在大部分时间内,表T都可以正常进行DML操作。只在切换的瞬间锁表,具有很高的可用性。这种方法具有很强的灵活性,对各种不同的需要都能满足。而且,可以在切换前进行相应的授权并建立各种约束,可以做到切换完成后不再需要任何额外的管理操作。
不足:实现上比上面两种略显复杂。
适用于各种情况。

这里只给出了在线重定义表的一个最简单的例子,详细的描述和例子可以参考下面两篇文章。

Oracle的在线重定义表功能:http://blog.itpub.net/post/468/12855

Oracle的在线重定义表功能(二):http://blog.itpub.net/post/468/12962

索引也可以进行分区,分区索引有两种类型:global和local。对于local索引,每一个表分区对应一个索引分区,当表的分区发生变化时,索引的维护由Oracle自动进行。对于global索引,可以选择是否分区,而且索引的分区可以不与表分区相对应。当对分区进行维护操作时,通常会导致全局索引的INVALDED,必须在执行完操作后REBUILD。Oracle9i提供了UPDATE GLOBAL INDEXES语句,可以使在进行分区维护的同时重建全局索引。

测试分区索引
1.创建分区表
create table T
(
  A NUMBER not null,
  D DATE
)
partition by range (D)
(
  partition P1 values less than (TO_DATE(' 2007-01-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS'))
    tablespace p1,
  partition P2 values less than (TO_DATE(' 2008-01-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS'))
    tablespace p2
);

2.往分区表增加数据
insert into t select rownum,object_name from dba_objects;

3.创建全局分区索引
create index t_d on t(d)
global partition  BY RANGE(D)
(
   partition pi_d_p1 values less than(TO_DATE(' 2007-01-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS'))
   tablespace p1,
   partition pi_d_p2 values less than(maxvalue)
   tablespace p2
)
创建全局分区索引的时候,最后一个分区必须指定maxvalue.如果是某一个固定的值,则创建不成功.

查看是否为全局分区索引(locality的值为global)
SQL>select t.index_name,t.table_name,t.partitioning_type,t.locality from user_part_indexes t
INDEX_NAME TABLE_NAME PARTITIONING_TYPE LOCALITY
T_D  T  RANGE   GLOBAL

使用08年的本地分区索引,注意INDEX ROWID前面的GLOBAL,说明是全局分区索引
SQL>select * from t tt
where tt.d=date '2007-01-02'
SELECT STATEMENT, GOAL = CHOOSE    1 1 22
  PARTITION RANGE SINGLE     1 1 22
   TABLE ACCESS BY GLOBAL INDEX ROWID TEST T 1 1 22
    INDEX RANGE SCAN   TEST T_D 1 1

SQL>select index_name,partition_name,tablespace_name,status,user_stats,global_stats
from user_ind_partitions

INDEX_NAME PARTITION_NAME TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  PI_D_P1  P1  USABLE NO  NO
T_D  PI_D_P2  P2  USABLE NO  NO

老罗的global_stats为'YES'

SQL>select index_name,partitioned,tablespace_name,status,user_stats,global_stats
from user_indexes t
where t.table_name='T'

INDEX_NAME PARTITIONED TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  YES    N/A NO  NO 
当创建分区索引后(无论分区的还是全局的,都不能再创建普通索引:create index t_d_g on t(d))


重编译全局分区索引的时候,要一个一个进行编译:
SQL>alter  index t_d rebuild partition pi_d_p2 online;

4.创建本地分区索引

1.删除我们上面创建的全局索引
  SQL>drop index t_d;
  用下面语句验证一下
  select index_name,partition_name,tablespace_name,status,user_stats,global_stats
  from user_ind_partitions
  没有查出记录,索引删除掉了.

2.创建本地分区索引
SQL>CREATE INDEX t_d ON t(d)
  local
  (
   partition part_idx_01 tablespace p1,
   partition part_idx_02 tablespace p2
  );

SQL>select index_name,partition_name,tablespace_name,status,user_stats,global_stats
from user_ind_partitions
INDEX_NAME PARTITION_NAME TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  PART_IDX_02 P2  USABLE NO  NO
T_D  PART_IDX_01 P1  USABLE NO  NO

SQL>select index_name,partitioned,tablespace_name,status,user_stats,global_stats
from user_indexes t
where t.table_name='T';
INDEX_NAME PARTITIONED TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  YES    N/A NO  NO

一个哥们说查询user_part_indexes的locality字段可以知道是本地的还是全局的分区索引
SQL>select t.index_name,t.table_name,t.partitioning_type,t.locality from user_part_indexes t
INDEX_NAME TABLE_NAME PARTITIONING_TYPE LOCALITY
T_D  T  RANGE   LOCAL

3.增加一个表分区,查看索引是否失效

SQL>alter table t add Partition P3 values less than (TO_DATE(' 2009-01-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN')) tablespace p3 ;

分区增加成功

SQL>select index_name,partitioned,tablespace_name,status,user_stats,global_stats
from user_indexes t
where t.table_name='T';
INDEX_NAME PARTITIONED TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  YES    N/A NO  NO

使用08年的本地分区索引,注意INDEX ROWID前面的LOCAL,说明是本地分区索引
SQL>select * from t tt
where tt.d=date '2008-01-01'
SELECT STATEMENT, GOAL = ALL_ROWS   2 60 720
  PARTITION RANGE SINGLE     2 60 720
   TABLE ACCESS BY LOCAL INDEX ROWID TEST T 2 60 720
    INDEX RANGE SCAN   TEST T_D 1 60

虽然我们并没有在小于09年手工创建索引,但oracle自动为我们添加了
SQL>select index_name,partition_name,tablespace_name,status,user_stats,global_stats
from user_ind_partitions
INDEX_NAME PARTITION_NAME TABLESPACE_NAME STATUS USER_STATS GLOBAL_STATS
T_D  PART_IDX_02 P2  USABLE NO  NO
T_D  PART_IDX_01 P1  USABLE NO  NO
T_D  P3  P3  USABLE NO  NO

SQL>select * from t tt
where tt.d=date '2008-01-02'
SELECT STATEMENT, GOAL = CHOOSE    2 60 720
  PARTITION RANGE SINGLE     2 60 720
   TABLE ACCESS BY LOCAL INDEX ROWID TEST T 2 60 720
    INDEX RANGE SCAN   TEST T_D 1 60
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics