为了方便起见,建立了以下简单模型,和构造了部分测试数据:
在某个业务受理子系统BSS中,
- --客户资料表
- createtablecustomers
- (
- customer_id number(8)notnull,-- 客户标示
- city_name varchar2(10)notnull,-- 所在城市
- customer_typechar(2)notnull,-- 客户类型
- ...
- )
- uniqueindexPK_customersoncustomers (customer_id)
由于某些原因,客户所在城市这个信息并不什么准确,但是在
客户服务部的CRM子系统中,通过主动服务获取了部分客户20%的所在
城市等准确信息,于是你将该部分信息提取至一张临时表中:
1) 最简单的形式
2) 两表(多表)关联update-- 仅在where字句中的连接
updatecustomers a-- 使用别名
setcity_name=(selectb.city_namefromtmp_cust_city bwhereb.customer_id=a.customer_id)
select1
fromtmp_cust_city b
whereb.customer_id=a.customer_id
)
-- update 超过2个值
set(city_name,customer_type)=(selectb.city_name,b.customer_type
whereb.customer_id=a.customer_id)
注意在这个语句中,
=(selectb.city_name,b.customer_typefromtmp_cust_city b
whereb.customer_id=a.customer_id )
与
(select1b.customer_id=a.customer_id)
是两个独立的子查询,查看执行计划可知,对b表/索引扫描了篇;
如果舍弃条件,则默认对A表进行全表
更新,但由于
01779,"cannot modify a column which maps to a non key-preserved table"
// *Cause: An attempt was madetoinsertorupdatecolumnsofajoinviewwhich
// maptoa non-key-preservedtable.
// *Action:Modifythe underlying base tables directly.
01427,"single-row subquery returns more than one row"
// *Cause:
// *一个比较简单近似于不负责任的做法是
(selectb.customer_id,b.city_name,count(*)
fromtmp_cust_city b,customers a
whereb.customer_id=a.customer_id
groupbyb.customer_id,b.city_name
havingcount(*)>=2
)
=(selectb.city_name,b.customer_typefromtmp_cust_city b
whereb.customer_id=a.customer_id )
与
(select1b.customer_id=a.customer_id)
是两个独立的子查询,查看执行计划可知,对b表/索引扫描了篇;
如果舍弃条件,则默认对A表进行全表
更新,但由于
whereb.customer_id=a.customer_id
有可能不能提供
"足够多"值,因为tmp_cust_city只是一部分客户的信息,所以报错(如果指定的列--city_name可以为NULL则另当别论):setcity_name=nvl((whereb.customer_id=a.customer_id),a.city_name)
或者
'未知')
-- 当然这不符合业务逻辑了
4) 上述)在一些情况下,因为B表的纪录只有A表的20-30%的纪录数,
考虑A表使用INDEX的情况,使用cursor也许会比关联update带来更好的性能:
setserveroutputon
declare
cursorcity_curis
selectcustomer_id,city_name
fromtmp_cust_city
orderbycustomer_id;
begin
formy_curincity_cur loop
setcity_name=my_cur.city_name
wherecustomer_id=my_cur.customer_id;
/** 此处也可以单条/分批次提交,避免锁表情况 **/
-- if mod(city_cur%rowcount,10000)=0 then
-- dbms_output.put_line('----');
-- commit;
-- end if;
endloop;
end;
5) 关联的一个特例以及性能再探讨
在oracle的语句语法中,除了可以表之外,也可以是视图,所以有以下个特例:
update(selecta.city_name,b.city_nameasnew_name
fromcustomers a,
tmp_cust_city b
whereb.customer_id=a.customer_id
)
setcity_name=new_name
这样能避免对B表或其索引的2次扫描,但前提是 A(customer_id) b(customer_id)必需是unique index或primary key。否则报错:
6)oracle另一个常见错误
回到3)情况,由于某些原因,tmp_cust_city customer_id 不是唯一index/primary key
whereb.customer_id=a.customer_id
)
当对于一个给定的a.customer_id
(b.city_nametmp_cust_city bb.customer_id=a.customer_id)
返回多余条的情况,则会报如下错误:
whereb.customer_id=a.customer_idandrownum=1)
如何理解01427错误,在一个很复杂的多表连接的语句,经常因考虑不周,出现这个错误,
仍已上述例子来描述,一个比较简便的方法就是将A表代入 值表达式 中,使用group by和
having字句查看重复的纪录