任务就是把几十万的数据导入目标数据库中,数据已经提供了,是excel格式
步骤:
第一步把excel文件都转为xsl文件,利用excel工具另存为就可以了,
第二步创建临时表,写sql将xsl文件中数据导入建好的相对应的表中,
需要的文件有三个,一个是sql文件,一个是fmt文件,一个是xsl文件,
sql文件中是建表、建存储过程、执行数据导入的sql,fmt文件中是字段的表示,xsl文件里面则是提供的数据不用管
第三步将做好的几个文件放在一个文件夹在数据库中执行就可以了
怎样写存储过程:
1.如果有则先删除存储过程
2.声明存储过程
3.insert是需要插入正式表的内容
4.查询临时表中的与正式表对应字段的内容,有数值则写值,有字段写字段名,没有则为0
5.写表与表之间的关联
怎样做fmt文件:
fmt文件都有一定的格式,第一行数值只有一个则会表示版本号,
第二行则是表示存储过程中需要的字段个数,
需要注意的是最后一行内容中需要有“\r\n”如若没有则会读取不到这个文件,
也不会报错
执行数据导入的sql示例如下:
use M_OLdisS
go
BULK INSERT dbo.tmp_DL_WORKDAY
FROM
'D:\test\0808\t_workday\T_WORKDAY201306.csv'
WITH(
FORMATFILE = 'D:\test\0808\t_workday\tmp_DL_WORKDAY.fmt'
,FirsTROW = 1
)
go
需要注意导入过程中的问题:
1.BULK INSERT会把NULL当成字符串来读取,所以需要把NULL转换为“ ”
2.BULK INSERT会把Excel中的空单元格当作字符串,所以需要把多余的空单元格删除掉,不管是列还是行
3.经常出现主键冲突,有重复的主键:
重复数据有两种可能
(1)表中已存在的数据跟你待插入的数据有重复的: 删除表中相同的数据 (解决方案)
(2)你待插入的数据中本身有重复的: group by后面的条件不需要的去掉 (解决方案)