20G的CSV文件(1000多万条记录)导入SQL2008的问题

[复制链接]
查看11 | 回复2 | 2021-1-27 05:17:21 | 显示全部楼层 |阅读模式
我是行政单位的,需要用SQL2008进行大数据分析,有个csv文件1000多万条记录,20多G,中文字段有大量空格,用execl的len公式试了,这些有空格的字段最长的到了1000,如图。
如果不清除空格这个20G的文件导入SQL2008,查询的时候又提示存储空间不足(所在分区有500G,剩余110G),如果需要清除空格那么用什么办法清除快些。真是没有办法了,有没有大神可以帮帮忙。



分 -->
回复

使用道具 举报

千问 | 2021-1-27 05:17:21 | 显示全部楼层
ID,记录性质,NO,实际票号,记录状态,序号,从属父号,价格父号,多病人单,记帐单ID,病人ID,主页ID,医嘱序号,门诊标志,记帐费用,姓名,性别,年龄,标识号,床号,病人病区ID,病人病区名称,病人科室ID,病人科室名称,费别,收费类别,收费细目ID,收费细目名称,计算单位,付数,发药窗口,数次,加班标志,附加标志,婴儿费,收入项目ID,收入项目名称,收据费目,标准单价,应收金额,实收金额,划价人,开单部门ID,开单部门名称,开单人,发生时间,登记时间,执行部门ID,执行部门名称,执行人,执行状态,执行时间,结论,操作员编号,操作员姓名,结帐ID,结帐金额,保险大类ID,保险项目否,保险编码,费用类型,统筹金额,是否上传,摘要,是否急诊
-------第一条数据--------
72****73,2,T0640919,,3,4,,,0,,1249694,1,28451007,2,1,张三,女,67岁,201****72,10,67,二内科,67,二内科,普通,5,9561,丹参川芎嗪注射液,支,1,,2,0,0,0,118,西药费,西药费,30.38,60.76,60.76,,67,二内科,龚建荣,2019/**/2512:00:00.000,2019/**/2508:40:28.000,93,住院西药房,,0,,,0054,李四,7432078,60.76,536,0,86903282000136,,0,1,丹参川芎嗪注射液5ml*5支,
-------第二条数据--------
72****74,2,T0640919,,1,2,,,0,,1249694,1,28450697,2,1,张三,女,67岁,201****72,10,67,二内科,67,二内科,普通,5,9800,葡萄糖酸钙,支,1,,2,0,0,0,118,西药费,西药费,13.2,26.4,26.4,,67,二内科,龚建荣,2019/**/2512:00:00.000,2019/**/2508:40:28.000,93,住院西药房,王五,1,2019/**/2510:11:28.000,,0054,李四,7432078,26.4,535,0,86902662001718,,0,1,葡萄糖酸钙10ml:1gX5支,
回复

使用道具 举报

千问 | 2021-1-27 05:17:21 | 显示全部楼层
如果导入成功了,只是查询有问题,可以将有空格的字段做空格消除,使用RTrim()函数即可,例如:
Update表名Set字段=LTrim(字段)//去除左边空格
Update表名Set字段=RTrim(字段)//去除右边空格
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行