文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

数据库中如何处理带有引号文本限定符的CVS

2024-04-02 19:55

关注

这篇文章给大家分享的是有关数据库中如何处理带有引号文本限定符的CVS的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

公司需要导入数据到MSSQLSERVER,但是对方给出的奇葩cvs文件是这样的:

aa,bb,cc,dd,ee
1,"this 
is a",1,"this is a",1
2,"this is
" a",2,"this is a",2

普通的bcp处理会有悲催的错位,而且mssql个坑货也不能像mysql自动区分文本限定符的"
研究了一下,用这个方式处理:

1. 在DB里建立对应的表

此处)折叠或打开


  1. exec xp_cmdshell 'bcp test.dbo.table_1 format nul -t "," -c -x -f C:\test\table_1.xml  -U****  -P****  '

  2. go

3,修改xml,请注意高亮部分。 这个你们用ie来打开的话也可以明确的看到"
此外还有这些特殊字符,大家先备着,万一哪天被不靠谱的猪队友坑了还能用。
单引号是' 
双引号是" 
&是&
>是>
<是&lt;
空格是&nbsp; 等

点击(此处)折叠或打开

  1. <?xml version="1.0"?>

  2. <BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

  3.  <RECORD>

  4.   <FIELD ID="1" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  5.   <FIELD ID="2" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  6.   <FIELD ID="3" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  7.   <FIELD ID="4" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  8.   <FIELD ID="5" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="12"/>

  9.  </RECORD>

  10.  <ROW>

  11.   <COLUMN SOURCE="1" NAME="aa" xsi:type="SQLINT"/>

  12.   <COLUMN SOURCE="2" NAME="bb" xsi:type="SQLVARYCHAR"/>

  13.   <COLUMN SOURCE="3" NAME="cc" xsi:type="SQLINT"/>

  14.   <COLUMN SOURCE="4" NAME="dd" xsi:type="SQLVARYCHAR"/>

  15.   <COLUMN SOURCE="5" NAME="ee" xsi:type="SQLINT"/>

  16.  </ROW>

  17. </BCPFORMAT>

然后再把cvs的首列的标题去掉, 虽说微软说可以通过firstrow来指定第一行,但我之前用了firstrow=2居然是从第二行开始的。
如果不去掉,会报错,由于赶时间,报错测原因和具体原理暂时不考虑再去深入研究了,之后有时间慢慢测。

4. 从cvs里取值,这里我用了openrowset来做验证,其实这个时候也可以直接用bcp加指定 format file来进行导入操作了。

点击(此处)折叠或打开

  1. select * from

  2. openrowset(bulk 'C:\Booker\test.csv', --要读取的文件路径和名称

  3.     formatfile='C:\Booker\Table_1.xml', --格式化文件的路径和名称

  4.      --fieldterminator='","',

  5.     firstrow = 1,--要载入的第一行

  6.     --lastrow  = 1000, --要载入的最后一行,此值必须大于firstrow

  7.     maxerrors = 100, --在加载失败之前加载操作中最大的错误数

  8.     --errorfile ='c:\wc_error1.txt', --存放错误的文件

  9.     rows_per_batch = 10000 --每个批处理导入的行数

  10.     ) as t


你需要的结果有了
数据库中如何处理带有引号文本限定符的CVS
文本格式下就是这么个东东
aa          bb                                                 cc          dd                                                 ee
----------- -------------------------------------------------- ----------- -------------------------------------------------- -----------
1           this, 
is, a                                      1           this is a                                          1
2           this is
" a                                       2           this is a                                          2



感谢各位的阅读!关于“数据库中如何处理带有引号文本限定符的CVS”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯