SQL Server不可见字符处理

发表于:2016-8-15 10:12

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:一百零七个    来源:51Testing软件测试网采编

  前言
  问题描述:在表列里有肉眼不可见字符,导致一些更新或插入失败。 几年前第一次碰见这种问题是在读取考勤机人员信息时碰见的,折腾了一点时间,现在又碰到了还有点新发现就顺便一起记录下。
  如下图所示 golds字段 看上去5个字符,长度则为44 ,可判断有特殊字符存在此列中。
  基础知识准备
  贴几个常用函数
  1、获取字符的ASCII码 ASCII
  ASCII码是对字符的标准编码。要获取字符的ASCII码就可以通过调用ASCII函数来实现。
  语法结构:
  ASCII(espression)
  这里的expression是一个返回char或varchar数据类型的表达式,ASCII函数仅对表达式最左侧的字符返回ASCII码值。–这个是重点
  返回值:int数据类型。
  示例:
  select ASCII(‘f’) –输出 102
  注意如果是多个字符的字符串,也只是返回第一个字符的ASCII码值。
  2、获取ASCII码对应的字符 Char
  语法结构:
  char(integer_expression)
  返回值类型:char型字符
  示例:
  select char(102) — 输出f
  3、获取字符的unicode编码 Unicode
  unicode函数可以获得字符的unicode编码。
  语法结构:
  unicode(‘ncharacter_expression’)
  这里的ncharacter_expression是nchar或nvarchar类型的表达式。函数仅会返回第一个字符的unicode编码。
  返回值:int类型数据
  示例:
  SELECT Unicode(‘飞’) — 输出 39134
  4、获取unicode编码对应的字符nchar
  nchar能够根据unicode标准的定义,返回具有指定的整数代码的unicode字符。
  语法结构:
  nchar(integer_expression)
  返回值:unicode字符
  示例:
  SELECT nchar(39134) — 输出 飞
  5、获取字符串长度LEN
  len函数用于获取字符串的长度(字符数),但不包括右边的空格。左边的空格和右边的空格计算在内。
  语法结构:
  len( string_expression )
  参数说明:
  string_expression:要计算长度的字符串。
  返回值:expression数据类型为varchar(max)、nvarchar(max)或varbinary(max),则为bigint。否则为int。
  示例:
  select len(‘天下之大,无奇不有’) — 输出 9
  6、REPLACE
  用另一个字符串值替换出现的所有指定字符串值。
  语法如下:
  REPLACE ( string_expression1 , string_expression2 , string_expression3 )
  参数
  string_expression1:要搜索的字符串表达式。string_expression1 可以是字符或二进制数据类型。
  string_expression2:要查找的子字符串。string_expression2 可以是字符或二进制数据类型。
  string_expression3:替换字符串。string_expression3 可以是字符或二进制数据类型。
  SELECT REPLACE(‘abcde’,’abc’,’xxx’) –xxxde
  7 、指定位置搜索字符串中的内容CHARINDEX
  charindex函数用于在指定的字符串中搜索特定的字符串,并可以指定开始搜索的位置,返回第一次找到目标字符串的字符数。
  语法结构:
  charindex ( expression1 , expression2 [ , start_location] )
  参数说明:
  expression1:一个字符串数据类型的表达式,其中包含要查找的字符的序列。
  expression2:一个字符串数据类型的表达式,通常是一个为指定序列搜索的列。
  start_location:开始在expression2中搜索expression1是的字符位置。如果start_location未被指定、是一个负数或零,则将从expression2的开头开始搜索。      start_location可以是bingint类型。
  返回值:如果expression2的数据类型为varchar(max)、nvarchar(max)或varbinary(max),则为bigint,否则为int。
  示例:
  select charindex(‘456′,’123456789’) — 输出 4 从123456789中检索456出现的位置
  select charindex(‘456′,’123456789’,4) — 输出 4
  问题处理
  以前言中描述的例子为例(个人习惯处理方式供参考,如果你的肉眼自带反隐功能可略过下文)
  先查看左右边字符和肉眼所见是否吻合结果如下图
  初步断定不可见字符在右边,因为第三个的查询结果不是0而是空(可能是字符串空吧”)
  接着查看它的ascii编码值
  查看ascii表,ASCII 非打印控制字符:ASCII 表上的数字 0–31 分配给了控制字符,用于控制像打印机等一些外围设备。
  得到结论1:右边第一个不可见字符是个控制字符(对应char(0),为什么是char(0)上面贴的基础知识有讲)
  一般到这里就结束了,查到了是什么字符,然后用replace函数替换成字符串空完事,下面将其处理掉时发现失败
  上面查到了是char(0)在作祟,而且我循环输出golds字段右边的字符发现有39个char(0),方便理解,简化问题,改为下图对比着看
21/212>
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号