CString 使用指南
上一篇 / 下一篇 2007-01-14 20:56:18 / 个人分类:C/C++
不错的文章,转至此:http://wdswei.spaces.live.com/
51Testing软件测试网P;j6o b7y51Testing软件测试网!ll3_"]{6SnAH]b
#M1iqV,Y:X2m kU U0通过阅读本文你可以学习如何有效地使用 CString。
sdX}w(WQ0
*Fz/cQ(E-{c2d ff2S0 CString 是一种很有用的数据类型。它们很大程度上简化了MFC中的许多操作,使得MFC在做字符串操作的时候方便了很多。不管怎样,使用CString有很多特殊的技巧,特别是对于纯C背景下走出来的程序员来说有点难以学习。这篇文章就来讨论这些技巧。51Testing软件测试网%Y&h'FG&kGO3o%c
使用CString可以让你对字符串的操作更加直截了当。这篇文章不是CString的完全手册,但囊括了大部分常见基本问题。51Testing软件测试网p5}Rc
L%B
51Testing软件测试网jt)jK$p@#X8A!H
这篇文章包括以下内容:
CString 对象的连接51Testing软件测试网2A/il;r:d#E%T]0u0L
- 格式化字符串(包括 int 型转化为 CString )
- CString 型转化成 int 型
- CString 型和 char* 类型的相互转化51Testing软件测试网(hu3eh4U y
- char* 转化成 CString
- CString 转化成 char* 之一:使用LPCTSTR强制转化
- CString 转化成 char* 之二:使用CString对象的GetBuffer方法
- CString 转化成 char* 之三: 和控件的接口
- CString 型转化成 BSTR 型
- BSTR 型转化成 CString 型
- VARIANT 型转化成 CString 型
- 载入字符串表资源
- CString 和临时对象;
- CString 的效率;
- 总结
下面我分别讨论。
ay
lm"[5^"\t}~ Q0
,p)x1N!p,Bj01、CString 对象的连接51Testing软件测试网zr;ncQ J
:b%x?(O@`;Rw0 能体现出 CString 类型方便性特点的一个方面就字符串的连接,使用 CString 类型,你能很方便地连接两个字符串,正如下面的例子:51Testing软件测试网M
xeFOxG+D yH
CString gray("Gray"); CString cat("Cat"); CString graycat = gray + cat;
)m R c,MdP5z0要比用下面的方法好得多:
1kJ)~2N)e:~8{G2h0char gray[] = "Gray"; char cat[] = "Cat"; char * graycat = malloc(strlen(gray) + strlen(cat) + 1); strcpy(graycat, gray); strcat(graycat, cat);
+U2`]3rZ02、格式化字符串51Testing软件测试网$[y?ys|@*\c
51Testing软件测试网xfhg?brlU8|8X
与其用 sprintf() 函数或 wsprintf() 函数来格式化一个字符串,还不如用 CString 对象的Format()方法:
CString s; s.Format(_T("The total is %d"), total);
KrbHP(y)M;S4^6X0 用这种方法的好处是你不用担心用来存放格式化后数据的缓冲区是否足够大,这些工作由CString类替你完成。51Testing软件测试网AuAd
d&m9y!u_7k
格式化是一种把其它不是字符串类型的数据转化为CString类型的最常用技巧,比如,把一个整数转化成CString类型,可用如下方法:
CString s; s.Format(_T("%d"), total);51Testing软件测试网z{"grN0~$v
我总是对我的字符串使用_T()宏,这是为了让我的代码至少有Unicode的意识,当然,关于Unicode的话题不在这篇文章的讨论范围。_T()宏在8位字符环境下是如下定义的:
*d _/Qiq$_0#define _T(x) x // 非Unicode版本(non-Unicode version)51Testing软件测试网ie_j#g ^(W
而在Unicode环境下是如下定义的:51Testing软件测试网v9OQ;A,Yi
#define _T(x) L##x // Unicode版本(Unicode version)51Testing软件测试网anS5y&r}
所以在Unicode环境下,它的效果就相当于:
_9WK~D~2O0s.Format(L"%d", total);
P Tqg[0 如果你认为你的程序可能在Unicode的环境下运行,那么开始在意用 Unicode 编码。比如说,不要用 sizeof() 操作符来获得字符串的长度,因为在Unicode环境下就会有2倍的误差。我们可以用一些方法来隐藏Unicode的一些细节,比如在我需要获得字符长度的时候,我会用一个叫做DIM的宏,这个宏是在我的dim.h文件中定义的,我会在我写的所有程序中都包含这个文件:
dma vJ8e0#define DIM(x) ( sizeof((x)) / sizeof((x)[0]) )
NPC7b1P*m!kQ4g-~0 这个宏不仅可以用来解决Unicode的字符串长度的问题,也可以用在编译时定义的表格上,它可以获得表格的项数,如下:
p.a@T'E,r-Z0
class Whatever { ... }; Whatever data[] = { { ... }, ... { ... }, }; for(int i = 0; i < DIM(data); i++) // 扫描表格寻找匹配项。51Testing软件测试网;i-dG_/A@On,WHzJ
这里要提醒你的就是一定要注意那些在参数中需要真实字节数的API函数调用,如果你传递字符个数给它,它将不能正常工作。如下:51Testing软件测试网-?*}+Kl5P'Nb'T
TCHAR data[20]; lstrcpyn(data, longstring, sizeof(data) - 1); // WRONG! lstrcpyn(data, longstring, DIM(data) - 1); // RIGHT WriteFile(f, data, DIM(data), &bytesWritten, NULL); // WRONG! WriteFile(f, data, sizeof(data), &bytesWritten, NULL); // RIGHT
2G+r;[2g1p3w-\S0造成以上原因是因为lstrcpyn需要一个字符个数作为参数,但是WriteFile却需要字节数作为参数。51Testing软件测试网[^%n#wg'Q
同样需要注意的是有时候需要写出数据的所有内容。如果你仅仅只想写出数据的真实长度,你可能会认为你应该这样做:51Testing软件测试网#r*K^}PKt-ej
WriteFile(f, data, lstrlen(data), &bytesWritten, NULL); // WRONG
bk2IccD!]9T%]Z3Y0但是在Unicode环境下,它不会正常工作。正确的做法应该是这样:51Testing软件测试网FGknL,N9k/E,M
WriteFile(f, data, lstrlen(data) * sizeof(TCHAR), &bytesWritten, NULL); // RIGHT51Testing软件测试网%`%w F'c `9S+a
因为WriteFile需要的是一个以字节为单位的长度。(可能有些人会想“在非Unicode的环境下运行这行代码,就意味着总是在做一个多余的乘1操作,这样不会降低程序的效率吗?”这种想法是多余的,你必须要了解编译器实际上做了什么,没有哪一个C或C++编译器会把这种无聊的乘1操作留在代码中。在Unicode环境下运行的时候,你也不必担心那个乘2操作会降低程序的效率,记住,这只是一个左移一位的操作而已,编译器也很乐意为你做这种替换。)
0v+|;v4O5R6~A w:`+t0 使用_T宏并不是意味着你已经创建了一个Unicode的程序,你只是创建了一个有Unicode意识的程序而已。如果你在默认的8-bit模式下编译你的程序的话,得到的将是一个普通的8-bit的应用程序(这里的8-bit指的只是8位的字符编码,并不是指8位的计算机系统);当你在Unicode环境下编译你的程序时,你才会得到一个Unicode的程序。记住,CString 在 Unicode 环境下,里面包含的可都是16位的字符哦。51Testing软件测试网%QJ#XzW
Z"|.O
H(z!MLz$k03、CString 型转化成 int 型51Testing软件测试网|pJ/Xre9q
.]9y\;{c0 把 CString 类型的数据转化成整数类型最简单的方法就是使用标准的字符串到整数转换例程。
%j'@ C|-l
S-`'O,D%g,E0 虽然通常你怀疑使用_atoi()函数是一个好的选择,它也很少会是一个正确的选择。如果你准备使用 Unicode 字符,你应该用_ttoi(),它在 ANSI 编码系统中被编译成_atoi(),而在 Unicode 编码系统中编译成_wtoi()。你也可以考虑使用_tcstoul()或者_tcstol(),它们都能把字符串转化成任意进制的长整数(如二进制、八进制、十进制或十六进制),不同点在于前者转化后的数据是无符号的(unsigned),而后者相反。看下面的例子:
CString hex = _T("FAB"); CString decimal = _T("4011"); ASSERT(_tcstoul(hex, 0, 16) == _ttoi(decimal));51Testing软件测试网RJ K.}V#P
4、CString 型和 char* 类型的相互转化
{2C"U0~/R(P7v"J051Testing软件测试网rXM0h+A8UP
这是初学者使用 CString 时最常见的问题。有了 C++ 的帮助,很多问题你不需要深入的去考虑它,直接拿来用就行了,但是如果你不能深入了解它的运行机制,又会有很多问题让你迷惑,特别是有些看起来没有问题的代码,却偏偏不能正常工作。
PQ'}-bT o0比如,你会奇怪为什么不能写向下面这样的代码呢:51Testing软件测试网w9w!a.x;B2l*B:m#z4r
CString graycat = "Gray" + "Cat";
'hGqs]O-H'l0或者这样:
;?5zky,v)hRD3v0CString graycat("Gray" + "Cat");51Testing软件测试网DSqe9J#w'{h-`:y
事实上,编译器将抱怨上面的这些尝试。为什么呢?因为针对CString 和 LPCTSTR数据类型的各种各样的组合,“ +” 运算符 被定义成一个重载操作符。而不是两个 LPCTSTR 数据类型,它是底层数据类型。你不能对基本数据(如 int、char 或者 char*)类型重载 C++ 的运算符。你可以象下面这样做:51Testing软件测试网o4Kkm K
CString graycat = CString("Gray") + CString("Cat");
e~6M+d7J`_ s0或者这样:51Testing软件测试网l/ez i mHf?'G*i
CString graycat = CString("Gray") + "Cat";51Testing软件测试网0@.PG.R!MX:~
研究一番就会发现:“ +”总是使用在至少有一个 CString 对象和一个 LPCSTR 的场合。51Testing软件测试网y2C,Wvmp
@1Mc-_:W8hD0注意,编写有 Unicode 意识的代码总是一件好事,比如:
CString graycat = CString(_T("Gray")) + _T("Cat");51Testing软件测试网 BF-SnWr4r
这将使得你的代码可以直接移植。51Testing软件测试网/X2W[3Y4N7o
:[wcfG5wf0char* 转化为 CString51Testing软件测试网O)DR"y*F'h3Ng:{
51Testing软件测试网3[-N/lP@v
tHQ
现在你有一个 char* 类型的数据,或者说一个字符串。怎么样创建 CString 对象呢?这里有一些例子:
char * p = "This is a test";
0Rs_B4_}G$y0或者象下面这样更具有 Unicode 意识:
}q3H f:w(gDVS7\0TCHAR * p = _T("This is a test")
Y0j2}w0L)c7~4x3t0或
i?i8X w0LPTSTR p = _T("This is a test");51Testing软件测试网'UW1X7g/_
你可以使用下面任意一种写法:51Testing软件测试网JO(e&`{(Fu3?*ei
CString s = "This is a test"; // 8-bit only CString s = _T("This is a test"); // Unicode-aware CString s("This is a test"); // 8-bit only CString s(_T("This is a test")); // Unicode-aware CString s = p; CString s(p);51Testing软件测试网Ir ALG#KDRkm3q jC
用这些方法可以轻松将常量字符串或指针转换成 CString。需要注意的是,字符的赋值总是被拷贝到 CString 对象中去的,所以你可以象下面这样操作:51Testing软件测试网am#p1JCPF|
TCHAR * p = _T("Gray"); CString s(p); p = _T("Cat"); s += p;
4]k~$X^#YG0结果字符串肯定是“GrayCat”。51Testing软件测试网O6s2ugGQ#B
f"RU%G7PY0CString 类还有几个其它的构造函数,但是这里我们不考虑它,如果你有兴趣可以自己查看相关文档。51Testing软件测试网.i$n(c5q'c'`0M
a
Y6['Y!l\r5Gk n
|S0事实上,CString 类的构造函数比我展示的要复杂,比如:
CString s = "This is a test";51Testing软件测试网O)X-cBF8}Ew
这是很草率的编码,但是实际上它在 Unicode 环境下能编译通过。它在运行时调用构造函数的 MultiByteToWideChar 操作将 8 位字符串转换成 16 位字符串。不管怎样,如果 char * 指针是网络上传输的 8 位数据,这种转换是很有用的。51Testing软件测试网l2Ye [i
_vE{*\3V3^0CString 转化成 char* 之一:强制类型转换为 LPCTSTR;
IP9f1SS#D4_0
f:x
Z,F{0 这是一种略微硬性的转换,有关“正确”的做法,人们在认识上还存在许多混乱,正确的使用方法有很多,但错误的使用方法可能与正确的使用方法一样多。51Testing软件测试网J:a]p8EQv
我们首先要了解 CString 是一种很特殊的 C++ 对象,它里面包含了三个值:一个指向某个数据缓冲区的指针、一个是该缓冲中有效的字符记数以及一个缓冲区长度。 有效字符数的大小可以是从0到该缓冲最大长度值减1之间的任何数(因为字符串结尾有一个NULL字符)。字符记数和缓冲区长度被巧妙隐藏。51Testing软件测试网G+^5r.i#rv(hF
除非你做一些特殊的操作,否则你不可能知道给CString对象分配的缓冲区的长度。这样,即使你获得了该0缓冲的地址,你也无法更改其中的内容,不能截短字符串,也 绝对没有办法加长它的内容,否则第一时间就会看到溢出。51Testing软件测试网5Qv2Qp(Db/vi,ID
LPCTSTR 操作符(或者更明确地说就是 TCHAR * 操作符)在 CString 类中被重载了,该操作符的定义是返回缓冲区的地址,因此,如果你需要一个指向 CString 的 字符串指针的话,可以这样做:51Testing软件测试网O;s1y[o
^
51Testing软件测试网EM,oFO
CString s("GrayCat"); LPCTSTR p = s;51Testing软件测试网B,Y P#f7M.ep
它可以正确地运行。这是由C语言的强制类型转化规则实现的。当需要强制类型转化时,C++规测容许这种选择。比如,你可以将(浮点数)定义为将某个复数 (有一对浮点数)进行强制类型转换后只返回该复数的第一个浮点数(也就是其实部)。可以象下面这样:
-^|Bl(r!A`0Complex c(1.2f, 4.8f); float realpart = c;
!{:ioV.@/s7`'xiM0如果(float)操作符定义正确的话,那么实部的的值应该是1.2。51Testing软件测试网V4R\%@D
这种强制转化适合所有这种情况,例如,任何带有 LPCTSTR 类型参数的函数都会强制执行这种转换。 于是,你可能有这样一个函数(也许在某个你买来的DLL中):
BOOL DoSomethingCool(LPCTSTR s);51Testing软件测试网9sw!VD}
你象下面这样调用它:51Testing软件测试网$UO)],_2j8Uv
CString file("c:\\myfiles\\coolstuff") BOOL result = DoSomethingCool(file);
7WMc6U/m.\2Y&b2DzV0 它能正确运行。因为 DoSomethingCool 函数已经说明了需要一个 LPCTSTR 类型的参数,因此 LPCTSTR 被应用于该参数,在 MFC 中就是返回的串地址。51Testing软件测试网lu.e#kH8~
}qNN
9O R| D~zJc0如果你要格式化字符串怎么办呢?51Testing软件测试网%y%j:gwi2Q2@
CString graycat("GrayCat"); CString s; s.Format("Mew! I love %s", graycat);
2e2]*z'Xv(qg
m6L0 注意由于在可变参数列表中的值(在函数说明中是以“...”表示的)并没有隐含一个强制类型转换操作符。你会得到什么结果呢?
3\ @4lb|D0 一个令人惊讶的结果,我们得到的实际结果串是:
"Mew! I love GrayCat"。
%] uk;d%`#{V0 因为 MFC 的设计者们在设计 CString 数据类型时非常小心, CString 类型表达式求值后指向了字符串,所以这里看不到任何象 Format 或 sprintf 中的强制类型转换,你仍然可以得到正确的行为。描述 CString 的附加数据实际上在 CString 名义地址之后。
lw2i5_"F!C[9I!p0 有一件事情你是不能做的,那就是修改字符串。比如,你可能会尝试用“,”代替“.”(不要做这样的,如果你在乎国际化问题,你应该使用十进制转换的 National Language Support 特性,),下面是个简单的例子:51Testing软件测试网"^:u:YW"Rb1g6J
CString v("1.00"); // 货币金额,两位小数 LPCTSTR p = v; p[lstrlen(p) - 3] = '','';
L e;Wz,D0 这时编译器会报错,因为你赋值了一个常量串。如果你做如下尝试,编译器也会错:
.M3Vp;Pt5v$r/m0strcat(p, "each");
GJ-Ae.cy0 因为 strcat 的第一个参数应该是 LPTSTR 类型的数据,而你却给了一个 LPCTSTR。51Testing软件测试网 J(t7`$bF+U:Pp
IkBKwR`ae0 不要试图钻这个错误消息的牛角尖,这只会使你自己陷入麻烦!
9}!r#P%gB3ao051Testing软件测试网+i1stUx"Ej6M
原因是缓冲有一个计数,它是不可存取的(它位于 CString 地址之下的一个隐藏区域),如果你改变这个串,缓冲中的字符计数不会反映所做的修改。此外,如果字符串长度恰好是该字符串物理限制的长度(梢后还会讲到这个问题),那么扩展该字符串将改写缓冲以外的任何数据,那是你无权进行写操作的内存(不对吗?),你会毁换坏不属于你的内存。这是应用程序真正的死亡处方。51Testing软件测试网'U0xM3T|1_A
CString转化成char* 之二:使用 CString 对象的 GetBuffer 方法;
"VIc\8n051Testing软件测试网HmrF[;|.x
如果你需要修改 CString 中的内容,它有一个特殊的方法可以使用,那就是 GetBuffer,它的作用是返回一个可写的缓冲指针。 如果你只是打算修改字符或者截短字符串,你完全可以这样做:51Testing软件测试网.O!OS%v&m
CString s(_T("File.ext")); LPTSTR p = s.GetBuffer(); LPTSTR dot = strchr(p, ''.''); // OK, should have used s.Find... if(p != NULL) *p = _T(''\0''); s.ReleaseBuffer();
h4_S@ja/]0e0 这是 GetBuffer 的第一种用法,也是最简单的一种,不用给它传递参数,它使用默认值 0,意思是:“给我这个字符串的指针,我保证不加长它”。当你调用 ReleaseBuffer 时,字符串的实际长度会被重新计算,然后存入 CString 对象中。51Testing软件测试网;H/oP:zt @*d
必须强调一点,在 GetBuffer 和 ReleaseBuffer 之间这个范围,一定不能使用你要操作的这个缓冲的 CString 对象的任何方法。因为 ReleaseBuffer 被调用之前,该 CString 对象的完整性得不到保障。研究以下代码: