SQL Server 2000全文检索

上一篇 / 下一篇  2007-06-06 15:07:11 / 个人分类:SQL

SQL Server 2000全文检索
@Z9V7{D;~rD051Testing软件测试网*f9s&Y'm,fS0V5\J
一、如何在SQL中启用全文检索功能51Testing软件测试网vu8o*UE4JPv
1、证全文检索服务是否安装51Testing软件测试网 x4I LGf#G7_x$P
通过储存过程FULLTEXTSERVICEPROPERTY(返回有关全文服务级别属性的信息)来验证搜索服务(全文组件)是否安装。如Select fulltextserviceproperty (‘IsFullTextInstalled’):返回1表示已安装全文组件;返回0表示未安装全文组件;返回Null表示输入无效或发生错误。
b%m%|'G&y*N3h/u,e02、启动全文检索服务(MircoSoft Search)51Testing软件测试网 QT;L2U.e
3、打开数据库全文索引的支持51Testing软件测试网"w OqOU5i$RLd|
为全文索引启用数据库:51Testing软件测试网1K"Z6onn3B,C:wk
Use Northwind
q"d_zG-LP0Exec sp_fulltext_database  ‘enable’51Testing软件测试网2F[P I7az7s
从数据库中删除所有目录:
+Z[-js-Dl0Use Northwind51Testing软件测试网p}?7G|"O
Exec sp_fulltext_database ‘disable’
/CI G+rEj0二、建立全文目录
y*u9}#T Q01、创建全文目录
4Jg%j r|~0Use Northwind51Testing软件测试网)}"\Y`K(np
Exec sp_fulltext_catalog @#ft_ Catalog @#, @#create@#51Testing软件测试网-szh S!X#C
2、重建全文目录51Testing软件测试网4N^2Dk5\\9lVI |.v
Use Northwind51Testing软件测试网8JG Pw n*c
Exec sp_fulltext_catalog @#ft_ Catalog @#, @# rebulid@#51Testing软件测试网,ke&zBMl'v0i8pk
3、启动全文目录的填充51Testing软件测试网 X(e;ylw lo
Use Northwind
OJn Gc9\X:]0Exec sp_fulltext_catalog @#ft_ Catalog @#, @#start_full@#51Testing软件测试网%gO1H:o _7z?
4、停止全文目录的填充51Testing软件测试网KeaPTf C3Ya
Use Northwind
;o f0`M+RQ(j0Exec sp_fulltext_catalog @#ft_ Catalog @#, @#stop@#51Testing软件测试网*X(B Ua e1_ @9n*G
5、删除全文目录51Testing软件测试网 JqHf#p ]
Use Northwind51Testing软件测试网6cU*U9G,k~ |m%J%C!g
  PK_Products51Testing软件测试网 c!I(Tr5H$fynoq
Exec sp_fulltext_catalog @#ft_ Catalog @#, @#drop@#51Testing软件测试网`5~B dx7~9B |
三、为表建立全文索引数据元51Testing软件测试网QLUCvh"Eb4K
1、建立的唯一索引51Testing软件测试网*_ ikK5M'h)q?0`:m
Use Northwind51Testing软件测试网*]9g_T,IS$CM
Exec sp_fulltext_table @#Products@#,@#create@#, @#ft_ Catalog@#, @# PK_Products @#51Testing软件测试网uy J0|XV
2、设置全文索引列名
8kP#j0n'H(u ^DU0Use Northwind51Testing软件测试网k*e{K7o:E0b2y B^Q
Exec sp_fulltext_table @#Products@#,@#create@#, @#ft_ Catalog@#, @# PK_Products @#51Testing软件测试网jiaIXB_
3、设置全文索引列名
*@/P8Q2F3_9N)TN)t0Use Northwind
)S dd7Q3p0Exec sp_fulltext_column @# Products @#, ProductName@#, @#add@#51Testing软件测试网Z&lP;mG] ot
Go
M+T;LV!y C~"G0Exec sp_fulltext_column @# Products @#, QuantityPerUnit@#, @#add@#51Testing软件测试网F3d![.RQ!j6G/d3jz
Go
#SeA3rE^7Pl/h-X-M#\L04、激活全文索引
!O4t7oi [| XLz0Use Northwind51Testing软件测试网q&NO#b0bp7[bA
Exec sp_fulltext_table @#Products@#,@#activate51Testing软件测试网TH,Kks
5、填充全文索引目录
"Iin@ ye$d0Use Northwind51Testing软件测试网#c:}k'Q-a.r
Exec sp_fulltext_catalog @#ft_ Catalog @#, @#start_full@#
'A#Cw2R$l WO.o0四、使用Transact-SQL进行全文检索,我们使用CONTAINS、FREETEXT等谓词
1]8c+}E wl01、检索ProductName中,即包含b又包含c的所有列51Testing软件测试网"dC q*vv3|B7Cu6E
Use Northwind
Jo.^ [Ob0SELECT *
P'H%X&m n0FROM Products
rnAbfxF0WHERE CONTAINS(ProductName, @#"c*" and "b*" @#)
?8G{ a R#d02、检索ProductName中,即包含chai chang tofu之一的所有列
UD~0R~o'N0Use Northwind
4U^:Ue})QaB+p0SELECT *51Testing软件测试网7h#l6sZ|`6n
FROM Products
&Rr-{`VR.F,[0WHERE FREETEXT(ProductName, @#chai chang tofu @#)51Testing软件测试网-fpl(B#q"~;V
五、全文查询有关的系统存储过程
,W ] PU#?;]_sm0(1)启动数据库的全文处理功能(sp_fulltext_datebase);
^r^#zT-PAqz:L*|k0(2)建立全文目录(sp_fulltext_catalog);51Testing软件测试网6h#V2E?8V2eL _
(3)在全文目录中注册需要全文索引的表(sp_fulltext_table);51Testing软件测试网le%@|HZ
(4)指出表中需要全文检索的列名(sp_fulltext_column)51Testing软件测试网.n6A4a:B6j4cB
(5)为表创建全文索引(sp_fulltext_table);
8@5V!s}-l _ li0(6)填充全文索引(sp_fulltext_catalog)。51Testing软件测试网nO q2aSS4l aK@

xczId v0全文查询支持
zd;[,H3[H0Microsoft® SQL Server™ 2000 在接收带全文构造的 Transact-SQL 语句时,使用全文提供程序从 Microsoft 搜索服务检索所需信息。全文构造是 CONTAINS 或 FREETEXT 谓词,或者是 CONTAINSTABLE 或 FREETEXTTABLE 行集函数。如果不知道包含搜索条件的列,全文构造可以在全文索引中引用多列。该进程的流程如下图所示。51Testing软件测试网.f(]}4VF!j:xc!r
51Testing软件测试网/N Q-x1C!s-S9[
这一进程涉及的步骤包括:
(Eg7oR{$gNC0应用程序给 SQL Server 实例发送带全文构造的 Transact-SQL 语句。
'K~E3hA$E7u$OO9u8d&i0SQL Server 关系引擎通过查询系统表验证全文构造,确定全文索引是否覆盖列引用。关系引擎将每个 SQL 语句简化为一系列行集操作,并使用 OLE DB 将这些操作传递给基础组件,通常是存储引擎。关系引擎通过全文提供程序而不是存储引擎,将任何全文构造转换成对行集的请求。请求的行集是满足搜索条件和等级的键集,而这个等级表示每个键的数据满足搜索条件的程度。向全文提供程序发送的行集请求命令包括全文检索条件。
'PD'@ r l%m'A0全文提供程序验证请求并将搜索条件更改为由Microsoft 搜索服务的查询支持组件使用的形式。将请求发送到搜索服务。
_-W\*X-r'ClZ/O0查询支持组件使用搜索引擎组件从全文索引析取所请求的数据。然后以行集的形式将这些数据传递回全文提供程序。51Testing软件测试网w0c$q {.a*RQg
全文提供程序将这个行集返回给关系引擎。
q6FzA7N5f*gw0关系引擎将它从存储引擎和全文提供程序收到的所有行集进行组合,以生成发送回客户端的最终结果集。51Testing软件测试网,_ V }QbNj
 
)t.M4u:I[%_O0全文目录和索引51Testing软件测试网oFZu5g(D v*R
Microsoft® SQL Server™ 2000 全文索引为在字符串数据中进行复杂的词搜索提供有效支持。全文索引存储关于重要词和这些词在特定列中的位置的信息。全文查询利用这些信息,可快速搜索包含具体某个词或一组词的行。
]A4ZJ5?9^|g5Q&`4x0全文索引包含在全文目录中。每个数据库可以包含一个或多个全文目录。一个目录不能属于多个数据库,而每个目录可以包含一个或多个表的全文索引。一个表只能有一个全文索引,因此每个有全文索引的表只属于一个全文目录。51Testing软件测试网yTR`4BxJ
全文目录和索引不存储在它们所属的数据库中。目录和索引由 Microsoft 搜索服务分开管理。51Testing软件测试网@8\5|XxX
全文索引必须在基表上定义,而不能在视图、系统表或临时表上定义。 全文索引的定义包括:51Testing软件测试网g`H#n)hh.KsZ
能唯一标识表中各行的列(主键或候选键),而且不允许 NULL 值。51Testing软件测试网^I;Tn1S-@
索引所覆盖的一个或多个字符串列。
W'{ M%t"V ?sk:}+g0全文索引由键值填充。每个键的项提供与该键相关联的重要词(干扰词或终止词除外)、它们所在的列和它们在列中的位置等有关信息。51Testing软件测试网e%^a0a2?0sZ1O
格式化文本字符串(如 Microsoft® Word™ 文档文件或 HTML 文件)不能存储在字符串或 Unicode 列中,因为这些文件中的许多字节包含不构成有效字符的数据结构。数据库应用程序可能仍需要访问这些数据并对其应用全文检索。因为 image 列并不要求每一字节都构成一个有效字符,所以许多站点将这类数据存储在 image 列中。SQL Server 2000 引入了对存储在 image 列中的这些类型的数据执行全文检索的能力。SQL Server 2000 提供筛选,可从 Microsoft Office™ 文件(.doc、.xls 和 .ppt 文件)、文本文件(.txt 文件)及 HTML 文件(.htm 文件)中析取文本化数据。设计表时除包括保存数据的 image 列外,还需包括绑定列来保存存储在 image 列中的数据格式的文件扩展名。可以创建引用 image 列和绑定列的全文索引,以便在存储于 image 列中的文本化信息上启用全文检索。SQL Server 2000 全文检索引擎使用绑定列中的文件扩展名信息,选择从列中析取文本化数据的合适的筛选。
8b7JHg(}"B0T-~uB0全文索引是用于执行两个 Transact-SQL 谓词的组件,以便根据全文检索条件对行进行测试51Testing软件测试网l3~F'O r b
CONTAINS51Testing软件测试网9[:@ xYX2Fw b6dS
FREETEXT51Testing软件测试网.q i^"E6}*I}
Transact-SQL 还包含两个返回符合全文检索条件的行集的函数:
&N@F"\QtE N{0CONTAINSTABLE51Testing软件测试网yl l%A-j o.`,Qj
FREETEXTTABLE
B;Ay(pS0A:M(UX0SQL Server 在内部将搜索条件发送给 Microsoft 搜索服务。Microsoft 搜索服务查找所有符合全文检索条件的键并将它们返回给 SQL Server。SQL Server 随后使用键的列表来确定表中要处理的行。51Testing软件测试网M\n3AHEcZ
全文索引
:E:^s\.}JB5V0对 Microsoft® SQL Server™ 2000 数据的全文支持涉及两个功能:对字符数据发出查询的能力和创建及维护基础索引以简化这些查询的能力。51Testing软件测试网V8}[Pg&L O
全文索引在许多地方与普通的 SQL 索引不同。51Testing软件测试网'r4{ F,i/U IQI

1KV`F+M4D0普通 SQL 索引
8C ~j.F S-^G m0
|{7G(h.[k?[0全文索引51Testing软件测试网9Tw,C#y7Q{
51Testing软件测试网@~XS9Z8d
存储时受定义它们所在的数据库的控制。51Testing软件测试网e VE6q!D4?m^zi
51Testing软件测试网u+G?Q^-}-|/x
存储在文件系统中,但通过数据库管理。
z]fk1N,ll*v4]"H@Z7D0
{Yax_&m7v,az0每个表允许有若干个普通索引。51Testing软件测试网)I| I3o"F#b
51Testing软件测试网zS/oC-[+x
每个表只允许有一个全文索引。51Testing软件测试网1j)LW!E \2t
51Testing软件测试网:pmkQX b(P
当对作为其基础的数据进行插入、更新或删除时,它们自动更新。
bGQW Y+k9{q.EK0
(m*PQ(oo1S"y0将数据添加到全文索引称为填充,全文索引可通过调度或特定请求来请求,也可以在添加新数据时自动发生。
5v r"o W(t r051Testing软件测试网z AZ5X ck;^e%n
不分组。
bhfI VoVb(h051Testing软件测试网~7~ m$erh3^.[#p
在同一个数据库内分组为一个或多个全文目录。
s,sB[w T1U M}$t0
x}'L Yl0使用 SQL Server 企业管理器、向导或 Transact-SQL 语句创建和除去。51Testing软件测试网+e c.B W&rf

Nm~'E0r ^#J0使用 SQL Server 企业管理器、向导或存储过程创建、管理和除去。51Testing软件测试网9sMQDM{8Pv

:W6JNZ4Xi!y0这些差异使大量管理任务变得不可缺少。全文管理是在几个层次上实施的:
_QZ(e#Z'@I0服务器51Testing软件测试网IXT'i`C
可以对服务器范围的某些属性(如 resource_usage)加以设置,以便增加或减少全文服务所使用的系统资源数量。
FM)w&?,m7LH#x0 51Testing软件测试网z~O+ma`w
说明  全文引擎作为名为 Microsoft 搜索的服务在 Microsoft Windows NT® Server 和 Microsoft Windows® 2000 Server 上运行。对于 Microsoft SQL Server 个人版,Microsoft 搜索服务不可用。尽管这意味着 Microsoft 搜索服务既未安装在 Microsoft Windows 95/98 上,也未安装在 Windows NT 工作站或 Windows 2000 Professional 客户端上,但这些客户端在连接到 SQL Server 标准版安装或企业版实例时可以使用这项服务。51Testing软件测试网ztnQ flw:{ Z@
数据库51Testing软件测试网"m.B.b\n*s3@y
必须启用数据库才能使用全文服务。可以在已启用的数据库中创建和除去一个或多个全文目录的元数据。
;q8^-}o9?-dj(y0全文目录
Y)nf/Bf0全文目录包含数据库中的全文索引。每个目录可以用于数据库内的一个或多个表的索引需求。该目录中的索引是使用这里介绍的管理功能来填充的。(全文目录必须驻留在与 SQL Server 实例相关联的本地硬盘驱动器上。不支持可移动的驱动器、软盘和网络驱动器)。在每个服务器上最多可创建 256 个全文目录。
/{YvZP0 
4c]ys/xA)x"o:Y0说明  Windows NT 故障转移群集环境完全支持全文索引。有关更多信息,请参见在故障转移群集中运行全文查询。
ds5su!~S#e}"N&Qt0
Vp FcxQ0首先,必须为全文支持启用表。然后,为与该表相关联的全文索引创建元数据(如表名及其全文目录)。表启用后,可以用为全文支持而启用的列中的数据填充它。如果表的全文定义被更改(例如,添加一个也将为全文检索而索引的新列),则必须重新填充相关的全文目录以使全文索引与新的全文定义同步。51Testing软件测试网R&Wf8H{Q}
51Testing软件测试网u*b+P2s R9{/z5Y
可以从非活动的注册表中添加或除去支持全文查询的列。51Testing软件测试网C L]tIE{
在所有这些级别上,可使用工具检索元数据和状态信息。51Testing软件测试网'TKva$sy!h_
和常规 SQL 索引一样,当在相关表中修改数据时,可自动更新全文索引。或者,也可以适当的间隔手工重新填充全文索引。这种重写可能既耗时又大量占用资源,因此,在数据库活动较少时,这通常是在后台运行的异步进程。
`#_j&r1h5J [0应将具有相同更新特性的表(如更改少的与更改多的,或在一天的特定时段内频繁更改的表)组合在一起,并分配给相同的全文目录。通过以此方法设置全文目录填充调度,使得全文索引和表保持同步,且在数据库活动较多时不对数据库服务器的资源使用产生负面影响。51Testing软件测试网jNV`(|!Qbd
为全文目录中的表安排全文索引的位置是非常重要的。在为全文目录指定表时,应该注意下列基本原则:51Testing软件测试网$saE%PyWxm
始终选择可用于全文唯一键的最小唯一索引。(4 个字节且基于整数的索引是最佳的。)这将显著减少文件系统中 Microsoft 搜索服务所需要的资源。如果主键很大(超过 100 字节),可以考虑选择表中其它唯一索引(或创建另一个唯一索引)作为全文唯一键。否则,如果全文唯一键的大小达到允许的上限(450 字节),全文填充将无法继续进行。
8_o4R2aW%y$z0如果进行索引的表有成千上万行,请将该表指定给其自己的全文目录。
:ys o3{"R#~V5k0应该考虑对其进行全文索引的表中发生的更改数以及表的行数。如果要更改的总行数,加上上次全文填充期间表中出现的行数达到成千上万行,请将该表指定给其自己的全文目录。
b"VW6Lk BH0

TAG: SQL

 

评分:0

我来说两句

Open Toolbar