|
|
Web“文件检索”允许您通过 Intranet 为 HTTP 服务器上或共享文件夹中的 Office 文档(包括 HTML 文档)编制索引。Web“文件检索” 还可用于 Internet 服务器,最终用户可为单词、词组或具体的文档属性(比如“作者”或“标题”)完成索引的全文本搜索。Web“文件检索”使用运行于Windows NT Server 或 Windows NT Workstation 上的“文件检索 NT”服务创建的索引。Windows NT 服务器或工作者必须设置为使用 Web 服务器软件(如 Microsoft Internet Information Server (IIS))的 HTTP 服务器。
用户会在 Web 浏览器(如 Microsoft Internet Explorer)中看到查询和结果页。在结果页上单击所找到文档的名称,即可用相应的应用程序打开文档。 如果您的 Web 浏览器支持“活动文档”,Office 应用程序就会在 Web 浏览器内打开。
通过 Office 应用程序的“文件”菜单中的 “打开”对话框搜索文档限于顺序搜索单个驱动器或文件夹的索引,不过,Web“文件检索”支持搜索涉及多个驱动器和文件夹的索引。Web“文件检索”还允许您创建多个索引。正确管理Web “文件检索”索引的范围是为您的工作组建立最有效的索引的关键。
本文所用示例均基于用 Microsoft IIS 作为您的 Web 服务器软件。如果您要使用其他 Web 服务器软件,请查阅您的 Web 服务器软件的说明,以了解对应的选项。
您还可以从 Web 上下载 Internet Explorer 的当前版本。如果您需要了解详细情况,请单击此处。
然后通过用于“域”的“用户管理”将管理员优先权授予需要使用 Web“文件检索管理”功能的用户。除了将这些用户访问权授予实际的“Web 管理”文件夹外,您必须完成这一点。
最后,您的 Web 服务器一定要设置为使用 Windows NT 安全性,对于 Microsoft Internet IIS,请按下述方法操作:
详细内容,请参阅您的 IIS 2.0 文档中的“安全性”主题。
如果您直接工作于服务器上,您可以用“文件检索”用户界面来创建索引。
注意:如果您希望用户能用 File(就像用 HTTP 一样)访问此 Web 节点上的文档,就应在“浏览”对话框中输入一个“通用命名约定”(UNC)名称。此 UNC 必须用读访问共享,确保“文件检索”有正确的登录权限。
注意: 如果选中“启用词组搜索”复选框,索引会大 4 至 6 倍(大小的增长大约是所汇集文档的 10-30%),而且创建时间也会长 4 至 6 倍。
您可以通过查看“文件检索”的索引记录(或打开 Windows 的 System 文件夹中的“ffastlog.txt”文件)来检查最初创建索引的状态。索引创建之后,您和您的用户都可以将其用于 Web 搜索。
如果您创建多个索引,应给每个索引起不同的名称,而且必须编辑查询页,以指定使用哪个索引。可用“记事本”等文本编辑工具打开 Query.htm,找到
< INPUT TYPE = "hidden" NAME = "Index" VALUE = " ">。
将空字符串改为需要搜索的索引的名称。您可以复制 Query.htm,然后对其进行自定义,以创建任意数量的查询页来搜索不同的索引。或者可以用其他高级 HTML 标签(比如Select标签)来让用户在单独的自定义查询页中选择不同的索引。
如果您直接在服务器上工作,可以用下面介绍的“文件检索”用户界面来添加文件夹。
Web“文件检索”管理工具可对任何连至您的 HTTP 服务器的客户计算机中的索引、查询和结果页进行远程管理。Web“文件检索”管理工具由一套 HTML 文档组成,这些文档可通过 Web 浏览器直接在 HTTP 服务器上处理或者在任何一台客户计算机上进行远程处理。
| 在此域中 | 输入此值 |
| 索引名称 | 为索引键入独有的友好名称,请勿使用标点符号。您会在 Web“文件检索”管理工具的其他区域中用到友好名称。
提示 可用索引的友好名称来描述索引涉及的范围,例如 "销售服务器索引"。 |
| 服务器上索引的位置 | 键入访问您希望创建索引的位置的路径。此路径应该是 Windows NT 服务器上的路径:或者是根目录,或者是原有文件夹。此位置及其所有子文件夹将包括在索引中。
提示 如果您在安装 Office Server Pack时指定了了一个可访问网络文件夹的帐户,可以用共享的UNC 地址(比如 \\MyServer\MyFolder)来输入索引路径,而不用本地路径(比如 N:\MyFolder)。如果 Web“文件检索”设置为返回 File地址,它就会使用此 UNC 路径。 |
| HTTP 地址 | 键入此文件夹的 HTTP 地址(例如,http://MyServer/MyFolder)。您应该确认您的 HTTP 服务器已用您的 Web 服务器软件中的这项映射进行了设置。如果 Web“文件检索”设置为返回 HTTP 地址,它就会使用此 HTTP 地址。有关 HTTP 映射的详细内容,请参阅您的 Web 服务器软件文档。 |
使用“索引”菜单中的“创建索引”命令还可以在您的 HTTP 服务器上用“文件检索”用户界面来创建索引。
| 在此域中 | 输入此值 |
| 索引名称 | 提示 如果要查看索引的当前设置,可单击“显示当前索引信息”。 |
| 要进行的操作 | 单击所需选项。您可以将文件夹添至索引当前涉及的范围,也可以删除文件夹。
请注意:您不能删除包含索引的文件夹。 |
| 文件夹名称 | 键入要添加或删除的文件夹的名称。请使用 UNC 地址,例如 \\MyServer\MyFolder。
您添加的文件夹不能已存在于索引涉及范围中(也就是说,它不能是初始索引位置下的子文件夹),也不能存在于以前添至索引的其他文件夹中。 |
| HTTP 地址 | |
使用“索引”菜单中的“更新索引”命令还可以在您的 HTTP 服务器上用“文件检索”用户界面来更改索引。
使用“索引”菜单中的“删除索引” 命令还可以在您的 HTTP 服务器上用“文件检索”用户界面来删除索引。
Web“文件检索”索引信息页会报告下表中列出的索引特征。
请注意:这与通过在其他 Web“文件检索”管理页上单击“显示当前索引信息” 而获得的信息是相同的。
| 此属性 | 含义为 |
| 友好名称 | |
| 储存索引的文件夹 | 索引的路径。 |
| 其他编入索引的文件夹 | 除索引文件位于的文件夹(及其子文件夹)外添至索引所涉及范围的文件夹。 |
| HTTP 映射 | 编入索引的文件夹的 HTTP 地址。 |
| 关联 | 表示 Web“文件检索”在返回从活动索引中所发现文档的列表时是否使用关联排列。如需了解关联排列的详细内容,请单击此处. |
| 加速属性显示 | 表示 Web“文件检索”在从活动索引中返回所发现文件列表时是否显示文档属性。有关显示属性的详细内容,请单击此处。 |
| 词组搜索 | 表示 Web“文件检索”是否在索引中支持词组搜索。如需了解词组搜索的详细内容,请单击此处。 |
使用“索引”菜单中的“更新索引”命令,您还可以从 HTTP 服务器上的“文件检索”用户界面中得到有关索引的信息。
随 Web“文件检索”在一起的是默认的查询和结果页。
| 此页 | 文件名为 |
| 简单查询页 | Query.htm |
| 高级查询页 | Queryadv.htm |
| 结果页 | Results.htm |
您必须指定某些选项,比如,要搜索的默认索引,最终用户才能使用您的查询页。方法是:编辑查询页的 HTML 代码。
在下面的例句中,将空 VALUE 串替换您在创建索引时赋予它的友好名称。
<!-- Specify, using the "Friendly Name", which index this page should search against -->
<INPUT TYPE = "hidden" NAME = "Index" VALUE = "">
如果您在非默认位置创建自定义结果页,就必须指定其路径。在下面的例句中,将字符串 C:\wwwroot\results.htm 替换为结果页的路径。
<!-- This is the actual path on my server where the results
template can be found. In this case, I have named it results.htm
-->
<INPUT TYPE = "hidden" NAME = "Template"
VALUE = "C:\wwwroot\results.htm">
在下面的例句中,将空 VALUE 字符串替换为到 Web“文件检索”GIF 文件和其他您已添至查询页或结果页的 GIF 文件(比如您所在公司的徽标)的 HTTP 路径。
<!-- This is the virtual path where my GIF files are (iexcel.gif, iword.gif, etc.) -->
<INPUT TYPE = "hidden" NAME = "Gif" VALUE = " ">
您可以指定想用于结果页中文档链接的协议。在下面的例句中,指定 HTTP 或 File。
<!-- Specify whether to return the hyperlinks as FILE or HTTP protocol -->
<INPUT TYPE = "hidden" NAME = "Protocol" VALUE = "HTTP">
<!-- This is how we would like the results sorted: Author SavedDate FileName Size Relevance -->
<INPUT TYPE = "hidden" NAME = "SortBy" VALUE = "Relevance">
在结果页 Results.htm 可以使用之前,您不需要对它进行编辑,不过,如果您想编辑,也可以用与编辑查询页相同的方法来编辑。例如,您可能会希望将本单位的徽标添至结果页,或者选择结果页上将出现的信息内容。
下面是您可以自定义的 Results.htm 中例句的列表。 Web“文件检索”在 Results.htm 中查找这些例句,如果找到,会在每次生成结果页时插入相应信息。
| 例句 | 含义 |
<!--WebFindFastList --> |
表示找到的文档列出的位置。 |
<!--WebFindFastPrev--> |
表示代表以前搜索结果的 URL 的位置(如果有)。 |
<!--WebFindFastNext--> |
表示代表以后搜索结果的 URL 的位置(如果有)。 |
<!--WebFindFastDocListPosition-->
| 插入消息 " 文档:共z,从 x 到 y." |
<!--WebFindFastCreatedDate-->
| 返回索引的创建日期。按默认方式,此例句不出现在 Results.htm 中。 |
<!--WebFindFastModifiedDate-->
| 返回上次更改索引的日期。 |
<!--WebFindFastNumberOfDocs-->
| 返回编入索引的文档总数。按默认方式,此例句不出现在 Results.htm 中。 |
<!--WebFindFastPrevGif-->
| 表示与所附 URL 一起放置 GIF 图像来返回以前的结果(如果有)的位置。默认图像是 Prev.gif,与 Results.htm 位于同一文件夹。 |
<!--WebFindFastNextGif-->
| 表示与所附 URL 一起放置 GIF 图像来返回以后的结果(如果有)的位置。默认图像是 Next.gif,与 Results.htm 位于同一文件夹。 |
<!--WebFindFastButtons-->
| 表示按钮与其代各自的 URL 放置的位置。按默认方式,此例句不出现在 Results.htm 中。 |
<!--WebFindFastQuery--> |
显示用户的查询 |
如果您想将查询页 URL 分发给您的工作组,最容易的办法是将它们作为电子邮件的附件,然后将邮件发给工作组。在邮件中,可指导收件人激活 URL,然后将其添至他们的“个人收藏夹”或书签,或者将其设为他们的默认搜索页。
您可以将下列用于 Microsoft Internet Explorer 3.0的指令复制并粘贴到您的电子邮件中。如果您的工作组使用的是另一种浏览器,可查阅浏览器说明。
您下次单击“搜索”按钮时,Internet Explorer 就会打开 Web“文件检索”搜索页。
Web“文件检索”PageView 是访问有特定常规属性的 Office 文档的超级链接汇集。Office 文档在出现于 Web“文件检索”PageView 之前必须包括在当前索引中。
您可以创建包含超级链接的 Web“文件检索”PageView,通过超级链接,可访问所有符合指定条件的已编入索引的文档。可创建的组合多达三层。例如,创建包含超级链接的 Web“文件检索”页,通过超级链接来访问所有编辑入索引的文档,这些文档是您所在单位的领导(“作者”属性)去年(“上次更改时间”属性)就拓展新业务机会(“主题”属性)撰写的。
在创建了 Web“文件检索”PageView 之后,您必须将它的 URL 或访问它的超级链接分发给您的最终用户,然后他们会有一个单独的位置,按您定义的任何一种组合层次进行浏览。
| 在此域中 | 输入此值 |
| 索引名称 | |
| Web“文件检索”页储存位置 | 键入访问您希望存放所生成页的位置的路径,此路径必须已经存在。您还可以指定开始页的名称,比如 C:\wwroot\start.htm。否则,按默认设置,使用的是 main.htm。您不能使用 UNC 路径。 |
| 组合依据 | 选择您希望据以在最高层组合文档的属性。 |
| 然后依据 | 选择您希望据以在第二和(或)第三层组合文档的属性。 |
| 组 1、2、3 的名称 | 在 Web“文件检索”将要生成的 PageViews 上键入名称,其下方将出现所选“组合依据”内容。 |
| 排序依据 | 键入您希望文档在 Web“文件检索” PageView 上据以排序的属性。 |
| 文件或 HTTP | 选择文件或 HTTP 链接。 |
Web“文件检索”PageView 用这些条件生成一系列链接的 HTML 文档。
如果您想将 PageViews URL 分发给您的工作组,最容易的办法是将它们作为电子邮件的附件,然后将邮件发给工作组。在邮件中,可指导收件人激活 URL,然后将其添至其“个人收藏夹”或书签。
您可以将下列用于 Microsoft Internet Explorer 的指令复制并粘贴到您的电子邮件中。如果您的工作组使用的是另一种浏览器,可查阅浏览器说明。
Web“文件检索”用关联排列来帮助用户从结果页上返回的文档列表中选择最有用的文档。关联排列的意思是:Web“文件检索”将有相同搜索项的文档组合在一起,其中搜索项经常重复的文档会出现在结果页上搜索项出现较少的文档上方。像 cinnamon 等不常见的单词排列得比其他常用单词(比如 spice)要高。
如果您用Web“文件检索”管理工具创建索引,它会自动启用关联排列。如果您用“文件检索” 用户界面创建索引,可指定“文件检索” NT 是否应启用关联排列。
在“文件检索” 用户界面中,您可以选中“索引”菜单中“创建索引”对话框中的“为 Web 搜索包括关联信息”复选框,启用关联排列。这样做虽然会增大索引文件,但同时也会增大 Web“文件检索”返回的文档与用户有关的可能性。这在用户搜索成百上千篇文档时更加有用。Web“文件检索”进行词组搜索时也需要关联排列。
尽管单词可用数量不等的空格或标点符号分隔开,但词组是文档中相邻的单词串。无论从哪种语言看,它们都没有任何语法意义,它们只需要在文档中作为相邻的单词序列出现。
如果您用Web“文件检索”管理工具创建索引,它会自动启用词组搜索,如果您在“文件检索”用户界面中创建索引,可指定“文件检索”NT 是否应该启用词组搜索。
在“文件检索”用户界面中启用词组搜索的方法是:选中“索引”菜单中“创建索引”对话框中的“启用词组搜索”复选框。虽然这样做会增大索引文件,但同时也会让用户使用更准确的搜索条件。
“文件检索”NT 可以在索引文件中储存文档属性,比如“标题”和“作者”。如果将文档属性储存起来,Web“文件检索”和 Microsoft Outlook 就可以为其相关文档将它们显示出来。不过,如果不储存属性:
如果您用Web“文件检索”管理工具创建索引,它会自动启用属性显示,如果您在“文件检索”用户界面中创建索引,可指定“文件检索”NT 是否应该启用属性显示。
在“文件检索”用户界面NT 控制面板中启用词组搜索的方法是:选中“索引”菜单中“创建索引”对话框中的“加速属性显示”复选框。虽然这样做会增大索引文件,但同时也会让 Web“文件检索”创建的所找到文档列表中带有其相关属性。选中“加速属性显示”复选框还可以使 Microsoft Outlook 能在表格视图中显示出文档属性。
如果您选择 HTTP 协议,Web“文件检索”会在用户的计算机中返回要求的 Office 文档的副本,但不允许用户将文档存回从中复制文档的服务器。如果您希望用户能方便地以只读权限访问编入索引的文档的库,但不希望用户编辑通过Web“文件检索”打开的文档,HTTP 协议比较合适。
只有当您在安装 Office Server Pack 时使用了带访问网络文件夹权限的帐户时,才能使用 File 协议。如果您使用 File 协议,当您创建索引并自定义查询页时,在指定服务器上的索引路径必须使用 UNC 路径。
启用 File 协议后,Web“文件检索”会打开一篇用户直接从文档所在服务器上要求的 Office 文档。除非文档受某些其他类型的保护(比如密码保护),否则用户就可以编辑文档并将其存回服务器。如果您希望用户能方便地以读、写权限访问编入索引的文档的库,File 协议比较合适。除其他文档保护方式之外,您还可以使用 File 协议,以便随意打开和编辑未受保护的文档。
如果您在Windows NT Server 上运行 Microsoft IIS,就会出现这个问题。在调用 Dispatch.dll 等 ISAPI 动态链接库时,IIS 会将其装入内存。IIS 在释放动态链接库前,会将其在内存中保留相当长的一段时间。如果您想在 IIS 释放动态链接库前将其删除,就必须先从 IIS Manager 中停止“文件检索”服务。
“文件检索”NT 在编制文档索引时需要通过网络访问。为了获取网络访问权限,“文件检索”NT 服务必须在用户帐户(通常是管理员帐户)下登录。如果Windows NT Server 上管理员的密码发生变更或过期,“文件检索”NT 服务就会终止索引,而且不会在系统下次启动时重新启动。解决此问题的方法是:用新用户帐户或密码登录“文件检索”NT 服务,然后重新启动服务。
如果您已经创建了多个索引,可以创建多份查询页,一个索引一份;或者,可以将 HTML 代码添至一份单独的查询页,以创建用户从中选择要搜索的索引的下拉列表。这样可以使最终用户简化搜索,因为他们以后可将一份单独的查询页用于多个索引。
下列代码示例可创建一个包含若干索引友好名称及出现于下拉列表中的文字的下拉列表框。例如,列表中第一项指以 HR Public 为友好名称的索引。下拉列表框中出现的文字是 "Human Resources Guidelines."。
<!-- Allow the user to specify which index they want
to search -->
<TR>
<TD colspan=2>Search <SELECT NAME="Index">
<OPTION SELECTED VALUE="HR Public">Human
Resources Guidelines
<OPTION VALUE="corporate.com">Our internet
server
<OPTION VALUE="MKT News">Recent press releases
<OPTION VALUE="Specs">Product specifications
</SELECT>
this index.</TD>
Query.htm 和其他搜索页应该在您在安装期间为“Web 搜索”选项选择的文件夹中(重新运行安装程序可改用其他文件夹)。用户从您的 Web 服务器上以读和执行权限都必须能访问此文件夹。
注意 请确认用户可从网络访问您的 Windows NT 服务器。在 Windows NT 4.0 的“开始”菜单或 Windows NT 3.51 的“程序管理器”中单击“管理工具/用户管理器”,然后单击“属性”菜单中的“用户权限” 命令,单击“所有人”并确认选中了“从网络访问这台计算机”选项。
注意 您可以重新运行安装程序来改变用于“Web 搜索”或“Web 管理” 选项的文件夹的位置。先运行安装程序来删除 Web“文件检索”,然后第二次再用新文件夹位置重新安装 Web“文件检索”。
管理 Web 页应该都在您在安装期间为“Web管理”选项指定的文件夹中。请按前面介绍的步骤操作,同时应确认:
如果您仍不能使用管理页来创建索引,则应改用“文件检索”用户界面。
在您提交搜索时,您可能会得到带有下述错误信息的页: “查询或搜索出错:Web“文件检索”无法为您的搜索查找索引...” 出现这种现象的原因是:
如果您在等待了相当长的一段时间后(每 100兆文档至少需要 1 小时)仍然无法执行搜索,请:
访问您包含在索引范围中的网络文件必须有读取权限,而“文件检索”服务可能没有。请查看检索记录:从“控制面板”中打开“文件检索”并单击 “文件”菜单中的“显示检索记录”命令,滚至记录结尾,您会发现“‘文件检索’未能访问文件夹”的信息。如果是这样,您可以重新运行安装程序,或按下述步骤改变“文件检索”服务运行所帐户:
检查“文件检索” indexer log,可能索引已无法再用。如果是这样,可双击“控制面板”中的“文件检索”图标,删除索引,然后重新创建。
如果 Web“文件检索”不返回新文件或返回不复存在的旧文件可能说明索引已不再更新。请按下述步骤检查:
“继续自动更新”选项会在选中后每隔两小时更新一次索引。如果要改变间隔时间,可单击“索引”菜单中的“更新间隔”命令,然后输入新的间隔时间。有关更新索引的详细内容,请查阅“文件检索”的联机帮助。
注意 您还可以单击“索引” 菜单中的“更新索引”命令来立即更新“文件检索”索引。
下面是 Web“文件检索”中最常见的错误信息及对错误信息的解释。
查询或搜索时出错:
Web“文件检索”无法为您的搜索查找索引。可请您的管理员来纠正此错误。
出现此错误信息的两条常见原因是:1. 索引实际不存在。或 2. 在查询页中指定的友好索引无效。
<INPUT TYPE = "hidden" NAME = "Index"
VALUE = "">