格微情报
信息采集工具基于知识管理思想和相关技术架构搭建,采用知识
挖掘技术作为核心支撑,结合企业
研究所的情报管理和应用需求现状及特点,基于互联
网上国内外同行业公开的网站实现信息的辅助跟踪、采集和管理等功能。它整合企业情报渠道,改进了信息收集效率,提高了对
重要信息采集处理的及时性和有效性,实现了对
互联网多种格式化信息源的采集、分类和存储,建立共享性好、统一管理
的情报辅助处理工具。
根据情报
采集的目标和形式不同,分为“主题跟踪”和“定点跟踪”两种形式。具体应用形式如下:
|
|
一、主题跟踪采集工具
|
利用主题
跟踪采集工具可以定制检索引擎,通过对情
报采集的相关主题内容和检索条件的设置实现对相关范围的网站提供的与跟踪主题相关的内容进行自动搜索和下载。工具辅助
情报人员完成一站式搜索和管理,并对检索
结果做归纳和整理,辅助情报
人员对检索结果做快速筛选和处理。
|
序号
|
模块
|
功能项
|
主要功能及特色
|
1
|
主题管理
|
主题目录管理
|
以树形结
构管理主题分类,包括:新建主题、重命名、删除。
|
2
|
主题设置管理
|
对具体的
某项采集主题内容进行管理,包括:设置跟踪条件、启动跟踪、重命名,删除等。
|
3
|
搜索管理
|
搜索条件管理
|
根据不同
搜索引擎的检索形式和条件进行搜索条件配置管理。
|
4
|
搜索结果管理
|
根据设置的搜索条件,搜索引擎
自动跟踪网站产生预搜索结果的摘要和标题信息,形成搜索结果列表。可以对搜
索结果列表进行下载、删除等管理。结果列表
信息中包括条目的权值、状态、标题、文件类型、更新时间、网页类型等。
|
5
|
文件预览
|
对搜索结
果列表中的内容可以进行原网页或文档信息预览。便于用户
确定网页内容是否符合下载的需要。可以实现对网页、word、pdf、ppt等多种格
式文档的下载和预览功能。
|
6
|
收藏管理
|
收藏夹管理
|
按照搜索
主题创建最终结果的收藏目录。每个最底
层目录下可以保存搜索结果的文件。
可以对收
藏夹进行维护,包括:打开、新建、清空、导出结果、重命名、删除功能。
|
7
|
历史记录
|
可以按照
主题查看已导出的历史结果。
|
8
|
工具设置
|
文件下载设置
|
可以对工
具下载的线程数、超时时间、下载文档临时目录、网页自动跟踪检查、网页预览、网页内容去噪、临时文件
清空等功能信息配置管理。
|
9
|
代理设置
|
某些网站
需要使用代理方式才能正常访问,系统提供
常用代理站点的维护管理功能,包括不使用代理、使用指定
代理以及采用轮询机制访问代理等。
|
10
|
其他设置
|
包括文档
结果收藏夹路径设置、搜索跟踪
的最大结果数量设置、搜索结果
状态显示以及搜索结果自动过滤设置等。
|
|
|
表- 功能模块列表
|
·主题管理:以树形结
构管理主题分类,对具体的
某项采集主题内容进行管理,包括设置跟踪条件、启动跟踪、重命名,删除等。
|
|
图- 搜索主题设置
|
·搜索管理:根据不同
搜索引擎的检索形式和条件进行搜索条件配置管理。根据设置的搜索条件,搜索引擎
自动跟踪网站产生预搜索结果的摘要和标题信息,形成搜索结果列表。可以对搜
索结果列表进行下载、删除等管理。结果列表
信息中包括条目的权值、状态、标题、文件类型、更新时间、网页类型等。对搜索结
果列表中的内容可以进行原网页或文档信息预览。便于用户
确定网页内容是否符合下载的需要。可以实现对网页、word、pdf、ppt等多种格
式文档的下载和预览功能。
|
|
·收藏管理:按照搜索
主题创建最终结果的收藏目录。每个子节
点目录下可以保存搜索结果的文件。可以对收
藏夹进行维护,包括:打开、新建、清空、导出结果、重命名、删除功能。
|
|
·工具设置:可以对工
具下载的线程数、超时时间、下载文档临时目录、网页自动跟踪检查、网页预览、网页内容去噪、临时文件
清空等功能信息配置管理。某些网站
需要使用代理方式才能正常访问,系统提供
常用代理站点的维护管理功能,包括不使用代理、使用指定
代理以及采用轮询机制访问代理等。
|
|
工具针对
美国专利搜索网站的特点做了针对性的分析处理,采用图文
结合的方式展示专利内容,工具可以
实现自动下载并生成统一的浏览文档,大大简化
了传统的手工逐个页面下载的操作复杂度。
|
|