EPI索引组件简介 |
组件特性 |
在线演示/免费下载 |
应用案例 |
各版本介绍 |
|
 |
| 简介: CSW中文分词组件,是一套基于标准C++开发的,可自动将一段文本按常规汉语词组进行拆分,并以指定方式进行分隔的DLL组件。本组件采用完全自主开发的高效的分词引擎及拆分算法,具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要,本组件同时提供词性及词频标注功能,可根据用户要求,对其拆分后的词组进行词性标注或词频标注。其广范应用于互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、 自动摘要、自动分类及信息加工处理等各个领域。 |
| 应用平台 |
封装方式 |
支持语言 |
MS Windows
2000/XP/2003或更高 |
COM接口 |
ASP、ASP.Net、C#、VB.Net、VB6.0、Delphi、VC等 |
MS Windows
2000/XP/2003或更高 |
C接口 |
C、C++、VC6、VC.NET、BC、PHP 等 |
MS Windows
2000/XP/2003或更高 |
Java调用接口 |
Java、JSP |
| Unix/Linux |
so |
[ 暂未推出 ] |
|
 |
| 简介: EPI海量数据索引组件,是一套为了满足当今在急剧膨胀的海量文本信息中实现高速检索(亚秒)的需要而开发的一套COM组件。其采用的高效的特殊索引算法突破了当前大型关系型数据库中普通查询检索和全文索引技术对海量信息检索的效率瓶劲,为用户带来瞬间搜索体验。其全部使用标准C++开发,采用附属的形式与当前大型数据库MySQL、SQL Server、Oracle等实现紧密结合。安装布属简单、操作高效易用。其可广范适用于中小型搜索引擎,企业内部信息检索、图书馆档案资料查询等各行各业。 |
MS Windows平台: |
Windows NT4.0 / 2000 / XP / 2003 各版本或更高 |
支持数据库: |
MySQL / MS SQL Server / Oracle / DB2 |
组件封装形式: |
COM接口的DLL文件 |
|
 |
| 简介: HLT高亮文本标注组件是一套在WEB信息检索中,为了满足对用户检索出的文本中的关键字进行高亮显示所开发的一套COM组件。其采用的特殊模板机制,可以高速的对文本中的关键字进行高亮标注,在大量长篇文本中效果更加明显。其可根据用户需求任意选择颜色标注文本,如结合中文分词组件可轻松实现按字或按词进行高亮标注。其广范应用于互联网中WEB信息检索。 |
应用平台: |
Windows 2000 / XP / 2003 各版本或更高 |
支持开发语言: |
ASP / ASP.NET/PHP及能支持COM接口的所有脚本语言 |
组件封装形式: |
COM接口的DLL文件 |
|
|
|
| |
支持Java语言调用的CSW中文分词组件现已开发完成,并附示例代码,欢迎下载试用
基于C接口的CSW中文分词组件现已开发完成,并附示例代码,欢迎下载试用
基于Windows平台的CSW中文分词组件5.0版现已开发完成,并正式发行,欢迎下载试用。
5.0版完全采用标准C++全面改写,较前版本的分词组件,速度上有数十倍的提高,充分满足大量文本拆分的需要。
重新改进的拆分算法可更加有效的识别歧义词组,准确性有质的提高。
应用户需求,CSW5.0分词组件晚些时候将会推出Linux平台下版本,敬请留意。
[ 上海电信 ] :在线分词演示
[ 北京网通 ] :在线分词演示 |
|