北京词网科技有限公司
联系我们:   010-82600818    

产品介绍

中文智能分词模块

中文智能分词模块,是词网在中文智能分词技术基础之上推出的便于二次开发的系统模块。它具有分词准确、高效、稳定的特点,主要应用于信息检索、内容识别与分析、自然语言理解等领域。

经测试,本系统词汇切分准确率可达到99%以上,并拥有可定制的开发接口,降低系统之间的耦合度。

申请产品试用,请拨打业务咨询电话: (郭先生)


站内全文检索引擎

站内全文检索系统是对网站数据进行海量全文检索的产品。词网公司经过多年的研究与用户习惯分析、系统优化,完成了现有的产品。本产品可对网站、信息系统内的各种数据提供全文检索服务。

本系统主要解决了网站对数据库进行频繁的模糊检索而带来的系统运行效率缓慢、符合加大的问题。客户可通过完善的产品后台对数据源、索引库、检索结果进行灵活的定制,并可设定搜索结果优先级、进行范围检索和分类检索。

系统数据源可以是网页,也可以是数据库、RSS等结构化数据,目前我们支持MysqlSql ServerOracle等多种数据库系统,同时也支持通过SOAP接口传递原始数据。

根据客户的数据量及负荷能力,本系统可采取租用平台和购买系统两种方式提供服务,我们的客户只需支付极低的费用,即可解决也许困扰您许久的搜索难题。

0505 全文检索系统白皮书


数据库搜索

IndexDB Server v1.0 能够帮助用户,轻松把现有的数据库,转换成Google一样的全文检索搜索引擎。用户无需编程,只要设置一些简单的参数,IndexDB Server 就能自动识别数据类型,通过高速中文分词引擎和索引引擎,创建全文索引,内置高性能WEB Server,不需要其他软件,脱离数据库,直接为互联网用户提供搜索服务。支持海量数据,单一服务器支撑每秒100个以上并发搜索

产品特点:
1、支持SQLServer、MySQL、Oracle、Access 数据库
2、内置高效IOCP Enabled Web Server, 支持压缩传输。
3、内置Ajax支持
4、自学习智能纠错
5、自学习拼音搜索
6、自学习相关搜索
6、自学习即时搜索
8、数据类型智能识别
9、自动定时更新 可指定时间或时间间隔
10、内置高速缓存,可配置。
11、内置搜索结果模板引擎
12、支持XML结果输出 用户可使用C#,Java,Php等进行解析,自定义搜索结果。
13、支持动态摘要
14、任意字段索引
15、任意字段排序
16、任意字段分组过滤
17、指定字段范围过滤
18、指定字段属性过滤
19、自动去除HTML标签
20、日志记录功能
21、系统状态实时监控
系统需求:
Windows xp,Windows vista,Windows Server 2000, Windows Server 2003
512兆内存、800Mhz处理器,20GB硬盘。
技术支持:
1、数据库检索和搜索引擎有什么区别?
    常见的数据库有Oracle,SqlServer,DB2等。数据库提供数据存储和检索服务。用户可以通过SQL语句对数据库信息进行添加、删除、修改、查询的工作。为提供查询速度,数据库提供索引服务,即提前把数据建立索引以提高查询速度。随着互联网的发展,信息量剧增,用户的检索对全文检索的需求越来越强烈。而数据库的索引服务对全文检索的支持很弱,用户对数据库进行全文检索,速度慢,准确率低,同时也给数据库造成巨大的压力,无法完成其他工作。
    搜索引擎应运而生,搜索引擎专门针对全文检索服务,围绕全文检索进行优化,在占用资源很小的情况下,提供数据库无法达到的性能。
2、使用IndexDB Server,需要了解哪些知识?
    IndexDB Server在设计上尽量简化了用户的输入。实际上最重要的参数就是数据库的设置。用户要了解自己数据的一些设置,如用户名,口令等。
3、什么叫摘要?
    对于一些比较长的字段,不便于用户在网页上展示,所以需要所见显示的内容。但所见内容的原则是尽量不丢失信息。 IndexDB Server提供动态智能摘要功能。
4、IndexDB Server支持多服务器吗?
    IndexDB Server支持多种scale out线性扩展架构。能满足最大数量的用户访问。如果您需要这样的服务,可以跟我们联系。

下面的实例演示的是产品搜索引擎。数据是通过Spider技术在互联网上获取的。实例将演示通过最简单的设置就能把数据库表变成搜索引擎。







下载试用版本

申请产品试用,请拨打业务咨询电话: (郭先生)


语音、视频内容检索模块

针对目前互联网上存在大量音频、视频信息无法以文字的形式被检索到的问题,我们与中国科学院声学研究所合作推出了语音、视频内容检索模块。本模块可对语音类数据进行有效的分析和索引,用户只需输入有关文字,即可查询到有关的视频内容及该段文字在视频中的位置信息。

目前该模块作为站内全文检索引擎的扩展模块投放市场,经测试,语音搜索准确率可达60%以上,并可对大多数方言、口头用语进行有效的识别。


内容关联服务引擎

目前国内的互联网市场拥有诸多以内容为主导的网站,且这些内容类网站占据了整个互联网流量的8成以上,大型网站如sina,sohu,中小型网站、社区、垂直门户则更多。在解决了访问量和推广问题后,这些网站面临的普遍挑战首先是如何提高自身的内容黏性和用户停留时间。其次,由于内容类网站的先天缺陷,以目录、频道层级的内容结构不易被用户查找,很多内容因为无法被检索到,而不能体现出其价值所在,从而成为了网站发展的瓶颈和负担。

词网内容关联及信息挖掘系统正是提供了上述问题的解决方案,基于特定算法及大量样本数据分析,参考用户行为习惯,识别出与特定内容相关并具一定延展性且符合用户阅读倾向的其它内容的技术。通过这一技术,可以通过内容之间的联系和智能推荐,帮助用户对网站内容进行挖掘,并让用户以零成本获得与此相关的更多内容进行深度阅读,从而提升用户在特定网站的停留时间和浏览量。通过结构化和模块化的设计,可以让我们的产品无缝的嵌入到客户的内容系统、网站中去,在用户浏览内容的同时,为其提供与当前文章相关并具延展性的相关内容,让用户改变长期以来养成的进来看、看完走的浏览习惯,而能够留下来、在自动指引下逛一逛找到更多有价值的内容。

经过我们的数据分析,词网系统仅在智能内容关联一个功能项上,即可为内容量在一万至五万条的中小型网站提高了用户平均停留时间达3分钟。提高了用户体验、让用户在网站内能找到更具价值的内容,即提高了网站本身的价值。

申请产品试用,请拨打业务咨询电话: (郭先生)


企业级全文检索解决方案

针对律师事务所、会计师事务所等电子文档交换、保存量均非常大的企业,定制出企业级文档检索解决方案。本系统是一台专用的设备,接入到企业内部网络上,经过简单配置,即可对企业内的所有文档建立索引,并根据事先设定的权限分类保存。所有经过授权的用户,均可通过该套系统提供的检索功能快速寻找、调用文档。解决了以往文档保存在员工电脑上导致的文档丢失、不易查找的难题,专业、稳定的文档存储系统将为您企业的无形财产加上一道电子防线。

此外本系统还支持远程调用和远程上传,方便您的业务人员在出差中、谈判中通过网络、手机远程获取必要的文档,同时还可以将新生成的文档通过

word,power,point,wps,pdf等数十种文档格式的索引和检索,系统无需专门维护人员,只连接到企业内网中即可正常运行。

申请产品试用,请拨打业务咨询电话: (郭先生)


 
    关于我们>    联系我们>    加入我们>    合作伙伴>    产品介绍>   
Copyright© 2010 cikuu