如何搭一个搜索引擎:[2]sphinx篇

Coreseek 块吧吨翘是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎(主要就是加了中文分词功能和支持了python数据源)。Sphinx提供了:索引、检索、排序等搜索引擎的主要功能,关键sphinx支持mysql数据源,方便基于LAMP架构的网站创建自己的搜索引擎服务。修改配置文件:(各配置项详细说明请认真阅读coreseek中文文档)1)指定数据源:一般使用mysql数据库作为源2)配置索引晗稍噔猷:mlock:为1的情况下使得内存中的索引数据不会被系统换出,某些情况下可以提高性能。

PHP+Mysql+Sphinx高效的站内搜索引擎搭建详释

为什献垴淄睬么要使用Sphinx 假设你现在运营着一个论坛,论坛数据已经超过100W,很多用户都反映论浊渫媵悴坛搜索速度非常慢,那么这时你就可以考虑使用Sphinx了(当然其他全文检索程序或方法也行)。 Sphinx是什么 Sphinx由俄罗斯人Andrew Aksyonoff 开发高性能全文搜索软开发的高性能全文搜索软件包,在GPL与商业协议双许可协议下发行。 全文检索是指以文档全部文本信息作为检索对象一种信息检索技术。检索的对象有可能是文章标题,也有可能是文章作者,也有可能是文章摘要或内容。 Sphinx的特性 高速索引 (在新款CPU上,近10 MB/秒);高速搜索 (2-4G文本量中平均查询速度不到0.1秒);高可用性1秒);高可用性 (单CPU上最大可支持100 GB文本,100M文档); 提供良好相关性排名;支持分布式搜索; 提供文档摘要生成; 提供从MySQL内部插件式存储引擎上搜索 ; 支持布尔,短语, 和近义词查询; 支持每个文档多个全文检索域(默认最大32个); 支持每个文档多属性; 支持断词; 支持单字节编码与UTF-8编码;

DedeCMS V5.7全文检索使用说明

DedeCMS V5.7全文检索使用说明

1.掳姗浚瑙Windows下安装Sphinx1.1.开始前准备工作先从http://www.coreseek.cn/products/ft_down/下载Coreseek 3.2.1泌驾台佐3,这里我们就以Windows环境为例:下载后直接解压coreseek-3.2.13-win32.zip,我php是一个不错的中文检索的例子.[D:\****\bin]应用程序目录,其中包含以下几个文件 * indexer: 用于创建全文索引; * search: 一个简单命令行(CLI) 测试程序,用于测试全文索引; * searchd: 一个守护进程,其他软件可以通过这个守护进程进行全文检索; * sphinxapi:sphinxapi: 一系列searchd 客户端API 库,用于流行Web脚本开发语言(PHP, Python, Perl, Ruby, Java). * spelldump: 一个简单命令行工具,用于从 ispell 或 MySpell (OpenOffice内置绑定) 格式字典中提取词条。当使用 wordforms

如何搭一个搜索引擎:[1]xapian篇

随这几年互联网技术发现,其实搜索引擎早已不像10年前那样高深莫测了,其实无非就是爬虫、倒排索引检索结果归并、排序、query分析等操作。核心功能也有不少开源代码,理论上,对于索引量几百万以内,需求不太复杂,这些开源搜索引擎都可以轻松胜任,也不需要做太多修改。前不久花了点时间学习了一下xapi,并用它搭了一个搜索引擎,最近正好想在一台机器上实验一些东西,想重新搭个环境,折腾了一上午,虽然有些细节,但整体上还是比较轻松地把引擎搭了起来。 装有Linux系统电脑一台 xapian开源软件包 1. 关于开源搜索引擎随便百度一下,好多开源搜索引擎,像lucene,sphinx还有一些人专门比较sphinx还有一些人专门比较了每种搜索引擎的优缺点。开源搜索引擎列表:http://www.oschina.net/project/tag/130/search-engine xapian是C语言写,本篇先介绍xapian使用方法。 2. xapian简介及资料具体看官网文档http://xapian.org/docs/

如何搭一个搜索引擎:[3]搜索引擎基本原理

如何搭一个搜索引擎:[3]搜索引擎基本原理

本经验介绍一下搜索引擎的最基本原理,对于有编程经验的人来说应该不难理解。其实不懂搜索引擎的人也可以通过一些工具很快速地搭建起一套很专业的搜索引擎来,但是理解了搜索引擎背后基本原理后,在使用过程中,对一些问题理解可以更深入,看得更透彻一些吧。 发展史:1) Archie: 1990年FTP资源搜索,搜索引擎鼻祖2)1990年FTP资源搜索,搜索引擎鼻祖2) YAHOO:第一代:1994年 分类目录3) excite:第二代:1993年 文本检索4) Google or Baidu: 第三代:1998年 超链分析 垂直搜索引擎:特点:•资源稀缺性•结构化信息•结果精准•社区化属性通用搜索引擎市场份额已经被瓜分殆尽情况下,做通型搜索引擎投入大、产出小,不如专业垂直类搜索引擎有前途,在垂直领域做深做细。 百度发展: 微博搜索:几大特色需求满足:1犬匮渝扮)—找人/明星/好友:姚晨、李开复—2)电影:富春山居图—关注人:产品经理—3)时效性晗稍噔猷:地震—4)社会化搜索:好友推荐餐馆/电影—5)时事…相对于百度这样搜索

ThinkPHP中如何使用coreseek(sphinx)

在网上找了很久,th坡纠课柩inkphp是没有sphinx扩展,那么我们可以自己扩展一个用,今天搞了好久,只能总结一点thinkphp调用sphinxapi一段小代码 首先我们把coreseek下载好,命名为coreseek,我们找到coreseek/etc中csft_mysql.conf修改这个配置文件ql_attr_uint=sid#从SQL读取到值必须为整数sql_attr_timestamp= time #从SQL读取到值必须为整数,作为时间属性 sql_query_info_pre= SET NAMESutf8#命令行查询时,设置正确字符集sql_query_info= SELECT#命令行查询时,从数据库读取原始数据信息} #index定义index lemai{source=lemai#对应source名称path= var/data/mysql #请修改为实际使用绝对路径,例如:/usr/local/coreseek/var/...docinfo= externmlock= 0morphology=

上页


12345678

下页
boodigo搜索引擎网址btdigg dht搜索引擎innojoy专利搜索引擎soopat专利搜索引擎搜索引擎云藏藏文搜索引擎搜索引擎友好性分析谷粉学术搜索引擎飞客bt搜索引擎搜猫搜索引擎源码唐老鼠搜索引擎下载手撕包菜搜索引擎火端搜索引擎源码sodu小说搜索引擎源码粉粉谷歌搜索引擎btdigg搜索引擎麦库搜索引擎香港谷粉搜索引擎入口lucene搜索引擎开发权威经典百度云搜索引擎入口搜索引擎快照新鲜度谷歌搜索引擎百度搜索引擎shodan搜索引擎