solr

实体服务器安装centos7过程记录
日志一次在实体服务器安装centos 7的过程记录 第一次在实体服务器上面安装服务器(centos 7),在此记录安装过程中遇到的一些坑. 系统版本:CentOS Linux release 7.6.18 ...
solr集群安装部署
日志一.安装部署zookeeper集群 zookeeper集群 二.solr集群部署 集群配置 IP | 节点名称 | 环境 --- | --- | --- 192.168.137.128 | 192.1 ...
Solr全文检索
日志1.Solr的安装 1.环境要求 jdk1.7+tomcat8+solr5.5.0 2.将以上的软件包上传到服务器 3. 安装tomcat8(解压文件) tar -zxvf apache-tomcat ...
Solr相似性算法
日志Solr相似性算法 介绍 Solr 4及之前的版本默认采用VSM(向量空间模型)进行相似度的计算(或打分).之后的版本,则采用Okapi BM25(一种二元独立模型的扩展),属于概率模型. 检索模型通 ...
solr+jieba结巴分词
日志为什么选择结巴分词 分词效率高 词料库构建时使用的是jieba (python) 结巴分词Java版本 下载 git clone https://github.com/huaban/jieba-ana ...
solr 配置中文分析器/定义业务域/配置DataImport功能(测试用)
日志一.配置中文分析器    使用IKAnalyzer    配置方法:        1)把IK的jar包添加到solr工程中/WEB-INF/lib目录下        2)把IK的配置文件扩展词典, ...
Solr 6.7学习笔记(07)-- More Like This
日志        Solr中提供了MoreLikeThis的功能,用于查询相似的文档 .应用场景(个人理解):1. 你写的文章和别人文章相似度高的话,有一方是抄袭的可能性就很大.2. 查找相似的产品. ...
Solr 6.7学习笔记(06)-- spell check
日志        拼写检查也是搜索引擎必备的功能.Solr中提供了SpellCheckComponent 来实现此功能.我看过<Solr In Action>,是基于Solr4.X版本的,那 ...
Solr 6.7学习笔记(05)-- highlighter
日志搜索结果高亮显示是搜索引擎中的常用功能,在Solr中,我们可以如下配置: <requestHandler name="/select" class="solr.Se ...
Solr 6.7学习笔记(04)-- suggester 遇到的问题
日志遇到的一些问题: 在前面的Suggest配置完后,我在 “/select” 这个 <requestHandler>里面加上了highlight的配置,可是当我在搜索框里输入字符时,竟然报如 ...
Solr 6.7学习笔记(04)-- Suggest
日志        当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现 ...
Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) - filter(5)
日志自定义fieldType时,通常还会用到filter.filter必须跟在tokenizer或其它filter之后.如: <fieldType> <analyzer> < ...
Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) - Analyzer, tokenizer(4)
日志有些时候,我们需要自定义 fieldType.下面的例子就是自定义的 fieldType,<analyzer type="index"> 表示索引时怎么处理,<a ...
Solr 6.7学习笔记(03)-- 样例配置文件 solrconfig.xml
日志位于:${solr.home}\example\techproducts\solr\techproducts\conf\solrconfig.xml <?xml version="1. ...
Solr 6.1学习笔记 -- spellcheck 组件
日志<searchComponent name="spellcheck" class="solr.SpellCheckComponent"> <s ...
Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) -- 样例(6)
日志 managed-schema 样例: <?xml version="1.0" encoding="UTF-8" ?> <!-- Licens ...
nutch集成solr和中文分词
日志nutch集成solr和中文分词 一.构建nutch环境 1. 设置代理 由于nutch使用ant构建,ant调用ivy,会从maven仓库中下载依赖包,因此若公司需要代理才能上网,需要设置代理,如果 ...
solr单机版的搭建
日志一.solr单机版的搭建 1.运行环境 solr 需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr默认提供Jetty(ja),本教va写的Servlet容器程 ...
solr 5.1.0安装-Windows(亦可用于5.4.1)
日志以前4.10的时候写过一个安装教程,是安装在tomcat的,在来安装5.1的时候,看了下简介,发现从5.x后solr集成了jetty,安装变得简单了不少. 现在只需要三步就能搞定,下载solr包解压, ...
Solr5.0源码分析-SolrDispatchFilter
日志      年初,公司开发法律行业的搜索引擎.当时,我作为整个系统的核心成员,选择solr,并在solr根据我们的要求做了相应的二次开发.但是,对solr的还没有进行认真仔细的研究.最近,事情比较清闲 ...