Solr与ES搜索引擎技术选择
...大约 2 分钟
Solr与ES搜索引擎技术选择
1. 简介
solr和Elasticsearch都是基于Lucene搜索服务器基础之上开发的,高性能的企业级搜索服务器【他们都是基于分词技术构建倒排索引的方式进行查询】
2. 对比
比较类目 | solr | Elasticsearch |
---|---|---|
诞生时间 | 2004 | 2010 |
搜索基础 | Lucene搜索 | Lucene搜索 |
实时建立索引 | solr会产生io阻塞,效率低 | 不阻塞,效率高 |
不断动态添加数据 | 检索效率变低 | 变化不大 |
自身系统管理 | 利用zookeeper进行分布式管理 | 自身带有分布式系统管理功能 |
部署 | 一般都要部署到web服务器上,如tomcat。启动tomcat的时候需要配置tomcat与solr的关联 | 自带运行功能,下载安装包直接安装就行 |
功用范围 | 官网提供的功能 | 更专注核心搜索,其它依赖第三方插件 |
支持索引方式 | HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式 | 仅支持json文件格式 |
社区和开发者 | apache 软件基金和社区支持 | 单一商业实体及其员工 |
节点发现 | Apache Zookeeper ,在大师项目中成熟且经过实战测试 | Zen内置于ES本身,需要专用的主节点才能进行分裂脑保护 |
高速缓存 | 全局,每个段更改无效 | 每段,更适合动态更改数据 |
分析引挚性能 | 非常适合精确计算的静态数据 | 结果的准确性取决于数据放置 |
全文搜索功能 | 基于lucene语文分析,多建议,拼写检查,丰富的高亮显示支持 | 基于Lucene语文分析,单一建议API实现 |
DevOps支持 | 尚未完全,还在完善中。。 | 非常好的API |
机器学习 | 内置-在流聚合之上,专注于逻辑回归和学习排名贡献模块 | 商业功能,专注于异常和异常值以及时间序列数据 |
赞助