如何在elasticsearch中导入数据

ElasticSearch

网站建设哪家好,找创新互联建站!专注于网页设计、网站建设、微信开发、小程序定制开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了沅陵免费建站欢迎大家使用!

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

1.工具安装

elasticsearch-jdbc是一个将关系型数据库(RDBMS)数据导入到ElasticSearch库中的一个工具包,支持MySQL、oracle、postgrey、csv等存储列式数据的容器。目前最新的版本是2.3.4.1,支持的ElasticSearch的版本为2.3.4。

下载数据导入工具包 elasticsearch-jdbc-2.3.4.1-dist.zip,可以到官方网站上下载,

由于github上是只有原代码,没有编译好的可执行包,可以到版本库上[下载] (http://xbib.org/repository/org/xbib/elasticsearch/importer/elasticsearch-jdbc/) 相应的版本

注意elasticsearch-jdbc版本与 elasticsearch要对应上,具体版本对应可以到github上看

https://github.com/jprante/elasticsearch-jdbc

下载

wget http://xbib.org/repository/org/xbib/elasticsearch/importer/elasticsearch-jdbc/

如果这种方式下载慢,也可以本地下载后上传

得到的elasticsearch-jdbc-2.3.4.1-dist.zip 的包可以解压到任何目录,elasticsearch-jdbc是一个独立的项目,并不是原来的老版本需要导入elasticsearch的plugins目录中,作为elasticsearch的插件安装

unzip elasticsearch-jdbc-2.3.4.1-dist.zip

解压得到目录

/bin

/lib

这样就安装成功了

注意如果你导入的数据库不是mysql数据库,那你需要在lib目录中放入相应数据库的驱动包,因为elasticsearch-jdbc默认就有mysql的驱动,所以数据库是mysql就不用了

2.编写导入脚本

可以进入bin目录下,里面很多数据导入脚本的范例脚本,可以稍做修改就可以用了,例如mysql-blog.sh  就是mysql数据库导入的例子

我的导入脚本如下

#!/bin/sh bin=/opt/elasticsearch-jdbc-2.3.4.1/bin lib=/opt/elasticsearch-jdbc-2.3.4.1/lib echo ' {     "type" : "jdbc",     "jdbc" : {         "url" : "jdbc:mysql://10.3.5.21:3306/998pz?useUnicode=true&characterEncoding=utf-8",         "user" : "root",         "password" : "roottest",         "sql" : "select p.name,p.type from prompt p;",         "index" : "prompt",         "type" : "prompt",         "metrics": {             "enabled" : true         },         "elasticsearch" : {          "cluster" : "es-cluster",              "host" : "10.3.32.83",              "port" : 9300          }        } } ' | java \     -cp "${lib}/*" \     -Dlog4j.configurationFile=${bin}/log4j2.xml \     org.xbib.tools.Runner \     org.xbib.tools.JDBCImporter

该脚本将表prompt的数据导入到索引prompt中去

注意:导入的字段名一定要跟索引的字段名一样

脚本编辑完成后需要赋予文件相应的执行权限

chmod 777 prompt.sh

如果导入脚本是你本地windows上编辑好上传到服务器,可能会因为windows编码与linux编码不一致,出现莫名其妙的错误,可以用vi编辑进入文件

在命令模式下,转换相应的编码

set ff=unix

3.导入地理坐标数据

索引

"location": {"store": true,"type": "geo_point"}

脚本

#!/bin/sh bin=/opt/elasticsearch-jdbc-2.3.4.1/bin lib=/opt/elasticsearch-jdbc-2.3.4.1/lib echo ' {     "type" : "jdbc",     "jdbc" : {         "url" : "jdbc:mysql://10.3.5.21:3306/998pz?useUnicode=true&characterEncoding=utf-8",         "user" : "root",         "password" : "roottest",         "sql" : "SELECT bh.,bh.name as nameSuggest,bh.latitude AS \"location.lat\", bh.longitude as \"location.lon\" FROM bd_hospital bh;",         "index" : "hospital2",         "type" : "hospital2",         "metrics": {             "enabled" : true         },         "elasticsearch" : {          "cluster" : "es-cluster",              "host" : "10.3.32.83",              "port" : 9300          }        } } ' | java \     -cp "${lib}/" \     -Dlog4j.configurationFile=${bin}/log4j2.xml \     org.xbib.tools.Runner \     org.xbib.tools.JDBCImporter


网站栏目:如何在elasticsearch中导入数据
文章起源:http://scyanting.com/article/pjdsco.html