spark导入数据到elasticsearch如何指定默认的id

Elasticsearch | 作者 datadog | 发布于6 天前 | 阅读数:61

如题,目前通过sparkstreaming实时处理数据之后将数据保存在elasticsearch,如过想指定文档_id默认为时间戳,需要如何设定呢?(是通过_mapping设置吗?)我们是用java或者python的,目前没有找到样例,求大神指导一下。
已邀请:

wuqi55777

赞同来自:

可参考下。
/** * 功能描述:插入数据(指定id)
 * @param index 索引名
 * @param type 类型 
* @param _id 数据id
 * @param json 数据 
*/ 
public boolean insertData(String index, String type, String _id, String json) { 
   int status = getTransportClient().prepareIndex(index, type).setId(_id).setSource( json).get().status().getStatus(); 
         if(status == RestStatus.CREATED.getStatus())
        {
            return true;
        }else{ 
            return false;
       } 
}
 

要回复问题请先登录注册