百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

Go 程序利用 ElasticSearch 游标 Scroll 实现海量数据分页查询

xsobi 2024-11-26 10:13 1 浏览

关注我的头条号:@Wooola,10 年 Java 软件开发及架构设计经验,专注于 Java、Go 语言、微服务架构,致力于每天分享原创文章、快乐编码和开源技术。

环境准备

  • ElasticSearch v6 集群环境
  • ES 第三方包
    1. github.com/olivere/elastic 文档以及测试用例比 go-elasticsearch 丰富
    2. github.com/elastic/go-elasticsearch

    本文 olivere/elastic 包进行 es 开发。

    ElasticSearch 配置读取

    编写 conf.ini 配置文件,添加 elasticsearch 集群地址

    [ES]
    EsAddrs = http://node1:9200,http://node2:9200,http://node3:9200

    定义 EsConf 结构体

    EsConf struct {
    		EsAddrs string
    }

    init 方法中,利用 goconfig 读取 confPath 参数指定的 conf.ini 配置文件路径。

    func init() {
    	var (
    		iniF string
    	)
    	flag.StringVar(&iniF, "confPath", "d:/conf.ini", "Set Configuration File")
    	flag.Parse()
    	var err error
    	IniF, err = goconfig.LoadConfigFile(iniF)
    	if err != nil {
    		os.Exit(1)
    	}
    	log.Println("Load conf.ini Success!")
    } 

    main 方法中读取 EsAddrs 参数值。

    EsConf := &conf.EsConf{
    		EsAddrs: GetStringValue(EsSection, EsAddrs, ""),
    	}
    
    func GetStringValue(section string, key string, defValue string) (r string) {
    	val, err := IniF.GetValue(section, key)
    	if err != nil {
    		return defValue
    	}
    	return val
    }

    初始化 elasticsearch 客户端实例。

    EsClient, err = NewClient()
    if err != nil {
    		panic(err)
    }
    
    func NewClient() (*elastic.Client, error) {
    	esConf := EsConf
    	if len(esConf.EsAddrs) == 0 {
    		panic("EsAddrs is Empty!")
    	}
    	esAddrs := strings.Split(esConf.EsAddrs, ",")
    	client, err := elastic.NewClient(elastic.SetURL(esAddrs...))
    	log.Println("ES initial successful!")
    	return client, err
    }

    ElasticSearch 游标(Scroll)分页

    时间查询需求:

    例如,查询  到 

    对应 es 时间格式为:

    # 开始时间
    st := 20171027000000
    # 结束时间
    et :=20200328235959

    初始化游标查询,设置游标每次查询 size 大小:5000 条,注意 sort 排序时,必须是 字段 + .keyword,否则查询会报错。

    boolQry := elastic.NewBoolQuery()
    boolQry.Must(elastic.NewRangeQuery("updateDate").From(st).To(et))
    res, err := EsClient.Scroll().Index(EsHisPendDB).Type(EsHisPendType).
    			Query(boolQry).
    			Sort("updateDate.keyword", false).
    			Scroll("5m").
    			Size(Conf.ExpConf.ExpPageSize).
    			Do(context.Background())
    
    # 抽取数据
    
    
    pendingList := extractPendList(*res.Hits)

    使用 for 循环读取所有数据,直到 len(res.Hits.Hits) 大小为 0,说明 elasticsearch 查询读取完毕,停止 for 循环。

    for {
    			res, err := EsClient.Scroll("1m").ScrollId(scrollId).Do(context.TODO())		 
    			pendingList := extractPendList(*res.Hits)			 
    }
    if len(res.Hits.Hits) <= 0 {
    				break
    			}

    输出效果

    其中使用 Scroll 游标第一次查询会产生 SrcollID 值。

    DnF1ZXJ5VGhlbkZldGNoBQAAAAAABDKbFldaYi1nOUhBVF8yZHNfZkJISllSMEEAAAAAAAMrlhZMRWZNdVlNaFFiQ1pjdkFiNHBrMW1BAAAAAAAEMpwWV1piLWc5SEFUXzJkc19mQkhKWVIwQQAAAAAABDKdFldaYi1nOUhBVF8yZHNfZkJISllSMEEAAAAAAAMwQhY4YUFDNVNVNlJsRzc4NFVYRnRyZ2xB

    相关推荐

    js向对象中添加元素(对象,数组) js对象里面添加元素

    一、添加一个元素对象名["属性名"]=值(值:可以是一个值,可以是一个对象,也可以是一个数组)这样添加进去的元素,就是一个值或对象或数组...

    JS小技巧,如何去重对象数组?(一)

    大家好,关于数组对象去重的业务场景,想必大家都遇到过类似的需求吧,这对这样的需求你是怎么做的呢。下面我就先和大家分享下如果是基于对象的1个属性是怎么去重实现的。方法一:使用.filter()和....

    「C/C++」之数组、vector对象和array对象的比较

    数组学习过C语言的,对数组应该都不会陌生,于是这里就不再对数组进行展开介绍。模板类vector模板类vector类似于string,也是一种动态数组。能够在运行阶段设置vector对象的长度,可以在末...

    如何用sessionStorage保存对象和数组

    背景:在工作中,我将[{},{}]对象数组形式,存储到sessionStorage,然后ta变成了我看不懂的形式,然后我想取之用之,发现不可能了~记录这次深刻的教训。$clickCouponIndex...

    JavaScript Array 对象 javascript的array对象

    Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

    JavaScript中的数组Array(对象) js array数组

    1:数组Array:-数组也是一个对象-数组也是用来存储数据的-和object不同,数组中可以存储一组有序的数据,-数组中存储的数据我们称其为元素(element)-数组中的每一个元素都有一...

    数组和对象方法&amp;数组去重 数组去重的5种方法前端

    列举一下JavaScript数组和对象有哪些原生方法?数组:arr.concat(arr1,arr2,arrn);--合并两个或多个数组。此方法不会修改原有数组,而是返回一个新数组...

    C++ 类如何定义对象数组?初始化数组?linux C++第43讲

    对象数组学过C语言的读者对数组的概念应该很熟悉了。数组的元素可以是int类型的变量,例如int...

    ElasticSearch第六篇:复合数据类型-数组,对象

    在ElasticSearch中,使用JSON结构来存储数据,一个Key/Value对是JSON的一个字段,而Value可以是基础数据类型,也可以是数组,文档(也叫对象),或文档数组,因此,每个JSON...

    第58条:区分数组对象和类数组对象

    示例设想有两个不同类的API。第一个是位向量:有序的位集合varbits=newBitVector;bits.enable(4);bits.enable([1,3,8,17]);b...

    八皇后问题解法(Common Lisp实现)

    如何才能在一张国际象棋的棋盘上摆上八个皇后而不致使她们互相威胁呢?这个著名的问题可以方便地通过一种树搜索方法来解决。首先,我们需要写一个函数来判断棋盘上的两个皇后是否互相威协。在国际象棋中,皇后可以沿...

    visual lisp修改颜色的模板函数 怎么更改visual studio的配色

    (defunBF-yansemokuai(tuyuanyanse/ss)...

    用中望CAD加载LISP程序技巧 中望cad2015怎么加载燕秀

    1、首先请加载lisp程序,加载方法如下:在菜单栏选择工具——加载应用程序——添加,选择lisp程序然后加载,然后选择添加到启动组。2、然后是添加自定义栏以及图标,方法如下(以...

    图的深度优先搜索和广度优先搜索(Common Lisp实现)

    为了便于描述,本文中的图指的是下图所示的无向图。搜索指:搜索从S到F的一条路径。若存在,则以表的形式返回路径;若不存在,则返回nil。...

    两个有助于理解Common Lisp宏的例子

    在Lisp中,函数和数据具有相同的形式。这是Lisp语言的一个重大特色。一个Lisp函数可以分析另一个Lisp函数;甚至可以和另一个Lisp函数组成一个整体,并加以利用。Lisp的宏,是实现上述特色的...