【云原生 • Prometheus】图解Prometheus数据抓取原理

发布时间:2023-04-22 10:33:13 来源：腾讯云

scrape加载流程组件关系

【云原生 • Prometheus】图解Prometheus数据抓取原理

discovery模块利用各种服务发现协议发现目标采集点，并通过channel管道将最新发现的目标采集点信息实时同步给scrape模块，scrape模块负责使用http协议从目标采集点上抓取监控指标数据。

如上图，discovery服务发现模块经过Discoverer组件--> updater组件--> sender组件，将服务发现采集点实时动态发送到syncCh通道上，而该通道的另一端就是scrape模块，这样discovery模块和scrape模块就构建起了关联。

(相关资料图)

scrape模块updateTsets组件通过协程方式运行实时监听syncCh通道，并将更新写入到scrapeManager结构体中targetSets字段对应的map中，同时触发triggerSend信号给reloader组件，告诉该组件采集点有更新，reloader组件就从scrapeManager中targetSets中拉取最新采集点进行加载。

reloader组件基于这些采集点信息生成一个个targetScraper组件，targetScraper组件组件主要负责按照job中配置的interval时间间隔不停轮训调用采集点的HTTP接口，这样就实现了采集点的指标数据采集。

scrape加载流程

下面来看下scrape模块reloader加载采集点具体流程，如下图：

「reloader采集点加载主要分为如下几个主要步骤：」

「1、scrapePool生成并初始化基础数据：」

scrapeManager结构体中targetSets字段对应的map中存放了当前服务发现的最新采集点信息，key是job名称，遍历该targetSets中存放的采集点信息，为每个job对应生成一个scrapePool结构体的实例，即scrapePool是封装单个抓取job的工作单元：

ScrapePools 是单个的Job的抓取目标的工作单位：type scrapePool struct { //存储指标 appendable storage.Appendable //一个scrapePool对应一个job，config即为该job配置 config *config.ScrapeConfig // 基于job配置生成http请求客户端工具，比如封装认证信息等 client *http.Client //每个target都会生成一个loop loops          map[uint64]loop //target_limit检查 targetLimitHit bool //relabe后有效的采集点 activeTargets  map[uint64]*Target //relabel后无效采集点 droppedTargets []*Target //生成scrapeLoop工厂函数 newLoop func(scrapeLoopOptions) loop}

每个抓取job生成的scrapePool存放在scrapeManager结构体中scrapePools这个map中：

scrapePools   map[string]*scrapePool

「2、targetgroup.Group构建Target：」

上面生成的scrapePool中主要初始化config、client等信息，并没有涉及到抓取采集点数据，然后对生成的scrapePool执行Sync方法，入参就是该抓取job当前所有采集点信息，这个方法就是对job的采集点信息进行处理：

func (sp *scrapePool) Sync(tgs []*targetgroup.Group)

遍历采集点，通过targetsFromGroup(tg, sp.config)解析采集点返回[]*Target，

var all []*Targetsp.droppedTargets = []*Target{}for _, tg := range tgs { //基于targetgroup.Group构建target集合 targets, err := targetsFromGroup(tg, sp.config) if err != nil {  level.Error(sp.logger).Log("msg", "creating targets failed", "err", err)  continue } for _, t := range targets {  if t.Labels().Len() > 0 {//relabel后符合要求的采集点   all = append(all, t)  } else if t.DiscoveredLabels().Len() > 0 {//relabel后不符合要求的采集点：废弃   sp.droppedTargets = append(sp.droppedTargets, t)  } }}

Target结构体主要字段如下，即将服务发现的采集点信息解析成scrape模块的Target信息，解析过程中会涉及relabel操作，从服务发现的目标采集点中过滤出符合要求的真实采集点，一个Target即代表一个将要真实触发Http请求对象：

type Target struct { //服务发现标签，即未经过relabel处理的标签 discoveredLabels labels.Labels //经过relabel处理之后标签 labels labels.Labels //http请求参数 params url.Values    //采集点状态：up、down、unknown health             TargetHealth}

「3、有效Target生成scrapeLoop：」

「Target只是包含采集点信息，scrapeLoop实现loop接口，封装了发送http请求采集数据指标逻辑的Target执行单元：」

type loop interface { run(interval, timeout time.Duration, errc chan<- error) setForcedError(err error) stop() getCache() *scrapeCache disableEndOfRunStalenessMarkers()}

其中run方法就是启动http数据抓取，入参interval指定循环抓取指标间隔；stop方法则是停止http数据采集。

我们来看下Target如何生成scrapeLoop：

if _, ok := sp.activeTargets[hash]; !ok {    //生成targetScraper，其中封装了Target和client //Target封装了采集点请求IP、端口、请求参数等信息，通过这些信息构建HTTP请求Request //client是封装了认证信息的http请求客户端工具，用于将http请求request发送出去 s := &targetScraper{Target: t, client: sp.client, timeout: timeout} l := sp.newLoop(scrapeLoopOptions{  target:          t,  scraper:         s,  limit:           limit,  honorLabels:     honorLabels,  honorTimestamps: honorTimestamps,  mrc:             mrc, })   ...}if _, ok := sp.activeTargets[hash]; !ok {    //sp.activeTargets不存在则表示新发现的采集点，则创建scrapeLoop     //生成targetScraper，其中封装了Target和client //Target封装了采集点请求IP、端口、请求参数等信息，通过这些信息构建HTTP请求Request //client是封装了认证信息的http请求客户端工具，用于将http请求request发送出去 s := &targetScraper{Target: t, client: sp.client, timeout: timeout} l := sp.newLoop(scrapeLoopOptions{  target:          t,  scraper:         s,  limit:           limit,  honorLabels:     honorLabels,  honorTimestamps: honorTimestamps,  mrc:             mrc, }) sp.activeTargets[hash] = t sp.loops[hash] = l uniqueLoops[hash] = l} else {    //sp.activeTargets存在则可能：    //1、重复的采集点：直接忽略即可    //2、之前发现并启动的采集点：设置uniqueLoops[hash] = nil，则后续启动loop时不用启动     //target在sp.activeTargets已存在，但是uniqueLoops不存在，说明该采集点之前就被发现过并被启动，当前发现的和之前一致未变 //uniqueLoops[hash] = nil表示当前还是存在，但是不需要启动，后面对于sp.activeTargets存在但是uniqueLoops中不存在的采集点，则为采集点消失，需要停止loop并移除掉 if _, ok := uniqueLoops[hash]; !ok {  uniqueLoops[hash] = nil } sp.activeTargets[hash].SetDiscoveredLabels(t.DiscoveredLabels())}

uniqueLoops存储当前抓取job所有有效采集点，不在该集合中的采集点需要停止并移除，如之前存在的采集点，但是当前又消失不见的采集点：

for hash := range sp.activeTargets { //uniqueLoops存储当前抓取job所有有效采集点，不在该集合中的采集点需要停止并移除，如之前存在的采集点，但是当前又消失不见的采集点 //uniqueLoops中value=nil的是不需要启动，之前服务发现过并被启动的；value不是nil则表示需要启动 if _, ok := uniqueLoops[hash]; !ok {  //移除  wg.Add(1)  go func(l loop) {   l.stop()   wg.Done()  }(sp.loops[hash])  delete(sp.loops, hash)  delete(sp.activeTargets, hash) }}

scrapeLoop中还有个关键的类型targetScraper，它才是真正执行http请求组件，其实现scraper接口(如下)，其中scrape就是一次http请求逻辑封装：

type scraper interface { scrape(ctx context.Context, w io.Writer) (string, error) Report(start time.Time, dur time.Duration, err error) offset(interval time.Duration, jitterSeed uint64) time.Duration}

「4、启动scrapeLoop：」

最后，执行scrapeLoop的run方法，启动scrapeLoop组件：

for _, l := range uniqueLoops { if l != nil {   go l.run(interval, timeout, nil) }}

组件关系

「scrape模块加载流程关键是几个核心组件创建、初始化及启动运行的过程：」

x 广告

【云原生 • Prometheus】图解Prometheus数据抓取原理

【云原生 • Prometheus】图解Prometheus数据抓取原理

scrape加载流程

组件关系

【云原生 • Prometheus】图解Prometheus数据抓取原理

信息：孔庙雅乐虚拟仿真实验

天天亮点！预告｜沉浸式体验“胖五”发射过程！锁定明日10点首都科学讲堂，专家独家探秘中国航天博物馆

每日观察!塘沽街道河华里社区携手宁波里小学开展应急救护普及培训活动

焦点播报:大宏立：公司与同业友商在部分业务上有一定重合，但每家公司具体经营方向仍存在着差异

深圳工业设计公司排名榜前十名_深圳工业设计公司排名-世界新视野

短讯！2023北京博爱医院五一放假吗？门急诊安排一览

最新房屋征收公告！德州主城区又一棚户区改造 全球快播报

世界短讯！2023南通海门盛放音乐节最新消息（持续更新）

银色北伐军军需官物品_银色北伐军军需官

科创板首批：*ST紫晶和*ST泽达将被实施重大违法强制退市_今日热搜

全球即时看！南国智库·财经观察｜专家解码：股票发行注册制下 海南企业登陆资本市场有哪些机遇？

明码标价、不欺骗消费者 多地发告诫书规范五一市场价格 当前独家

即时：二十四中中考录取通知书怎么拿_中考录取通知书怎么拿

《中国烧烤品类发展报告2023》发布：一人食烧烤存机遇

新动态：越秀集团与杭州地铁签署战略合作协议

我爱我家北京市场扩张“冻结”，店多人少服务待改进，战略股东被深套后仍亏损减持

hiv病毒是哪一年被分离出_hiv病毒是哪一年被分离出来的

杂音末来图片 杂音未来恐怖图片

中国科学家精确测量！银河系“体重”算出来了 世界快资讯

济南推出青年人才优惠政策2.0版，餐饮观影享优惠，免费看演出

斯特里贝克曲线_关于斯特里贝克曲线简介

热资讯！三部门发文支持光伏发电产业发展

Apple将AIChat带到MacBook的更多地方

首针接种完成 国产带状疱疹疫苗全国接种正式启动 重点聚焦

世界快消息！短期出口信用综合险

世界微资讯！梦见打枪是什么意思好不好_梦见打枪是什么意思？

华北制药(600812.SH)发布2022年业绩 净亏损6.89亿元 同比由盈转亏

红相股份：延期披露2022年年度报告和2023年第一季度报告_时讯

好久不见陈乔恩啦！她怎么变成这样了？-每日精选

当前报道:性褔导航_幸福导航

环球要闻：怎么添加打印机到电脑上_打印机无法显示打印机属性

全球观察：江苏金租最新公告：一季度净利润6.8亿元、同比增长10.38%

李荣浩演唱会明日在郑州奥体中心唱响，公交增加运力

多媒体课件制作软件工具_多媒体课件制作软件

天天短讯！医学院校大学录取分数线2022_湖南医药学院分数线

remember when 艾薇儿_remember when-世界热资讯

迈越科技拟香港主板上市，行政总裁李常青持股52%

环球播报:继子女和亲生子女继承比例

环球简讯:硅业分会：本周工业硅价格有止跌企稳迹象

环球视讯！飞行近3分钟！“史上最强火箭”空中爆炸！马斯克第一时间“祝贺”

KD也得给我当配角 布克进攻侵略性拉满 太阳能否击沉快船他是关键

环球热点！外汇局：人民币在跨境使用中占比上升 有助降低货币错配风险

【世界独家】城市治理不妨多些“共享思维”

吴懿韬_吴懿 世界看热讯

每日头条!新型超滤分离法“降伏”核废料镅

刘备不愧为一代枭雄，一生从不重用赵云，临终前才告诉赵云原因

贵州三穗颇洞村 田园变游园

环球快资讯：杭州几个区最新（杭州几个区）

豪掷227亿！华润一日两城夺五地

出错率_出错

性无能有哪些症状男性_性无能有哪些症状

金店今日金价多少一克(2023年4月21日) 世界观热点

军工股业绩亮眼，主力大幅加仓，行业或迎新一轮景气周期|天天热推荐

热推荐：“日化巨头”誓言“夺回”过去三年的利润率，华尔街并不买账

曲阜：“沉浸式”国防教育树立家国情怀 重点聚焦

昨日的雨下得有多大？132个雨量站达暴雨 明后两天阵雨又来

全球短讯！英搏尔(300681.SZ)：目前专注于新能源车动力系统领域的研发和生产，暂未有场景应用到AI相关技术

纯棉卫衣会缩水吗 纯棉的卫衣会缩水嘛-世界热头条

每日热门：25980元起，轻骑大韩驯风300上市，还有多款新车同场发布

小学班干部类型有哪些_小学班干部类型|前沿资讯

全球播报:俄罗斯太平洋舰队完成战备突击检查

全球头条：河口口岸进口榴莲实现集装箱“一柜直达”

互动｜环旭电子：今年将量产SiC的功率模组

尕撒拉原唱_歌曲的歌词内容

全球新资讯：阿迪尔拉米姐弟恋_阿迪尔拉米

全球速递！航天科技：4月20日融资买入1046.07万元，融资融券余额5.67亿元

精选！石油焦商品报价动态（2023-04-20）

全球时讯：免费给大连人女足做技术指导，韩端：帮助中国女足义不容辞

亮相七年，怡心湖如何突出重围？

土耳其总统埃尔多安与苏丹冲突双方通电话-消息

股市早8点丨重要观点：五篇新沙牛微信

中国联通网上营业厅网官网_联通10155是什么-全球视点

斯科尔斯：利桑德罗缺阵确实是损失，但我们有两名经验丰富的中卫

我国连锁酒店客房总规模近553万间

今日精选：值机是什么意思_zj是什么意思

最新房屋征收公告！德州主城区又一棚户区改造全球快播报

科创板首批：ST紫晶和ST泽达将被实施重大违法强制退市_今日热搜

全球即时看！南国智库·财经观察｜专家解码：股票发行注册制下海南企业登陆资本市场有哪些机遇？

明码标价、不欺骗消费者多地发告诫书规范五一市场价格当前独家

杂音末来图片杂音未来恐怖图片

中国科学家精确测量！银河系“体重”算出来了世界快资讯

首针接种完成国产带状疱疹疫苗全国接种正式启动重点聚焦

华北制药(600812.SH)发布2022年业绩净亏损6.89亿元同比由盈转亏

KD也得给我当配角布克进攻侵略性拉满太阳能否击沉快船他是关键

环球热点！外汇局：人民币在跨境使用中占比上升有助降低货币错配风险

吴懿韬_吴懿世界看热讯

贵州三穗颇洞村田园变游园

曲阜：“沉浸式”国防教育树立家国情怀重点聚焦

昨日的雨下得有多大？132个雨量站达暴雨明后两天阵雨又来

纯棉卫衣会缩水吗纯棉的卫衣会缩水嘛-世界热头条

小伙多期票揽大乐透930万奖票险因泼水节损坏

山东临沭：精准开展信用修复助力优化营商环境

环球最资讯丨长城证券（002939）：4月20日该股均线系统呈多头排列状

四川高校本科专业新增69个撤销22个

环球通讯！世界速讯：北京檀翌教育：PR入门级教程，入行影视后期行业必学！-全球热议报道

环球今亮点！三力士: 关于召开2023年第二次临时股东大会通知的更正公告

世界微速讯：温格预测欧冠冠军看好AC米兰和曼城夺冠皇马防守偏弱

甘州区新墩镇：党群同心绘出美丽乡村春景图世界关注

明嘲宝马mini 小鹏汽车：欢迎鹏友们来吃冰淇淋焦点快报

环球焦点！比特兽对战官网在哪下载最新官方下载安装地址

“五一”酒店订单量大增酒店一线岗位人员紧缺-天天新视野

妙奇星球平民打工阵容怎么搭配妙奇星球平民打工阵容搭配技巧-世界看热讯

恐怖游戏《苦夜降临》已在Steam发售首周享八折优惠

全球滚动:国际电工开关是什么牌子国际电工开关官网

推特收数据费后遭微软(MSFT.US)“封杀” 马斯克扬言要起诉新要闻

“壮族三月三”临近广西歌圩摆擂台迎客来即时焦点

加强保险与科技融合，轻松筹科技赋能精准挖掘用户需求天天快播

根植沃土匠筑新境丨万科山河道焕新中原主城而来-热门

南安：白蚁侵袭千年古树多方联合“把脉问诊”

小说红楼梦中薛姨妈为何从不邀请贾府众人看戏？环球焦点

以球会友！中法少年以球为媒切磋交流每日信息

7.09GW！三峡集团2023年光伏组件、逆变器集采项目招标世界资讯

DC新片《闪电侠》确定引进国内待定档北美院线将于6月16日上映热推荐

世界微资讯！美银行业：美国经济疲软消费者开始拖欠信贷还款

绿茵生态：子公司休闲旅游项目一期已建成落地今日看点

养老走进企业摩根资产管理携手上海外服共话养老之道观点