target allocator missing default value for scrape settings for prometheusCR #1106

seankhliao · 2022-09-16T22:11:16Z

Repo with reproducer: https://github.com/seankhliao/testrepo0032

Target Allocator: 0.1.0 and main
Operator: 0.60.0
Collector: 0.60.0

When creating jobs/scrape targets from ServiceMonitors, the target allocator doesn't produce values for:

__scrape_interval__
__scrape_timeout__
__scheme__
__metrics_path__
maybe also __param_*

When the prometheusreceiver reads the HTTP SD configs, it produces errors like the below for __scrape_*,
"target": "//a.b.c.d:port", "error": "Get \"//a.b.c.d:port\": unsupported protocol scheme \"\"" for missing scheme, and 404s (or other invalid input) for missing paths:

2022-09-16T16:59:39.911Z	error	scrape/scrape.go:488	Creating target failed	{"kind": "receiver", "name": "prometheus", "pipeline": "metrics", "scrape_pool": "/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets", "error": "instance 0 in group http://ta-test-targetallocator/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets?collector_id=ta-test-collector-0:1: scrape interval cannot be 0", "errorVerbose": "scrape interval cannot be 0\ngh.neting.cc/prometheus/prometheus/scrape.PopulateLabels\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:446\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:504\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571\ninstance 0 in group http://ta-test-targetallocator/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets?collector_id=ta-test-collector-0:1\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:506\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571"}
github.com/prometheus/prometheus/scrape.(*scrapePool).Sync
	github.com/prometheus/prometheus@v0.38.0/scrape/scrape.go:488
github.com/prometheus/prometheus/scrape.(*Manager).reload.func1
	github.com/prometheus/prometheus@v0.38.0/scrape/manager.go:222
2022-09-16T16:59:39.911Z	error	scrape/scrape.go:488	Creating target failed	{"kind": "receiver", "name": "prometheus", "pipeline": "metrics", "scrape_pool": "/jobs/dummy/targets", "error": "instance 0 in group http://ta-test-targetallocator/jobs/dummy/targets?collector_id=ta-test-collector-0:0: scrape interval cannot be 0", "errorVerbose": "scrape interval cannot be 0\ngh.neting.cc/prometheus/prometheus/scrape.PopulateLabels\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:446\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:504\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571\ninstance 0 in group http://ta-test-targetallocator/jobs/dummy/targets?collector_id=ta-test-collector-0:0\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:506\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571"}
github.com/prometheus/prometheus/scrape.(*scrapePool).Sync
	github.com/prometheus/prometheus@v0.38.0/scrape/scrape.go:488
github.com/prometheus/prometheus/scrape.(*Manager).reload.func1
	github.com/prometheus/prometheus@v0.38.0/scrape/manager.go:222
2022-09-16T16:59:39.911Z	error	scrape/scrape.go:488	Creating target failed	{"kind": "receiver", "name": "prometheus", "pipeline": "metrics", "scrape_pool": "/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets", "error": "instance 0 in group http://ta-test-targetallocator/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets?collector_id=ta-test-collector-0:0: scrape interval cannot be 0", "errorVerbose": "scrape interval cannot be 0\ngh.neting.cc/prometheus/prometheus/scrape.PopulateLabels\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:446\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:504\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571\ninstance 0 in group http://ta-test-targetallocator/jobs/serviceMonitor%2Fdefault%2Fsm-test%2F0/targets?collector_id=ta-test-collector-0:0\ngh.neting.cc/prometheus/prometheus/scrape.TargetsFromGroup\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/target.go:506\ngh.neting.cc/prometheus/prometheus/scrape.(*scrapePool).Sync\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/scrape.go:486\ngh.neting.cc/prometheus/prometheus/scrape.(*Manager).reload.func1\n\tgh.neting.cc/prometheus/prometheus@v0.38.0/scrape/manager.go:222\nruntime.goexit\n\truntime/asm_amd64.s:1571"}
github.com/prometheus/prometheus/scrape.(*scrapePool).Sync
	github.com/prometheus/prometheus@v0.38.0/scrape/scrape.go:488
github.com/prometheus/prometheus/scrape.(*Manager).reload.func1
	github.com/prometheus/prometheus@v0.38.0/scrape/manager.go:222

Initial report in slack: https://cloud-native.slack.com/archives/C033BJ8BASU/p1663327567933649

The text was updated successfully, but these errors were encountered:

jaronoff97 · 2022-09-17T16:16:49Z

Thanks for reporting this! I can look in to the fix here.

jaronoff97 · 2022-09-19T17:52:33Z

Alright, I began looking in to this and was able to reproduce this in my development cluster. The issue appears to be that the target allocator returns linkJSON which solely contains a link for the http_sd job. When this is used, no scrape interval (or other configuration) is set. Another bug I discovered is the scrape name is set to be the LinkJSON rather than the key to the map (the job name.)

I think the fix will require two changes:

One in the target allocator that returns the job config as part of the jobs endpoint
- We will need to include relabel config, scrape interval, scrape timeout, i'm not sure anything else
One in the collector to read this config to construct the expected job from that scrape configuration

I can take both fixes. For the target allocator PR, we are going to need to include some of this information (relabel_config) in the job we set. I believe this is a good opportunity for us to change some of the internal models of the TA which currently make it more difficult to bubble up this information via http. Doing so will set us up for success for #1064

yuriolisa assigned jaronoff97 Sep 18, 2022

pavolloffay added the area:target-allocator Issues for target-allocator label Sep 20, 2022

pavolloffay closed this as completed in #1124 Oct 4, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

target allocator missing default value for scrape settings for prometheusCR #1106

target allocator missing default value for scrape settings for prometheusCR #1106

seankhliao commented Sep 16, 2022

jaronoff97 commented Sep 17, 2022

jaronoff97 commented Sep 19, 2022

target allocator missing default value for scrape settings for prometheusCR #1106

target allocator missing default value for scrape settings for prometheusCR #1106

Comments

seankhliao commented Sep 16, 2022

jaronoff97 commented Sep 17, 2022

jaronoff97 commented Sep 19, 2022