npj Digital Medicine

Fig. 4: Alignment between human rater and LLM-based judge. | npj Digital Medicine

Fig. 4: Alignment between human rater and LLM-based judge.

From: Benchmarking large language models for personalized, biomarker-based health intervention recommendations

Fig. 4: Alignment between human rater and LLM-based judge.

Search

Advanced search

Quick links