npj Digital Medicine

Fig. 2: Evaluation results on the AMEGA benchmark. | npj Digital Medicine

Fig. 2: Evaluation results on the AMEGA benchmark.

From: Autonomous medical evaluation for guideline adherence of large language models

Fig. 2

Search

Advanced search

Quick links