npj Digital Medicine

Fig. 2: Dataset statistics of MedThink-Bench. | npj Digital Medicine

Fig. 2: Dataset statistics of MedThink-Bench.

From: Automating expert-level medical reasoning evaluation of large language models

Fig. 2: Dataset statistics of MedThink-Bench.

Search

Advanced search

Quick links