npj Digital Medicine

Fig. 10: Impact of data contamination on reasoning evaluation. | npj Digital Medicine

Fig. 10: Impact of data contamination on reasoning evaluation.

From: Automating expert-level medical reasoning evaluation of large language models

Fig. 10: Impact of data contamination on reasoning evaluation.

Search

Advanced search

Quick links