Fig. 2: Average response accuracy versus mean self-reported confidence across large language models. | npj Gut and Liver

Fig. 2: Average response accuracy versus mean self-reported confidence across large language models.

Search