Fig. 1: Distribution of baseline irritability scores across large language models (LLMs) measured using three validated scales: the Brief Irritability Test (BITe), the Irritability Questionnaire (IRQ), and the Caprara Irritability Scale (CIS). | npj Digital Medicine

Fig. 1: Distribution of baseline irritability scores across large language models (LLMs) measured using three validated scales: the Brief Irritability Test (BITe), the Irritability Questionnaire (IRQ), and the Caprara Irritability Scale (CIS).

From: Assessing the impact of safety guardrails on large language models using irritability metrics

Search

Advanced search

Search

Quick links