In meno di due anni già si parla di nuova rivoluzione dei chatbot di intelligenza artificiale rispetto alla loro accuratezza sulle materie scientifiche. Per la prima volta il nuovo modello o1 di OpenAI è diventato il primo modello linguistico di grandi dimensioni a battere ricercatori con dottorato di ricerca a un test che prevedeva una serie di domande molto complesse, chiamato Graduate-Level Google-Proof Q&A Benchmark (GPQA).