Deze nieuwe benchmark zou de grootste zwakte van AI kunnen blootleggen
ARC-AGI-3 test of modellen door nieuwe problemen kunnen redeneren en niet alleen maar patronen kunnen herinneren, een taak waar zelfs topsystemen nog steeds moeite mee hebben. De invloedrijke AI re