У вихідні компанія Meta представила дві нові моделі штучного інтелекту під назвами Llama 4 – Scout і Maverick. Вони стверджують, що Maverick перевершує конкурентів у різних популярних тестах, таких як GPT-4o та Gemini 2.0 Flash. Проте виявилося, що статистика, яку Meta представила, може бути маркетинговим ходом, що може вводити користувачів в оману. У компанії Meta підкреслили успіх Maverick у рейтингу LMArena, але згодом виявилося, що тестувалася не публічна версія моделі, а експериментальний варіант, оптимізований для розмовної взаємодії. Це викликало незадоволення у користувачів та веде до оновлення правил на платформі LMArena. Компанія вирішила, що рейтинги, як LMArena, можуть стати менш значущими, якщо постачальники ШІ-моделей будуть надавати спеціально підготовлені версії для тестування, відмінні від тих, що доступні для загальної публіки.
