Как этот проект делается ИИ-агентами

Стоит сказать прямо, потому что это тоже часть ответа на вопрос, который сам проект исследует — «что значит быть оператором ИИ»: сайт, который вы читаете, и ресерч под ним не написаны одним человеком за один проход. Их делает один основатель Mars IT School, который ставит задачи и держит ответственность за результат, и несколько ИИ-агентов, которые выполняют исследовательскую и инженерную работу. Эта заметка заменяет собой мета-раздел прошлой версии сайта (agents.html и «Рефлексию ИИ») — здесь то же самое, но честнее по итогам разбора, что не получилось в прошлый раз.

Как устроена работа

Основатель формулирует вопрос или задачу — не решение, а вопрос: что известно про провалы Humane и Rabbit, как устроена архитектура приложений, из чего складывается доверие независимой исследовательской лаборатории, чем «AI-slop» в дизайне отличается от осознанного выбора. Каждый вопрос уходит отдельному агенту с узкой зоной ответственности — так факт-чек одного блока не размывается фактами другого. Дальше агенты:

Делают ресерч — читают источники, проверяют цифры, фиксируют, где вывод — факт, а где гипотеза. Опубликованные на сегодня ресерчи: модель app / skill / agent для всей ОС, разбор рынка и конкурентов, жанр independent research lab и дизайн-крафт против «AI-slop». Два блока ресерча — партнёрский дек по железу и техническая основа внутреннего каталога — не публикуются: один содержит партнёрские условия, другой описывает внутренние системы Mars, не относящиеся к внешнему читателю.
Пишут спеки — переводят ресерч в конкретное архитектурное или дизайн-решение прежде, чем что-либо верстать: позиционирование, структуру сайта, дизайн-систему, список признаков, которых на сайте быть не должно.
Верстают — собирают страницы по утверждённой спеке и общей таблице стилей, не изобретая на ходу новые цвета, радиусы или анимации.
Проверяют друг друга — отдельный агент-верификатор сверяет готовую страницу с замеренными референсами через скриншоты, по рубрике из чек-листа «AI-slop», а не «на глаз нравится / не нравится».

Что не получилось в прошлый раз

Предыдущая версия сайта (разбор в соседней записи) прошла через тот же процесс — ресерч, спека, вёрстка, верификация — и всё равно вышла статистически усреднённым дизайном с абстрактными текстами вместо фактов ресерча. Причина оказалась не в отсутствии проверки, а в её слабости: у верификатора не было права провалить страницу и отправить её обратно. Он мог отметить несоответствия, но решение публиковать принималось независимо от его вердикта. На практике это превращало верификацию в формальность, которая подтверждает уже сделанную работу, а не ставит её под сомнение.

Второй сбой был тоньше: ресерч был точнее, чем страницы, которые из него выросли. Точные числа — сколько стоил Humane, по какой цене продаются планшеты конкурентов, что показывает регуляторика — существовали в ресерч-файлах, но на страницах растворялись в словах вроде «умно» и «безопасно», которые ничего не проверяют. Хороший ресерч сам по себе ничего не даёт, если между ним и читателем стоит слой абстрактного копирайта.

Что изменилось

Для текущей версии это дало два конкретных правила, а не общие пожелания: верификатор получил право провалить страницу целиком, и это стало частью процесса сборки, а не отдельным пожеланием после факта; и любой факт с числом из ресерча, у которого есть страница-получатель, должен оказаться на этой странице как число, а не как прилагательное. Это не гарантирует, что следующая версия не найдёт собственных слепых зон — но это конкретнее, чем «в следующий раз постараемся».

Разница между «купите» и «мы исследуем» — не смягчение тона, это единственный способ не соврать в фазе, где ответов ещё нет. То же верно и для разницы между «проверили» и «отметили замечания»: вторая формулировка ничего не гарантирует.