Нейросети провалили работу в офисе и показали отвратительные результаты
Можете не беспокоиться, нейросети точно не заберут вашу работу в офисе. Пока что.
На фоне новостей о том, что искусственный интеллект скоро заберет работу у человечества, эксперты создали виртуальную IT-компанию, куда отправили работать ИИ-агентов. Там была реализована полноценная офисная среда: рабочий интерфейс, внутренние чаты, файловая система, график, задачи, отчёты и т.д.
«Сотрудниками» офиса стали современные ИИ-модели: GPT, Claude, Gemini, Nova Pro и LLaMA.
Результаты оказались просто отвратительными. Лучше всех с работой справился Claude, завершив аж 24% всех задач и тратя при этом по шесть долларов на каждую задачу. Худший результат показал Nova Pro — он вообще выполнил только 1,7% задач.
Из интересного:
— Один из сотрудников не нашёл нужного коллегу в рабочем чате и просто переименовал другого пользователя, будто это и был нужный человек — и продолжил с ним работу;
— Другой ИИ-агент не справился с рабочей задачей, но отметил её как завершённую, надеясь, что никто не заметит;
— Ещё один сотрудник не смог закрыть всплывающее окно (да, просто не додумался нажать на крестик «X»). Из-за этого у него никак не получалось открыть нужные файлы. Что он сделал? Правильно — пожаловался на это HR-менеджеру, который порекомендовал обратиться к айтишникам, чтобы те решили эту проблему.
Что в итоге? ИИ-агенты демонстрируют отсутствие здравого смысла, имеют плохие социальные навыки, практически не умеют ориентироваться в рабочей среде и никогда не признаются, что ничего не поняли.