1 месяц назад 23 декабря 2024 в 2:15 7882

Согласно недавнему сообщению в The Wall Street Journal, разработка крупной языковой модели следующего поколения OpenAI, GPT-5, отстает от графика, а достигнутые результаты пока не оправдывают ожиданий, связанных со значительными затратами.

Эта новость согласуется с предыдущим отчетом The Information, который намекнул, что OpenAI может искать новые стратегии, поскольку GPT-5 под кодовым названием «Орион», возможно, не сможет достичь значительного скачка производительности, который наблюдался в предыдущих моделях.

В отчете Wall Street Journal приводятся дополнительные подробности 18-месячного процесса разработки проекта «Орион». В нем говорится, что OpenAI провела как минимум две масштабные тренировки, направленные на повышение производительности модели за счет массивной обработки данных. Однако первая тренировка прошла медленнее, чем ожидалось, что говорит о том, что даже более масштабные тренировки потребуют значительного времени и ресурсов.

Хотя в отчете говорится, что производительность GPT-5 превосходит ее предшественницу, уровень достигнутого прогресса пока не оправдывает огромных затрат, необходимых для поддержания работы этой модели.

Помимо использования общедоступных данных и лицензионных соглашений, в отчете сообщается, что OpenAI нанимает персонал для создания совершенно новых наборов данных путем написания кода или решения математических задач. В процессе разработки GPT-5 компания также использует синтетические данные, сгенерированные другой ее моделью, o1.

На момент написания статьи OpenAI еще не отреагировала на эти сообщения. Ранее компания заявляла, что не выпустит модель «Орион» в этом году.

Никто не прокомментировал материал. Есть мысли?