В нее закачали 20 триллионов единиц информации (токенов), но дополнительно задействовали методологии тонкой настройки (SFT), а также обратную связь с человеком (RLHF), то есть применили самые современные приемы. Это не будет так быстро, как с DeepSeek, но это будет лучше. Неудивительно, что Qwen превзошла и существующие американские аналоги.
Alibaba не утверждает, что обучила сеть за копейки. Но дает понять: не так дорого, как американцы. Компания подробно рассказала, как именно учили. Что больше всего поразило экспертов в этом рассказе – оптимизация на каждом этапе. В результате для обучения (и потом для работы) требуется минимум вычислительных мощностей.
Продукт от Alibaba обошел DeepSeek во всех тестах (бенчмарках), на которых обычно испытывают возможности нейросети. Сеть оказалась лучше в точности ответов, скорости обработки данных и в адаптивности. Что немудрено: учили ее на совесть.
На самом деле создатели нейросетей давно соревнуются именно в обучении. Если верить американской Open AI, это очень дорого и долго. Так, на обучение следующего поколения GPT, GPT5, Open AI планирует потратить миллиард. Компании приобретают целые электростанции, чтобы запитывать центры обучения. А воровство контента где угодно (в Сети, в социальных сетях, даже в персональных данных) давно стало предметом споров и разбирательств. Но контент остро нужен, ведь ИИ требуются примеры, чтобы изучить жизнь людей.
DeepSeek потому стала великой нейросетью, что умудрилась обучиться всего за 5,5 миллионов долларов (впрочем, говорят, что в сумму не включили некоторые расходы; все равно дешево), а получилось в общем-то неплохо. Нейросеть точно не хуже GPT4, а обошлась в сотни раз дешевле.
Alibaba – это в Китае, как Open AI в США, компания давно и успешно создает сетки. Весной прошлого года на технологический горизонт Поднебесной ворвалась новая (создана в 2023-м) компания DeepSeek. На Западе появление первой версии их нейросети не заметили (а теперь кусают локти). А вот в Китае она нашумела. В той же Alibaba созывали совещания и антикризисные штабы. Молодежь нас обходит!
И вот новый поворот. Сеть от Alibaba рвет внутренний рынок, а вместе с DeepSeek они прямо-таки разделывают под орех рынок международный.
Вниз полетели акции западных ИИ-компаний, например, производитель чипов Nvidia потерял одномоментно 600 миллиардов долларов. Но беда (для Запада) не приходит одна. В первый день китайского нового года крупный ИИ-игрок Alibaba презентовал нейросеть Qwen 2.5 Max, и она еще мощнее. С такими темпами лидерство Китая становится неоспоримым.
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев