https://developers.sber.ru/link/gc4msq !!!
Дисклеймер: я не датасаентист, но понимаю математику и физику процесса, потому мои знания скорее обобщенные, чем точные!!!
С декабря 2022 года примерно мир переживает новую пандемию – она называется в версии западных коллег GPT и ChatGPT. Лидером тут безоговорчно является суперзакрытая компания OpenAI.
Это алгоритмы, которые позволяют отвечать на человеко-понятные вопросы так, как отвечал бы человек абсолютного знания всего. Отдельные технологические скептики его опасаются также как и COVID-19, было даже официальное письмо от известных личностей с просьбой остановиться и сначала подготовиться – продумать архитектуру с точки зрения безопасности человека от влияния ИИ. Но это негативный кейс. А позитивный что же? Chat GPT и MidJourney позволяют генерировать программы, изображения, отвечать на конкретные вопросы по заданному контексту или информации в запросе, контексте - запросы в модели называют промптами. Мои коллеги дебажили написанный человеком код на предмет – "почему этот код не работает?". Это инструмент, который не заменяет людей, а расширяет их возможности и скорости рутинных операций.
Условно, раньше мы пытались на отдельные запросы-фразы искать подходящие смыслы и отвечать по заготовленным алгоритмам, теперь модель которая отвечает на вопросы это большой черный ящик, похожий на мозг животного, ближе конечно к приматовскому / человеческому, ибо слова и символы – высшие абстрактные сущности. Чуть ниже уровнем, хорошо научился понимать изображение и даже рисовать, а так же воспринимать на слух и говорить. Но! Искусственный интеллект еще плохо работает в области низкоуровневых операций – хождение, манипуляция предметами, управление внутренними органами, жизне-обеспечивающими системами и т.п. Это для ИИ область развития.
В мире больших языковых моделей самое важное это топология / размер нейросетей и обучающие данные. Чем больше настраиваемых параметров сети, тем больше знаний. Количество параметров сейчас варьируется от миллиардов до сотен миллиардов. Настройка этих параметров (чисел) это обучение. Знания специальным образом готовятся для обучения. Под ИИ собирают целые университеты одного студента, где сотни экспертов в разных областях готовят обучающие выборки для ИИ. Сам процесс обучения – это хитрый алгоритм подбора параметров, при которых модель может отвечать на вопросы по обучающей выборке. Обучение и работа. Обучение – «ооооочееееень дооооолгий» процесс, тк большое количество параметров тонко настраиваются и не один раз меняются. В обучении есть основной процесс обучения pretrain – когда относительно быстро достигаются наиболее вероятные параметры до заданного качества ответов (число, порядка например 92%), а также есть fine tuning – когда модель тонко и долго настраивают достигая уже 95-97%. Это сутки, недели и месяцы работы десятков / сотен GPU устройств, да-да, тех самых которыми мы играем на пекарнях и генерим биткоин. Работа нейросети, ответ на запрос срабатывает обычно за секунды, время за которое мы хотим и можем ждать, дольше нам уже не интересно, там и традиционный поиск справляется неплохо.
В России аналогичными алгоритмами исторически занимаются Сбер и Яндекс, и ряд других известных рядовым пользователям компаний и не очень.
И Яндекс и Сбер анонсировали свои модели еще весной.
Наша команда СберДевайсес (Сбер) выходила в закрытое тестирование с моделью GihaChat в мае-июне, получили первый опыт ушли в работы по улучшению качества. В конце июля начали возвращать доступы всем, кто приходил в мае. Сегодня мы открываемся на всех.
Итак, вашему вниманию, ГигаЧат – тут можно задавать ИИ от Сбера разные вопросы. Можно просить нарисовать, придумать, порекомендовать, сгенерировать идею, написать сочинение, реферат, ответить на специальные вопросы о литературных героях и исторических личностях и тп. Возможности ИИ будут расширяться. Впереди много вкусного)
Всем приятного и полезного опыта!
https://developers.sber.ru/link/gc4msq !!!
...https://developers.sber.ru/studio/login 😎
...Присоединяйтесь к ОК, чтобы посмотреть больше фото, видео и найти новых друзей.
Нет комментариев