ИИ как платформа: какие перспективы уже показала технология машинного обучения
Иллюстрация Getty Images Накал страстей вокруг свежих достижений ИИ дошел до появления писем, подписанных исследователями и бизнесменами, требующими прервать дальнейшую разработку больших языковых моделей. Стали раздаваться и более радикальные призывы, вплоть до необходимости быть готовыми бомбить дата-центры. Что же такого произошло, что взбудоражило мировую общественность? В колонке для Forbes рассказывает директор по стратегическому маркетингу «Яндекса» Андрей Себрант
Содержание:
«Т9 на стероидах»
В I квартале 2023 года тема продуктов на основе больших языковых моделей заслуженно лидировала не только в околотехнологической прессе, но и во вполне массовых изданиях. Даже в наше быстрое время ни одно приложение не набирало 100 млн ежемесячных пользователей за два месяца с момента запуска и без массовой рекламы. Еще недавно примером взрывного роста считался TikTok, набравший такое количество пользователей за девять месяцев, и его рост объясняли социальным характером приложения. Но ChatGPT совсем не социальная сеть или молодежная забава (хотя при желании его и к этому можно приспособить), это просто возможность поговорить с компьютерным алгоритмом. Вдруг оказалось, что такая возможность заворожила десятки миллионов далеких от компьютерной техники людей. И процесс не думает останавливаться.
Эта свежая волна интереса к возможностям нейронных сетей обусловлена достижениями класса алгоритмов, называемого «большие языковые модели». Важное слово здесь — «языковые». Для нас язык — это очень компактный способ отображения и описания богатства внешнего и внутреннего мира, эффективного кодирования куда более сложной сущности: нашей жизни и окружающего мира. Для языковых же моделей за языком не существует вообще ничего просто по определению. Сложнейшая изощренная статистика словоупотребления, приправленная местами случайностью, — вот суть языковых моделей, никаких сущностей вне языка в них не заложено. Циничное высказывание одного специалиста «ChatGPT — это Т9 на стероидах» технически корректно, если не задумываться о ядерной мощи тех стероидов. Но ни магии, ни места для самозарождения сознания в этих моделях нет.
Второй пилот
Первый квартал 2023 года примечателен не только взлетом ChatGPT. Куда интереснее и серьезнее с точки зрения последствий для всех нас факт очень быстрой интеграции возможностей больших языковых моделей как в массовые, так и в профессиональные онлайновые сервисы. Несколько неожиданно законодателем моды здесь выступила Microsoft. Именно там нашли точную метафору, описывающую роль ИИ-продуктов: copilot (второй пилот). Компетентный и неутомимый напарник, которого можно попросить взять на себя управление каким-то процессом, обсудить ситуацию, доделать что-то скучное, — вполне понятная роль.
Прежде всего нам предложили «второго пилота» для путешествий по интернету, как выразился один из журналистов, «постпоисковую модель интернета». Возможности ChatGPT встроили как в поисковик Bing, так и в браузер Edge. Они позволили быстрее получать решение пользовательской задачи в некоторых поисковых сценариях, например стало возможным быстро получить реферат длинного опубликованного материала.
Конечно, ни Bing, ни Edge не являются лидерами в своих нишах. Но в Google с его популярнейшим в мире поиском и самым распространенным браузером Chrome не собираются безучастно наблюдать за мощным рывком Microsoft, тем более что именно в Google разработаны первые большие языковые модели и имеются все необходимые аппаратные и человеческие ресурсы для их обучения.
Языки программирования — тоже языки. Поэтому неудивительно, что большие языковые модели и с ними научились работать: они оказались способны выдавать работоспособный код, а не только осмысленный текст на человеческих языках. В итоге «второй пилот» смог разгрузить многих программистов от рутинных, но отнимающих время элементов их работы.
Офисный пакет Office 365 опять же в значительной степени про работу с языком, словами и формулами. Поэтому и здесь оказалось возможным много чего отдать «второму пилоту», Microsoft это с успехом и продемонстрировал.
В итоге в ближайшие месяцы появление функций ИИ в продуктах, которыми уже пользуются миллиарды людей, сформирует в мировом масштабе новые привычки в работе с цифровыми сервисами.
Простота общения
Год 2023-й будет знаменит не только взрывным прогрессом ChatGPT и подобных продуктов вширь, то есть колоссальным масштабом аудиторий. Еще важнее прогресс вглубь. Уже в первом квартале произошло как минимум три важных события.
Во-первых, OpenAI объявила о запуске плагинов к своему сервису, а это означает, что всего через несколько месяцев после старта ChatGPT превратился в платформу. Ярким примером важности и мощи сторонних плагинов служит разработка известного математического сервиса Wolfram. У чисто языковой модели неизбежно возникают проблемы даже с арифметикой, не говоря уже о более сложной математике или работе с данными. Но если для математической части ответа на вопрос или выполняемого задания ChatGPT самостоятельно и прозрачно для пользователя обратится к Wolfram, качество и надежность ответа резко улучшатся, а значит, и расширится сфера применения.
Столь же универсально полезным оказывается и появление у ChatGPT браузера и возможности по запросу самостоятельно работать с актуальными ссылками в интернете, а для миллионов узкоспециальных задач разработчики напишут миллионы плагинов; любой пользователь магазина приложений на мобильной платформе на собственном опыте отлично знает колоссальную мощь платформ. Кстати, популярная платформа — это хорошая и устойчивая бизнес-модель, а хорошая монетизация — залог дальнейшего развития и процветания ChatGPT и, возможно, его сильнейших конкурентов, которые тоже сумеют стать платформами.
подпишитесь на нас в Telegram
Во-вторых, появились работы, демонстрирующие возможность мультимодального взаимодействия с языковыми моделями. В этом случае запрос может формулироваться картинкой, а иметь ассистента, способного видеть и понимать окружающий мир, полезнее, чем просто начитанного, но незрячего помощника.
В-третьих, были продемонстрированы не просто мультимодальные модели, но модели, реализованные во вполне материальных физических объектах (термин embodiment еще ждет своего адекватного перевода). В этом случае толковый и зрячий помощник обретает тело, речь идет о создании роботов, очень похожих на тех, которых любили описывать фантасты. Им можно не отдавать конкретные команды из конечного списка, а формулировать задачи, решение которых требует смекалки, знаний и взаимодействия с материальным миром. И, конечно же, способности учиться новому. Впечатляющие прототипы таких устройств, работающих в домашней среде на основе языковых моделей, уже существуют.
Первые месяцы 2023 года показали, что в какой бы области деятельности люди ни попробовали ChatGPT, они быстро находили возможности применения. Студенты и преподаватели, врачи и менеджеры, юристы и журналисты и много кто еще обнаружили, что теперь можно по-другому организовать свою работу, и многих это шокировало: никогда раньше колоссальная мощь технологий машинного обучения не являла себя народу таким наглядным и впечатляющим образом.
Человечество не первый раз сталкивается с технологическими прорывами, разве что реакция каждый раз требуется все более быстрая. Именно поэтому 2023 год (и, возможно, сколько-то последующих) станет периодом активной адаптации. Мы будем наблюдать, как ИИ-продукты меняют нашу работу, бизнес и досуг, как регуляторы удерживают процесс в рамках этики и закона, как мошенники пытаются по-новому нас обмануть. Впрочем, на этот раз именно благодаря простоте работы с новыми технологиями почти каждый сможет не только наблюдать за изменениями, но и самостоятельно развивать свое общение с цифровым миром.
Мнение редакции может не совпадать с точкой зрения автора