AIGC, волна генерации контента пришла

Оригинал: Деловые знания Фудань

Источник изображения: сгенерировано Unbounded AI‌

Человеческую цивилизацию можно представить как совокупность записей отпечатков всей человеческой жизни. Итак, если существует сверхмозг, который усваивает все знания, записанные людьми, может ли он помочь нам создать более блестящую и богатую цивилизацию?

В декабре 2022 года AIGC, вошедшая в десятку лучших достижений в науке по версии журнала «Science», воплотит эту мечту в реальность. Полное название AIGC — AI-Generated Content, то есть генеративный ИИ, который использует технологию искусственного интеллекта для автоматического производства контента. Для AIGC 2022 год считается годом невероятного роста. ** AIGC можно назвать самым популярным и наполненным фантазиями направлением развития в области ИИ на сегодняшний день.Разработка AIGC породила взрывоопасные приложения, такие как помощники по письму, рисование ИИ, диалоговые роботы, цифровые люди и офис. программные помощники, которые формируются посредством взаимодействия человека с компьютером, новые парадигмы записи, обучения и воссоздания. ** Тогда возникает насущный вопрос: как AIGC будет стимулировать новую волну искусственного интеллекта?

Записывайте, учитесь и воссоздавайте

Герои не обязательно начинают снизу История OpenAI начинается с группы выскочек-предпринимателей, полных страха перед будущим искусственного интеллекта. Серия GPT подобна супермозгу, взращиваемому различными кормами, тщательно подготовленными OpenAI.

Модель GPT-2, созданная почти через три с половиной года после ее создания, является первой действительно репрезентативной работой OpenAI. GPT-2 содержит 1,5 миллиарда параметров, содержит 8 миллионов сообщений на форуме Reddit и в общей сложности 40 ГБ текста, демонстрируя возможность продолжать писать текст. Например, если ввести предложение во «Властелине колец», оно сгенерирует продолжение, в котором невозможно различить правду и ложь, а сюжет отличается от оригинала, но выглядит логичным.

OpenAI отчаянно хотел узнать, какими возможностями обладал бы этот супермозг, если бы мог съесть больше корпуса, поэтому родился GPT-3 со 175 миллиардами параметров. Одно только обучение GPT-3 стоит десятки миллионов долларов.Эксперты загружают модель сотнями миллиардов английских слов, включая новости, посты, полнотекстовые книги и различные веб-страницы, собранные с 60 миллионов доменных имен за последние 12 лет. . На этот раз GPT-3 не только обладает более мощной способностью генерации языка, но также обладает отличной способностью к контекстному обучению и большим знанием мира.Он умеет писать стихи, писать новостные репортажи, отвечать на вопросы и писать код. Последний GPT-4 имеет более мощные возможности обработки и понимания данных: он может принимать и генерировать текст из 25 000 слов, что в 8 раз больше, чем у предыдущего ChatGPT.

Кроме того, его способности к логическому мышлению и способности к пониманию образов также значительно улучшились. OpenAI, возможно, является самым последовательным практиком парадигмы записи, обучения и воссоздания ИИ. Согласно предположениям Эдинбургского университета и Института искусственного интеллекта Аллена, от GPT-3 до GPT-3.5 и GPT-4 OpenAI внутри себя перерабатывал несколько версий. **ChatGPT выполняет точную настройку инструкций на основе обучения с подкреплением обратной связи от человека и улучшает четыре способности: подробный ответ, честный ответ, отклонение неуместных вопросов и отклонение вопросов, выходящих за рамки его знаний, за счет значительного снижения способности к контекстному обучению. **

AIGC в пути

В дополнение к технологии генерации языка, представленной ChatGPT, AIGC также включает в себя генерацию изображений, генерацию видео, генерацию аудио и т. д. Длительный процесс разработки AIGC, согласно «Белой книге AIGC», выпущенной Китайской академией информационных и коммуникационных технологий, можно условно разделить на следующие три этапа:

**Ранняя зародышевая стадия (1950–1990-е годы): **Ограниченный уровнем технологии, AIGC ограничивается мелкомасштабными экспериментами, а генерируемый контент не очень реалистичен. В 1957 году Леджарен Хиллер и Леонард Исааксон завершили первую в истории компьютерную музыкальную композицию, изменив управляющие переменные в компьютерной программе на музыкальные ноты — Струнный квартет «Сюита Ильяка». В 1966 году Джозеф Вейценбаум (Joseph Weizenbaum) и Кеннет Колби (Kenneth Colby) совместно разработали первого в мире робота «Элиза» (Eliza), который использует сканирование ключевых слов и рекомбинацию для выполнения интерактивных миссий. В середине 1980-х IBM создала пишущую машинку с голосовым управлением «Тангора» на основе модели скрытой цепи Маркова, способную обрабатывать 20 000 слов. На этом этапе AIGC генерируется только путем изучения правил, написанных экспертами, и его способность к обобщению крайне ограничена, как марионетка, которую играют эксперты.

**Этап накопления наносов (1990-е-2010-е гг.): **АИГК постепенно перешел от экспериментального к практическому. Основные прорывы были сделаны в алгоритмах глубокого обучения, графических процессорах (GPU), тензорных процессорах (TPU) и масштабировании обучающих данных. В 2007 году система искусственного интеллекта, собранная исследователем искусственного интеллекта Нью-Йоркского университета Россом Гудвином (Ross Goodwin), написала первое в мире создание полностью искусственного интеллекта, записав и восприняв увиденное и услышанное во время дорожного путешествия. . В 2012 году Microsoft публично продемонстрировала полностью автоматическую систему синхронного перевода.С помощью глубокой нейронной сети (DNN) контент англоговорящих может автоматически преобразовываться в китайскую речь с помощью распознавания речи, языкового перевода, синтеза речи и других технологий. На этом этапе AIGC начал автоматически изучать небольшой объем данных, записанных людьми, и освоил определенную способность к обобщению, но, ограниченный узким местом алгоритма, эффект генерации необходимо улучшить. В это время AIGC похож на хорошо подражающего попугая, который вроде бы порядочный, но ничего не знает.

**Стадия быстрой разработки (с 2010-х по настоящее время):**С 2014 года, с введением генеративных алгоритмов глубокого обучения и быстрым расширением масштаба обучающих данных, эффект контента, созданного AIGC, постепенно стал настолько реалистичным, что его трудно оценить. людей различать. В 2017 году девушка с искусственным интеллектом Microsoft «Сяобин» выпустила первый в мире сборник стихов «Солнечный свет потерял стеклянное окно», полностью созданный с помощью искусственного интеллекта. В 2018 году модель StyleGAN, выпущенная Nvidia, может автоматически генерировать картинки, и генерируемые ею картинки высокого разрешения практически не различимы человеческим глазом. В 2021 году OpenAI запустила DALL-E, а год спустя выпустила обновленную версию DALL-E-2.Пользователям нужно только ввести короткий описательный текст, и DALL-E-2 может создавать соответствующие мультфильмы чрезвычайно высокого качества, реалистичные, абстрактные. и другие стили живописи. В июле 2022 года был выпущен инструмент для рисования с искусственным интеллектом с открытым исходным кодом Stable Diffusion, позволяющий обычным людям создавать работы на уровне профессионального художника. В августе того же года художественная работа под названием «Космический оперный театр» получила первый приз на Ярмарке штата Колорадо в США Эта работа была сделана ИИ. Такие модели, как Make-A-Video, Imagen Video и Phenaki, выпущенные позже, могут генерировать видео с текстовыми описаниями. ** 30 ноября 2022 года компания OpenAI выпустила чат-робота ChatGPT.На данный момент эра AIGC полностью открыта, и генерируемый контент процветает. **

Топливо для данных

После почти 70 лет технологического осадко AIGC стала важной формой индустрии искусственного интеллекта. В 2022 году исследователи из Google опубликовали статью под названием «Новые возможности больших языковых моделей» и обнаружили, что, когда языковая модель слишком велика, чтобы превысить определенное критическое значение, появятся возможности, которых нет у более мелких моделей. ** В последние годы замечательные достижения технологий крупномасштабных моделей, представленных GPT-4 и ChatGPT, показали, что увеличение масштаба моделей и данных является эффективным способом преодоления узких мест существующих технологий.

Модели ИИ увеличиваются в размерах, в основном для того, чтобы вместить больше данных, однако высококачественные данные, записанные людьми, могут быть исчерпаны в ближайшем будущем. Epoch, организация, занимающаяся исследованиями и прогнозированием искусственного интеллекта, в нерецензируемой статье предсказала, что высококачественные текстовые данные, некачественные текстовые данные и данные изображений будут искусственно обрабатываться в 2023–2027, 2030–2050 и 2030 годах. -2070 соответственно Интеллект истощен.

В то время синтез данных на основе AIGC станет новым топливом для искусственного интеллекта. В настоящее время на данные, генерируемые искусственным интеллектом, приходится менее 1% всех данных.**По прогнозу консалтинговой фирмы Gartner (Гартнер), к 2025 году на данные, генерируемые искусственным интеллектом, будет приходиться 10% всех данных. данные. ** Таким образом, скорейшее создание полной промышленной экологии AIGC, позволяющей пользователям активно взаимодействовать с AIGC для генерации данных, тем самым формируя маховик данных, будет и впредь способствовать развитию технологий искусственного интеллекта.

Заглядывая в будущее, AIGC для науки может стать глубоководной областью и новым основным полем битвы для применения технологий искусственного интеллекта, то есть «искусственный интеллект открывает будущее научных исследований». **В прошлом дивиденды данных интернет-компаний были исчерпаны, но в научной сфере накоплено большое количество экспериментальных данных. Накормив 280 миллионов последовательностей аминокислот, стартап из Беркли, Калифорния, позволил модели выучить язык белков, впервые осуществив синтез новых белков с нуля. Инновации, которые AIGC привносит в науку, находятся в самом разгаре. ** Прогнозируется, что к 2025 году более 30% лекарств и материалов будут обнаружены с помощью AIGC. **

В будущем люди будут связаны с AIGC, чтобы сформировать симбиоз создания контента и открытия знаний, но все глубоко укоренившиеся вещи людей не будут изменены ИИ. Генеральный директор OpenAI Сэм Альтман (Sam Altman) однажды предвидел: **Как человеческие существа, мы по-прежнему обращаем внимание на взаимодействие между людьми, механизм вознаграждения человеческого мозга не изменился, мы по-прежнему стремимся к счастью и имеем желание творить. стремление к соперничеству, желание создать семью... То, что заботило людей 50 000 лет назад, будет заботить людей сто лет спустя. **

Сэм Альтман также сказал, что популярность ChatGPT заставляет всех чувствовать, что AGI (общий искусственный интеллект) кажется нам ближе, но на самом деле большая языковая модель, подобная ChatGPT, все еще очень далека от AGI, и у нас все еще есть долгий путь в будущем. Между изменением и неизменностью наступила волна, запущенная AIGC.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить