AIGC,內容生成巨浪已來

原文:復旦商業知識

圖片來源:由無界AI‌ 生成

人類文明可以被認為是全人類生活印記的記錄總和。那麼,如果有一個超級大腦學習了人類記錄下的全部知識,是否可以幫助我們創作出更燦爛豐富的文明?

2022年12月,入選《科學》雜誌年度科學十大突破的AIGC,將這一夢想照進了現實。 AIGC全稱為AI-Generated Content,即生成式AI,利用人工智能技術來自動生產內容。對AIGC來說,2022年被認為是其發展速度驚人的一年。 **AIGC可以說是當今AI領域最火爆和充滿幻想的發展方向,AIGC的發展催生了寫作助手、AI繪畫、對話機器人、數字人、辦公室軟件助理等爆款級應用,並通過人機交互形成了新的記錄、學習和再創作範式。 **一個引人注目的問題隨之浮現:AIGC會如何助推新的人工智能浪潮?

記錄、學習和再創作

英雄未必起於微末,OpenAI的故事起於一群對人工智能的未來充滿恐懼的創業新貴。 GPT系列就像OpenAI精心準備的各種飼料所培育出的超級大腦。

成立近三年半後才打造出的GPT-2模型是OpenAI第一個真正意義上的代表作。 GPT-2包含15億參數,以800萬篇Reddit論壇帖子、總計40GB文本為食,顯現出文本續寫的能力。比如輸入《指環王》中的句子,它會生成讓人無法分辨真假、劇情和原著不同,但看上去符合邏輯的續文。

OpenAI瘋狂地想知道要是能吃下更多的語料,這個超級大腦會擁有何種能力,於是擁有1750億參數的GPT-3橫空出世。 GPT-3光訓練就消耗數千萬美元,專家們把此前12年從6000萬個域名中收集的新聞報導、帖子、書籍全文以及各種網頁等數千億個單詞的英文資料統統餵進模型。這次GPT-3不光具備了更強大的語言生成能力,還額外掌握了出色的上下文學習能力和大量的世界知識,寫詩歌、寫新聞報導、回答問題、編寫代碼樣樣精通。而最新的GPT-4的數據處理、理解能力更強,它可以接收並生成25000字的文本,是之前ChatGPT的8倍。

另外,它的邏輯思考能力、圖像理解能力也有了非常大的飛躍。 OpenAI可能是人工智能記錄、學習和再創作這一範式最堅定的踐行者。根據愛丁堡大學與艾倫人工智能研究院推測,從GPT-3到GPT-3.5再到GPT-4,OpenAI內部就已經迭代了多個版本。 **ChatGPT基於人類反饋的強化學習進行指令微調,通過大幅下調上下文學習能力而提升了翔實的回應、公正的回應、拒絕不當問題、拒絕其知識範圍之外的問題四種能力。 **

一路走來的AIGC

除了以ChatGPT為代表的語言生成技術之外,AIGC還包含了圖像生成、視頻生成、音頻生成等。 AIGC漫長的發展歷程,根據中國信通院發布的《AIGC白皮書》,可大致分為以下三個階段:

**早期萌芽階段(20世紀50—90年代):**受限於科技水平,AIGC僅限於小範圍實驗,生成的內容真實感不強。 1957年,萊杰倫·希勒(Lejaren Hiller) 和倫納德·艾薩克森(Leonard Isaacson)通過將計算機程序中的控制變量改為音符,完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲》。 1966年,約瑟夫·韋岑鮑姆(Joseph Weizenbaum)和肯尼斯·科爾比(Kenneth Colby) 共同開發了世界上第一個機器人“伊莉莎”(Eliza),其通過關鍵字掃描和重組來完成交互式任務。 80年代中期,IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉”(Tangora),能夠處理兩萬個單詞。在這一階段,AIGC僅通過學習專家編寫規則進行生成,泛化能力極其有限,就像專家手中擺弄的提線木偶。

**沉積積累階段(20世紀90年代—21世紀10年代):**AIGC從實驗性向實用性逐漸轉變。深度學習算法、圖形處理單元(GPU)、張量處理器(TPU) 和訓練數據規模等都取得了較大突破。 2007年,紐約大學人工智能研究員羅斯·古德溫(Ross Goodwin)裝配的人工智能係統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智能創作的小說——1 The Road。 2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網絡(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。在這一階段,AIGC開始自動學習人類記錄的少量數據,掌握了一定泛化能力,但受到算法瓶頸的限制,生成效果有待提升。此時的AIGC就像一隻善於模仿的鸚鵡,看似像模像樣實則一竅不通。

**快速發展階段(21世紀10年代至今):**自2014年起, 隨著生成式深度學習算法的提出和訓練數據規模的飛速擴充, AIGC生成內容的效果逐漸逼真直至人類難以分辨。 2017年, 微軟人工智能少女“小冰”推出了世界首部完全由人工智能創作的詩集《陽光失了玻璃窗》。 2018年, 英偉達發布的StyleGAN模型可以自動生成圖片, 其生成的高分辨率圖片人眼難以分辨真假。 2021年, OpenAI推出了DALL-E並於一年後推出了升級版本DALL-E-2, 用戶只需輸入簡短的描述性文字, DALL-E-2即可創作出相應極高質量的卡通、寫實、抽像等風格的繪畫作品。 2022年7月,開源AI繪畫工具Stable Diffusion發布,使普通人也能創作專業畫師級別的作品。同年8月,一幅名為《太空歌劇院》的美術作品在美國科羅拉多州博覽會上獲得一等獎,這幅作品正是出自AI之手。隨後發布的Make-A-Video、Imagen Video和Phenaki等模型更是能以文字描述生成視頻。 **2022年11月30日,OpenAI發布對話機器人ChatGPT,至此AIGC時代全面開啟,生成內容百花齊放。 **

數據燃料

歷經近七十年的技術沉澱,AIGC已成為人工智能產業落地的重要形式。 2022年谷歌的研究者發表了題為《大型語言模型的湧現能力》的論文,發現**當語言模型大到超過特定的臨界值,就會湧現出較小的模型不具備的能力。 **近年來,以GPT-4、ChatGPT為代表的大模型技術所取得的顯著成果表明,增大模型規模和數據規模是突破現有技術瓶頸行之有效的方法。

人工智能模型規模越來越大,本質上是為了容納更多的數據,然而人類記錄的高質量數據可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經同行評審的論文中預測,高質量文本數據、低質量文本數據、圖片數據分別會在2023—2027年、2030—2050年以及2030—2070年被人工智能耗盡。

屆時,基於AIGC的數據合成將成為人工智能新的燃料。目前由人工智能生成的數據佔所有數據的1%不到,**根據諮詢公司高德納(Gartner)預測,到2025年,人工智能生成數據將佔所有數據的10%。 **因此,儘早建立完整的AIGC產業生態,讓用戶主動與AIGC交互生成數據,從而形成數據飛輪,將持續推動人工智能技術的進步。

放眼未來,**人工智能驅動的科學研究(AIGC for science)可能會成為人工智能技術落地的深水區與新的主戰場,即“人工智能開啟未來的科研”。 **過去互聯網公司的數據紅利已經耗盡,但在科學領域積累了海量的實驗數據。在投餵了2.8億種氨基酸序列後,加州伯克利的一家初創公司讓模型學會了蛋白質的語言,首次實現從零合成全新蛋白。 AIGC帶給科學領域的創新方興未艾。 **據預測, 到2025年, 超過30%的藥物和材料將藉助AIGC被發現。 **

人類未來將與AIGC鏈接形成內容創作與知識發現的共生體,但所有人類深層次的東西都不會被AI改變。 OpenAI首席執行官山姆·阿爾特曼(Sam Altman)曾這樣展望:**作為人類,我們依然注重人與人之間的互動聯繫,人類大腦的獎勵機制沒有變,我們依然追求快樂,擁有創造慾和競爭欲,渴望組建家庭……五萬年前人類在意的東西,一百年後的人類也會在意。 **

山姆·阿爾特曼還表示,ChatGPT的火爆讓大家覺得AGI(通用人工智能)似乎離我們近了一些,但實際上類似於ChatGPT這種大語言模型仍距離AGI十分遙遠,未來我們還有很長的路要走。在變與不變之間,AIGC掀起的浪潮已然來臨。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate.io APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)