AIGC ، لقد حان موجة توليد المحتوى

الأصل: Fudan Business Knowledge

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI‌

يمكن اعتبار الحضارة الإنسانية مجموع سجلات بصمات الحياة البشرية كلها. لذا ، إذا كان هناك عقل خارق يتعلم كل المعرفة التي سجلها البشر ، فهل يمكن أن يساعدنا في إنشاء حضارة أكثر إشراقًا وثراءً؟

في ديسمبر 2022 ، ستجعل AIGC ، التي تم اختيارها كواحدة من أفضل عشرة اختراقات علمية من قبل مجلة "Science" ، هذا الحلم حقيقة واقعة. الاسم الكامل لـ AIGC هو المحتوى الذي يتم إنشاؤه بواسطة AI ، أي الذكاء الاصطناعي التوليدي ، والذي يستخدم تقنية الذكاء الاصطناعي لإنتاج المحتوى تلقائيًا. بالنسبة إلى AIGC ، يعتبر عام 2022 عامًا من النمو المذهل. ** يمكن القول إن AIGC هو اتجاه التطوير الأكثر شعبية والمليء بالخيال في مجال الذكاء الاصطناعي اليوم. لقد أدى تطوير AIGC إلى ولادة تطبيقات متفجرة مثل مساعدي الكتابة ، والرسم بالذكاء الاصطناعي ، وروبوتات الحوار ، والبشر الرقميين ، والمكاتب مساعدي البرمجيات ، والتي يتم تشكيلها من خلال التفاعل بين الإنسان والحاسوب.نماذج جديدة للتسجيل والتعلم وإعادة الإنشاء. ** ثم يظهر سؤال مقنع: كيف ستعزز AIGC الموجة الجديدة من الذكاء الاصطناعي؟

التسجيل والتعلم وإعادة الإنشاء

لا يبدأ الأبطال بالضرورة من أشياء تافهة. تبدأ قصة OpenAI بمجموعة من رواد الأعمال المبتدئين الذين لديهم مخاوف بشأن مستقبل الذكاء الاصطناعي. تشبه سلسلة GPT دماغًا فائقًا يتم زراعته بواسطة العديد من الأعلاف التي أعدتها شركة OpenAI بعناية.

نموذج GPT-2 ، الذي تم إنشاؤه بعد ما يقرب من ثلاث سنوات ونصف من إنشائه ، هو أول عمل تمثيلي حقيقي لشركة OpenAI. يحتوي GPT-2 على 1.5 مليار معلمة ، ويتغذى على 8 ملايين مشاركة في منتدى Reddit ، وما مجموعه 40 جيجابايت من النص ، مما يُظهر القدرة على مواصلة كتابة النص. على سبيل المثال ، إذا أدخلت جملة في "The Lord of the Rings" ، فسيتم إنشاء استمرار يجعل من المستحيل التمييز بين الصواب والخطأ ، والحبكة مختلفة عن الأصل ، لكنها تبدو منطقية.

أراد OpenAI بشكل محموم معرفة نوع القدرات التي يمكن أن يمتلكها هذا الدماغ الخارق إذا كان بإمكانه أكل المزيد من الجسم ، لذلك ولدت GPT-3 مع 175 مليار متغير. يكلف تدريب GPT-3 وحده عشرات الملايين من الدولارات. يقوم الخبراء بتغذية النموذج بمئات المليارات من الكلمات الإنجليزية ، بما في ذلك التقارير الإخبارية والمنشورات والكتب ذات النصوص الكاملة وصفحات الويب المختلفة التي تم جمعها من 60 مليون اسم نطاق في السنوات الـ 12 الماضية. . هذه المرة ، لا تتمتع GPT-3 بقدرة أكثر قوة على توليد اللغة فحسب ، بل تتمتع أيضًا بقدرة ممتازة على تعلم السياق والكثير من المعرفة العالمية.إنها بارعة في كتابة الشعر وكتابة التقارير الإخبارية والإجابة على الأسئلة وكتابة التعليمات البرمجية. يحتوي أحدث إصدار من GPT-4 على إمكانات أقوى في معالجة البيانات وفهمها ، حيث يمكنه تلقي وإنشاء نص مكون من 25000 كلمة ، وهو ما يعادل 8 أضعاف مثيله في ChatGPT السابقة.

بالإضافة إلى ذلك ، فقد حققت قدرتها على التفكير المنطقي وقدرتها على فهم الصور قفزات كبيرة أيضًا. ربما يكون OpenAI هو الممارس الأكثر ثباتًا في نموذج تسجيل الذكاء الاصطناعي والتعلم وإعادة الإنشاء. وفقًا لتكهنات جامعة إدنبرة ومعهد ألين للذكاء الاصطناعي ، من GPT-3 إلى GPT-3.5 إلى GPT-4 ، قامت OpenAI بتكرار إصدارات متعددة داخليًا. ** يقوم ChatGPT بضبط التعليمات بناءً على التعلم المعزز للتغذية الراجعة البشرية ، ويحسن القدرات الأربع للاستجابة التفصيلية ، والاستجابة العادلة ، ورفض الأسئلة غير الملائمة ، ورفض الأسئلة خارج نطاق المعرفة عن طريق الحد بشكل كبير من القدرة على تعلم السياق. **

** AIGC على طول الطريق **

بالإضافة إلى تقنية إنشاء اللغة التي يمثلها ChatGPT ، تتضمن AIGC أيضًا إنشاء الصور وتوليد الفيديو وتوليد الصوت وما إلى ذلك. يمكن تقسيم عملية التطوير الطويلة لـ AIGC ، ** وفقًا لـ "الورقة البيضاء AIGC" الصادرة عن الأكاديمية الصينية لتكنولوجيا المعلومات والاتصالات ، تقريبًا إلى المراحل الثلاث التالية: **

** المرحلة الجنينية المبكرة (1950 - 1990): ** مقيدًا بمستوى التكنولوجيا ، AIGC مقصور على التجارب الصغيرة ، والمحتوى الناتج ليس واقعيًا للغاية. في عام 1957 ، أكمل Lejaren Hiller و Leonard Isaacson أول تأليف موسيقي تم إنشاؤه بواسطة الكمبيوتر في التاريخ عن طريق تغيير متغيرات التحكم في برنامج الكمبيوتر إلى نوتات موسيقية - - String Quartet "Ilyac Suite". في عام 1966 ، قام جوزيف وايزنباوم (جوزيف وايزنباوم) وكينيث كولبي (كينيث كولبي) بتطوير أول روبوت في العالم "إليزا" (إليزا) ، والذي يستخدم مسح الكلمات الرئيسية وإعادة التركيب لإكمال المهام التفاعلية. في منتصف الثمانينيات ، أنشأت شركة IBM الآلة الكاتبة التي يتم التحكم فيها بالصوت "Tangora" استنادًا إلى نموذج سلسلة ماركوف المخفي ، والذي كان قادرًا على معالجة 20000 كلمة. في هذه المرحلة ، يتم إنشاء AIGC فقط من خلال تعلم القواعد المكتوبة من قبل الخبراء ، وقدرتها على التعميم محدودة للغاية ، تمامًا مثل دمية يلعبها الخبراء.

** مرحلة تراكم الرواسب (التسعينيات - 2010): ** تغيرت AIGC تدريجياً من مرحلة تجريبية إلى عملية. تم تحقيق اختراقات كبيرة في خوارزميات التعلم العميق ووحدات معالجة الرسومات (GPUs) ومعالجات الموتر (TPUs) ومقياس بيانات التدريب. في عام 2007 ، كتب نظام الذكاء الاصطناعي الذي جمعه باحث الذكاء الاصطناعي بجامعة نيويورك روس جودوين (روس جودوين) أول ابتكار ذكاء اصطناعي بالكامل في العالم من خلال تسجيل وإدراك ما رآه وسمعه خلال الرحلة على الطريق. خيال - * 1 الطريق * . في عام 2012 ، عرضت Microsoft علنًا نظام ترجمة فورية تلقائي بالكامل.من خلال الشبكة العصبية العميقة (DNN) ، يمكن إنشاء محتوى المتحدثين باللغة الإنجليزية تلقائيًا في الكلام الصيني من خلال التعرف على الكلام وترجمة اللغة وتوليف الكلام وغيرها من التقنيات. في هذه المرحلة ، بدأت AIGC في التعرف تلقائيًا على كمية صغيرة من البيانات المسجلة من قبل البشر ، وإتقان قدرة معينة على التعميم ، ولكن محدودة بسبب عنق الزجاجة في الخوارزمية ، يجب تحسين تأثير التوليد. في هذا الوقت ، تشبه AIGC ببغاءًا جيدًا في التقليد ، والذي يبدو أنه لائق ولكنه لا يعرف شيئًا.

** مرحلة التطوير السريع (2010 حتى الوقت الحاضر): ** منذ عام 2014 ، مع إدخال خوارزميات التعلم العميق التوليدية والتوسع السريع في مقياس بيانات التدريب ، أصبح تأثير المحتوى الذي تم إنشاؤه من AIGC تدريجيًا واقعيًا لدرجة يصعب معها البشر للتمييز. في عام 2017 ، أطلقت فتاة الذكاء الاصطناعي التابعة لمايكروسوفت "Xiaobing" أول مجموعة شعرية في العالم بعنوان Sunshine Lost the Glass Window تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي. في عام 2018 ، يمكن لنموذج StyleGAN الذي أصدرته Nvidia إنشاء صور تلقائيًا ، وبالكاد يمكن تمييز الصور عالية الدقة التي تم إنشاؤها بواسطة العين البشرية. في عام 2021 ، أطلقت OpenAI DALL-E وأطلقت نسخة مطورة DALL-E-2 بعد عام. يحتاج المستخدمون فقط إلى إدخال نص وصفي قصير ، ويمكن لـ DALL-E-2 إنشاء رسوم متحركة عالية الجودة وواقعية ومجردة. وأنماط أخرى من الرسم. في يوليو 2022 ، تم إطلاق أداة الرسم بالذكاء الاصطناعي مفتوحة المصدر Stable Diffusion ، مما مكّن الأشخاص العاديين من إنشاء أعمال احترافية على مستوى الرسامين. في أغسطس من نفس العام ، فاز عمل فني يُدعى "دار الأوبرا الفضائية" بالجائزة الأولى في معرض ولاية كولورادو في الولايات المتحدة ، وقد تم صنع هذا العمل بواسطة منظمة العفو الدولية. يمكن لنماذج مثل Make-A-Video و Imagen Video و Phenaki التي تم إصدارها لاحقًا إنشاء مقاطع فيديو بأوصاف نصية. ** في 30 نوفمبر 2022 ، أطلقت شركة OpenAI برنامج الدردشة الآلي ChatGPT. وحتى الآن ، تم افتتاح عصر AIGC بالكامل ، وازدهر المحتوى الذي تم إنشاؤه. **

** وقود البيانات **

بعد ما يقرب من 70 عامًا من الترسيب التكنولوجي ، أصبحت AIGC شكلاً هامًا من أشكال صناعة الذكاء الاصطناعي. في عام 2022 ، نشر باحثون في Google ورقة بعنوان "القدرة الناشئة لنماذج اللغة الكبيرة" ، ووجدوا أنه عندما يكون نموذج اللغة أكبر من أن يتجاوز قيمة حرجة معينة ، ستظهر القدرات التي لا تمتلكها النماذج الأصغر. ** في السنوات الأخيرة ، أظهرت الإنجازات الرائعة لتقنيات النماذج واسعة النطاق التي يمثلها GPT-4 و ChatGPT أن زيادة حجم النماذج والبيانات هي وسيلة فعالة لاختراق عنق الزجاجة للتقنيات الحالية.

تزداد نماذج الذكاء الاصطناعي حجمًا ، بشكل أساسي لاستيعاب المزيد من البيانات ، ومع ذلك قد يتم استنفاد البيانات عالية الجودة التي يسجلها البشر في المستقبل القريب. تنبأت Epoch ، وهي منظمة أبحاث وتنبؤات في مجال الذكاء الاصطناعي ، في ورقة غير خاضعة لمراجعة الأقران بأن البيانات النصية عالية الجودة والبيانات النصية منخفضة الجودة وبيانات الصور ستتم معالجتها بشكل مصطنع في 2023-2027 و 2030-2050 و 2030 -2070 على التوالي استنزاف الذكاء.

في ذلك الوقت ، سيصبح تركيب البيانات المعتمد على AIGC وقودًا جديدًا للذكاء الاصطناعي. في الوقت الحالي ، تمثل البيانات الناتجة عن الذكاء الاصطناعي أقل من 1٪ من جميع البيانات. ** وفقًا لتوقعات شركة الاستشارات Gartner (Gartner) ، بحلول عام 2025 ، ستشكل البيانات الناتجة عن الذكاء الاصطناعي 10٪ من إجمالي البيانات. بيانات. ** لذلك ، فإن إنشاء بيئة صناعية كاملة لـ AIGC في أقرب وقت ممكن ، مما يسمح للمستخدمين بالتفاعل بنشاط مع AIGC لتوليد البيانات ، وبالتالي تشكيل دولاب موازنة للبيانات ، سيستمر في تعزيز تقدم تكنولوجيا الذكاء الاصطناعي.

بالنظر إلى المستقبل ، قد تصبح AIGC للعلوم منطقة عميقة وساحة معركة رئيسية جديدة لتطبيق تكنولوجيا الذكاء الاصطناعي ، أي "الذكاء الاصطناعي يفتح مستقبل البحث العلمي". ** في الماضي ، تم استنفاد أرباح البيانات لشركات الإنترنت ، ولكن تراكمت كمية كبيرة من البيانات التجريبية في المجال العلمي. بعد تغذية 280 مليون متوالية من الأحماض الأمينية ، سمحت شركة ناشئة في بيركلي ، كاليفورنيا للنموذج بتعلم لغة البروتينات ، محققة تخليق بروتينات جديدة من الصفر لأول مرة. الابتكار الذي يجلبه AIGC للعلم على قدم وساق. ** من المتوقع أنه بحلول عام 2025 ، سيتم اكتشاف أكثر من 30٪ من الأدوية والمواد بمساعدة AIGC. **

في المستقبل ، سيتم ربط البشر مع AIGC لتشكيل تعايش بين إنشاء المحتوى واكتشاف المعرفة ، ولكن لن يتم تغيير جميع الأشياء العميقة الجذور للبشر بواسطة الذكاء الاصطناعي. تصور الرئيس التنفيذي لشركة OpenAI سام ألتمان (سام ألتمان) ذات مرة: ** كبشر ، ما زلنا نولي اهتمامًا للتفاعل بين الناس ، لم تتغير آلية المكافأة في الدماغ البشري ، وما زلنا نلاحق السعادة ولدينا الرغبة في الإبداع و الرغبة في المنافسة ، والرغبة في تكوين أسرة ... ما كان البشر يهتمون به منذ حوالي 50000 عام ، سيهتم به البشر بعد حوالي مائة عام. **

قال Sam Altman أيضًا أن شعبية ChatGPT تجعل الجميع يشعرون أن AGI (الذكاء الاصطناعي العام) يبدو أقرب إلينا ، ولكن في الواقع ، لا يزال نموذج اللغة الكبير المشابه لـ ChatGPT بعيدًا جدًا عن AGI ، ولا يزال لدينا طريق طويل لنقطعه في المستقبل. الطريق لنقطعه. بين التغيير والثبات ، وصلت الموجة التي أطلقها AIGC.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت