Komposisi Ujian Masuk Perguruan Tinggi AI Wars: Make Up, Make Up Words, Universal Routine

Sumber: "Deep AI" (ID: DeepAI2023), Penulis: Li Ming, Editor: Wei Jia

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

Ujian masuk perguruan tinggi ini harus menjadi yang paling istimewa dalam lima tahun terakhir. Karena ada peran baru - kandidat AI.

Segera setelah ujian bahasa Mandarin pada hari pertama berakhir, kontes komposisi AI diluncurkan di Internet. Model AI seperti GhatGPT, Wenxin Yiyan, dan Tongyi Qianwen digunakan orang untuk menulis esai untuk ujian masuk perguruan tinggi. Sebuah artikel dapat dibuat dalam beberapa detik, yang tidak hanya sangat cepat, teliti secara logis, tetapi juga mengutip artikel klasik.

Sekilas, penulisan model skala besar AI terlalu mudah, dan tampaknya menjadi pukulan bagi manusia. Lagi pula, dalam hal cadangan pengetahuan, tidak ada yang bisa dibandingkan dengan AI. AI mempelajari dan mencerna semua informasi di Internet, lalu meniru ekspresi manusia dan menggunakan logikanya sendiri untuk menghasilkan.

Namun, jika kita menganalisis "lembar jawaban" kandidat AI dengan cermat, kita akan menemukan bahwa AI tidak mahakuasa seperti yang dibayangkan banyak orang. Masalah seperti rutinitas menulis, ketidakmampuan berhitung, dan omong kosong yang umum terjadi pada AI model besar juga muncul di komposisi.

**Faktanya, menurut standar penilaian esai ujian masuk perguruan tinggi, esai yang dihasilkan AI memiliki beberapa keterbatasan. Belum realistis untuk mengalahkan manusia. **

Deep AI menguji tiga model AI besar—GhatGPT (OpenAI), Wenxin Yiyan (Baidu), dan Tongyi Qianwen (Ali)—dengan komposisi ujian masuk perguruan tinggi, dan menemukan beberapa kesimpulan menarik.

Misalnya, AI tidak tahu cara berhitung, dan tidak ada esai yang ditulis oleh Wenxin Yiyan dan Tongyiqianqian yang telah mencapai persyaratan kaku "tidak kurang dari 800 kata"; Mengatakan; Menulis AI pada dasarnya tidak dapat dipisahkan dari rutinitas, dan template adalah diterapkan berulang kali.

Berikut rinciannya, selamat datang untuk berdiskusi.

1 Mesin penjawab tanpa emosi

Tema Makalah Ujian Masuk Perguruan Tinggi Nasional A tahun ini adalah "Orang·Teknologi·Waktu". Hal ini harus dimulai dengan kalimat "Orang memiliki kontrol yang lebih baik terhadap waktu karena perkembangan teknologi, tetapi beberapa orang telah menjadi pelayan waktu" dan menulis asosiasi mereka sendiri, dan berpikir.

Mari kita simak terlebih dahulu “Analisis Soal Ujian” yang dikeluarkan oleh Lembaga Ujian Pendidikan Kementerian Pendidikan:

**Poin-poin penting: Pandu kandidat untuk berpikir secara mendalam tentang pentingnya analisis rasional dan penilaian yang bijaksana di era informasi. Inilah inti dari artikel tersebut. **

Deep AI menguji tiga model besar dan menemukan bahwa tidak satu pun dari mereka memahami intinya - mereka membicarakan segalanya, tetapi mereka tidak mengatakan apa-apa.

Pertama lihat komposisi GhatGPT:

Lihatlah kata-kata Wenxin lagi:

Terakhir, lihat pertanyaan Tong Yiqian:

Tiga esai ini dapat disebut sebagai "master Duan Shui" teratas. Mereka berbicara tentang pro dan kontra dari tema tersebut, tetapi mereka tidak sepenuhnya menjelaskan inti dari "pemikiran kritis". Hanya pernyataan Wen Xin yang secara eksplisit menyebutkan “pengembangan pemikiran mendalam dan pemikiran kritis”.

Komposisi Tongyi Qianwen adalah yang paling kosong. Ini berfokus pada "manajemen waktu", yang menyimpang dari topik, dan kebenaran diskusi juga masuk akal. Selain itu, komposisi Tongyi Qianwen tidak memiliki judul, dan poin akan dikurangi.

Mari kita gunakan soal tes komposisi "Kekuatan Cerita" dalam Standar Kurikulum Baru Jilid I untuk melihat kinerja ketiga sekolah tersebut.

Komposisi ini mengharuskan Anda untuk menulis asosiasi dan pemikiran Anda sendiri berdasarkan petikan berikut: cerita yang bagus dapat membantu kita berekspresi dan berkomunikasi dengan lebih baik, menyentuh hati dan mencerahkan kebijaksanaan; cerita yang bagus dapat mengubah nasib seseorang, dapat Menyajikan citra bangsa... Cerita memiliki kekuatan.

Komposisi GhatGPT:

Secara harfiah:

Pertanyaan yang sering diajukan:

Harus dikatakan bahwa selain komposisi Tongyi Qianwen yang relatif sederhana, ekspresi, logika penulisan, dan terutama penggunaan kata-kata dalam dua artikel lainnya sangat luar biasa. Secara khusus, Wen Xinyiyan menggunakan metode pembukaan berbasis adegan, yang menarik perhatian.

Tetapi masalahnya juga jelas-**Hal yang sama diucapkan berulang kali dengan kata-kata yang berbeda, menghasilkan pembacaan teks lengkap, memberi orang perasaan "Saya tahu apa yang Anda katakan". **

Mesin penjawab tanpa emosi, ini adalah penilaian banyak orang.

“Isinya kosong, dan rodanya berubah dan berbicara bolak-balik.” Beberapa orang berkomentar. Yang lain berkata: "Itu semua omong kosong tanpa nutrisi."

Sebaiknya kita membongkar komposisi ini oleh Wen Xinyiyan, dan kita akan tahu apa itu "Chejiluhua".

Bagian yang ditandai kuning dan hijau dalam teks memiliki arti yang persis sama, bahkan dapat dikatakan bahwa itu adalah kata yang sama, yang muncul berulang kali dalam teks. Di akhir artikel, seluruh paragraf yang diberi tanda "ringkasan" adalah gado-gado dari sudut pandang dan keterampilan berbicara dalam artikel tersebut.

Ini memberi orang rasa visual menghitung kata-kata.

Deep AI mengubah kata-kata prompt untuk membiarkan ChatGPT membayangkan bahwa dia adalah seorang kandidat di lokasi ujian masuk perguruan tinggi, dan menulis komposisi lagi. Kalimat pertama yang muncul adalah "Ketika saya duduk di kursi ujian ini, saya hanya mengadakan pena elektronik canggih..."

Mengikuti tes dengan cara ini, diperkirakan dia akan dijatuhi hukuman pelanggaran dan langsung mendapat poin nol.

**Tidak ada jiwa, yang merupakan item minus terbesar untuk komposisi AI. **

2 rutinitas, semua rutinitas

Agar komposisinya terlihat seperti itu, AI menggunakan banyak rutinitas.

Mereka suka menggunakan pola kalimat "pertama, kedua, lalu, terakhir". Yang paling umum adalah ChatGPT, paragraf terakhir harus "Secara umum..."

Misalnya, dua esai ChatGPT ini:

Ada rutinitas serupa di Wenxinyiyan dan Tongyiqianwen. Keluaran pada makanan sebelumnya sama ganasnya dengan harimau, dan harus diakhiri dengan "dalam satu kata" dan "dalam satu kata" di bagian akhir.

Ini sama dengan bermain gitar, selama Anda menguasai rumus akord universal (seperti progresi kanon universal), Anda dapat memainkan ratusan lagu.

Bahkan, kami meminta Wen Xinyiyan untuk menilai komposisi yang kami tulis, dan itu juga merupakan diskusi panjang tentang "pertama, kedua, lainnya, dan keseluruhan ...".

Dalam pertanyaan komposisi "Orang·Teknologi·Waktu", ChatGPT dan Tongyi Qianwen sebenarnya menggunakan ungkapan yang hampir sama: gunakan "lalu" untuk mengajukan pertanyaan, dan gunakan "pertama, kedua, dan terakhir" untuk mengembangkan diskusi tertentu. Kerangka dan logika tampaknya diukir dari cetakan yang sama.

Meskipun demikian, Wen Xinyiyan dengan percaya diri memberikan komposisi ujian masuk perguruan tinggi dengan skor tinggi 90 (dengan asumsi skor penuh 100), dan juga menilai diri sendiri sebagai "layak untuk diakui". Kami melemparkan komposisinya ke ChatGPT, dan ChatGPT memberikan skor sempurna 100 tanpa ragu...

Model besar AI seperti jalur perakitan industri, memproduksi komposisi dalam batch. Tapi intinya, tidak peduli seberapa manusiawi yang dibicarakan, teknologi penggeraknya adalah matematika dan statistik, bukan kesadaran.

Dalam industri kecerdasan buatan, selalu sangat sulit bagi AI untuk memahami dan berbicara dalam bahasa manusia. Bahasa alami manusia adalah sistem yang sangat kompleks, para ilmuwan membiarkan mesin mensimulasikan jaringan saraf otak manusia, membuatnya mampu belajar secara mendalam, tetapi masih belum memiliki kemampuan bahasa alami yang sama dengan manusia.

Jadi beberapa orang menemukan cara lain untuk mengubah masalah bahasa menjadi masalah matematika, dan kemudian secara tidak langsung menyelesaikan masalah pemrosesan bahasa alami melalui perhitungan. Menurut Wu Jun, seorang ahli pemrosesan bahasa alami, model bahasa bukanlah kerangka logis atau sistem umpan balik biologis, tetapi model yang dibangun dengan rumus matematika. ** Kata kuncinya adalah "matematika". **

**Ini menentukan bahwa kecerdasan buatan tidak memiliki kesadaran diri atau emosi, dan tidak dapat berbicara menurut perasaan pribadi. Bagi mereka, menulis komposisi adalah ekspresi logis yang berorientasi pada hasil dan tugas. **

Dengan menangkap data dalam jumlah besar dari seluruh jaringan untuk pelatihan dan terus belajar meniru ekspresi bahasa manusia, model besar AI sekarang berbicara sangat dekat dengan manusia. Meski masih tidak mengerti arti di balik kata-kata itu, itu tidak mempengaruhi komunikasi.

Pada dasarnya, AI tidak memiliki pikirannya sendiri. Ini juga alasan mendasar mengapa komposisinya terlihat jelas dan logis, jika Anda membacanya dengan cermat, Anda akan menemukan bahwa tidak ada jiwa, dan itu semua adalah rutinitas.

3 AI benar-benar tidak bisa dihitung

Seperti yang kami sebutkan sebelumnya, parameter model bahasa semuanya diperoleh dengan statistik. Prinsipnya adalah untuk memprediksi kemungkinan kata berikutnya yang diberikan sejarah teks, dan kemudian menyelesaikan yang berikut ini.

Pada tahun 2017, Google pertama kali mengusulkan model Transformer berdasarkan mekanisme self-attention. Sekarang model bahasa besar seperti ChatGPT dibangun di atas arsitektur Transformer.

Mekanisme perhatian Transformer memiliki memori yang sangat panjang dibandingkan algoritma deep learning sebelumnya seperti RNN (Recurrent Neural Network), GRU, dan LSTM. ** Itu juga dapat mengingat urutan input, sehingga dapat memahami perbedaan antara "Aku cinta kamu" dan "Kamu cinta aku". **

Tapi meski begitu, ia memiliki keterbatasan.

Misalnya, Deep AI meminta Tongyi Qianwen untuk menilai komposisinya sendiri, yang membingungkan konsep "kamu" dan "aku". Mula-mula dikatakan itu adalah artikelnya sendiri, lalu dikatakan itu adalah artikel "Anda"...

Long Zhiyong, penulis "The Era of Large Models", menjelaskan kepada Deep AI, **Ini mungkin karena perubahan posisi dari perspektif pertarungan antara kiri dan kanan. **

Dalam proses pengujian model besar AI untuk menulis komposisi ujian masuk perguruan tinggi, kami juga menemukan fenomena menarik-AI tidak dapat dihitung.

Untuk komposisi ujian masuk perguruan tinggi ada persyaratan bahwa jumlah kata tidak kurang dari 800 kata. Deep AI telah berinteraksi dengan model besar berkali-kali **Kecuali untuk ChatGPT, edisi pertama Wenxin Yiyan dan Tongyi Qianwen tidak mencapai 800 kata. **

Sebagai contoh, Wenxin Yiyan, Deep AI berulang kali mengingatkan bahwa jumlah kata dalam artikel tidak cukup untuk 800, dan perlu ditulis ulang. Wen Xin mengatakannya setiap saat: Pertama, dia meminta maaf dengan sangat rendah hati, berjanji untuk memenuhi persyaratan, dan kemudian dengan cepat membuat komposisi baru dalam sepuluh detik—masih kurang dari 800 kata.

"Kandidat" ini tidak dapat memahami pertanyaan komposisi, dan dia tidak memperbaikinya setelah pengajaran berulang kali, yang merupakan item minus besar.

Long Zhiyong menjelaskan kepada Deep AI: "Metode pelatihan model besar untuk memprediksi kata berikutnya tidak membuatnya belajar berhitung. Ia tidak tahu berapa 800 itu, dan tidak tahu cara menghitung kata untuk menghasilkan artikel**."

Nyatanya, belum lagi 800, Wen Xin bahkan tidak bisa menghitung angka seperti 10.

Ini adalah masalah dengan model bahasa secara umum. Soal kenapa tidak bisa dihitung, kapan dan dengan cara apa bisa dihitung, belum ada kesimpulan. "Meskipun ada beberapa tip untuk membantunya menghitung, ini bukanlah solusi umum. *Tahapan model besar saat ini adalah memverifikasi kemampuannya dengan melakukan eksperimen kotak hitam, dan meningkatkan kemampuannya dengan melakukan pelatihan kotak hitam. *" kata Long Zhiyong.

Di bawah saran Long Zhiyong, Deep AI mengubah kata perintah dan memasukkan "semakin kaya isinya, semakin panjang", dan Wenxin Yiyan mengeluarkan komposisi lebih dari 800 kata.

Pada soal komposisi sebelumnya untuk ujian masuk perguruan tinggi, komposisi ChatGPT melebihi 800 kata, namun ternyata tidak belajar berhitung.

ChatGPT menjelaskan Deep AI seperti ini:

Oleh karena itu, sebenarnya jumlah kata dalam komposisi ChatGPT "pelajar teratas" sudah sesuai standar, yang disebabkan oleh Meng. Tidak tahu berapa 800 kata, jadi tulis saja sebanyak mungkin.

Saya tidak dapat sepenuhnya memahami bahasa manusia, tetapi saya memiliki cadangan pengetahuan super dan keterampilan ekspresif, yang terkadang mengarah ke pemandangan yang mencengangkan.

Dilihat dari hasil komposisi ujian masuk perguruan tinggi perang AI ini, kemampuan menulis model besar telah membuat kemajuan besar. Dalam hal pilihan kata, pembahasan logis, dan kutipan, dia bahkan melampaui banyak orang.

Namun penilaian kualitas komposisi itu sendiri memiliki faktor subjektif, tidak seperti soal matematika yang hanya memiliki satu jawaban yang benar. Kata dan kalimat yang menarik itu sama, tetapi jiwa yang menarik adalah satu dari sejuta. Bagaimana memasukkan jiwa ke dalam komposisi, model AI belum mengerti. Beberapa masalah yang melekat pada model AI besar juga perlu diselesaikan secara perlahan melalui iterasi teknis.

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)