Chống nạn "mại dâm trắng" của OpenAI, nhưng Reddit lại bị chính người dùng "nổ tung" trước?

Nguồn: Silicon Starman (ID: guixingren123)

Tác giả: Lý Hạc

Không bao giờ nghĩ rằng Reddit là một người như vậy

Không biết bao nhiêu người còn nhớ thông báo thu phí giao diện API của Reddit hồi tháng 4 năm nay.

Đánh giá về phiên bản tiết kiệm luồng là do các công ty như OpenAI và Google không hài lòng với dữ liệu của nền tảng của riêng họ để đào tạo các mô hình lớn của họ, Reddit sẽ bắt đầu tính phí các công ty gọi API của họ.

Mới đây, người ta phát hiện ra rằng bị ảnh hưởng bởi sự cố này, ba nhóm quy mô lớn r/aww, r/pics và r/gifs trên Reddit (với 34,1 triệu, 30 triệu và 21,6 triệu người đăng ký lần lượt) đã bị John Oliver theo dõi. Bức ảnh "nổ tung".

Vì các bài đăng hiển thị trong các nhóm Reddit được sắp xếp theo số lượt thích nên khi vào ba nhóm này, màn hình tràn ngập khuôn mặt hân hoan của John Oliver...

spez là tên người dùng Reddit của Giám đốc điều hành Reddit Steve Huffman

r/gifs và r/aww cũng đổi tên nhóm của họ thành "GIF của John Oliver" và "Một subreddit dành cho những bức ảnh dễ thương và âu yếm của John Oliver."

John Oliver là người dẫn chương trình trò chuyện nổi tiếng "Last Week Tonight", chương trình này nổi tiếng với sự châm biếm về các tin tức thời sự, nghệ thuật trình diễn tập thể của cư dân mạng rõ ràng là muốn sử dụng các meme của anh ấy để bày tỏ sự bất mãn của họ đối với Reddit.

Ví dụ như một bức ảnh có 222.000 lượt thích, nội dung màn hình là ảnh chụp nhóm của John Oliver và 3 nhân vật chính của "Sesame Street", kèm theo dòng chữ là: John Oliver, CEO và người điều hành của Reddit.

Điều ấn tượng hơn nữa là rất nhiều chất liệu được sử dụng trong các meme này đều do chính John Oliver cung cấp cho cư dân mạng.

Vậy cái quái gì đang xảy ra ở đây vậy?

Reddit gieo rắc bất hòa?

Reddit đã thông báo qua các phương tiện truyền thông vào ngày 18 tháng 4 năm nay rằng họ sẽ tính phí sử dụng dữ liệu đối với các công ty gọi API của mình. Vào thời điểm đó, Giám đốc điều hành Reddit Steve Huffman đã nói rõ rằng " Kho dữ liệu của Reddit rất có giá trị, nhưng chúng tôi không cần để sử dụng tất cả chúng. Dữ liệu có giá trị được cung cấp miễn phí cho một số công ty lớn nhất thế giới."

Thoạt nhìn, quyết định này nhằm vào các công ty phát triển mô hình lớn như OpenAI và Google, nhưng ngay sau đó, một số nhà phát triển ở các lĩnh vực khác nhớ lại rằng họ có thể là người bị tàn sát nhiều nhất.

Rắc rối nhất là vào ngày 8 tháng này, khi ứng dụng khách Reddit bên thứ ba Apollo trên nền tảng iOS thông báo rằng nó sẽ chính thức ngừng hoạt động vào ngày 30 tháng Sáu.

Chúng tôi biết rằng thiết bị đầu cuối di động của Reddit đã hoạt động kém trong một thời gian dài, vì vậy nó đã tạo ra sự phát triển của nhiều ứng dụng bên thứ ba. Họ sẽ sử dụng giao diện API miễn phí do Reddit cung cấp để giúp người dùng duyệt nội dung trên Reddit thuận tiện hơn.Apollo là một trong những ứng dụng khách Reddit bên thứ ba phổ biến nhất.

Nhà phát triển Apollo Christian Selig đã nói về lý do đóng cửa Apollo, nói rằng theo chính sách API mới, Reddit sẽ tính phí 12.000 đô la cho mỗi 50 triệu yêu cầu API. Trả trước 1,68 triệu đô la mỗi tháng (7 tỷ yêu cầu API) và có khả năng lên tới 20 triệu đô la mỗi năm cho Reddit.

Vấn đề là mức phí cao ngất ngưởng này đơn giản là không thể chi trả được đối với các nhà phát triển cá nhân như Christian Selig và Apollo, vốn được định vị miễn phí.

Christian Selig đã liên lạc với Reddit nhiều lần nhưng không có kết quả, và cuối cùng đã đưa ra quyết định đóng trang web. Trên thực tế, khi mọi thứ phát triển ở đây, mọi người có thể phân tán, việc Reddit tính phí API là hợp lý, nhưng điều thực sự khiến người dùng tức giận là một loạt hoạt động tiếp theo của reddit.

Khi Christian Selig vẫn đang đàm phán với Reddit, một ngày nọ, anh bất ngờ nhận được một tin nhắn hỏi anh nhận xét thế nào về tuyên bố nội bộ của Reddit rằng "Apollo đã cố đe dọa Reddit với giá 10 triệu đô la để dập tắt tranh chấp".

Nhưng điều mà Reddit không ngờ tới là Christian Selig đã ghi lại cuộc liên lạc với họ. Sau đó, anh ấy đã đăng bản ghi và âm thanh của phần này của cuộc gọi lên mạng và nhận xét rằng Reddit đang "nói dối một cách trắng trợn".

Tưởng rằng sau lần này, Reddit sẽ suy nghĩ lại về việc định giá, nhưng nó không những vẫn khẳng định sẽ thúc đẩy chính sách API mới mà còn tiếp tục chỉ trích Christian Selig rằng: "Nói một đằng, nhưng lại hoàn toàn là một nẻo". thế giới bên ngoài... Các cuộc gọi riêng tư được ghi âm và rò rỉ khiến tôi không biết nên làm ăn với anh ta như thế nào."

Phản hồi kém này cuối cùng đã dẫn đến hơn 7.000 nhóm trên Reddit tham gia phản đối Reddit. Một số nhóm bôi đen hầu hết nội dung của họ, một số chuyển sang chế độ riêng tư và những nhóm khác chọn đóng cửa.

Tại một thời điểm, tôi thậm chí không thể tìm thấy r/funny, nhóm lớn nhất trên Reddit

Dù làn sóng phản đối này đã khiến Reddit gần như tê liệt, nhưng CEO Steve Huffman của Reddit vẫn có những nhận xét gây kinh ngạc như gọi những trưởng nhóm quyên góp không công cho nhóm Reddit là "quý ông địa chủ", và nhiều thành viên trong nhóm đã phải nghe theo họ "Giống như một thành phố nơi các cuộc biểu tình diễn ra quá lâu và phần còn lại của người dân thị trấn muốn tiếp tục cuộc sống của họ... Nếu họ có thể bình luận, tôi cá là cả nhóm sẽ nói 'Tắt nó đi, thật phiền phức'."

Sau đó là nghệ thuật trình diễn của người dùng ở đầu bài viết này.

Để lật đổ nhận xét của Steve Huffman, những người lãnh đạo của các nhóm này đã kêu gọi các thành viên trong nhóm tương ứng của họ tiến hành một cuộc bỏ phiếu để xác định tương lai của nhóm.Các lựa chọn là: A-Trở lại bình thường, B-Chỉ cho phép meme của John Oliver.

Kết quả, số phiếu ủng hộ phương án B giành chiến thắng áp đảo.

Mọi thứ bắt đầu với mô hình lớn

Reddit thực ra không phải là nền tảng đầu tiên thay đổi quy tắc tính phí API vì vấn đề về dữ liệu cuộc gọi mô hình lớn. Vào tháng 2 năm nay, Musk đã thông báo rằng quyền truy cập API của Twitter sẽ thiết lập một bức tường phí trong tương lai.

Theo một tài liệu do đại diện khách hàng của Twitter công bố vào đầu tháng 3, công ty có kế hoạch cung cấp cho các nhà phát triển ba cấp độ gói Enterprise:

Gói nhỏ, gói rẻ nhất, có giá 42.000 đô la một tháng và cấp quyền truy cập vào 50 triệu tweet. Các cấp cao hơn cung cấp cho các nhà nghiên cứu hoặc doanh nghiệp quyền truy cập vào nhiều dữ liệu hơn, tương ứng là 100 triệu và 200 triệu tweet, nhưng chi phí tương ứng là 125.000 đô la và 210.000 đô la một tháng.

Nói cách khác, các nhà phát triển phải trả cho Twitter ít nhất 500.000 đô la một năm (nhưng khối lượng dữ liệu của 505.000 tweet không đủ để đào tạo một mô hình lớn).

Vào ngày 19 tháng 4 (một ngày sau khi Reddit thông báo rằng họ sẽ tính phí sử dụng API), Microsoft đã thông báo rằng họ sẽ không còn cung cấp dịch vụ quản lý dữ liệu quảng cáo hướng đến người dùng cho Twitter do không hài lòng với việc không thể truy cập dữ liệu Twitter miễn phí trong tương lai. .

Sau đó, Musk đã tweet vào ngày hôm sau rằng ông có thể kiện Microsoft, cáo buộc hãng này sử dụng "bất hợp pháp" dữ liệu Twitter để đào tạo AI.

Ngoài ra, Getty Images cũng đã kiện Stability AI vào tháng 2 năm nay, cho rằng nó vi phạm bản quyền hình ảnh của Getty Images.

Tuy nhiên, khi những vụ việc tương tự phát triển đến Reddit thì tình hình có vẻ đã khác, thứ nhất Reddit không chọn kiện các công ty mô hình lớn, thứ hai là sau khi tiêu chuẩn tính phí API của Reddit bị phanh phui, các công ty mô hình lớn (đặc biệt là OpenAI) vẫn giữ im lặng.

Nhiều người không biết, Sam Altman, hiện là Giám đốc điều hành của OpenAI, là nhà đầu tư sớm vào Reddit.

Ứng dụng di động Loopt do Altman phát triển trong các dự án đầu tư mạo hiểm ban đầu của ông đã từng thuộc cùng một nhóm các công ty khởi nghiệp được đầu tư bởi vườn ươm cũ nổi tiếng Y Combinator với tên gọi Reddit. -thời gian đối tác người dân.

Vào năm 2014, người sáng lập Y Combinator, Paul Graham, đã chọn Altman, người trẻ hơn mình 20 tuổi, làm chủ tịch của Y Combinator. Sau đó, Y Combinator do Altman lãnh đạo đã dẫn đầu vòng tài trợ B của Reddit vào tháng 9 năm 2014.

Ông thậm chí còn giữ chức CEO tạm thời của Reddit trong 8 ngày sau khi CEO Yishan Wong của Reddit từ chức vào năm 2014.

Trong hơn bảy năm kể từ đó, Altman là thành viên ban giám đốc của Reddit cho đến tháng 1 năm 2022 khi ông tuyên bố rời đi. Khi rời đi, anh ấy nói: "Tôi yêu Reddit với tư cách là một người dùng và tôi yêu những năm tháng tôi đã dành cho hội đồng quản trị. Đội ngũ do Steve lãnh đạo và những người còn lại trong hội đồng quản trị rất tuyệt vời và toàn bộ công ty là những người rất có năng lực."

Do đó, một số người suy đoán rằng với 7 năm "tình bạn", quyết định tính phí sử dụng API của Reddit có thể đã được thảo luận với OpenAI.

Dữ liệu được coi là một trong những yếu tố chính của cạnh tranh mô hình quy mô lớn trong tương lai, đặc biệt là với việc phát hành mô hình ngôn ngữ lớn mã nguồn mở LLaMA của Meta. mô hình quy mô mã nguồn mở cũng đã được thảo luận rộng rãi— —Một trong những kết luận là chất lượng dữ liệu được sử dụng để huấn luyện các mô hình lớn tốt hơn kích thước của dữ liệu.

Bất kể chất lượng dữ liệu hay kích thước dữ liệu, Reddit đều có lợi thế. Trước hết, nó là trang web được truy cập nhiều thứ 11 trên thế giới (thứ 6 ở Hoa Kỳ), và thứ hai, nó tạo ra các cuộc thảo luận thực tế được cập nhật liên tục về các sự kiện nóng nhất vào lúc này—dù bạn nhìn nó như thế nào, nó vẫn là trang lý tưởng nhất. để đào tạo cơ sở dữ liệu mô hình lớn.

Trước đây đã có thông tin cho rằng Reddit có kế hoạch IPO vào cuối năm nay, điều đó có nghĩa là Reddit, công ty có doanh thu vẫn do quảng cáo chi phối và chưa tạo ra lợi nhuận, cần khẩn trương tìm thêm nhiều cách để kiếm tiền. tiền, rõ ràng là có lợi hơn so với các nhà phát triển cá nhân.

Altman trước đó cũng cho biết OpenAI đang tích cực hợp tác với các công ty nội dung và xin phép, bày tỏ sẵn sàng trả giá cao cho dữ liệu chất lượng cao trong các lĩnh vực cụ thể.

Một cho dữ liệu, một cho tiền, có vẻ như là một sự kết hợp hoàn hảo. Một số người cũng suy đoán rằng Reddit có thể tiếp cận các mô hình lớn trong tương lai.

Xét từ thái độ cứng rắn hiện tại của Reddit, có vẻ như nó không muốn quá quan tâm đến các nhà phát triển cá nhân, khi đối mặt với người dùng và lợi ích thương mại, nó chọn cái sau. Nhưng một vấn đề mâu thuẫn là nền tảng Reddit mà Steve Huffman nói có thể đào tạo mô hình lớn để tạo ra kết quả tốt nhất và dữ liệu có "tính mới và mức độ phù hợp" lại được tạo ra bởi hết người dùng Reddit này đến người dùng Reddit khác.

Nhưng giống như Steve Huffman sẽ nói "một thành phố nơi các cuộc biểu tình đã kéo dài quá lâu đến nỗi những công dân khác muốn tiếp tục cuộc sống của họ", anh ấy có vẻ khá tin rằng người dùng sẽ không rời đi.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)