Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Google dùng video YouTube để huấn luyện AI: Sự thật đã biết và việc che giấu sự thật

image

Nguồn: CritpoTendencia Tiêu đề gốc: Google đã đào tạo AI của mình bằng video từ YouTube: những gì đã biết (và những điều họ không nói với bạn) Liên kết gốc:

Chuyện gì đang diễn ra trong thế giới crypto?

Google không công bố rầm rộ cũng không gửi cảnh báo cho các nhà sáng tạo; họ chỉ đơn giản điều chỉnh chính sách và trả lời câu hỏi của các chuyên gia, để lộ ra một điều quan trọng: một phần kho video của YouTube đã được sử dụng để đào tạo các mô hình trí tuệ nhân tạo, bao gồm Gemini và các công nghệ tạo video như Veo 3.

Thông tin này là công khai, nhưng phần lớn người dùng không bao giờ biết vì nó xuất hiện rải rác, thông qua các phương tiện truyền thông phát hiện thay đổi trước cả khi nền tảng tự giải thích trực tiếp.

Những gì Google thừa nhận (và chúng ta biết như thế nào)

YouTube xác nhận rằng họ sử dụng kho video để đào tạo AI tạo sinh. Nền tảng này sẽ bổ sung tính năng cho phép nhà sáng tạo quyết định liệu nội dung của họ có thể được sử dụng để đào tạo cho bên thứ ba hay không.

Chỉ riêng việc có tùy chọn này đã ngụ ý rằng một phần quá trình đào tạo đã và đang diễn ra.

Cũng có báo cáo cho rằng cả Google lẫn OpenAI đều đã sử dụng bản chép lời từ video YouTube để huấn luyện các mô hình ngôn ngữ. Không có thông tin rõ ràng về phạm vi cũng như loại video nào được bao gồm, nhưng có thể thấy rõ hệ sinh thái video của YouTube là nguồn dữ liệu giá trị cho AI.

Những vùng xám gây lo ngại

Google thừa nhận sử dụng nội dung trên YouTube để cải thiện các mô hình, nhưng không nêu rõ tỷ lệ phần trăm kho dữ liệu được sử dụng, cách lựa chọn video, hay video không công khai sẽ được xử lý ra sao. Đối với hàng triệu người dùng, một video không công khai gần như là riêng tư; còn với một mô hình AI, nó có thể chỉ là một mảnh nhỏ trong tập dữ liệu.

Cũng chưa rõ về sự đồng thuận thực sự. Liệu tùy chọn mới cho nhà sáng tạo sẽ hiển thị cho tất cả? Có được bật mặc định không? Chỉ ảnh hưởng đến video mới hay cả nội dung đã tải lên suốt nhiều năm qua? Những câu hỏi này vẫn chưa có lời giải đáp vì Google chưa cung cấp chi tiết về vận hành.

Trong lúc đó, quy mô là điều không thể phủ nhận: trên YouTube, hơn 500 giờ video được tải lên mỗi phút. Khối lượng này biến nền tảng thành mỏ dữ liệu hoàn hảo để đào tạo các hệ thống có khả năng nhìn, hiểu, phân loại và bắt chước hành vi con người trong video.

Vấn đề không phải là việc sử dụng: mà là sự thiếu minh bạch

Cuộc thảo luận cốt lõi không nằm ở việc các mô hình của Google có nên được đào tạo bằng video hay không - điều này đã và đang diễn ra - mà là giới hạn được thiết lập như thế nào, ai quyết định luật chơi và mức độ minh bạch nào được yêu cầu đối với một nền tảng sở hữu kho lưu trữ video lớn nhất hành tinh.

Những gì chúng ta biết hiện nay chủ yếu đến từ các trang công nghệ theo dõi thay đổi trước khi công ty giải thích rõ ràng. Google chỉ xác nhận một phần, nhưng chưa hoàn thiện bức tranh.

AI tiến bộ, dữ liệu chảy liên tục, còn người dùng bình thường chỉ nhận được những manh mối nhỏ giọt.

Đây không phải là một vụ rò rỉ. Đây là thông tin chính thức. Điều đáng lo là những gì họ vẫn chưa nhắc tới.

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim