Các công ty AI sử dụng dữ liệu người dùng trên Tumblr và Reddit: Những gì chúng ta biết

Các công ty AI như OpenAI và Midjourney đang sử dụng dữ liệu người dùng trên các nền tảng như Tumblr và Reddit để huấn luyện hệ thống trí tuệ nhân tạo. Điều này đã gây ra tranh cãi và các vụ kiện bản quyền. Bài viết này tóm lược những thông tin chúng ta đã biết về việc sử dụng dữ liệu người dùng trong lĩnh vực này.

Công ty AI sử dụng dữ liệu người dùng trên Tumblr và Reddit: Những gì chúng ta biết

Các công ty AI sử dụng dữ liệu người dùng trên Tumblr và Reddit: Những gì chúng ta biết - -1627604551

( Ảnh: Vox )

Các công ty AI như OpenAI và Midjourney đang sử dụng dữ liệu người dùng trên các nền tảng như Tumblr và Reddit để huấn luyện hệ thống trí tuệ nhân tạo. Điều này đã gây ra tranh cãi và các vụ kiện bản quyền. Bài viết này tóm lược những thông tin chúng ta đã biết về việc sử dụng dữ liệu người dùng trong lĩnh vực này.

Dữ liệu người dùng trên Tumblr và WordPress.com

Các công ty AI như OpenAI và Midjourney đã sử dụng dữ liệu người dùng trên các nền tảng như Tumblr và WordPress.com để huấn luyện các hệ thống trí tuệ nhân tạo của họ. Thông tin từ 404 Media cho biết rằng Automattic, công ty mẹ của Tumblr và WordPress, đang chuẩn bị thông báo về việc bán dữ liệu người dùng cho OpenAI và Midjourney. Dữ liệu này có thể bao gồm các bài đăng của người dùng trên Tumblr và trên WordPress.com.

Automattic đã thông báo cách cho người dùng tắt chia sẻ nội dung công khai của họ với bên thứ ba. Tuy nhiên, công ty cũng cho biết rằng họ đang làm việc trực tiếp với một số công ty AI chọn lọc miễn là kế hoạch của họ phù hợp với những gì cộng đồng quan tâm, như sự ghi nhận, tùy chọn không tham gia và kiểm soát.

Dữ liệu người dùng trên Reddit

Reddit, một nền tảng chia sẻ nội dung lớn, cũng đã trở thành một nguồn dữ liệu cho các công ty AI. Trước thông báo về IPO, Reddit đã ký thỏa thuận trị giá 60 triệu đô la với Google cho phép truy cập vào Reddit API để huấn luyện các mô hình AI. Điều này đã gây ra phản ứng không hết sức hào hứng từ một số nhà quản lý và người đăng bài trên Reddit.

Tóm tắt

Việc sử dụng dữ liệu người dùng từ các nền tảng như Tumblr và Reddit để huấn luyện các hệ thống trí tuệ nhân tạo đã gây ra tranh cãi và các vụ kiện bản quyền. Các công ty AI như OpenAI và Midjourney đã sử dụng dữ liệu này mà không có sự cho phép từ người dùng. Mặc dù một số công ty đã thỏa thuận cung cấp dữ liệu, việc sử dụng dữ liệu người dùng vẫn đang gặp phải nhiều tranh cãi và phản đối từ cộng đồng người dùng.

Đăng nhận xét

Mới hơn Cũ hơn