Vào thứ Năm, Stability AI đã công bố Stable Diffusion 3, một mô hình tổng hợp hình ảnh thế hệ tiếp theo có trọng số mở. Nó đi theo những người tiền nhiệm bằng cách tạo ra các hình ảnh chi tiết, đa chủ đề với chất lượng và độ chính xác được cải thiện trong việc tạo văn bản. Thông báo ngắn gọn không kèm theo bản demo công khai, nhưng hôm nay Stability sẽ mở danh sách chờ cho những ai muốn dùng thử.
Kể từ năm 2022, chúng ta đã thấy Stability khởi động một loạt các mô hình tạo hình ảnh AI: Stable Diffusion 1.4 , 1.5, 2.0 , 2.1 , XL , XL Turbo và bây giờ là 3. Stability đã tạo nên tên tuổi khi cung cấp một giải pháp thay thế cởi mở hơn cho đến các mô hình tổng hợp hình ảnh độc quyền như DALL-E 3 của OpenAI, mặc dù không gây tranh cãi do việc sử dụng dữ liệu đào tạo có bản quyền, thành kiến và khả năng lạm dụng . (Điều này đã dẫn đến các vụ kiện chưa được giải quyết.) Các mô hình Khuếch tán ổn định có trọng lượng mở và có sẵn nguồn, nghĩa là các mô hình có thể được chạy cục bộ và được tinh chỉnh để thay đổi đầu ra của chúng.
Chúng tôi không có quyền truy cập vào Stable Diffusion 3 (SD3), nhưng từ các mẫu mà chúng tôi tìm thấy được đăng trên trang web của Stability và các tài khoản mạng xã hội liên quan, các thế hệ này gần như có thể so sánh được với các mô hình tổng hợp hình ảnh hiện đại khác vào thời điểm hiện tại, bao gồm DALL-E 3 đã nói ở trên , Adobe Firefly , Imagine with Meta AI , Midjourney và Google Imagen .
Mặc dù Stable Diffusion 3 không được phổ biến rộng rãi nhưng Stability cho biết sau khi quá trình thử nghiệm hoàn tất, các trọng số của nó sẽ được tải xuống và chạy miễn phí tại địa phương. Stability viết: “Giai đoạn xem trước này, cũng như các mô hình trước đây, rất quan trọng để thu thập thông tin chuyên sâu nhằm cải thiện hiệu suất và độ an toàn của nó trước khi phát hành mở.”
Gần đây, Stability đã được thử nghiệm với nhiều kiến trúc tổng hợp hình ảnh khác nhau. Ngoài SDXL và SDXL Turbo, mới tuần trước, công ty đã công bố Stable Cascade , sử dụng quy trình ba giai đoạn để tổng hợp văn bản thành hình ảnh.