STARTECH AT CO.,LTD

Chào mừng bạn đến với StarTech AI
News

Stability công bố Stable Diffusion 3, trình tạo hình ảnh AI thế hệ tiếp theo

Vào thứ Năm, Stability AI đã công bố Stable Diffusion 3, một mô hình tổng hợp hình ảnh thế hệ tiếp theo có trọng số mở. Nó đi theo những người tiền nhiệm bằng cách tạo ra các hình ảnh chi tiết, đa chủ đề với chất lượng và độ chính xác được cải thiện trong việc tạo văn bản. Thông báo ngắn gọn không kèm theo bản demo công khai, nhưng hôm nay Stability sẽ mở danh sách chờ cho những ai muốn dùng thử.

Stability cho biết dòng mô hình Stable Diffusion 3 (lấy các mô tả văn bản được gọi là "lời nhắc" và biến chúng thành hình ảnh phù hợp) có kích thước từ 800 triệu đến 8 tỷ tham số. Phạm vi kích thước phù hợp cho phép các phiên bản khác nhau của mô hình chạy cục bộ trên nhiều loại thiết bị—từ điện thoại thông minh đến máy chủ. Kích thước tham số gần tương ứng với khả năng của mô hình về mức độ chi tiết mà nó có thể tạo ra. Các model lớn hơn cũng yêu cầu nhiều VRAM hơn trên bộ tăng tốc GPU để chạy.

Kể từ năm 2022, chúng ta đã thấy Stability khởi động một loạt các mô hình tạo hình ảnh AI: Stable Diffusion 1.4 , 1.5, 2.0 , 2.1 , XL , XL Turbo và bây giờ là 3. Stability đã tạo nên tên tuổi khi cung cấp một giải pháp thay thế cởi mở hơn cho đến các mô hình tổng hợp hình ảnh độc quyền như DALL-E 3 của OpenAI, mặc dù không gây tranh cãi do việc sử dụng dữ liệu đào tạo có bản quyền, thành kiến ​​và khả năng lạm dụng . (Điều này đã dẫn đến các vụ kiện chưa được giải quyết.) Các mô hình Khuếch tán ổn định có trọng lượng mở và có sẵn nguồn, nghĩa là các mô hình có thể được chạy cục bộ và được tinh chỉnh để thay đổi đầu ra của chúng.

Chúng tôi không có quyền truy cập vào Stable Diffusion 3 (SD3), nhưng từ các mẫu mà chúng tôi tìm thấy được đăng trên trang web của Stability và các tài khoản mạng xã hội liên quan, các thế hệ này gần như có thể so sánh được với các mô hình tổng hợp hình ảnh hiện đại khác vào thời điểm hiện tại, bao gồm DALL-E 3 đã nói ở trên , Adobe Firefly , Imagine with Meta AI , Midjourney và Google Imagen .

Mặc dù Stable Diffusion 3 không được phổ biến rộng rãi nhưng Stability cho biết sau khi quá trình thử nghiệm hoàn tất, các trọng số của nó sẽ được tải xuống và chạy miễn phí tại địa phương. Stability viết: “Giai đoạn xem trước này, cũng như các mô hình trước đây, rất quan trọng để thu thập thông tin chuyên sâu nhằm cải thiện hiệu suất và độ an toàn của nó trước khi phát hành mở.”

Gần đây, Stability đã được thử nghiệm với nhiều kiến ​​trúc tổng hợp hình ảnh khác nhau. Ngoài SDXL và SDXL Turbo, mới tuần trước, công ty đã công bố Stable Cascade , sử dụng quy trình ba giai đoạn để tổng hợp văn bản thành hình ảnh.