STARTECH AT CO.,LTD

Chào mừng bạn đến với StarTech AI

Cựu giám đốc Snap AI ra mắt Higgsfield để cạnh tranh với trình tạo video Sora của OpenAI

OpenAI đã làm say đắm thế giới công nghệ vài tháng trước với mô hình AI sáng tạo, Sora, biến mô tả cảnh thành video gốc – không cần máy ảnh hay đoàn làm phim. Nhưng Sora cho đến nay vẫn bị kiểm soát chặt chẽ và công ty dường như đang nhắm nó vào những nhà sáng tạo được tài trợ tốt như các đạo diễn Hollywood – nhất thiết không phải là những người có sở thích hay những nhà tiếp thị thời gian nhỏ.

 

Alex Mashrabov, cựu giám đốc bộ phận AI tại Snap, đã cảm nhận được cơ hội. Vì vậy, anh đã cho ra mắt Higgsfield AI, một nền tảng chỉnh sửa và tạo video được hỗ trợ bởi AI được thiết kế cho các ứng dụng được cá nhân hóa và phù hợp hơn.

 

Được hỗ trợ bởi mô hình chuyển văn bản thành video tùy chỉnh, ứng dụng đầu tiên của Higgsfield, Diffuse, có thể tạo video từ đầu hoặc chụp ảnh tự sướng và tạo clip có sự tham gia của người đó.

 

“Đối tượng mục tiêu của chúng tôi là những người sáng tạo thuộc mọi loại hình,” Mashrabov nói với TechCrunch trong một cuộc phỏng vấn, “từ những người dùng thường xuyên muốn tạo nội dung thú vị với bạn bè của họ cho đến những người sáng tạo nội dung xã hội muốn thử định dạng nội dung mới cho đến các nhà tiếp thị truyền thông xã hội muốn thương hiệu của họ để nổi bật.”

 

Mashrabov đến với Snap thông qua AI Factory, công ty khởi nghiệp trước đây của anh, được Snap mua lại vào năm 2020 với giá 166 triệu USD. Khi ở Snap, Mashrabov đã giúp xây dựng các sản phẩm như hiệu ứng và bộ lọc AR cho Snapchat, bao gồm cả Cameos, cũng như chabot MyAI gây tranh cãi của Snapchat.

 

Higgsfield — mà Mashrabov đồng sáng lập vài tháng trước với Yerzat Dulat, một nhà nghiên cứu AI chuyên về video tổng hợp — cung cấp một tập hợp các clip được tạo trước, một công cụ để tải lên phương tiện tham chiếu (tức là hình ảnh và video) và một trình chỉnh sửa nhanh chóng cho phép người dùng mô tả các nhân vật, hành động và cảnh mà họ muốn miêu tả. Bằng cách sử dụng Diffuse, người dùng có thể chèn trực tiếp bản thân vào một cảnh do AI tạo ra hoặc bắt chước những thứ giống như kỹ thuật số của họ – như các bước nhảy – được ghi lại trong các video khác.

Mashrabov cho biết: “Mô hình của chúng tôi hỗ trợ các chuyển động và biểu cảm có tính thực tế cao. “Chúng tôi đang tiên phong trong ‘mô hình thế giới’ dành cho người tiêu dùng, điều này sẽ cho phép chúng tôi tạo và chỉnh sửa video tốt nhất với mức độ kiểm soát cao.” Higgsfield không phải là công ty khởi nghiệp video sáng tạo duy nhất đối đầu với OpenAI. Runway là một trong những công cụ đầu tiên xuất hiện và các công cụ của nó tiếp tục được cải tiến. Ngoài ra còn có Haiper, được hỗ trợ bởi hai cựu thành viên DeepMind và hơn 13 triệu USD tiền mặt mạo hiểm. Mashrabov lập luận rằng Diffuse sẽ nổi bật nhờ chiến lược tiếp cận thị trường dựa trên thiết bị di động, hướng tới xã hội. Mashrabov cho biết: “Bằng cách ưu tiên các ứng dụng iOS và Android thay vì quy trình làm việc trên máy tính để bàn, chúng tôi cho phép người sáng tạo tạo nội dung truyền thông xã hội hấp dẫn mọi lúc, mọi nơi”. “Thật vậy, bằng cách xây dựng trên thiết bị di động, chúng tôi có thể ưu tiên các tính năng dễ sử dụng và thân thiện với người tiêu dùng ngay từ ngày đầu tiên.” Higgsfield cũng đang hoạt động tinh gọn. Mashrabov nói rằng các mô hình tổng hợp làm nền tảng cho nền tảng này đã được phát triển bởi một nhóm 16 người trong vòng chưa đầy chín tháng và được đào tạo trên một cụm 32 GPU (32 GPU nghe có vẻ nhiều, nhưng xét đến việc OpenAI sử dụng hàng chục nghìn GPU thì thực sự không phải vậy). ). Và Higgsfield cho đến nay mới chỉ huy động được 8 triệu USD, phần lớn trong số đó đến từ đợt tài trợ hạt giống gần đây do Menlo Ventures dẫn đầu.

 

Latest Post