Bài đăng

引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网
币界网
币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。

Miễn trừ trách nhiệm: Nội dung OKX Orbit chỉ để tham khảo. Tìm hiểu thêm

Phản hồi

Chưa có bình luận. Trở thành người phản hồi đầu tiên!

Related Flash News

ChainCatcher3 giờ trước

Công ty khởi nghiệp AI Groq đang huy động được 650 triệu đô la cho các thực thể mới của mình

Odaily5 giờ trước

Vòng quay tiền nóng tăng tốc: từ Bitcoin sang vàng, sau đó là AI và chất bán dẫn lưu trữ

币界网7 giờ trước

Cơ sở suy luận mã nguồn mở của Perplexity pplx-garden bỏ qua thuế mạng của Nvidia để đạt được giao tiếp cực nhanh nhiều thẻ

币界网8 giờ trước

NVIDIA đã phát hành Gamma-World, một mô hình thế giới đa tác nhân hỗ trợ cộng tác bốn người và 24 FPS thời gian thực

ChainCatcher9 giờ trước

AI và cổ phiếu công nghệ hàng đầu tiếp tục đà tăng trưởng mạnh mẽ, trong khi Gate mở rộng phạm vi giao dịch tài sản toàn cầu

币界网11 giờ trước

Khung đào tạo AI ngôn ngữ C tự phát triển của SpaceX gần như hoàn thành và sẽ được sử dụng để đào tạo Grok v5

币界网13 giờ trước

Khối ngoại mua cổ phiếu Nhật Bản tuần thứ tám liên tiếp

Blockbeats15 giờ trước

Giao dịch chứng khoán Mỹ tạo ra sự giàu có trên chuỗi: Một địa chỉ đầu tư 4,3 triệu nhân dân tệ vốn để tham gia thị trường chứng khoán Mỹ, với mức tăng 280% trong hai tháng.

Blockbeats1 ngày trước

"Photon Stock God": Khoản đầu tư của Nvidia giúp Nokia chuyển đổi thành cơ sở hạ tầng AI, với những người trong cuộc tích cực tăng lượng nắm giữ của họ trong tháng qua

币界网1 ngày trước

Doanh thu hàng năm tăng lên 600 triệu đô la và nhà cung cấp dịch vụ suy luận AI Baseten có kế hoạch huy động 1 tỷ đô la với mức định giá 11 tỷ đô la