Publier

引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora

币界网
币界网
币界网消息,研究人员在ICLR 2026提交的论文中提出了一种名为planning at inference的推理时缩放框架,首次将AlphaGo的蒙特卡洛树搜索(MCTS)算法应用于长视频生成。该框架将长视频生成任务建模为顺序决策问题,引入MCTS以解决传统生成中的语义漂移与误差累积难题。研究团队设计了多树MCTS变体,以更合理的剪枝与分支系数在状态空间中展开广泛搜寻,显著提升探索效率。在以英伟达开源视频预测模型Cosmos-Predict2为底座的实验中,该框架成功生成超过20秒的高质量连贯视频,生成质量在物体持久性、时间连贯性和文本-视频对齐度等核心指标上相比传统方法实现了大幅提升,视频时长比Sora长18%、比Kling长47%。尽管引入多树搜索带来了算力开销,但随着计算硬件的进步,该框架有望成为长视频生成的关键技术路径。

Avertissement : les contenus d'OKX Orbit sont uniquement publiés à titre informatif. En savoir plus

Réponses

Aucun commentaire pour le moment. Soyez le premier à répondre !

Related Flash News

ChainCatcherIl y a 3 h

La start-up d’IA Groq lève 650 millions de dollars pour ses nouvelles entités

OdailyIl y a 5 h

La rotation de la monnaie chaude s’accélère : du Bitcoin à l’or, puis à l’IA et aux semi-conducteurs de stockage

币界网Il y a 7 h

La base d’inférence open source de Perplexity (pplx-garden) contourne la taxe réseau de Nvidia pour obtenir une communication ultra-rapide multi-cartes

币界网Il y a 8 h

NVIDIA a lancé Gamma-World, un modèle multi-agents supportant la collaboration à quatre personnes et le temps réel à 24 FPS

ChainCatcherIl y a 9 h

L’IA et les principales actions technologiques poursuivent leur forte dynamique, tandis que Gate élargit sa couverture mondiale du trading d’actifs

币界网Il y a 11 h

Le cadre d’entraînement IA en langage C développé par SpaceX est presque terminé et sera utilisé pour entraîner Grok v5

币界网Il y a 13 h

Des investisseurs étrangers ont acheté des actions japonaises pour la huitième semaine consécutive

BlockbeatsIl y a 15 h

Le trading boursier américain crée de la richesse sur la chaîne : une adresse a investi 4,3 millions de yuans en capital pour entrer sur le marché boursier américain, avec une augmentation de 280 % en deux mois.

BlockbeatsIl y a 1 j

« Photon Stock God » : L’investissement de Nvidia aide Nokia à se transformer en infrastructure d’IA, les initiés ayant activement augmenté leurs avoirs au cours du mois écoulé

币界网Il y a 1 j

Le chiffre d’affaires annualisé a grimpé à 600 millions de dollars, et le fournisseur de services d’inférence en IA Baseten prévoit de lever 1 milliard de dollars à une valorisation de 11 milliards de dollars