
帖子
Zyphra发布首个MI355X推理评测:长文本直逼B200

币界网消息,Zyphra发布了基于AMD旗舰芯片MI355X的端到端大模型推理实测,测试在真实单节点环境下运行DeepSeek V3.2、Kimi K2.6与GLM-5.1,并对标NVIDIA B200。实测显示,AMD的288GB显存远超B200的180GB,使其在处理超长文本时能更高效地利用缓存,降低硬件成本。然而,AMD在芯片间互联上处于劣势,B200通过NVLink交换机实现900GB/s带宽,而MI355X采用点对点直连,通信效率较低。为弥补这一短板,Zyphra开发了张量序列并行(TSP)与树状注意力(Tree Attention)算法。最终结果显示,尽管在单请求速度上NVIDIA B200仍领先,但在长文本场景下,Zyphra推理栈的吞吐量逐渐逼近B200,证明AMD在长文本生产环境中具备竞争力。
相關快訊
美股半導體、存儲晶元、伺服器、應用軟體全線爆發,多股再創歷史新高
「BTC OG內幕巨鯨」代理人:AI吸走加密市場流動性,下一輪牛市仍需等待周期回歸
鏈上「炒股」愈演愈烈,trade.xyz 合約持倉量連創新高
「新股神」Serenity繼續看多AAOI:激光瓶頸下光通信需求爆發,13億美元市值仍被低估
分析師:比特幣市值降至約1.09萬億美元,跌出全球前十
XBIT DEX:NVIDIA預計將成為6月底最大公司,概率87.5%
AI 初創公司 Groq 正為新實體籌集 6.5 億美元資金
熱錢輪動加速:從比特幣到黃金,再到AI與存儲半導體
Perplexity開源推理底座pplx-garden,繞過英偉達網路稅實現多卡極速通信
英偉達發佈Gamma-World,多智慧體世界模型支援四人協作與即時24 FPS