发布日期:2025-03-18 20:53 点击次数:70
3月10日小母狗 文爱小母狗 文爱,字节豆包大模子团队官宣开源一项针对MoE架构的要道优化时间,可将大模子考试截止提高1.7倍,老本爽脆40%。据悉,该时间已实际行使于字节的万卡集群考试,累计匡助爽脆了数百万GPU小时考试算力。(证券时报)