头条推荐
人王兴就曾首次公开披露美团的 GPU 储备战略,不仅在当年持续投入数十亿美元保障充足的算力供应,还明确表示未来将进一步加大投资力度,为大模型的研发筑牢基础。去年 9 月,美团已发布并开源了首款自研大语言模型 LongCat-Flash,该模型同样基于 MoE 架构,拥有 5600 亿总参数,凭借打破常规的“零计算专家机制”等创新优化设计,在保持了极高推理效率的同时显著降低了运营成本,详情可见此前报
相关搜索
当前文章:http://bs8ext.ruotepai.cn/1lq/0r0b.html
发布时间:01:09:29