观点网讯:2月6日,美团发布轻量化MoE模型LongCat-Flash-Lite。
根据公开资料整理,该模型拥有685亿参数,每次推理仅激活29亿~45亿参数,通过将超300亿参数高效用于嵌入层,在智能体与代码领域表现突出,且依托YARN技术支持最长256K上下文,可高效处理长文档、大规模代码分析等场景。
据了解,LongCat-Flash-Lite不仅超越了参数量等效的MoE基线模型,还在与同规模现有模型的对比中展现出卓越竞争力。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。