IT之家 11 月 22 日消息,微软研究院(Microsoft Research)近日发布新闻稿,推出了相比较主流语言模型更小的 Orca 2 LLM,不过依然可以回答一些复杂问题。
微软 Orca 2 共有 70 亿和 130 亿两种尺寸,部分融合了 Llama 2 LLM 参数,通过融合定制的高质量合成数据,提供更准确、更优秀的合成数据。
微软表示 Orca 2 使用扩展的、高度定制的合成数据集进行训练。Orca 2 支持分步处理、回忆然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。
Orca 2 模型相比较 Llama 2 和 WizardLM 等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解等方面更为优秀。
微软表示:“我们的初步结果表明,Orca 2 的性能明显优于类似尺寸的模型。它还达到了与至少大 10 倍的模型相似或更好的性能水平,展示了为较小模型配备更好推理能力的潜力。”
IT之家附上微软 Orca 2 模型的介绍链接,感兴趣的用户可以深入阅读。
领取专属 10元无门槛券
私享最新 技术干货