DeepSeek说实话,的确挺好用的,最近一段时间,用Kimi都少了,晚上偶然打开Kimi,发现Kimi悄然上线了长思考模型,看来是想和DeepSeek学习,也或者是PK。
于是,向Kimi提出一些问题,总体上有两个感受:
一是推理过程看上去有模仿的意味。从文字展现和模式上面,至少前端的展现,和DeepSeek很相似,就像笔者之前说的一样,“像一个啰嗦的老者”。
二是速度的确比DeepSeek快了很多。试图问同样的问题,但是DeepSeek依然是“服务器繁忙,请稍后再试”,或许,Kimi可以在一定程度上,接下DeepSeek的溢出流量。
从效果上来看,在问了几个问题后,发现Kimi的推理和分析,与DeepSeek还是有一定的距离,具体怎么样,等到后面来验证吧。
也有好的地方,Kimi虽然也会展现漫长的推理过程,不过在输出结果的时候,对推理过程做了隐藏,这是比DeepSeek好的地方。
那么,Kimi的长思考模型,和DeepSeek相比,到底怎么样呢?把这个问题喂给了Kimi,输出的结果还是蛮有意思的。
Kimi首先给出了对DeepSeek的评价,Kimi认为,DeepSeek 是一个在人工智能领域备受瞩目的语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。
他总结了DeepSeek的六个优点:
强大的推理能力:在编码、逻辑和数学方面表现出色,在 MMLU 等基准测试中取得高分。
开源可访问性:该模型在 MIT 许可下发布,允许用户为了商业目的检查和修改代码。
功能丰富:提供模块化功能和反向行逻辑等高级功能,使其适用于复杂的项目。
性价比高:所属公司 DeepSeek 产品以开源为主,其模型训练成本远低于行业主流模型,性价比具有显著优势。
高生成速度:每秒生成 60 个字符(TPS)的速度使得 V3 能够满足对响应速度要求高的应用场景。
本地部署支持:通过 FP8 权重的开源,用户可以在本地部署,降低对云服务的依赖,提升数据隐私性。
也说了DeepSeek的三个缺点:
代码生成表现不稳定:在生成一些相对简单的代码时表现不如预期。
知识引用能力不足:在处理一些需要现代知识引用的复杂测试时,未能达到令人满意的效果。
语言交互问题:使用过程中可能出现中英文思考、输出混乱的问题。
接着,Kimi就开始了自我评价。Kimi k1.5 是由 Moonshot AI 开发的一种尖端多模态 AI 模型,旨在完成各种任务,包括文本生成、图像分析和编码。同样,也列举了自己的6大优点和2个缺点(注意,前文DeepSeek给出了3个缺点)。
Kimi k1.5 的六大优点:
多模态能力:可以跨文本和图像进行处理和推理,用途十分广泛。
增强上下文窗口:凭借 128K 上下文窗口,Kimi k1.5 可以在单个提示中处理大量信息。
高级推理:该模型使用强化学习来随着时间的推移提高其解决问题的能力。
免费且无限制使用:Kimi k1.5 免费提供,没有使用限制,可供广泛的用户使用。
网页搜索能力:支持 100 多个网站的实时网页搜索,确保用户获得最新、准确的信息。
处理多个文件:可以同时处理多个文件,包括 PDF、文档、PPT 和图片,在处理大量数据时非常高效。
Kimi k1.5 的两大缺点:
编码能力有限:虽然具有编码功能,但更适合初学者,生成的代码相对简单,缺乏高级功能。
图像分析能力有限:在某些图像分析任务中,表现不如预期,可能提供不准确或不相关的信息。
然后,给出了一个比较表:
最后,给出了结论:
DeepSeek R1在复杂推理、编码和多语言处理上表现优异,适合开发者和专业用户。
Kimi k1.5 长思考模型在长文本处理、多模态任务和用户体验上更具优势,适合普通用户和研究人员。
两者各有侧重,用户可根据具体需求选择适合的模型。
如果一开头不说这是Kimi输出的结果,你会不会认为是DeepSeek呢?
您认为Kimi的分析和评价客观吗?您怎么看?欢迎留言讨论。
请【点赞】,点【在看】,把文章【转发】给您身边的人,谢谢!
领取专属 10元无门槛券
私享最新 技术干货