首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GiantPandaCV

    Huggingface CEO:阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位

    Qwen2-72B-Instruct效果展示 我在HuggingFace的Qwen-2开源地址上测试了几个我实际用到的文创,代码以及CUDA相关的问题,感觉效果非常不错,这里贴一下截图。

    74110编辑于 2024-07-01
  • 来自专栏AI进修生

    CodeGeeX4-ALL-9B:新的开源代码模型击败了 DeepSeek Coder V2 和 Qwen-2 ?(全面测试)

    9B 的新 CodeGeeX4-ALL-9B 编码模型,该模型据称在编码方面击败了 DeepSeek Coder V2、Qwen2、Llama3 和其他模型,同时体积更小;它还在各种编码任务中击败了 Qwen

    1K00编辑于 2024-12-02
  • 来自专栏安全性测试

    左移安全测试:在需求阶段发现SQL注入漏洞

    方法3:LLM辅助需求安全分析利用大语言模型(如Qwen-2、GPT-5)对需求文档进行静态安全分析,自动识别潜在SQL注入风险点:from openai import OpenAIclient = OpenAI

    33310编辑于 2025-08-30
  • 来自专栏AI进修生

    Mistral NeMo:这是现在最好的开源LLM! (经过全面测试并击败 Qwen2、DeepSeek-V2 及其他)

    在我的测试中,它击败了 Qwen-2、DeepSeek-V2、Llama-3 等。 它在编码任务方面甚至更好,并且也非常擅长做文本到应用程序、文本到前端和其他事情。

    1.1K10编辑于 2024-12-02
  • 来自专栏机器之心

    英伟达开源最强通用模型Nemotron-4 340B

    : Nemotron-4-340B-Base 在 ARC-Challenge、MMLU 和 BigBench Hard 基准等常识推理任务上与 Llama-3 70B、Mixtral 8x22B 和 Qwen

    72810编辑于 2024-06-17
  • 来自专栏AI SPPECH

    1. 大模型进入“推理成本时代“

    这一转变的核心原因在于: 大模型规模爆炸:GPT-5、Qwen-2 720B等超大规模模型的出现,使得单次推理的计算资源需求呈指数级增长。

    34010编辑于 2026-01-19
  • 来自专栏新智元

    全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了

    OSS迎来了一位新王者——Qwen-2的MMLU为84.32,完全堪称GPT-4o/Turbo级别模型」! 4个月不到的时间,Qwen-2-72B的生成质量已经和GPT-4不分伯仲。

    84310编辑于 2024-06-17
  • 来自专栏新智元

    英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o

    结果显示,Nemotron-4-340B-Base在常识推理任务,如ARC-Challenge、MMLU和BigBench Hard基准测试中,可以和Llama-3 70B、Mixtral 8x22B和Qwen 我们将该模型 表3是Nemotron-4-340B-Base与Llama-3 70B、Mistral 8x22和Qwen-2 72B三款开源模型的比较结果。

    37710编辑于 2024-06-17
  • 来自专栏NLP/KG

    LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发

    install openllm # or pip3 install openllm openllm hello 支持模型 Llama-3.1 Llama-3 Phi-3 Mistral Gemma-2 Qwen

    2.6K11编辑于 2024-08-17
  • 来自专栏AIGC 先锋科技

    字节提出 LLaVA-OneVision :首个突破多模态模型性能瓶颈的开源大型模型 !

    作者选择Qwen-2 [147]作为作者的LLM 的参数化模型,因为它提供了各种模型大小并表现出目前公开的预训练权重中强大的语言能力。 视觉编码器。

    2.3K10编辑于 2024-08-14
领券