如果你是一名程序员,那么你一定体会了AI帮助你快速完成编程任务,提高工作效率。
但是,目前市面上的大多数代码生成模型都需要依赖云端的强大计算资源,无法在本地设备上运行,这给使用者带来了不便和限制。
有没有一种方法,可以让你在没有专用 GPU 的普通笔记本电脑上,也能享受到高质量的代码生成服务呢?
答案是有的,那就是 Stability AI 公司最新发布的 Stable Code 3B 模型。
Stable Code 3B 是什么?
Stable Code 3B 是一个拥有 30 亿参数的大型语言模型,专注于辅助代码任务。它不仅能够在多种编程语言上提供准确和响应的代码补全,还能够填充代码中的缺失部分,甚至生成整个函数或组件。
Stable Code 3B 目前支持 18 种编程语言,包括 Python,JavaScript,Java,C++,和 Go 等。
最大特点:小巧和强大
它只有 30 亿个参数,这意味着它可以在普通的笔记本电脑上本地运行,甚至不需要专用的 GPU。
这是因为它使用了 Flash Attention 2 的技术,这是一种可以显著提高模型的推理速度和内存效率的技术,使得模型能够在普通的 CPU 上快速地生成代码。这样,使用者就不需要依赖云端的服务,也不需要担心网络延迟或隐私泄露的问题,可以随时随地地使用 Stable Code 3B 来辅助编程。
Stable Code 3B的功能十分强大
在相同尺寸下,Stable Code 3B 的能力超过其他AI模型
它的性能与 Meta 公司的 CodeLLaMA 7B 等大型模型相当,甚至在某些方面超过它们,但是它的模型大小却只有它们的 60%。
Stable Code 3B 强大的秘诀
Stable Code 3B 的秘诀在于它的训练过程和优化技术。它基于 Stability AI 公司之前开发的 Stable LM 模型,这是一个在自然语言数据上预训练的模型,拥有强大的通用语言理解能力。
然后,它在软件工程相关的数据上进行了进一步的微调,包括代码库和程序员论坛等。在这个过程中,它采用了 Rotary Position Embeddings (RoPE) 的技术,这是一种可以扩展模型的上下文长度的方法,使得模型能够处理长达 100k 个 token 的代码序列。这样,模型就能够更好地理解代码的结构和逻辑,生成更合理和高质量的代码。
模型地址:
https://huggingface.co/stabilityai/stable-code-3b
官方介绍:
https://stability.ai/news/stable-code-2024-llm-code-completion-release
领取专属 10元无门槛券
私享最新 技术干货