网站首页 > 文章精选 正文
阿里巴巴 Qwen 研究团队发布的新 Qwen2.5-Coder 系列开源LLM(Apache 2.0 许可)引起了广泛关注。乍一看,这种关注似乎是当之无愧的。
Qwen 声称:
Qwen2.5-Coder-32B-Instruct 已成为当前的 SOTA 开源代码模型,与 GPT-4o 的编码能力相匹配。
对于一个足够小的 32B 模型来说,这是一个很大的声明,它可以在我的 64GB MacBook Pro M2 上运行。 Qwen 发布的分数看起来令人印象深刻,在各种代码相关基准测试中与 GPT-4o 和 Claude 3.5 Sonnet(2024 年 10 月)版本相比均表现出色:
在基准测试比较中,Qwen 2.5 Coder(32B Instruct)在 LiveCodeBench、Spider 和 BIRD-SQL 指标上的表现优于 GPT-4o 和 Claude 3.5 Sonnet,在 MBPP、Aider 和 CodeArena 上落后,在 MultiPL-E 上显示出好坏参半的结果,在 HumanEval 和 McEval 基准测试中的表现也类似。
其他研究人员的基准测试怎么样?Paul Gauthier 的 Aider 基准测试享有盛誉,Paul 报告称:
新的 Qwen 2.5 Coder 模型在 aider 的代码编辑基准测试中表现非常出色。32B Instruct 模型的得分介于 GPT-4o 和 3.5 Haiku 之间,84% 3.5 Sonnet、75% 3.5 Haiku、74% Qwen2.5 Coder 32B、71% GPT-4o、69% Qwen2.5 Coder 14B、58% Qwen2.5 Coder 7B
这是针对 Aider“整体编辑”基准测试的。“diff”基准测试得分也不错,Qwen2.5 Coder 32B 与 GPT-4o 持平(但略低于 Claude 3.5 Haiku)。
鉴于这些分数(以及 Reddit 上的积极评价),我不得不亲自尝试一下。
我尝试使用 llm-gguf 运行 Qwen/Qwen2.5-Coder-32B-Instruct-GGUF Q8,但速度有点太慢了,因为我目前没有编译它来使用我的 Mac 的 GPU。
但是 Ollama 版本和 MLX 版本都运行良好!
我使用以下命令安装了 Ollama 版本:
ollama pull qwen2.5-coder:32b
这获取了一个 20GB 的量化文件。我使用我的 LLM 工具和 Sergey Alexandrov 的 llm-ollama 插件运行了一个提示,如下所示:
llm install llm-ollama
llm models # Confirming the new model is present
llm -m qwen2.5-coder:32b 'python function that takes URL to a CSV file and path to a SQLite database, fetches the CSV with the standard library, creates a table with the right columns and inserts the data'
这是结果。代码有效,但我必须先解决一个令人沮丧的 ssl 错误(如果我允许模型使用 requests或 httpx 而不是标准库,这不会成为问题)。
我还尝试使用 Apple Silicon 快速阵列框架 MLX,我 直接使用 mlx-llm 库来运行它,通过 uv 运行如下:
uv run --with mlx-lm \
mlx_lm.generate \
--model mlx-community/Qwen2.5-Coder-32B-Instruct-8bit \
--max-tokens 4000 \
--prompt 'write me a python function that renders a mandelbrot fractal as wide as the current terminal'
这给了我一个非常令人满意的结果——当我在终端中运行它生成的代码时,我得到了这个:
这是一个非常有前途的开发。32GB 足够小,我可以在 Mac 上运行模型,而不必退出我正在运行的所有其他应用程序,而且结果的速度和质量都与当前最好的托管模型相媲美。
鉴于代码辅助目前大概占我 LLM 使用量的 80% 左右,这对于我如何使用这类技术来说是一个非常有用的版本。
猜你喜欢
- 2024-12-30 简单的使用SpringBoot整合SpringSecurity
- 2024-12-30 Spring Security 整合OAuth2 springsecurity整合oauth2+jwt+vue
- 2024-12-30 DeepSeek-Coder-V2震撼发布,尝鲜体验
- 2024-12-30 一个数组一行代码,Spring Security就接管了Swagger认证授权
- 2024-12-30 简单漂亮的(图床工具)开源图片上传工具——PicGo
- 2024-12-30 Spring Boot(十一):Spring Security 实现权限控制
- 2024-12-30 绝了!万字搞定 Spring Security,写得太好了
- 2024-12-30 SpringBoot集成Spring Security springboot集成springsecurity
- 2024-12-30 SpringSecurity密码加密方式简介 spring 密码加密
- 2024-12-30 Spring cloud Alibaba 从入门到放弃
- 最近发表
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 计算机网络的拓扑结构是指() (45)
- 稳压管的稳压区是工作在什么区 (45)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)