{ "lastUpdated": "2026-02-27T02:34:17.862Z", "totalItems": 13, "items": [ { "title": "字节全家桶 Seed 2.0 + TRAE 玩转 Skill", "link": "http://www.ruanyifeng.com/blog/2026/02/seed-2.0.html", "pubDate": "2026-02-14T11:51:22.000Z", "content": "\n

一、引言

\n\n

国产大模型之中,字节是一个异类。

\n\n

不像其他大模型轰轰烈烈、争夺眼球,它更低调,不引人注目。

\n\n

但是,它做的事情反倒最多,大模型、Agent、开发工具、云服务都有独立品牌,遍地开花,一个都不缺,都在高速推进。

\n\n

\"\"

\n\n

Seed 是字节的大模型团队,底下有好几条产品线,最近热得发烫的视频模型 Seedance 2.0 就是他们的产品。

\n\n

\"\"

\n\n

今天,我就用字节的全家桶 ---- 刚刚发布的 Seed 2.0 模型和开发工具 TRAE ---- 写一篇 Skill 教程。

\n\n

大家会看到,它们组合起来既强大,又简单好用,(个人用户)还免费。这也是我想写的原因,让大家知道有这个方案。

\n\n

只要十分钟,读完这篇教程,你还会明白 Skill 是什么,怎么用,以及为什么一定要用它。

\n\n

二、Seed 2.0 简介

\n\n

先介绍 Seed 2.0,它是 Seed 家族的基座模型

\n\n

\"\"

\n\n

所谓\"基座模型\"(foundation model),就是一种通用大模型,可用来构建其他各种下游模型。最大的两个特征有两个:一个是规模大,另一个是泛化能力强,这样才方便构建别的模型。

\n\n

大家熟知的豆包,就是基于 Seed 模型,它也被称为\"豆包大模型\"。这次 Seed 2.0 包含 Pro、Lite、Mini 三款通用模型,以及专为开发者定制的 Seed 2.0 Code 模型。

\n\n

由于各种用途都必须支持,Seed 2.0 的通用性特别突出,比以前版本都要强。

\n\n
\n

1、支持多模态,各种类型的数据都能处理:文字、图表、视觉空间、运动、视频等等。

\n\n

2、具备各种 Agent 能力,方便跟企业工具对接:搜索、函数调用、工具调用、多轮指令、上下文管理等。

\n\n

3、有推理和代码能力。

\n
\n\n

正因为最后一点,所以我们可以拿它来编程,尤其是生成前端代码。跟字节发布的 AI 编程工具 TRAE 配合使用,效果很好,特别方便全栈开发,个人用户还免费。

\n\n

三、TRAE 的准备工作

\n\n

下载安装 TRAE 以后,它有两种模式,左上角可以切换:IDE 模型和 SOLO 模型。

\n\n

\"\"

\n\n

选择 IDE 就可以了,SOLO 是 AI 任务的编排器,除非多个任务一起跑,否则用不到。

\n\n

然后,按下快捷键 Ctrl + U(或者 Command + U),唤出对话框,用来跟 AI 对话。

\n\n

\"\"

\n\n

我们要构建 Web 应用,左上角就选 @Builder 开发模式。右下角的模型就选 Seed-2.0-Code。

\n\n

\"\"

\n\n

可以看到,TRAE 自带的国产开源编程模型很全,都是免费使用。

\n\n

准备工作这样就差不多了。

\n\n

四、编程测试

\n\n

我选了一个有点难度的任务,让 Seed 2.0 生成。

\n\n

ASCII 图形是使用字符画出来的图形,比如下图。

\n\n

\"\"

\n\n

我打算生成一个 Web 应用,用户在网页上输入 ASCII 图形,自动转成 Excalidraw 风格的手绘图形。

\n\n

提示词如下:

\n\n
\n

\"生成一个 Web 应用,可以将 ASCII 图形转为 Excalidraw 风格的图片,并提供下载。\"

\n
\n\n

\"\"

\n\n

模型就开始思考,将这个任务分解为四步。

\n\n

\"\"

\n\n

五、生成结果

\n\n

等到 Seed 2.0 代码生成完毕,TRAE 就会起一个本地服务 localhost:8080,同时打开了预览窗口。

\n\n

\"\"

\n\n

生成的结果还挺有意思,上部的 ASCII 输入框提供了四个示例:Box、Tree、Flowchart、Smiley。下面是 Tree 的样子。

\n\n

\"\"

\n\n

然后是 Excalidraw 参数的控制面板:线宽、粗糙度、弯曲度、字体大小。

\n\n

\"\"

\n\n

点击 Convert(转换)按钮,马上得到手绘风格的线条图。

\n\n

\"\"

\n\n

整个页面就是下面的样子。

\n\n

\"\"

\n\n

六、Skill 简介

\n\n

这个页面的设计,感觉不是很美观,还可以改进。我打算为 Seed 2.0 加入专门的前端设计技能,使其能够做出更美观的页面。

\n\n

所谓 Skill(技能),就是一段专门用途的提示词,用来注入上下文。

\n\n

有时候,提示词很长,每次都输入,就很麻烦。我们可以把反复用到的部分提取出来,保存在一个文件里面,方便重复使用。这种提取出来的提示词,往往是关于如何完成一种任务的详细描述,所以就称为\"技能文件\"。

\n\n

格式上,它就是一个 Markdown 文本文件,有一个 YAML 头,包含 name 字段和 description 字段。

\n\n

\"\"

\n\n

name 字段是 Skill 的名称,可以通过这个名称调用该技能;description 字段则是技能的简要描述,模型通过这段描述判断何时自动调用该技能。

\n\n

有些技能比较复杂,除了描述文件以外,还有专门的脚本文件、资源文件、模板文件等等,相当于一个代码库。

\n\n

\"\"

\n\n

这些文件里面,SKILL.md 是入口文件,模型根据它的描述,了解何时何处调用其他各个文件。

\n\n

这个库发到网上,就可以与其他人共享。如果你觉得 AI 模型处理任务时,需要用到某种技能,就可以寻找别人已经写好的 Skill 加载到模型。

\n\n

七、前端设计技能

\n\n

下面,我使用 Anthropic 公司共享出来的前端设计技能,重构一下前面的页面。它只有单独一个 Markdown 文件,可以下载下来。

\n\n

打开 TRAE 的\"设置/规则和技能\"页面。

\n\n

\"\"

\n\n

点击技能部分的\"+ 创建\"按钮,打开创建技能的窗口。

\n\n

\"\"

\n\n

你可以在这个窗口填写 SKill 内容,也可以上传现成的 Skill 文件。我选择上传,完成后,就可以看到列表里已经有 frontend-design 技能了。

\n\n

\"\"

\n\n

然后,我就用下面的提示词,唤起这个技能来重构页面。

\n\n
\n

\"使用 frontend-design 技能,重构这个页面,让其变得更美观易用,更有专业感。\"

\n
\n\n

下面就是模型给出的文字描述和重构结果。

\n\n

\"\"

\n\n

\"\"

\n\n

页面确实感觉变得高大上了!

\n\n

八、Vercel deploy 技能

\n\n

最后,再看一个技能的例子。

\n\n

代码生成以后,都是在本地机器上运行,能不能发布到网上,分享给更多的人呢?

\n\n

回答是只要使用 Vercel 公司的 deploy 技能,就能一个命令将生成结果发布到 Vercel 的机器上。

\n\n

在 Vercel 官方技能的 GitHub 仓库里,下载 Vercel-deploy 技能的 zip 文件。

\n\n

然后,把这个 zip 文件拖到 TRAE 的技能窗口里面,就会自动加载了。

\n\n

\"\"

\n\n

输入提示词:\"将生成的网站发布到 Vercel\"。

\n\n

模型就会执行 vercel-deploy 技能,将网站发布到 Vercel,最后给出两个链接,一个是预览链接,另一个是发布到你个人账户的链接。

\n\n

\"\"

\n\n

大家现在可以访问这个链接,看看网站的实际效果了。

\n\n

九、总结

\n\n

如果你读到这里,应该会同意我的观点,Seed 2.0 的编程能力相当不错,跟自家的编程工具 TRAE 搭配起来,好用又免费。

\n\n

Skill 则是强大的能力扩展机制,让模型变得无所不能,一定要学会使用。

\n\n

(完)

\n\n

文档信息

\n
\n
\n ", "author": "阮一峰", "categories": [], "source": "阮一峰的网络日志", "sourceUrl": "http://www.ruanyifeng.com/blog/atom.xml" }, { "title": "科技爱好者周刊(第 385 期):马斯克害怕中国车企吗?", "link": "http://www.ruanyifeng.com/blog/2026/02/weekly-issue-385.html", "pubDate": "2026-02-12T18:34:10.000Z", "content": "\n

这里记录每周值得分享的科技内容,周五发布。([通知] 下周春节假期,周刊休息。

\n\n

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

\n\n

封面图

\n\n

\"\"

\n\n

去年7月开通的浙江丽水机场,是一个丘陵之中的山地机场,设计理念是与自然和谐共生,由马岩松 MAD 事务所设计。(via

\n\n

马斯克害怕中国车企吗?

\n\n

两周前,马斯克宣布,特斯拉公司将停产 Model S 和 Model X 两种车型。

\n\n

\"\"

\n\n

他的解释是,生产线空出来,用来生产机器人和无人驾驶出租车。

\n\n

这显然会打击特斯拉的汽车业务。它的家用轿车一共只有四款,现在一下子少了两款,而且是最贵的两款,只留下低价的 Model 3 和 Model Y。

\n\n

新闻发布会上,记者就问了,那么有没有计划推出新的车款?

\n\n

特斯拉的工程副总裁这样回答:

\n\n
\n

\"你们必须转变对我们的看法,我们现在更多是提供交通运输服务,而不仅仅是为市场提供可购买的车辆。\"

\n
\n\n

马斯克补充说:

\n\n
\n

\"我相信,长期中我们将只生产自动驾驶车辆。\"

\n
\n\n

这意味着,特斯拉改变了定位,它将是一家交通运输公司,而不是汽车制造商了。剩下的两种车款,未来也有可能放弃,也许只生产不需要司机的自动驾驶车辆。

\n\n

国外立刻有评论家,发表了尖锐的批评,认为特斯拉正在放弃造车,这是自杀行为。

\n\n

\"\"

\n\n

他说,马斯克因为兴趣转向其他地方,不再坚持造车了,非常可惜,也非常愚蠢。

\n\n
\n

\"特斯拉听任自家非常成功的汽车制造业务衰落,以便去追逐那些不知道能否成功、也不知道能否获得批准、更不知道有没有市场的机器人和无人驾驶出租车。\"

\n
\n\n

他呼吁,马斯克不要畏惧与中国车企竞争,要坚持下去,造出又好又便宜的美国电动汽车。

\n\n
\n

\"未来可以有另一种版本:特斯拉依然是电动汽车领域的领军企业,同时还在积极研发 AI 和自动驾驶技术,推出价格亲民的车款与中国电动汽车展开竞争,并拓展至新的细分市场。\"

\n
\n\n

这大概是一种相当普遍的看法马斯克对于与中国车企竞争,没有信心了,不怎么想继续造车了

\n\n

\"\"

\n\n

毕竟,特斯拉的汽车销量在2025年是衰退的,少于2024年,\"世界最大电动车厂商\"的头衔也让给了比亚迪。

\n\n

马斯克是不是害怕中国车企?我说说我的看法。

\n\n

首先,我不知道,他把生产线转为制造机器人,是不是正确的决定;我也不知道,他还想不想造车。我只知道,那些批评他的人,完全不了解马斯克。

\n\n

千万不要用普通人的心态,去揣度马斯克,他不是一个常规的人

\n\n

如果看过他的传记,就会知道,他迄今所有的创业项目,都不是常规项目。从最早的 Paypal,到后来的电动汽车、太阳能发电、可回收火箭、星链、脑机通信等等,都有一个共同点,那就是他做的时候,那些项目都没有成功先例,因此也不存在竞争对手。

\n\n

马斯克一生中只喜欢做那些\"从0到1\"、最前沿的、从没人成功过的事情。 做跟别人一样的产品,争夺市场份额,完全不是他的风格。

\n\n

电动汽车已经是一种成熟商品了,主要技术问题都解决了,完全没有进入门槛,大家开始比拼成本了。你觉得,马斯克还会有兴趣吗?

\n\n

我告诉你吧,对于击败中国车企,成为世界最大、最先进的电动车厂商,人家根本没有这个兴趣。他也压根不需要赚更多的钱了,已经是世界首富了。

\n\n

反倒是,做出无所不能的机器人,组建自动驾驶车队,或者从事其他更酷的、无人见过的业务,更符合马斯克的风格。

\n\n

我认为,这值得学习。中国企业不仅要追求做大做强,也可以追求做一些前无古人的事情,不仅要做 number one,还要做 only one。

\n\n

科技动态

\n\n

1、世界最贵的域名

\n\n

一位加密货币网站创始人,花费7000万美元收购了域名\"ai.com\"。这是迄今已知的域名交易中价格最高的一笔。

\n\n

\"\"

\n\n

真是很难相信,单单一个域名,价值会超过人民币5亿元。

\n\n

该域名目前可以抢注用户名,并绑定信用卡,将来会提供\"AI 智能体\"服务。

\n\n

历史第二贵的域名是币圈公司 Block.one 花费3000万美元从 MicroStrategy 购买的\"Voice.com\"。第三贵的域名是360公司花费1700万美元买入的\"360.com\"。

\n\n

2、华为的表情符号

\n\n

表情符号(emoji)在各个系统的实现不一样。这些年来,一个趋势是各家的实现逐渐向苹果的设计靠拢。

\n\n

\"\"

\n\n

上图中,\"枪\"的表情符号最后都变成苹果的\"水枪\"。

\n\n

一个例外是华为的鸿蒙系统,表情符号跟其他系统有很多不同。

\n\n

\"\"

\n\n

上图是\"恳求\"的表情符号,只有华为是双手合十。

\n\n

\"\"

\n\n

上图是风筝,只有华为是中式的纸鹫。

\n\n

3、LinkedIn 的用户指纹

\n\n

很多网站会追踪用户,以前使用 cookie,现在使用\"用户指纹\",即为每个用户生成一个特征码。

\n\n

\"\"

\n\n

最近,有人披露了 LinkedIn 网站如何生成\"用户指纹\",令人瞠目结舌。

\n\n

它的页面会加载一个清单,里面列出了2,953个浏览器插件,脚本会依次检查你安装了其中哪些插件。下面就是研究人员提取出来的脚本

\n\n

\"\"

\n\n

这导致的直接后果就是,访问 LinkedIn 时,控制台可能有上千个报错

\n\n

\"\"

\n\n

文章

\n\n

1、直接用 Postgres 吧(英文)

\n\n

\"\"

\n\n

一般来说,不同用途可以使用不同的数据库,比如搜索用 Elasticsearch、缓存用 Redis、队列用 Kafka......

\n\n

本文提出,不管什么用途,Postgres 数据库都适用,只要为它装上相应的插件。

\n\n

2、TypeScript 的 Brand 类型(英文)

\n\n

\"\"

\n\n

本文介绍 TypeScript 的一个重要编程技巧:为同一种类型添加 brand 属性,防止混淆。

\n\n

这里还有一篇同样主题的教程,可以结合起来一起看。

\n\n

\"\"

\n\n

3、我如何对本地餐厅排序(英文)

\n\n

\"\"

\n\n

作者介绍他从谷歌地图,下载本地餐厅数据和评价,进行评分排序的过程。

\n\n

4、如何在开发者工具定位 JavaScript 对象(英文)

\n\n

\"\"

\n\n

本文介绍一个 JS 的高级技巧,有时需要追踪内存中的某个对象的变化,可以利用开发者工具来查看。

\n\n

5、如何使用 Unix 信号传递消息(英文)

\n\n

\"\"

\n\n

Unix 系统(包括 Linux 和 macOS)有信号机制,用来触发进程的某种行为。信号只是一个数字,本身不能发送文本消息。

\n\n

本文用一种很巧妙的方法,实现了通过信号向进程发送文本消息。

\n\n

6、泊松分布背后的原理(英文)

\n\n

\"\"

\n\n

泊松分布是独立小概率事件的概率分布,本文通俗介绍它的原理。

\n\n

工具

\n\n

1、Subtrace

\n\n

\"\"

\n\n

一个开源的 Docker 应用,在浏览器里观察本机 Docker 容器的网络通信。

\n\n

2、ScrapeServ

\n\n

一个抓取网页截图的服务器,需要自己架设,通过 API 调用。

\n\n

3、QtScrcpy

\n\n

\"\"

\n\n

电脑操作手机的工具,可以将手机投屏到电脑,然后用键盘和鼠标操作手机。

\n\n

它是用 Qt 重新实现的 scrcpy

\n\n

4、ProxyPin

\n\n

\"\"

\n\n

全平台的开源抓包软件,拦截和重写 HTTP(S) 流量。(@wanghongenpin 投稿)

\n\n

5、luci-theme-aurora

\n\n

\"\"

\n\n

一款 OpenWrt LuCI 现代感主题,基于 Vite 和 Tailwind CSS。(@eamonxg 投稿)

\n\n

6、BetterCapture

\n\n

\"\"

\n\n

开源的 Mac 录屏软件。(@cosmicqbit 投稿)

\n\n

7、FeedCraft

\n\n

\"\"

\n\n

开源的 Web 服务,生成处理后的 RSS 源,可用来提取全文、翻译、摘要、过滤等。(@Colin-XKL 投稿)

\n\n

8、Extension.js

\n\n

\"\"

\n\n

一个浏览器插件开发的工具库,帮你快速开发一个插件。

\n\n

9、Yaak

\n\n

\"\"

\n\n

一个跨平台的桌面软件,可以用来调试 API(包括 REST、GraphQL 和 gRPC),是 Postman 的替代品。

\n\n

10、Neko Master

\n\n

\"\"

\n\n

网络流量的轻量级分析面板,展示与统计本地网关的流量数据。(@foru17 投稿)

\n\n

AI 相关

\n\n

1、Codex Viz

\n\n

\"\"

\n\n

OpenAI 公司的编程工具 Codex 的本地数据统计面板。(@onewesong 投稿)

\n\n

2、Universal DB MCP

\n\n

一个 MCP 服务器,可以让 AI 连接17种数据库。(@Anarkh-Lee 投稿)

\n\n

另有一个 Excalidraw MCP,可以通过 AI 用自然语言来生成手绘风格图表。(@Scofieldfree 投稿)

\n\n

3、BrainKernel

\n\n

\"\"

\n\n

一个终端应用,使用 AI 分析每个进程,一旦识别为恶意进程,就把它终止。

\n\n

资源

\n\n

1、神经网络的视觉解释

\n\n

\"\"

\n\n

这个网站用动画解释\"什么是神经网络\"。

\n\n

2、DevOps Engineer

\n\n

\"\"

\n\n

一个 IT 课程网站,学习 Linux 和 DevOps 的实践技能,在网页上连接远程虚拟机进行交互操作,有中文版,免费额度是每天3次虚拟机。(@huhuhuhang 投稿)

\n\n

3、理解机器学习:从理论到算法(英文)

\n\n

\"\"

\n\n

免费的英文电子书。

\n\n

图片

\n\n

1、显卡的包装

\n\n

现在的显卡包装,都非常简单。比如,下面是5090显卡的包装。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

但是,二十多年前的21世纪初,可不是这样,显卡的包装非常花哨。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

究其原因,一方面是环保观念的提升,另一方面是显卡现在几乎没有竞争,一上架就会被买走,厂商就不在包装上动脑筋了。

\n\n

\"\"

\n\n

\"\"

\n\n

文摘

\n\n

1、迪拜如何走向繁荣

\n\n

迪拜是中东地区最繁荣的城市。

\n\n

\"\"

\n\n

但是,在1950年的时候,它还是一个海边的沙漠小村庄,除了出产珍珠,没有任何特殊之处。

\n\n

\"\"

\n\n

它的地理位置也不好。

\n\n

\"\"

\n\n

迪拜在红海一个突出的岬角上(上图箭头处),并不靠近主要航线,周围还有其他港口,那些地方也产珍珠,谁会特意来迪拜呢?

\n\n

幸运的是,1966年,迪拜发现了石油,获取了巨额财富。但是,单单有石油,并不会变成繁荣的大城市。

\n\n

这时,迪拜的酋长做出了几个重要决定:(1)免税,不对其他国家的商人征税;(2)发展贸易,给予商人各种便利,方便他们做生意;(3)加强基础设施,石油赚到的钱都投在道路、机场、电力、通信、港口;(4)信仰自由,任何信仰的人都可以来迪拜,不会强迫你遵守伊斯兰教。

\n\n

正是这些措施,使得迪拜高速发展。

\n\n

后来,迪拜的石油枯竭了,但是贸易已经稳固确立了,城市开始多元化发展:金融、旅游、房地产......

\n\n

迪拜的故事告诉我们,自然资源不会带来繁荣,但是一个低税收、宽容、安全、低管制的环境会带来繁荣。

\n\n

言论

\n\n

1、

\n\n

根据亚马逊老板贝佐斯的定义,小团队就是可以用两张大披萨喂饱的团队,也就是5到8人。

\n\n

AI 出现以后,小团队将变得只用一张大披萨就可以喂饱,只需要2到3人(含产品经理和设计师)。

\n\n

-- 《单披萨工程团队的兴起》

\n\n

2、

\n\n

我们的规则是:(1)代码绝不能由人编写。(2)代码不得由人进行审查。(3)如果每位工程师每天消耗的 token 不到1000美元,那么就还有提升空间。

\n\n

-- 《StrongDM AI 的故事》

\n\n

3、

\n\n

AI 热潮对于美国的影响是,电工越来越难找,一些建筑项目被迫暂停。

\n\n

亚马逊、谷歌、微软、Meta 和 Oracle 这五家公司,2026年的 AI 硬件投资,将相当于美国军费的四分之三。

\n\n

-- 《华盛顿邮报》

\n\n

4、

\n\n

创业公司可以分成两种:O(n) 与 O(n^2),其中的 n 表示时间。

\n\n

O(n) 公司随着时间大致呈线性增长,而 O(n^2) 公司会呈超线性的加速增长。

\n\n

-- 《O(n) 与 O(n^2) 创业企业》

\n\n

5、

\n\n

进入物理学领域是我一生的最大错误,我应该选择计算机科学。虽然我还是不会有女朋友,但至少会赚得盆满钵满。

\n\n

-- 《锗的电子带结构》

\n\n

往年回顾

\n\n

重新思考 6G(#338)

\n\n

技术写作的首要诀窍(#288)

\n\n

停止寻找的最佳时间(#238)

\n\n

音乐是反社交(#188)

\n\n

(完)

\n\n

文档信息

\n
\n
\n ", "author": "阮一峰", "categories": [], "source": "阮一峰的网络日志", "sourceUrl": "http://www.ruanyifeng.com/blog/atom.xml" }, { "title": "智谱旗舰 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex", "link": "http://www.ruanyifeng.com/blog/2026/02/glm-5.html", "pubDate": "2026-02-12T01:26:13.000Z", "content": "\n

一、引言

\n\n

刚才我看到,智谱新一代的旗舰模型 GLM-5 已经正式发布了。

\n\n

真的拼啊,非要赶在长假之前,上一个版本 GLM-4.7 发布还不到两个月呢......

\n\n

\"\"

\n\n

GLM-4.x 在国内外评价很高,公认是编程领域第一梯队的模型。新的大版本就让人很好奇,会有哪些改进。

\n\n

实话实说,上个星期,他们团队联系我参与内测,我已经使用这个模型好几天了。

\n\n

巧的是,也在上个星期,国外两个旗舰模型同时发了新版本:Anthropic 公司发了 Claude Opus 4.6,OpenAI 公司发了 GPT-5.3-Codex。

\n\n

这三个新模型都主打编程,我就忍不住进行了比较测试,看看它们有没有差别,我想这也是很多人感兴趣的。

\n\n

下面就是真实编程任务,在这三个 AI 模型上的生成结果。

\n\n

二、GLM-5 简介

\n\n

官方的发布说明,这样介绍 GLM-5:作为开源模型,GLM-5 完全对标顶尖闭源模型,在两个地方做了特别强化。

\n\n

(1)复杂系统工程

\n\n

GLM-5 不单善于生成前端网页,更善于处理后端任务、系统重构、深度调试,摒弃了\"重前端审美、轻底层逻辑\"的模式。

\n\n
\n

它具备极强的自我反思与纠错机制,能在编译失败或运行报错时,自主分析日志、定位根因并迭代修复,直到系统跑通。

\n
\n\n

(2)长程 Agent

\n\n

它能够跑长程任务,即多阶段、长步骤的复杂任务,可以自主拆分需求,自动化连续运行长达数小时,并保持上下文连贯与目标一致性。

\n\n

(3)小结

\n\n

GLM-5 可以完成的任务,已经超越了生成前端 UI,而是可以生成系统级大型复杂项目,比如操作系统内核、浏览器内核、V8 引擎之类的。

\n\n

它的宣传语是\"在大模型进入 Agent、大任务的时代,GLM-5 是你可以使用的开源选择。\"

\n\n

三、测试方法

\n\n

我选择的测试题目,是 HuggingFace 公司的布道师亚历杭德罗·奥(Alejandro AO)测试 Opus 4.6 和 GPT 5.3 的题目。

\n\n

\"\"

\n\n

他拍了一个视频,展示这两个模型的表现。

\n\n

我就拿同样的题目去测 GLM-5,再跟他的结果进行对比。

\n\n

一共四道题,前端和后端的都有。我已经把原始的提示词和原始脚本,做成了一个仓库,放到了 GitHub

\n\n

四、网页设计测试

\n\n

第一个测试是网页设计和重构能力。

\n\n

原始页面非常简陋。

\n\n

\"\"

\n\n

它只是把信息做了分类,然后堆叠在一起,我们让 AI 对这个网页进行重新设计,让它变得美观易用,透露出成熟可靠的专业感。

\n\n

前面说了,提示词和原始文件都在 GitHub,这里不重复贴了。大家可以拿来自己跑,也可以让其他模型跑。

\n\n

下面就是 GLM-5 的生成结果。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

这个结果称得上美观又专业,所有信息组织得井井有条,而且带有动画效果,手机浏览(下图)也没有问题,简直可以直接上线。

\n\n

\"\"

\n\n

我把这个页面发布出来了,大家可以点击这里去看。

\n\n

下面是 Opus 4.6 的生成结果,从视频截图的。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

下面是 GPT-5.3 的生成结果。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

这三个设计都是可用的,但是 GPT-5.3 有一个瑕疵(页眉没做成粘性页眉,往下拉就没了),而且在设计上也不如另外两者好看。

\n\n

所以,在这个测试中,GLM-5 和 Opus 4.6 表现更好,至于哪一个更出色,要看使用者的审美偏好。我个人更喜欢 GLM-5 的设计风格。

\n\n

五、3D 沙盒测试

\n\n

第二个测试看看 AI 模型的 3D 动画生成能力。

\n\n

要求是生成一个教育目的的网页 3D 沙盒,用动画展示太阳系的天体运动,并且能够调整质量、位置、速度等动画参数,还能手动增加新的天体。

\n\n

下面是 GLM-5 的生成结果。

\n\n

\"\"

\n\n

页面的右侧是动画区,默认展示三个小行星围绕中间的恒星进行轨道运动,可以用鼠标拖拽进行360度旋状,以及放大和缩小。

\n\n

\"\"

\n\n

页面的左侧是操控面板,做得挺不错。

\n\n

\"\"

\n\n

\"\"

\n\n

上半部分可以调节动画和天体参数,下半部分用来增加新的天体,或者删除现有天体。

\n\n

作为比较,Opus 4.6 的生成结果。

\n\n

\"\"

\n\n

\"\"

\n\n

GPT-5.3 的生成结果。

\n\n

\"\"

\n\n

\"\"

\n\n

这三个生成结果,都满足了需求,都可以顺利运行。但是,GLM-5 的动画缺了引力网格线,而 GPT-5.3 的网格线太凌乱,因此动画效果方面 Opus 4.6 更好一些。

\n\n

操控面板方面,GLM-5 和 Opus 4.6 都设计得不错,GPT-5.3 有点简单。

\n\n

总体上,我感觉这一轮的最佳选手是 Opus 4.6,其次是 GLM-5,最后是 Codex 5.3。

\n\n

六、网页游戏

\n\n

第三个测试是生成一个网页游戏\"愤怒的小鸟\"(angry birds)。

\n\n

GLM-5 的生成结果还可以,挺像原作的,可以玩,但是游戏性不足,弹跳效果不够好。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

Opus 4.6 的还原度很高,游戏体验也接近原作。

\n\n

\"\"

\n\n

\"\"

\n\n

\"\"

\n\n

GPT-5.3 的生成结果令人尴尬,小鸟根本弹不出去,游戏不能玩。

\n\n

\"\"

\n\n

\"\"

\n\n

这一轮很明显,Opus 4.6 最佳,GLM-5 其次。

\n\n

七、Laravel 转为 Next.js

\n\n

最后一个测试是,将一个基于 PHP 语言 Laravel 框架的 Web 应用,转为 JavaScript 语言 Next.js 框架。

\n\n

GLM-5 在处理时,几乎没有出现任何麻烦,很快就将 PHP 语言转成了 JS 语言,并且给出了转换后的代码结构。

\n\n

\"\"

\n\n

它还在转化后,贴心地自动安装了依赖的软件包,做好了脚本编译,提示用户:你只要接入外部 API,一键执行npm run dev就能直接运行了。

\n\n

\"\"

\n\n

我按照它的提示,运行很顺利,没有报错,打开localhost:3000就能访问应用了。

\n\n

\"\"

\n\n

这是一个查看城市天气的应用。因为没有要求改变样式,所以看上去跟 PHP 原版一模一样。

\n\n

右上角输入框,可以查询城市。

\n\n

\"\"

\n\n

在查询结果中,选中你所要的城市。

\n\n

\"\"

\n\n

点击进去,就是城市的详情页,有天气、日出日落时间、空气质量、地图等信息。

\n\n

\"\"

\n\n

Opus 4.6 和 GPT-5.3 也生成了同样的结果,因为页面、功能完全一样,就不展示截图了。

\n\n

值得一提的是,GLM-5 和 GPT-5.3 的转换时间都在5分钟左右,Opus 4.6 似乎遇到了一点问题,花费了整整20分钟。

\n\n

这一轮单看结果,三个模型都很好,但是 GLM-5 花费的生成时间短,没有任何报错,全过程的用户体验好,我愿意投它一票。

\n\n

八、总结

\n\n

经过这些测试,GLM-5 的编程表现可圈可点,是拿得出手的,能够跟国外最新的旗舰模型放在一起。某些方面甚至还能赢出,即使不如人家的地方,往往也是细节问题,不是质的差别。

\n\n

它听说在训练和运行过程中,都使用了国产的\"万卡集群\"。可以想象,如果得到更多的卡、更多的算力,它的表现会更好,足以跟世界第一梯队的大模型公司正面 PK。

\n\n

另外,它这次特别强化的两个点----\"复杂系统\"和\"长程任务\"----是有感的。

\n\n

它生成的系统逻辑和后端代码,可靠性不错,无论是生成时还是运行时,报错都不多。缺失的地方往往就是一些功能的缺失,后期让 AI 再补上就可以了,不是架构出问题。另外,我有一项个人任务,它跑了足足两个小时,最后也完成了,没有乱掉。

\n\n

我愿意把官方的一段话,作为结尾。

\n\n
\n

2026年编程大模型正在从\"能写代码\"进阶为\"能构建系统\",而 GLM-5 堪称开源界的\"系统架构师\"模型,从关注\"前端审美\"转向关注\"Agentic深度/系统工程能力\",是 Opus 4.6 与 GPT-5.3 的国产开源平替。

\n
\n\n

(完)

\n\n

文档信息

\n
\n
\n ", "author": "阮一峰", "categories": [], "source": "阮一峰的网络日志", "sourceUrl": "http://www.ruanyifeng.com/blog/atom.xml" }, { "title": "一些杂事", "link": "https://wangdaodao.com/20260112/trivial-matters.html", "pubDate": "2026-01-12T15:07:00.000Z", "content": "\n

一转眼就到了2026年了,差不多再有一个月就要过年了。最近身边,也发生了一些杂事,有好事也有不好的事,让我自己也有了一些反思。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "关于孟鲁司特钠的不良反应", "link": "https://wangdaodao.com/20260105/montelukast.html", "pubDate": "2026-01-05T14:54:00.000Z", "content": "\n

最近刷抖音,发现一些医生和家长都在说孟鲁司特钠、易坦静盐酸氨溴索口服溶液和西替利嗪这些儿童用药,都会导致口吃、多动、自杀等倾向。

早在2020年3月,美国 FDA 对孟鲁司特钠发布黑框警告,强调医护人员应意识到孟鲁司特钠可能带来严重神经/精神事件风险,包括抑郁、自残、自杀倾向。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "开源网易云及QQ音乐播放插件", "link": "https://wangdaodao.com/20251226/typecho-netease-qq-player.html", "pubDate": "2025-12-26T05:25:00.000Z", "content": "\n

之前一直用的是 Meting 插件来解决博客音乐播放的问题,不过发现作者很久都不再维护更新了,所以想造个轮子自己搞一个播放器试试。我这次并没有自己来解析音乐,因为现在网易云和QQ都有自己的分享链接,直接用官方的不是更稳定嘛……

再说一下为啥不用短代码这种形式,我感觉直接放一个链接是更方便的,后面就算是禁用了插件,也不会影响跳转到正常的官方链接上。目前除了高德地图这种的我现在用的是短代码,其他的例如豆瓣卡片都是使用的链接形式。

这次为啥没拆分成两个组件呢,因为这两个都是链接方式的,而且也有共同的设置,所以就整合到一起了,后面再增加播放器也走统一逻辑。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "开源Typecho抖音播放器插件", "link": "https://wangdaodao.com/20251220/dou-yin-player.html", "pubDate": "2025-12-20T08:24:00.000Z", "content": "\n

前段时间,开源了一个Bilibili播放器插件,原理也是非常简单。这次看到抖音也可以视频分享,那就也做一个抖音的播放器插件吧。

原理非常简单,使用正则表达式匹配抖音的链接,然后替换成 iframe 播放器就可以了。

抖音自己会根据容器的宽度来判断移动端或者电脑端,跟了下代码,发现730px是他的临界值,所以样式也会基于这个宽带做适配。

使用的时候更简单了,根本不用短代码,直接把视频链接扔进去就可以了,这样一来即便是禁用了插件,也可以正常的跳转到视频地址。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "2025年终总结", "link": "https://wangdaodao.com/20251214/2025-summary.html", "pubDate": "2025-12-14T05:52:00.000Z", "content": "\n

2025年还有半个月就要过去了,回头看看这一年,还真发生了不少事情。趁着周末有点时间,稍微总结一下,免的到了月底,没时间总结。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "Typecho博客开启EdgeOne", "link": "https://wangdaodao.com/20251210/typecho-edge-one.html", "pubDate": "2025-12-10T12:03:00.000Z", "content": "\n

其实腾讯云的边缘安全加速平台 EdgeOne 应该10月份搞活动的时候就已经获取并激活了,但是一直不知道该怎么用。今天有点空闲,就拿起来配置一下。不过这方面我是个菜鸟,好多东西还不懂,只能边问 AI 变配置。如果有大佬知道如何配置,还望在留言中指点一二,感激不尽,因为域名也没有备案,所以只能选择全球加速了,我主机买的是 RackNerd,机房在洛杉矶,再怎么弄应该也会快一点点吧……

之前也看过一些博主,开启后又选择关闭了,我这现在开的也忐忑啊,先用上试试吧,不行了再说。目前启用后,发现内存有少量的下降,启用前内存平均在31%,启用后内存平均在26%。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "发布一个Typecho AI文本润色插件", "link": "https://wangdaodao.com/20251206/typecho-plugins-AI-text-polish.html", "pubDate": "2025-12-06T11:44:00.000Z", "content": "\n

现在AI已经融入到各行各业中,编码的时候都借助AI来辅助编程。那么,在写博客文章的时候,遇到语句不够流畅或表达不够专业的时候,能不能快速的借助AI帮我们对语句做一些润色呢?

为此,我开发了一个Typecho插件,该插件运用AI技术,能够对用户选定的文本进行智能化的润色与优化。不过使用前需要调用一些AI服务,所以先准备好了再说😃

插件目前开启售卖,价格定为 10 元,收入款全部捐给韩红基金会,并在关于页面公布捐款情况,购买请移步到文末,购买后请把订单截图通过邮件发送到我邮件 hi@wangdaodao.com,我会在当天处理邮件,把插件捐款情况回复在邮件中。购买前如果有疑问,也可以发邮件与我沟通,避免引起误会。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "开源高德地图及规划路径短代码插件", "link": "https://wangdaodao.com/20251203/typecho-plugin-amap.html", "pubDate": "2025-12-03T05:22:00.000Z", "content": "\n

继上次足迹插件,这次开源两个插件,分别是 高德地图插件高德地图路径规划插件,相对于足迹插件是一个简化版的,也希望大家多支持足迹插件?。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "开始记账了", "link": "https://wangdaodao.com/20251128/bookkeeping.html", "pubDate": "2025-11-28T13:38:00.000Z", "content": "\n

不知道大家有没有记账的习惯,我之前刚工作那会是有的,当时手机上记账软件也不多,看来看去用的随手记,还买了安卓的会员。前段时间又下载回来试了试,竟然又要收费了…

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" }, { "title": "发布Typecho足迹插件", "link": "https://wangdaodao.com/20251122/typecho-track.html", "pubDate": "2025-11-22T08:38:00.000Z", "content": "\n

MyTrack 是一个为 Typecho 博客系统开发的足迹记录插件,允许用户在地图上标记自己的旅行足迹,并关联相关的文章和图片。插件基于高德地图 API,提供了直观的地图展示和便捷的管理功能。

插件目前开启售卖,价格定为 10 元,收入款全部捐给韩红基金会,并在文章底部公布捐款情况,购买请移步到文末,购买后请把订单截图通过邮件发送到我邮件 hi@wangdaodao.com,我会在当天处理邮件,把插件捐款情况回复在邮件中。购买前如果有疑问,也可以发邮件与我沟通,避免引起误会。

捐款后会生成捐款证书,所以邮件中最好能附带姓名,我可以按照姓名来捐款,目前捐款列表已经迁移到关于页面

我相信,购买插件的都是有爱心的朋友,所以还希望大家使用后帮忙宣传一下。

[...]

\n", "author": "王叨叨", "categories": [], "source": "王叨叨", "sourceUrl": "https://wangdaodao.com/feed/atom/" } ] }