猫鱼周刊 vol. 074 浅谈Vibe Coding
编辑
关于本刊
这是猫鱼周刊的第 75 期,本系列每周日更新,主要内容为每周收集内容的分享,同时发布在
博客:阿猫的博客-猫鱼周刊
RSS:猫鱼周刊
邮件订阅:猫鱼周刊
微信公众号:猫兄的和谐号列车
头条
信心花舍,特殊为你开铺。——《信心花舍》陈奕迅
摄于香港赤柱市集。赤柱在香港的南端,远离城市喧嚣,旁边的山上很多别墅,有种度假村的感觉。从市区坐公交车可以直达,车程四十分钟左右;坐在双层大巴的上层右侧,大巴驶出市区,穿过山之后,就可以看到海景。由于比较远,也不是热门的景点,所以人很少,甚至以外国人居多。
这周写了一篇长文 你不是在 vibe coding,而是在十倍速生成屎山,在 2025 年中这个节点体验了一下 Agent Mode 的 AI 编程。简单来说,现在的 AI 编程工具确实能帮助编程小白非常迅速地完成一个像模像样的项目,但同时 vibe coding 的产物基本上就是屎山。
一旦你开始 vibe coding,你就只能 vibe 到底了。
在 vibe coding 十个小时后,我的代码库里出现了几千行我根本看不懂也没法维护的代码,以及一个「好像能用」的产品。说实话,这个项目如果要我自己一边查文档一边写,估计至少要花上一周。但是这在工程上没有太大的意义,完全就是十倍速生成屎山。
比较有意思的是,刚好尤雨溪也发了个推说这个事:
另外,在 AI 陷入瓶颈之后,如果使用者本身对技术不理解,不能帮助 AI 脱困,那只会跟 AI 一起深陷泥潭。所以到头来还是那句话:
AI 决定下限,人决定上限。
文章
MoonTV —— 一次 Vibe Coding 尝试
一个类似的尝试,作者也是对前端不是很熟悉,而 AI 在一些小众或者说疑难问题上,就是需要人去亲自上手来解决。
这个跟我有点相似的经历让我产生了一个想法:AI 编程真正利好的也许是跨技术栈工作的人,例如精通后端的人去写前端,或者反过来。如果你已经精通了一个技术栈,你的基础知识够扎实,了解解决疑难问题的路径和常用工具,并且有跨技术栈的一点点基础,就不会跟 AI 一块受困。
vibe coding 最近大火,所以经常在网上看到很多简陋的网站,或者项目,这些网站有个特点:样式都很相似、展示为主没什么后端逻辑,或者项目的文档都一股 AI 味。我觉得「AI 味」某种程度上就是「过于完美」,缺乏多样化的个人风格。我一直把编程视为一种「创作」活动(除了在公司做 CRUD 的需求不是很算),被 AI 大举入侵之后如果在编程中完全放弃自己创作,那会索然无味吧。
美团开源 OIBench 与 CoreCodeBench:揭示大模型编程能力的真实水平
美团开源的两个评测集,分别是针对信息学奥赛级别算法以及复杂的工程场景的题库。
它的结果也挺有意思,挑一点说说:
首先是 BugFix 场景,AC Rate 最多也只有六七十的水平,在多函数的时候平均居然只有二十多,这解释了我的长文里提到的,如果你圈好上下文(例如你定位到某个可能出问题的函数)再让它去解决,效果会更好。
其次,AC@1(一次解决)也是一个很重要的指标,可以看到目前大多数模型这个指标都不到 50%,说明大多数情况模型都没法很高效地解决问题。从使用上观察,有些聪明的模型会引导你打日志,或者是做单元测试等,这都是比较好的解决方案。
从这个区分度高的评测来看,AI 编程在解决实际问题确实还处在比较「弱智」的水平,好听点说,跟非常初级的程序员相当。所以一天到晚嚷嚷程序员要被 AI 取代的哥们醒醒吧,要么尽早转行,要么好好学吧。
然后是这个能力图谱,可以作为平时 coding「选妃」的参考。跟我印象中的差不多,claude 不错,在复杂问题上选 thinking 模型,简单问题选基础模型。比较意外的是 Gemini-2.5-Pro 居然成绩一般,我还觉得挺好用来着。
Chrome's SSL Bypass Cheatcode
在 Chrome 中遇到 SSL 错误时,可以盲打 thisisunsafe
强行打开网页。这个功能还有点小历史,几年间变过几次,看得出开发者不希望它变得流行。
本来可以水一篇 TIL 的,但是太短了,顺手发在这里好了。
贵就是好?镜头之间的差距,到底在哪?
影视飓风的「硬核科普」栏目,第一次看,其他几期感觉都比较偏向专业向的视频创作团队。
虽然我对摄影有点了解,但是确实很少在看电影或者视频的时候认真去观察或者去想画面是怎么拍的、用什么镜头拍的。看完这个科普视频反而让我觉得,作为业余,去折腾器材来提高所谓画质或者质感反而是没意义的事,在烧钱这块摄影出了名的无底洞,不如多出门拍来得有用和实惠。
想法
Switch 2 到手体验
本来没计划这么快就买 Switch 2,但是出了蓝凤凰(Harman Phoenix II),所以决定去香港的海边拍一卷(这个卷没拍完,等拍完洗出来再分享下),所以去了香港。因为赤柱地方很小,所以拍和逛完还剩下不少时间,所以顺便去把 Switch 2 买了。网上看攻略都是去 K11 Musea 的 nsew 买,他们在小红书有账号,而且现在不需要配货了,就挑了这个。地方稍微有点难找,在 B2,一开始看 B2 都是食街以为走错了,结果在比较里面的地方。
虽然说不用配货,但是我顺便买了咚奇刚的游戏,以及 microSD Express 的卡。列一下价格,仅供参考,单位都是 HKD。
- 马利欧赛车世界主机套装 3750
- SanDisk 256GB microSD Express 398
- 咚奇刚蕉力全开 498
- 钢化膜 80
另外咚奇刚还送了一把香蕉扇和一副扑克牌周边。招行的掌上生活 app 搜境外,可以领 2000-60 的券,店里可以刷 visa 卡,或者微信支付宝,不支持银联。现场会开机给你确认一下屏幕,帮你贴好膜,开机红要连手柄才会有,所以没必要录像(不是很懂为什么小红书会有这种赛博处女情结?)。购买的体验大概就是这样,店员的服务意识很好,也很友善,我很少在线下买东西,这点给我感觉挺好。过关的话也没什么,提着红袋子大摇大摆从西九龙高铁站走,没人会管你。
到家以后开机,转移数据,这一步稍微有点折腾。首先是要把 Switch 2 和 Switch 都先升级到最新的系统版本,然后要两台机都接入电源才能开始(但实际过程中可以拔掉电源,骗过一开始的检测就行了)。然后中间又有数次需要手机扫 Switch 2 上的码进行登录等等操作,每次都要打开网页输密码,也没有引导你去安装 Switch App。这点很蛋疼,建议参考一下 Steam 的操作,从 Switch App 扫码就可以授权就好了。
花了大概半个小时左右完成数据的转移,终于进入系统,又要下载游戏数据。如果是虚拟游戏卡(电子版),固然要等它下载;如果是 Switch 1 的卡带,需要等待的时间也比较长(估计是下载 Switch 2 的特有文件);如果是 Swtich 2 的卡带(非密钥卡),就稍微快点,也要等几分钟更新。我觉得作为主机,开箱即玩的体验很重要,我不反对电子版游戏,但是体验没有插入卡带就能开玩来得爽快。
吐槽了这么多,我对这个机器还是很满意的,尤其是我打开 Swtich 2 版本的塞尔达传说王国之泪的时候,1080p 60 帧的体验真的很好。在 Switch 上,这个游戏不仅糊还掉帧,体验实在拉跨(虽然这也不是我玩不下去的原因)。现在终于能以现代游戏的分辨率和帧率重新游玩,又开始让我感到上头。两个新游戏也简单玩了一下,没有太多特别,就是休闲娱乐型的游戏,认知负担不高。
其他方面的话,按键比 Switch 大了一点,Joycon 也大了一点,总体手感我觉得不错。虽然屏幕大了一圈,也重了不少,但是长时间握着玩没太多感觉。续航倒不是太满意,玩两个多小时塞尔达就没电了,不过性能的提升让我觉得我觉得这个 tradeoff 还算合理。
工具/网站
AGI-Eval
由美团、上海交通大学、Datawhale 等合作搞的一个评测,前面提到的两个数据集就在里面。希望这不是又一个 KPI 项目,而是能长久的运行下去。
最后
本周刊已在 GitHub 开源,欢迎 star。同时,如果你有好的内容,也欢迎投稿。如果你觉得周刊的内容不错,可以分享给你的朋友,让更多人了解到好的内容,对我也是一种认可和鼓励。(或许你也可以请我喝杯咖啡)
另外,我建了一个交流群,欢迎入群讨论或反馈,可以通过文章头部的联系邮箱私信我获得入群方式。
- 1
- 0
-
赞助
微信赞赏码
-
分享