阿猫的博客

阿猫的博客

猫鱼周刊 vol. 097 五一快乐

2026-05-03
猫鱼周刊 vol. 097 五一快乐

关于本刊

这是猫鱼周刊的第 98 期,本系列每周日更新,主要内容为每周收集内容的分享,同时发布在

博客:阿猫的博客-猫鱼周刊

RSS:猫鱼周刊

邮件订阅:猫鱼周刊

微信公众号:猫兄的和谐号列车

私信:leslieleung@proton.me

INIT

摄于香港九龙城区保良局颜宝铃书院外,是一个外墙上的壁画,看了下落款应该是在 2005 年左右画的。过去 20 年了,居然还保存得非常好,而且附近的外墙上也有很多这种壁画。

五一快乐!这周的内容不算很多,浅浅分享一下最近的所见所闻,以及摸索的一些东西吧。

STDIN

失去懒惰的代价

原文链接

作者先引用了 Larry Wall 在《Programming Perl》里提到的程序员三大美德:懒惰、不耐烦、傲慢自大。这里的「懒惰」指的是程序员会为了避免未来重复劳动,主动去寻找更好的抽象、把系统做得更简单、更容易组合。作者认为,这种「懒惰」其实非常深刻,因为它背后是愿意现在多花脑力,换未来更少的复杂度和更高的效率。作者认为现在出现了很多 brogrammer,尤其是 LLM 的出现之后,很多人炫耀写了多少代码、产出了多少功能,而不是关注抽象是否更清晰、系统是否更简洁,LLM 更是把「堆代码」的速度放大到极致」。LLM 没有「懒惰」这种美德,因为对它来说,劳动几乎没有成本。 它不会像人类工程师那样在意未来的维护成本、认知负担和系统复杂度,它会很自然地继续往屎山上继续拉屎。

我在去年中的时候就提到过,vibe coding 基本上等于十倍速生成屎山,当然那时候 vibe coding 这件事情还没有那么普及。最近公司开始给大家配 Codex 了,才算是见识到了 brogrammer 的厉害。我有一个同事,以烧光配额里的 token 为荣,正好当时 GPT 5.4 过度设计的情况非常严重,以至于我 review 他的代码的时候非常痛苦。我把这个问题提出来质问他的时候,他还一脸轻松地说「AI 的发展会解决这些问题」。我挺无语的,软件工程中一直存在着一种破窗效应,一旦开始有人往代码里面拉屎,那后续的代码质量都难以保证。

一个来自 1930 年的古早语言模型

原文链接

一般来说,我们认为模型的训练语料肯定是越新越好、越多越好,而 talkie 这个模型只用 1931 年之前的英文历史文本训练,一方面是让人能「和过去的人对话」,另一方面是把它当成研究工具,去观察语言模型在没有现代知识污染时到底会表现出什么能力。

如果你感兴趣,可以在线体验一下。我尝试问它中国有什么适合旅游的地方,它回答了上海、南京和北京,而且地名还是用的威妥玛拼音

STDOUT

语音输入

最近经常刷到一些做 vibe coding 的硬件,一个麦克风、几个按键这样,说是能提升 vibe coding 的效率;也看到不少 TypeLess 之类的软件的分享,以及各家 ASR 模型的发布等等,感觉可以重拾一下语音输入。

硬件方面,我买了大疆最近新出的 Mic Mini 2, ¥329 的手机接收器一收一发套装。因为我正好有 Action 4,可以直连,而索尼的相机也可以通过一百多的热靴转 USB-C 来实现完美的外接。发射器小小一个,夹在衣服上没什么感觉。比较惊艳的是它的降噪效果真的不错,人声收录得非常清楚。

软件方面,搜罗了一圈,主要有以下这几个:

  • TypeLess:可能是当今业界的标杆,功能最齐全效果最好;付费软件,免费有用量限制
  • 微信语音输入法:也有不少提起,但是我不喜欢使用第三方输入法(隐私泄露问题),pass
  • 豆包语音输入法:说是很强,但是 macOS 版本还在内测,没有找到安装包
  • 其他类似 TypeLess 的开源/闭源软件:在 V2EX 上一搜一大堆,试了几个,留下了 OpenLess

体验了几天,我觉得语音输入有一定的可取之处,但是我还没有完全习惯。我打字的速度应该算比较快的那一档,基本上能够跟得上说话的速度,而且一句话下来,手敲和语音识别+LLM 改写+人工修正的时间差不多,所以在输入效率上其实是没有什么提高的。跟传统的语音输入相比,基于大模型 ASR 的语音输入倒是有不少体验的提升,例如嗯啊这些语气词可以被 LLM 改写去掉,中英文混输的识别也比较精准。比较难受的是,Mic Mini 2 上不能直接触发录音,还是需要手动按键盘上的某个键才可以开始录音。当然,我看到有人做了用 Switch 手柄 + Mic Mini 2 这样的方案,可以用 Switch 上的按键绑定语音输入键、回车键、切换权限等。如果大疆后续做个功能,可以把 Mic Mini 2 上的某个键绑定成开始语音输入,那将会是绝杀。

回到语音输入这件事上,我觉得它非常适合「嘴比脑快」的情况,要想达到最佳的效果,你可以不用刻意组织语言,有什么说什么,让 LLM 帮你理清楚,还是需要不少适应的。反正暂时来说,我还是更加喜欢键盘这种输入方式。

漫步香港

五一当天我去香港逛了半天,一半时间在土瓜湾、九龙城这几个地方闲逛拍照,另一半时间在黄埔天地参加了星球大战的活动。

先说扫街这部分,因为香港已经去了很多次,这次特意选了比较小众的地方,也是市井气息比较浓的地方,所以虽然正好是五一,也没遇到什么游客,可以很舒服慢慢逛慢慢拍。香港的街道总是给人一种很破旧但是又很多彩、很干净的感觉,旧楼的外墙使用的颜色都很大胆,街道斑斑驳驳但是很干净。

正好聊到干净,我觉得除了人口素质高,另一方面是相关法例非常完善,而且执行力度很大。例如乱丢垃圾是定额罚款三千港币,在禁烟区抽烟/管有电子烟也是定额罚款三千港币,行人闯红灯是两千港币,在港铁已付车费区域饮食也是两千港币。像我经常吐槽国内的游烟问题在香港可能一次性就被罚六千港币——吸烟三千,乱丢烟头再罚三千,这种执行力度可以说能极大遏制这种行为。

日落之后,我顺路逛到黄埔天地,正好朋友出 cos,我也参加了也夜跑的活动。所谓夜跑,其实就是沿着海边步道,来回一公里左右的距离。现场估计有几千人聚集在一起,氛围非常好。

晚上回程坐的东铁线,之前我都是坐高铁或者大巴回,这次尝试了个新路线。不过东铁线的末班车在九点四十几的样子,所以如果再晚又买不到高铁可能就要坐大巴去罗湖了,有机会再试试吧。

MISC

编码套餐看板

网站链接

现在各家 Coding Plan 都在限购,就算买到限流的情况也很严重,国外的套餐也不好买。这个网站提供了各家 Coding Plan 的方案比较,以及性能指标,可以帮你快速对比选择。

不过截至现在(2026.05.03),里面有些信息可能不准确了(例如阿里的这个 Coding Plan 已经下架了),最终还是以供应商的页面为准。

Pokopia 数据库

网站链接

Pokopia 的在线图鉴。比较可惜的是 UI 没有做到像游戏里面那样的。

hyperframes

项目链接

通过编写 HTML 来渲染视频,而且支持通过 AI Agent 来生成。项目提供了对应的 Skills,你给出一个创意或者方向,就可以让 AI Agent 来生成对应的动画脚本,TTS 配音,然后合成视频。

我写了一个 skill,可以用来生成一段短视频,解释某一个概念,例如公私钥加密的概念这样。

OpenLess

项目链接

TypeLess 的开源替代。主要支持语音识别,以及后续的润色功能,自定义词典的功能也有。实测下来搭配豆包 ASR 体验不错。

EOF

本周刊已在 GitHub 开源,欢迎 star。同时,如果你有好的内容,也欢迎投稿。如果你觉得周刊的内容不错,可以分享给你的朋友,让更多人了解到好的内容,对我也是一种认可和鼓励。(或许你也可以请我喝杯咖啡

另外,我建了一个交流群,欢迎入群讨论或反馈,可以通过文章头部的联系邮箱私信我获得入群方式。