最近大模型迭代很快,档次提升明显。比如谷歌直接在官网放出新模型,效果惊艳——也就是大家热议的“nano banana”。半年前,我就开始用Gemini测试生图了,只不过是用python直出。 于是我把旧代码翻出来,准备再优化一轮。原先的版本能跑通“做图方案+图生图”两条链路,但效果一般,现在想把它推到更高水平。 刚开始,打算用一套代码把竞品分析、做图方案、提示词转换、文生图、图生图全打通。后来发现,提示词本身才是核心,只要提示词写得够细,直接扔给各家官网就能出好图,根本没必要接多个API。生图本质上是“交互”,不是死流程,更不用说现在都是用嘴改图。

想通这点后,我把项目砍回最简版本,只保留最初的模块——成本低、可控性还高。加入了产品信息,因为之前是竞品分析,只分析了共性,没有加入个性。所以这次综合所有,形成方案,再用AI解析成提示词,清爽了很多。

这次的vibe coding交给了codex,效果还不错,感觉是T0的级别。但是要把Claude code用好,一定要给他加系统提示词。Claude code太适合做加法了,从0到1。 突然悟到,为什么大家都把 Claude 叫“编程天花板”,它的鲁棒性太强。为了兼容各种大型项目,它把防守机制做得滴水不漏,对我这种本地小脚本来说,反倒有点“大材小用”。