跳到内容
跨境Ai视界 跨境Ai视界
Go back

解放双眼,用AI视觉模型识别,亚马逊竞品主图

文章目录共 5 节
  1. 想法
  2. 视觉模型选择
  3. 选产品
  4. 测试
  5. 总结

在产品开发,或者竞品调查的时候,第一步会去用插件找和我们产品相似的竞品,再把所有的ASIN收集起来,再下载。

在挑竞品ASIN的时候,就需要人工筛选。这是一项很枯燥,而且容易出错的,并很主观的事情。一是要找足够数量的竞品ASIN,二是判断什么样的产品和我们类似。很多时候,总是在纠结,这个产品到底是不是竞品。

想法

经过上次用算法给关键词评分的经验后,这次我很容易就想到了,是否可以让AI的视觉模型识别竞品的主图,然后经过多模态,对比我们的产品,再通过相似度评分,从而在一定程度上客观的挑选相似竞品。

《我是如何用AI词库,提升亚马逊站内SEO排名的》

在询问Claude后,他经过思考,就给我了四个方案。第一个方案是,纯语义识别标题和描述,这个准确性很难保证。

Image

Image

第二个方案是,基于tensorflow图像相似度分析,高端但是没必要,就那200个产品,还要吃电脑的CPU。

Image

第三个方案是,结合前两个方案,综合评分,有点意思了。

Image

第四个方案,和我的想法有点接近了。用预训练的视觉模型去理解图像。

Image

然后,我询问他是否可以用多模态的视觉模型结合方案四去优化。这时,他就给了一个完整的方案,结合OpenAI兼容的模型去理解图像,再和标题描述文本结合,去综合评分。

Image

视觉模型选择

由于视觉模型不涉及英文的输出,同时考虑到速度原因,优先选择国内的模型。阿里模型太多了,傻傻分不清楚,而且免费的少,主要适合2b商用。

智谱GLM-4V-flash虽然免费,但版本有点老,好像是24年的。

字节跳动的豆包模型是25年1月出来的,还新鲜热乎的,而且正赶上送50万token的活动,那就不好意思了,嘿嘿。

Image

Image

选产品

依然选择老牌测试员“投影仪”,我选择了一个筒状的mini投影仪作为对比产品。

Image

测试

经过第一轮ASIN的合并去重清洗,剩下了200个产品,然后直接让豆包模型去跑。

Image

代码启动,泡上一杯茶,运行5分钟后完成,得到了跑分结果。

Image

可以看到每个产品后都给了文本评分和视觉评分,最后得出综合总分,真正的实现把主观的判断用评分去量化。

Image

最后把相似度前20输出成html方便查看。到这里,我可以按相似度评分降序,把低分不相似的产品全部删除,保留我需要的产品,可以大大提高筛选竞品的效率。

Image

总结

这是我用Cursor扫描整个代码,用Claude做出的流程图。

第一步,设置api key,写关键词,放对比图片。

第二步,用TF-IDF把文本向量化,包括标题,五点,描述等,计算文本相似度

第三步,用多模态AI大模型分析图片,计算视觉相似度

第四步,计算综合评分,保存到表格,生成HTML报告。

Image

不得不说,Claude 3.7的编程能力很强,只要简单的一句话就能生成一个简单的项目。剩下的就是需要我们有足够多的想法,去改造工作流程,实实在在用AI提高效率。

由于篇幅有限,我把相似度评分的表格和HTML的完整报告放到了飞书文档,感兴趣的朋友,可以加我微信领取。

PS:

由于之前开源过一版关键词清洗库,所以很多朋友会问我python安装问题。其实我建议,这种程序报错的问题,可以直接去问AI,效率会更高。可以把你自己的电脑系统也告诉AI,更容易出解决方案。


Share this post on:

上一篇
无需邀请码,我用OpenManus询问,特朗普增加关税,对跨境电商的影响
下一篇
最强跨境电商Ai提示词Prompt