如何用豆包MarsCode，解决关键词库Python清洗

上篇文章解决了关键词库数据展示的部分，完成了从Tableau本地客户端，到云Saas数跨境BI的迁移。收到了很多的读者的反馈说，他们已经成功解决数据看板的问题，节省了很多时间。

本着同样的逻辑，我们来解决Python清洗的部分，完成从本地端到云端的迁移。

今天要使用的工具是字节跳动出品的豆包MarsCode。这是一个可以运行代码的云IDE软件，不需要本地配置环境，直接在云端执行。

创建项目

1.首先注册MarsCode，由于是大厂出品，可靠性和安全性上不用担心。

2.进入工作台，选择MarsCode IDE。

3.新建项目，选择导入git代码仓库,输入我已经上传到github上的项目链接。

1.创建好项目之后，在控制台中，复制这行命令安装依赖。

pip install -r requirements.txt

2.复制命令，创建环境变量。

cp .env.example .env

3.把 .env 文件中的 ZHIPUAI_API_KEY 替换成自己的key。

4.把下载好的表格，重命名为 data.xlsx 并上传项目根目录。点击界面顶部的 “Run” 按钮，执行代码。完成后，下载 output.csv 文件。

到这里，教程就结束了。整个过程极其优雅，再也不用担心本地配置环境的问题。

1.首先解决nltk词库报错的问题，我把需要的文件直接放到项目当中，不需要联网调用。

2.添加了环境变量，可以方便的更换api key、智谱模型、筛选系数和聚类数量。智谱模型换成了免费版的GLM-4-Flash。由于我们使用AI分类的需求比较简单，免费的模型足以胜任。

3.代码托管到了github，后续会直接在上面更新，项目链接地址不变。

到目前为止，关键词库三件套已经形成闭环了。首先找到热卖竞品ASIN，通过卖家精灵导出扩展词，用python清洗表格，用AI给关键词分类，最后在数跨境BI中，生成可视化效果。

第一部分-方法论

https://www.amzalysis.com/article/amazon-keyword-library

第二部分-Python清洗(本篇)

https://www.amzalysis.com/article/keyword-library-python

第三部分-数据分析

https://www.amzalysis.com/article/keyword-library-upgrade

整个过程，本着运营的逻辑，加上个人的思考，借助AI工具，结合读者的反馈，完成从本地到云端的迁移。

即使有了这么多丰富的工具，我也会经常提醒自己，产品和需求才是第一。在AI逐渐成型的今天，工具的价值在于更好的辅助运营，我们可以将更多精力放在提升产品质量和用户体验上，这才是运营工作的核心所在。