项目博客关于

Opencord AI

2023-10商业项目

Next-Gen Social Media Operations with AI Agent
查看

项目简介

随着人工智能的不断发展,AI 创作、绘画、配音的能力越来越强,互联网上由 AI 产生的内容正变得越来越普遍。 我们相信在不远的未来,互联网上几乎所有用户生成的内容(UGC)都将由 AI 生成或参与制作。

Opencord AI 是下一代的社交媒体运营 AI Agent 平台。 简而言之,就是让 AI Agent 无缝接管您的社交账号运营,通过可视化/无代码的方式,灵活定制社交媒体运营 AI Workflow,实现内容创作、分发、互动的自动化,为企业和个人的品牌传播、内容营销和社群运营赋能。

项目亮点

  1. 支持主流社交媒体账号:可与 Twitter、Instagram、YouTube 等主流社交媒体平台无缝集成,方便用户集中管理不同平台的账号。只需安装 Opencord AI 浏览器插件,即可轻松启用自动化运营功能。
  2. AI 驱动的内容创作:AI Agent 可以根据用户提供的主题、关键词等信息自动生成高质量的原创内容。同时,AI 还可以对现有内容进行优化和润色,确保内容质量和可读性。
  3. 自动化发布和互动:平台支持自动化内容发布,用户可以预先设定发布时间和频率。此外,AI Agent 还可以根据用户偏好和行为数据,自动与粉丝互动,提高用户粘性和参与度。
  4. 7x24 小时不间断运行:AI Agent 可以 7x24 小时不间断运行,确保账号内容持续更新和互动,从而提高曝光率和影响力。
  5. 降低运营成本:通过自动化流程,平台可以显著降低社交媒体账号运营的人力和时间成本,提高运营效率,为企业和个人节省更多时间,创造更多价值。

技术浅析

在这个项目中,我主要负责前期 Python 版本基于 LangChain 的 AI Agent 的架构与优化工作。随着业务的不断发展,基于 LangChain 的 Agent 方案,弊端愈加明显:

  1. 业务要求对 AI Agent 内部的实现有极高的灵活度和可控性,LangChain 对 AI Agent 的层层抽象与封装,与我们的业务逻辑无法契合,可扩展性差,阻碍了正常业务需求的实现和快速迭代。
  2. LangChain 框架对 AI Agent 的实现方案比较落后,未利用 JSON mode 等特性,且系统 Prompt 比较简单,对复杂场景和特殊 case 未作任何处理,不适合用于生产环境。
  3. Python 环境消耗机器资源比较高,无法支撑高并发环境。在平台早期,为了快速迭代和方便管理,AI Agent 都是有状态的,用户创建的每一个 AI Agent 实例,都会起一个独立的 docker 容器来运行,内存消耗较高。
  4. 团队后端技术栈以 Go-lang 为主,Python 版本的 AI Agent 实现,前期主要是我一个人在负责,团队缺少 Python 技术储备,等新迭代较慢。

鉴于上述的几点原因,后期我们在整个 AI Agent 的架构实现上,迁移到了基于 Go 的 Workflow 方案。

主要贡献

除了上面提及的平台早期 Python 版本 AI Agent 框架的架构与优化工作之外,我主要负责完成了前端 Workflow 可视化预览与编辑模块的实现。

前端流程图的技术选型是 ReactFlow,除了我们前端本身的技术栈是 React, ReactFlow 的更新频率、社区流行度、稳定性和可扩展性等方面综合考量下来,与我们的需求最为相符。另外,国内滴滴开源的 LogicFlow 还有蚂蚁集团出品的 X6 等,对于简单图编辑场景来说,也都是不错的选择。

基于 ReactFlow,我主要解决了以下几个核心问题:

1. Node 自动布局算法

2. Edge 自动路由算法

3. Edge 折线拖拽编辑

最终实现的效果,基本可以媲美 Figma 和飞书的流程图编辑体验。

备注

  1. A* 搜索算法: 一种在图形平面上,有多个节点的路径,求出最低通过成本的启发式搜索算法。常用于游戏中的 NPC 的移动计算,或线上游戏的 BOT 的移动计算上。

  2. 曼哈顿距离: 在欧几里德空间上两点所形成的线段,对坐标轴产生的投影的距离总和。 对于平面直角坐标系,曼哈顿距离只要计算加减法即可,极大提高了运算速度。

  3. Edge 自动路由思路主要参考自:LogicFlow 边的绘制与交互