由大型语言模型(LLM)支撑的 GenAI 为软件开发人员和企业带来了令人兴奋的新可能性,下图所列是新兴的 LLM 应用堆栈的参考架构,它展示了我们所看到的 GenAI 初创公司和科技公司在构建生成式 AI 应用时使用的最常见的系统、工具和设计模式。
在 GenAI 应用的架构中,LLM 是核心组成部分,擅长处理自然语言、多轮推理任务,背靠海量的预训练数据,LLM 更善于应对开放类型的问题。但 LLM 本身有着知识时效性滞后、领域专精度不足、逻辑约束缺失以及动态交互能力弱等局限性,这时候就用到 RAG(弥补 LLM 在静态知识上的缺陷)、Fine-tuning(提升专业性)、Prompt Engineering(控制生成方向)、Function Calling(扩展 LLM 的动态执行能力)。然后一批新型的 AI 编排应用出现,比如 Dify、FastGPT、Coze、Flowise 以及 Langflow 等。这类应用将模型接入、Prompt 管理、知识库、插件、工作流等一条龙管理起来,通过能力整合让 LLM 发挥更大的作用,解决更复杂场景的问题。
Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。
相比较同质产品,Flowise 以及 Langflow 是 LangChain 的可视化工具。FastGPT 是一个基于 LLM 的智能问答系统,提供开箱即用的数据处理、模型调用等能力,更加专注在 RAG 领域。Coze 则是字节跳动推出的一款AI聊天机器人构建平台,集成豆包、飞书,面向 C 端入门/基础需求。而 Dify 功能更加全面,面向企业应用场景。
Dify 自身的核心组件包括 API、Worker、Proxy/Nginx、Web、Plugin_Daemon、Sandbox, 除此外 Dify 还依赖一些外部组件,如 Redis、PostgreSQL、Vector Database。