1. 概述

1.1. GenAI App

由大型语言模型(LLM)支撑的 GenAI 为软件开发人员和企业带来了令人兴奋的新可能性,下图所列是新兴的 LLM 应用堆栈的参考架构,它展示了我们所看到的 GenAI 初创公司和科技公司在构建生成式 AI 应用时使用的最常见的系统、工具和设计模式。

image.png

在 GenAI 应用的架构中,LLM 是核心组成部分,擅长处理自然语言、多轮推理任务,背靠海量的预训练数据,LLM 更善于应对开放类型的问题。但 LLM 本身有着知识时效性滞后、领域专精度不足、逻辑约束缺失以及动态交互能力弱等局限性,这时候就用到 RAG(弥补 LLM 在静态知识上的缺陷)、Fine-tuning(提升专业性)、Prompt Engineering(控制生成方向)、Function Calling(扩展 LLM 的动态执行能力)。然后一批新型的 AI 编排应用出现,比如 DifyFastGPTCozeFlowise 以及 Langflow 等。这类应用将模型接入、Prompt 管理、知识库、插件、工作流等一条龙管理起来,通过能力整合让 LLM 发挥更大的作用,解决更复杂场景的问题。

1.2. Dify 简介

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。

相比较同质产品,Flowise 以及 Langflow 是 LangChain 的可视化工具。FastGPT 是一个基于 LLM 的智能问答系统,提供开箱即用的数据处理、模型调用等能力,更加专注在 RAG 领域。Coze 则是字节跳动推出的一款AI聊天机器人构建平台,集成豆包、飞书,面向 C 端入门/基础需求。而 Dify 功能更加全面,面向企业应用场景。

image.png

Dify 自身的核心组件包括 API、Worker、Proxy/Nginx、Web、Plugin_Daemon、Sandbox, 除此外 Dify 还依赖一些外部组件,如 Redis、PostgreSQL、Vector Database。