PIG™ AI Microservice Architecture
系统白皮书
──


「2025 如果你的产品没有 AI,将变得一文不值」
佩格科技
COPYRIGHT © ai.pig4cloud. ALL RIGHTS RESERVED.

PIG AI 是一款开源的大语言模型(LLM)应用开发平台,它结合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者能够快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。

PIG AI 内置了构建 LLM 应用所需的关键技术栈,包括对数十个模型的支持、高质量的 RAG 引擎以及灵活的 Agent 框架,并提供了一套易用的界面和 API。这使得开发者可以节省大量重复造轮子的时间,适用于多种企业级商业场景,如企业智能客服、企业智能文档、专家顾问助理、业务联动等。

通过PIG AI,企业可以轻松构建出功能强大、高效智能的应用程序,提升业务流程的自动化程度和智能化水平,从而提高企业的竞争力和创新能力。

多模型支持

PIG AI 为以下模型提供商提供原生支持:

厂商模型类型模型名称
阿里百炼聊天qwen-max-latest
阿里百炼聊天qwen-plus
阿里百炼视觉qwen-vl-max
阿里百炼向量text-embedding-v3
阿里百炼图片flux-schnell
阿里百炼音频paraformer-v2
阿里百炼音频cosyvoice-v1
DeepSeek聊天deepseek-chat
DeepSeek聊天deepseek-reason
零一万物聊天yi-lightning
讯飞星火聊天Spark 4.0 Ultra/Max
字节豆包聊天Doubao-lite/Doubao-pro
字节豆包向量Doubao-embedding
月之暗面聊天kimi
智谱清言聊天glm-4-plus
智谱清言视觉glm-4v-plus
智谱清言向量embedding-3
硅基流动图片black-forest-labs/FLUX.1-schnell
硅基流动音频FunAudioLLM/SenseVoiceSmall
OpenAI聊天gpt-4o-mini/4o
OpenAI视觉gpt-4o
OpenAI向量text-embedding-3-small
OpenAI向量text-embedding-3-large
Ollama聊天qwen2.5:14b/32b/72b
Ollama推理deepseek R1
Ollama向量bge-m3
Ollama视觉minicpm-v:latest

理论上,我们的系统支持 Ollama 本地推理框架客户端,这使得一键部署像 Llama 2、Mistral、Llava 等大型语言模型成为可能。PIG AI 可以轻松接入 Ollama 部署的大型语言模型,并利用其强大的推理和 embedding 能力。这意味着我们的系统可以利用 Ollama 提供的高效、可扩展的推理框架,从而为用户提供更快速、更准确的语言理解和处理功能。通过与 Ollama 的集成,我们能够为用户带来更优秀的语言模型服务,助力他们在各种应用场景下实现更高水平的智能化处理。

深度推理 🔥

PIG AI 完整支持 DeepSeek 、QwQ 深度推理能力,通过 deepseek-reasoner、QwQ 模型实现了更强大的推理和决策能力

① 全链路思维链保留

通过 deepseek-reasoner、、QwQ 模型完整保留 AI 的思维链推理过程,在输出最终答案前强制生成详细的分析推导步骤。这种机制使决策过程完全透明可追溯,通过逐步验证确保结论可靠性,彻底解决传统框架(如 Spring AI/LangChain)因丢弃中间推理环节导致的"AI 黑箱"问题。

② 实时联网搜索增强

突破大模型预训练数据的时间边界,通过智能联网搜索获取最新实时信息。系统自动抓取权威信源的高质量内容,结合思维链机制进行多维度分析验证,完美解决时效性敏感问题(如金融数据、科技动态、政策法规等),使 AI 始终基于最新认知进行决策。

这两大特性形成独特优势:全链路思维链确保推理过程可解释可审计,实时联网搜索突破模型知识时效限制。相比同质化严重的大模型产品,PIG AI 通过"深度推理+实时感知"的技术组合,为企业构建差异化的智能决策系统。

③ 私有化搜索引擎集成

支持私有化搜索的直接部署和接入,企业可快速构建自主可控的搜索服务。通过私有化部署方案,用户可完全掌控搜索索引和数据流向,在保障数据主权的同时享受类 Bing 的搜索体验。该方案支持与企业现有权限系统深度整合,实现基于角色和业务场景的细粒度访问控制,确保敏感信息只在授权范围内流通。

RAG 知识库

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与文本生成相结合的技术范式。其核心思想是通过实时检索外部知识库获取与当前任务最相关的信息片段,将这些检索结果作为上下文输入给生成模型,从而提升生成内容的准确性和事实性。

对比维度模型微调RAG(推荐方案)
投入成本✅ 高昂:相当于自建工厂,长期维护(更新),适合预算充足的大企业。💡 低成本:类似租用云服务,,适合中小企业。
实施难度✅ 复杂:需专家团队,耗时数月开发调试,技术门槛极高。💡 简单易用:像使用现成软件,配置即可上线,普通IT团队可操作。
技术要求✅ 苛刻:需顶尖算法专家、海量数据、高性能硬件,风险高。💡 轻量化:无需算法专家,依赖外部知识库(如企业文档库),即插即用。
功能影响❌ 破坏性:可能导致模型原有能力丢失(如json/function等)。💡 无侵入:不修改模型本身,保留全部原有功能,风险可控。
适用范围❌ 局限:仅支持特定模型,依赖公开数据集,需长期技术迭代。💡 普适灵活:适配所有主流AI模型,可快速接入企业私有知识库,灵活扩展。

① 场景演示

PIG AI 的知识库功能确实非常强大,支持上传外部数据,如本地文件和实时数据,并利用向量搜索来检索最相关的内容以回答用户的问题。这种功能可以大大提高机器人的回答准确度和效率,使其能够更精确地理解和回应用户的提问。

通过上传外部数据,用户可以将各种类型的信息整合到 PIG AI 的知识库中,包括文档、数据库查询结果、实时数据等。然后,PIG AI 使用先进的向量搜索技术来对这些数据进行索引和搜索,以便快速找到与用户查询最相关的内容。

这种功能对于各种场景都非常有用,包括客户服务、技术支持、知识管理等。通过使用 PIG AI 的知识库功能,用户可以轻松构建出功能强大的智能问答系统,为用户提供更快速、更准确的帮助和支持。


② 知识库

将数据上传到 PIG AI 知识库后,PIG AI 会自动将你的文档分割成内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。

例如:


PIG AI 知识库可以处理和理解来自不同模态(例如文本、图像、PDF、Office 等)的文档信息,使大型模型能够跨越多种输入形式进行学习和推理。

为解决目前 RAG(Retrieval-Augmented Generation)在实施中遇到的问题,如数据库的多路召回能力和数据处理问题。通过提供专用的数据库和工具,旨在使 RAG 更易于被更多企业和个人使用,并解锁更多应用场景。


③ PIG AI的创新

PIG AI 在 RAG (检索增强生成) 领域实现了多项创新突破,通过全面重构 Java 技术栈下的 RAG 实现方案,构建了高质量、高性能的企业级知识库解决方案:

数据清洗与预处理创新

PIG AI 开发了专用的数据清洗管道,解决了传统 RAG 系统在处理企业非结构化数据时的痛点:

这套数据清洗流程可将原始文档的有效信息密度显著提升,显著减少了"垃圾进、垃圾出"的问题,为高质量检索奠定基础。

混合检索与排序算法

PIG AI 突破了单一向量检索的局限性,构建了多路召回、多因素排序的混合检索引擎:

混合检索技术将传统单一向量检索的有了很大准确率提升,特别是在处理复杂查询和专业领域知识时表现突出。

Java 领域的技术重建

PIG AI 基于 Java 技术栈重构 RAG 技术体系,填补 Java 生态在 AI 应用领域的架构空白:

技术特性

核心优势

PIG AI 的 RAG 体系实现了技术突破与商业价值的有机统一,通过工程实践闭环将算法创新转化为可落地的智能服务,为企业构建自主可控的认知智能基座。

业务联动

① 场景演示

将自然语言转换为 API 调用参数或查询数据库的条件;提取文本中的结构化数据。提供基于通用大型模型的实时回调业务函数能力,Function Calling 使得 Chat Completion 模型可以调用外部函数获取信息再针对输出进行格式化。能够方便地扩展任何业务逻辑,使模型更了解业务,更敏捷地构建您的私域大模型。使用函数调用能力,可以满足当前大模型无法解决的部分问题,包括:

② 业务联动

将大模型回调业务系统的功能融入现有业务流程中 是一项关键任务。在这个过程中,首先需要经过现有业务的权限判断、参数校验等业务逻辑判断,以确保调用的合法性和准确性。一旦通过了这些判断,大模型回调功能就会被触发,开始执行相应的智能逻辑。

这种打通大模型和业务系统的壁垒,实际上是在传统应用中引入了更智能的处理方式。通过大模型的回调,业务系统可以获得更精准、更智能的决策支持,从而提升业务处理的效率和准确性。这种智能化的应用场景不仅可以优化现有业务流程,还可以为企业带来更多的竞争优势和创新可能性。


③ 扩展能力

PIG AI 提供了强大的功能调用支持,允许用户自行开发和实现 function calling,从而实现业务联动能力。这意味着用户可以根据自身业务需求,开发定制的功能模块,并通过 PIG AI 提供的方便 API 接口将这些功能集成到应用中。

④ 实际案例

【智能 CRM 系统增强】PIG AI 重构企业客户关系管理范式,通过多模态理解引擎实现非结构化数据的智能解析与业务联动。系统架构包含三大核心价值维度:

技术架构突破
采用多模态理解框架(文本+图像联合建模)与函数调用编排引擎,实现从原始数据到业务系统的全链路自动化。通过动态参数绑定技术,确保提取的客户信息直接对接企业现有 CRM 数据库字段,消除系统对接的二次开发成本。

系统通过声明式接口配置实现与企业现有 OA/ERP 系统的无缝对接,将 AI 能力注入现有IT基础设施,降低智能化改造成本。

智能体编排

PIG AI智能体设计界面

智能体(Agent)是具备自主决策和执行能力的 AI 实体,通过感知环境、分析决策、执行动作的闭环机制完成特定任务。PIG AI 的智能体编排系统提供可视化流程设计器,支持多智能体协同工作流的构建与优化。

① 核心特征

② 适用场景

场景类型典型应用
内容生产多语言文档翻译、营销文案批量生成
数据分析报表自动生成、数据洞察提取
流程自动化邮件自动分类回复、工单智能派发
资源处理图像批量标注、视频关键帧提取

③ 交互范式

单向任务流指令输入 → 智能体执行 → 结果输出 的标准化流程

Chat2SQL

Chat2SQL 能够实现**自然语言与 SQL 的转换,从而极大地提升了工作效率。在 AI 时代,数据库研发人员可以将 Chat2SQL 视为必备的利器,它为他们提供了便捷而高效的工作方式。即使是不懂 SQL 的运营或业务人员,也可以轻松地使用 Chat2SQL 进行快速的数据查询和报表生成。

Chat2SQL 还具有智能化的功能,能够根据上下文自动选中相关的数据表,并生成与业务需求相匹配的 SQL 查询语句。这种智能关联功能使得用户无需深入了解数据库结构,就能够轻松地执行复杂的数据查询操作,极大地降低了使用门槛,提高了工作效率。


函数编排

全新的函数编排功能,从模型描述、入参定义、调用增强到结果处理,均可在线设计和编辑,实现大模型驱动的复杂业务流程自动化。

多模态

PIG AI 提供全面的多模态支持,通过先进的大模型技术实现高质量的内容生成与转换能力。系统支持文本、图像、语音等多种模态的智能转换与协同处理,显著提升内容创作效率。

通过统一的 API 接口,开发者可以便捷集成这些多模态能力到现有业务系统中,构建智能化的内容生产流水线。系统采用模块化设计,支持根据业务需求灵活组合不同模态的处理能力。


AI OCR


PIG AI 提供了强大的 OCR(光学字符识别)能力,依托先进的大语言模型技术,支持多种复杂的识别场景,帮助企业和开发者高效处理图像中的文字和表格信息。其核心功能包括:

  1. 结构化 JSON 输出

  1. 灵活的内容提取

  1. 多语言支持与扩展性

  1. 业务集成与调用

实际案例

PIG AI 在矿山治理领域的应用展现了其强大的行业适应性。通过整合多模态 OCR 能力与传统机器学习数据分析手段,系统实现了矿山作业的全方位智能监管:

该系统将大幅降低矿山安全事故发生率,提高矿区运营效率。相比传统人工巡检,自动化监管可减少 75% 的人力投入,同时提高违规行为发现率 60%。系统利用 PIG AI 的 OCR 技术将非结构化的监控数据转化为可分析的结构化信息,再通过业务联动机制联动预警和处置流程,实现了从监测到处置的闭环管理。

规则引擎增强

生成式 AI 因其特性而在各地区受到不同程度的管控,针对这一挑战,我们基于规则引擎平台实现了业务决策与代码解耦的创新方案。PIG AI 的规则引擎通过预定义语义模块承载业务规则,支持动态配置敏感词过滤、IP 地域限制、tokens 流量管控等多维度风控策略,实现毫秒级风险决策响应。系统优势体现在

  1. 强风控能力:不仅满足各地合规要求,更通过可视化策略编排实现审查规则动态调整,支持敏感模式秒级生效

  2. 灵活解耦架构:将原本硬编码在业务逻辑中的风控规则抽象为独立可配置的规则节点,业务迭代无需修改核心代码

  3. 二开友好设计:提供标准化的规则扩展接口,新模型接入时可快速组合现有规则组件,业务扩展效率提升 70%以上

通过规则热更新机制,运维人员可在不停服的情况下实时调整审查策略,确保 AI 服务始终符合最新监管要求的同时,保持业务连续性。

Java 技术栈

基于 Java 语言 进行系统开发,提供了丰富的模型支持,包括公有模型和私有模型,并且具有方便的扩展性和二次开发性。让我详细解释一下:

  1. 丰富的模型支持: PIG AI 提供了多种大模型支持,涵盖了文本、图片视觉、语音识别等模型。这些模型既包括了公有模型,也支持用户上传和使用私有模型,因此可以满足各种不同场景和需求下的系统开发。

  2. 方便的扩展性: PIG AI 提供了友好的接口和工具,方便开发人员轻松地扩展系统功能。无论是集成新的预训练模型,还是开发定制的模型和算法,都可以通过 PIG AI 提供的扩展机制来实现。

  3. 二次开发支持: PIG AI 提供了灵活的二次开发支持,可以根据具体需求进行定制化开发。开发人员可以基于 PIG AI 提供的模型和工具,快速构建出符合业务需求的系统,并且可以根据实际情况进行调整和优化。

  4. 与 Java 的紧密集成: PIG AI 提供了与 Java 紧密集成的功能,这使得 Java 开发者可以更轻松地使用 PIG AI 的功能。通过 PIG AI 提供的 Java SDK 和 API,开发人员可以在 Java 项目中直接调用 PIG AI 的功能,实现各种智能化应用场景。

综上所述,基于 PIG AI 进行系统开发可以让大模型距离 Java 开发者更近一步,为他们提供了丰富的模型支持、方便的扩展性和二次开发支持。这将有助于开发人员快速构建出功能强大、智能化的系统应用。

① 服务端技术栈

② 前端技术栈

配置要求

① 配置说明

② 私有模型

附录:详细功能清单

功能清单总览

功能分类功能点描述AI 大模型开发平台
演示环境http://home.pig4cloud.com:38083
产品定位PIG AI 是一款完全基于Java 的大语言模型(LLM)应用开发平台,使Java开发者能够快速搭建生产级的生成式 AI 应用
通用功能除AI部分外,其他所有功能均一致✅ 商业版全部功能
模型在线配置OpenAI :聊天、推理、向量
 阿里百炼:Qwen 聊天、推理、向量、图文、音频
 DeepSeek:聊天、推理
 Ollama、vllam 本地私有模型
 智谱清言:聊天、推理、向量、音频
 硅基流动:聊天、推理、向量、图文、音频
 月之暗面、文心一言:聊天
 字节豆包、月之暗面:聊天
 讯飞星火、零一万物:聊天
 联网搜索
向量在线配置milvus
 qdrant
 chroma
 redis
 ...
知识库RAG发布形式:外链、iframe、悬浮增强
 发布DIY
 文档预总结
 AI OCR
 会话压缩
 标注增强
 安全管理
 敏感词过滤
 多轮会话
文档管理文件上传 jpeg/png/jpg/gif/md/doc/xls/ppt/txt/pdf/docx/xlsx/pptx
 ISSUE同步
 在线录入
 API 同步
 office2md ETL增强
切片管理命中查询
 切片编辑
 重新训练
深度推理思维链展示
 思考时间计算
 联网搜索增强
业务联动系统管理:创建用户
 流程管理:审批发起
 IOT 联动: 米家联动
Chat2SQL自定义业务接入
 数据源管理
 动态数据表
 自然语言SQL
 结果 MD展示
多模态高质量文生图
 文生脑图
 文转语音
 语音转文
通用OCR底图标注
 结果结构化
 通用维护
AI业务编排 (beta)动态表单
 代码节点
 模型节点
 HTTP节点
 通知节点
 选择节点
 判断节点
 函数编排
其他数据标注
 提示词维护