PIG™ AI Microservice Architecture
系统白皮书
──


「2025 如果你的产品没有 AI,将变得一文不值」
佩格科技
COPYRIGHT © ai.pig4cloud. ALL RIGHTS RESERVED.

PIG™ AI Microservice Architecture<br>系统白皮书<br>──<br><br><br>「2025 如果你的产品没有 AI,将变得一文不值」<br>佩格科技<br>COPYRIGHT © ai.pig4cloud. ALL RIGHTS RESERVED.产品定位挑战一:Java 生态不足挑战二:单纯工具的局限性挑战三:集成复杂性与管控难题核心定位多模型支持深度推理 🔥① 全链路思维链保留② 实时联网搜索增强③ 私有化搜索引擎集成RAG 知识库多源知识融合历史数据企业知识公开资料智能清洗增强数据收集与标准化文本切分与去噪知识标注与向量化精准多路召回向量搜索全文搜索知识图谱关系重排① 场景演示② 知识库多知识库支持丰富的知识库场景答案标注安全控制输出富文本结果可溯源全局配置化模型切换向量数据库提示词维护账单管理③ 文档对话引擎④ PIG AI的创新数据清洗与预处理创新混合检索与排序算法Java 领域的技术重建业务联动打造超级员工Function Calling:智能与系统的深度集成业务流程自动化:AI 成为企业超级员工① 业务联动② 场景演示AI 智能表单③ 扩展能力④ 实际案例智能体编排① 核心特征② 适用场景③ 交互范式AI 问数智能图表生成自动识别数据特征智能化优势MCP 能力MCP 颠覆传统架构传统架构的局限性MCP 带来的架构革新实际应用场景MCP 客户端能力多样化接入方式核心能力特性MCP 服务端能力1. rest2mcp 自动化转换工具2. common-mcp 注解式集成AI 视觉多模态AI 视频AI 音频AI 智绘AI 海报AI 多模态搜索AI 公文AI OCRAI 安全监测核心特性应用场景技术优势实际案例智能提示词提示词的重要性实现路径与技术架构AI 编辑器核心功能交互体验AI 报告规则引擎增强两大核心价值01 安全控制02 方便扩展Java 技术栈① 服务端技术栈② 前端技术栈配置要求① 配置说明② 私有模型附录:详细功能清单功能清单总览

PIG AI 是一款企业级大语言模型(LLM)应用开发平台,它结合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者能够快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。

PIG AI 内置了构建 LLM 应用所需的关键技术栈,包括对数十个模型的支持、高质量的 RAG 引擎以及灵活的 Agent 框架,并提供了一套易用的界面和 API。这使得开发者可以节省大量重复造轮子的时间,适用于多种企业级商业场景,如企业智能客服、企业智能文档、专家顾问助理、业务联动等。

通过PIG AI,企业可以轻松构建出功能强大、高效智能的应用程序,提升业务流程的自动化程度和智能化水平,从而提高企业的竞争力和创新能力。

产品定位

PIG AI 致力于解决企业 AI 开发面临的三大核心挑战:

挑战一:Java 生态不足

AI 开发的许多前沿框架和库都优先在 Python 中实现,导致 Java 开发者在构建 AI 应用时面临工具链不完善、生态支持不足的困境。

PIG AI 的解决方案:在 Java 技术栈下全面重构 AI 应用开发的关键技术体系,填补了 Java 生态在 AI 应用领域的架构空白,完全基于 Java 语言的大语言模型(LLM)应用开发平台,让大模型距离 Java 开发者更近一步。

挑战二:单纯工具的局限性

像 Spring AI 或 LangChain4j 这样的开发框架虽然提供了基础的模型调用和编排能力,但在面对复杂的企业级业务流程时,往往显得能力不足,难以实现深度的业务联动和智能化。

PIG AI 的解决方案:提供了超越基础工具库的综合能力,有效解决了 Java 生态在 AI 领域的不足,并提供了超越基础开发库的强大功能,以满足复杂业务场景的需求。

挑战三:集成复杂性与管控难题

企业在落地 AI 应用时,往往需要对接来自不同厂商的多种模型(如聊天、向量、视觉模型),并与内部复杂的业务系统进行集成。这个过程缺乏统一标准,导致接口不一、重复开发、管理混乱。

PIG AI 的解决方案:平台通过引入标准化的通信协议和强大的规则引擎,来解决集成复杂性和管控难题,无缝在 50+ 模型中切换集成。

核心定位

链接模型和应用层:PIG AI 作为桥梁,连接底层大模型与上层业务应用,助力企业快速搭建稳定、可扩展的生成式 AI 应用。

服务 Java 开发者:PIG AI 的首要和核心定位是为广大的 Java 开发者提供一个功能全面、生产就绪的 AI 应用开发平台,旨在填补 Java 生态在 AI 领域的空白。

多模型支持

PIG AI 为以下模型提供商提供原生支持:

厂商模型类型模型名称
阿里百炼聊天qwen-max-latest
阿里百炼聊天qwen-plus
阿里百炼聊天qwen3-235b-a22b
阿里百炼向量text-embedding-v4
阿里百炼向量text-embedding-v3
阿里百炼排序gte-rerank-v2
阿里百炼图片flux-schnell
阿里百炼视觉qwen-vl-max-latest
阿里百炼视觉qwen-vl-plus-latest
阿里百炼视觉qwen-vl-ocr
阿里百炼音频cosyvoice-v1
阿里百炼音频paraformer-v2
DeepSeek聊天deepseek-chat
DeepSeek推理deepseek-reasoner
零一万物聊天yi-lightning
讯飞星火聊天Spark 4.0 Ultra/Max
火山方舟聊天doubao-1-5-pro-32k-250115
火山方舟聊天deepseek-v3-250324
火山方舟推理deepseek-r1-250120
火山方舟向量doubao-embedding-large-text-240915
火山方舟视觉doubao-1-5-vision-pro-32k-250115
月之暗面聊天kimi-k2-0711-preview
月之暗面视觉kimi-latest
月之暗面推理kimi-thinking-preview
智谱清言聊天glm-4-flash
智谱清言聊天glm-4-plus
智谱清言推理glm-z1-air
智谱清言推理glm-z1-airx
智谱清言推理glm-z1-flash
智谱清言向量embedding-3
智谱清言视觉glm-4v-flash
智谱清言视觉glm-4v-plus
硅基流动聊天deepseek-ai/DeepSeek-V3
硅基流动聊天moonshotai/Kimi-K2-Instruct
硅基流动推理deepseek-ai/DeepSeek-R1
硅基流动推理MiniMaxAI/MiniMax-M1-80k
硅基流动向量Qwen/Qwen3-Embedding-8B
硅基流动向量Qwen/Qwen3-Embedding-4B
硅基流动向量BAAI/bge-large-zh-v1.5
硅基流动向量BAAI/bge-m3
硅基流动排序Qwen/Qwen3-Reranker-8B
硅基流动排序Qwen/Qwen3-Reranker-4B
硅基流动排序BAAI/bge-reranker-v2-m3
硅基流动排序netease-youdao/bce-reranker-base_v1
硅基流动图片Kwai-Kolors/Kolors
硅基流动图片black-forest-labs/FLUX.1-schnell
硅基流动图片stabilityai/stable-diffusion-3-5-large
硅基流动视频Wan-AI/Wan2.1-I2V-14B-720P
硅基流动视频Wan-AI/Wan2.1-I2V-14B-720P-Turbo
硅基流动视觉Qwen/Qwen2.5-VL-32B-Instruct
硅基流动视觉Qwen/Qwen2.5-VL-72B-Instruct
硅基流动音频FunAudioLLM/CosyVoice2-0.5B
硅基流动音频RVC-Boss/GPT-SoVITS
OpenAI聊天gpt-4.1
OpenAI聊天gpt-4.1-mini
OpenAI聊天gpt-4.1-nano
OpenAI向量text-embedding-3-large
OpenAI向量text-embedding-3-small
OpenAI视觉gpt-4o
Ollama聊天qwen2.5:14b/32b/72b
Ollama聊天qwen3:14b/30b/32b/256b
Ollama推理deepseek-r1:8b/14b
Ollama向量bge-m3:latest
Ollama向量shaw/dmeta-embedding-zh
Ollama视觉minicpm-v:latest
Ollama视觉qwen2.5vl:7b/32b/72b
Gitee聊天deepseek/deepseek-v3-base:free
Gitee聊天qwen/qwen3-235b-a22b:free
Gitee向量Qwen3-Embedding-8B
Gitee排序Qwen3-Reranker-8B
搜索服务搜索bocha-web-search
搜索服务搜索sear-xng
Jina排序jina-reranker-m0
Jina解析jina-reader

PIG AI 提供了与 OllamavLLM 等本地模型部署工具的无缝集成能力,实现企业级私有化大模型的高效运行。通过简单配置,用户可以一键接入 DeepSeek 等主流开源大模型,充分利用本地计算资源进行高性能推理。

支持多种部署模式:

深度推理 🔥

PIG AI 完整支持 DeepSeek 、QwQ 深度推理能力,通过 deepseek-reasoner、QwQ 模型实现了更强大的推理和决策能力

① 全链路思维链保留

通过 deepseek-reasoner、QwQ 模型完整保留 AI 的思维链推理过程,在输出最终答案前强制生成详细的分析推导步骤。这种机制使决策过程完全透明可追溯,通过逐步验证确保结论可靠性,彻底解决传统框架(如 Spring AI/LangChain)因丢弃中间推理环节导致的"AI 黑箱"问题。

② 实时联网搜索增强

突破大模型预训练数据的时间边界,通过智能联网搜索获取最新实时信息。系统自动抓取权威信源的高质量内容,结合思维链机制进行多维度分析验证,完美解决时效性敏感问题(如金融数据、科技动态、政策法规等),使 AI 始终基于最新认知进行决策。

这两大特性形成独特优势:全链路思维链确保推理过程可解释可审计,实时联网搜索突破模型知识时效限制。相比同质化严重的大模型产品,PIG AI 通过"深度推理+实时感知"的技术组合,为企业构建差异化的智能决策系统。

③ 私有化搜索引擎集成

支持私有化搜索的直接部署和接入,企业可快速构建自主可控的搜索服务。通过私有化部署方案,用户可完全掌控搜索索引和数据流向,在保障数据主权的同时享受类 Bing 的搜索体验。该方案支持与企业现有权限系统深度整合,实现基于角色和业务场景的细粒度访问控制,确保敏感信息只在授权范围内流通。

RAG 知识库

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与文本生成相结合的技术范式。其核心思想是通过实时检索外部知识库获取与当前任务最相关的信息片段,将这些检索结果作为上下文输入给生成模型,从而提升生成内容的准确性和事实性。

对比维度模型微调RAG(推荐方案)
投入成本✅ 高昂:相当于自建工厂,长期维护(更新),适合预算充足的大企业。💡 低成本:类似租用云服务,,适合中小企业。
实施难度✅ 复杂:需专家团队,耗时数月开发调试,技术门槛极高。💡 简单易用:像使用现成软件,配置即可上线,普通IT团队可操作。
技术要求✅ 苛刻:需顶尖算法专家、海量数据、高性能硬件,风险高。💡 轻量化:无需算法专家,依赖外部知识库(如企业文档库),即插即用。
功能影响❌ 破坏性:可能导致模型原有能力丢失(如json/function等)。💡 无侵入:不修改模型本身,保留全部原有功能,风险可控。
适用范围❌ 局限:仅支持特定模型,依赖公开数据集,需长期技术迭代。💡 普适灵活:适配所有主流AI模型,可快速接入企业私有知识库,灵活扩展。

多源知识融合

PIG AI 平台通过先进的 RAG(检索增强生成)技术,将外部知识库与大语言模型深度融合,显著提升 AI 应用在企业场景下的准确性和可靠性,有效降低"模型幻觉"现象。系统支持多源知识的智能整合:

历史数据

大模型在训练阶段学习到的海量、通用的世界知识。这些知识是静态的,有明确的时间截止点(知识截止日期)。模型数据集中包含了互联网上的公开信息、书籍、论文等大规模文本数据。

企业知识

企业内部独有的、非公开的知识,如产品规格、技术文档、内部流程、业务规则等私有资料。这些数据是企业的核心资产,通过 PIG AI 可以安全地整合到 AI 应用中,使 AI 真正理解企业业务。

公开资料

通过搜索引擎链接外部世界,获取最新的行业新闻、市场趋势、竞品动态等公开信息。这突破了模型训练数据的时效性限制,让 AI 能够基于最新信息做出判断和回答。

智能清洗增强

PIG AI 开发了专用的数据清洗管道,解决了传统 RAG 系统在处理企业非结构化数据时的痛点,实现从"垃圾进、垃圾出"到精准应答的质的飞跃:

数据收集与标准化

来源多样化:支持文档(PDF、Word、Excel、PPT)、图片(通过视觉模型)、网页爬取、企业内部资料等多种数据源。

标准化处理:去除格式差异,统一为结构化/半结构化数据,为后续处理奠定基础。

文本切分与去噪

智能切分策略:支持按段落、语义块或自定义规则进行分片,保持内容的语义完整性。

深度清洗:自动识别并移除文档中的页眉页脚、水印、重复内容等干扰信息;去除噪音、无效符号,修正乱码,过滤重复内容。

知识标注与向量化

标注增强:为分片数据打上领域标签(行业、主题、时效性等),自动提取并标记文档的关键属性(如权威性、适用范围等),提升检索语义关联度。

向量化处理:使用大模型/专用嵌入模型将文本转换为高维向量,支持语义级别的相似度检索。

精准多路召回

PIG AI 突破了单一向量检索的局限性,构建了多路召回、多因素排序的混合检索引擎,显著提升查全率和查准率:

向量搜索

将您的所有资料(私有文档、数据等)转化为能够捕捉深层语义的"数学向量"。当用户提问时,系统不再是简单地匹配关键词,而是在语义层面去理解问题的真实意图,并找出内容上最相关的资料片段。这种稠密向量检索特别适合处理语义理解和概念关联。

全文搜索

采用传统的关键词匹配技术,对文本进行索引。当用户的提问包含特定的术语、代码、人名或产品型号时,该策略能快速、精准地定位到包含这些关键词的原文。稀疏向量检索在处理精确匹配场景时表现出色。

知识图谱

将非结构化的信息(如文本)转化为由"实体-关系-实体"组成的结构化知识网络。当用户提问涉及复杂关系时(如"A公司的CEO是谁"、"产品B依赖哪些技术"),系统可以直接在图谱中进行推理,并给出确定性的、高度浓缩的答案,而不是一段相关文本。

关系重排

在向量搜索、全文检索等策略完成初步检索(例如,找出最相关的 20 个信息片段)之后,关系重排模块并不会立刻将这些结果直接交给大模型。相反,它会作为一个更精细的"筛选官",不仅评估"每个片段与问题的相关性",更重要的是分析"这些片段之间的内在关系"。

通过基于相关性、时效性、权威性等多维度因素的二次排序,确保最终呈现给大模型的上下文是最优质的信息组合。

① 场景演示

PIG AI 的知识库功能确实非常强大,支持上传外部数据,如本地文件和实时数据,并利用向量搜索来检索最相关的内容以回答用户的问题。这种功能可以大大提高机器人的回答准确度和效率,使其能够更精确地理解和回应用户的提问。

通过上传外部数据,用户可以将各种类型的信息整合到 PIG AI 的知识库中,包括文档、数据库查询结果、实时数据等。然后,PIG AI 使用先进的向量搜索技术来对这些数据进行索引和搜索,以便快速找到与用户查询最相关的内容。

这种功能对于各种场景都非常有用,包括客户服务、技术支持、知识管理等。通过使用 PIG AI 的知识库功能,用户可以轻松构建出功能强大的智能问答系统,为用户提供更快速、更准确的帮助和支持。

② 知识库

将数据上传到 PIG AI 知识库后,PIG AI 会自动将你的文档分割成内容片段进行存储,并通过向量搜索来检索最相关的内容来回答用户问题。

例如:


RAG最高形态输出

PIG AI 知识库可以处理和理解来自不同模态(例如文本、图像、PDF、Office 等)的文档信息,使大型模型能够跨越多种输入形式进行学习和推理。

为解决目前 RAG(Retrieval-Augmented Generation)在实施中遇到的问题,如数据库的多路召回能力和数据处理问题,PIG AI 提供了专用的数据库和工具套件。系统支持配置多种重排序策略(如相关性优先、时效性优先、权威性优先等),并允许用户根据业务需求自定义检索参数和排序权重。通过这些灵活的配置选项和优化的检索算法,PIG AI 旨在使 RAG 更易于被更多企业和个人使用,并解锁更多应用场景,同时显著提升检索结果的准确性和相关性。

多知识库支持

PIG AI 支持同时管理和使用多个知识库,通过语义自动导航技术,系统能够智能识别用户问题的意图和领域,自动选择最相关的知识库进行检索。

当用户提问时,系统不需要手动指定使用哪个知识库,而是通过以下机制自动完成知识库匹配:

这种能力使得企业可以构建不同业务领域的专业知识库(如产品知识库、技术文档库、政策法规库等),而用户无需关心底层的知识库组织结构,只需自然提问即可获得精准答案。

丰富的知识库场景

PIG AI 知识库提供了多层级的功能特性,确保在企业环境中的安全可控使用:

答案标注

对历史对话中的回答进行标注,系统会在未来遇到类似问题时复用这些标注答案,从而提高回答的一致性和准确性。通过不断积累标注数据,知识库的质量会持续提升。

安全控制

多层级安全控制机制,涵盖访问权限管理、敏感词过滤、访问次数限制等功能,确保知识库在企业内的安全可控使用。支持细粒度的权限配置,不同角色可访问不同范围的知识内容。

输出富文本

支持富文本结果输出,包含图片、表格、链接、代码块等多种格式,提升信息表达的完整性与可读性。回答不再局限于纯文本,而是能够呈现结构化的、多媒体的内容。

结果可溯源

生成内容均提供关键引用的快照和原文出处,支持点击追溯到具体的文档位置,确保答案有据可依,让决策更可靠。这种可追溯性对于需要审计和合规的企业场景尤为重要。

全局配置化

PIG AI 提供了灵活的全局配置能力,让用户能够根据业务需求灵活调整系统行为:

模型切换

支持多种模型的在线配置,这意味着用户可以在统一的管理界面中灵活切换和调用不同厂商、不同类型的 AI 模型。无需修改代码,通过配置即可实现模型的热切换,大幅降低了对特定模型的依赖风险。

向量数据库

支持多种向量数据库的在线配置,允许用户根据业务需求、技术栈或成本考量,方便地切换和使用不同的向量存储方案(如 Milvus、Qdrant、Chroma、Redis-Stack、PGVector、Neo4j 等)。

提示词维护

提供提示词(Prompt)的在线维护功能,并引入了智能提示词优化引擎,以提升大模型的输出效果。用户可以在界面上直接编辑、测试和优化提示词,无需重新部署应用。

账单管理

在整个 AI 调用(API/智能体编排/批量任务)全流程中实现精确计量、透明归因,避免重复扣费并支持多租户/用户的成本分摊。企业可以清晰了解 AI 使用成本的分布情况,进行精细化的成本管理。

③ 文档对话引擎

PIG AI 的 Chat2File 功能重新定义了人机文档交互方式,通过创新的多模态对话引擎支持 Office 文档、图片、PDF 等十余种文件格式的智能解析与语义理解。用户只需上传文件,即可开启自然语言对话获得精准的文档洞察。

📄 智能文档解析

上下文感知问答

🌐 多语言智能转换

🔍 可验证知识溯源

④ PIG AI的创新

PIG AI 在 RAG (检索增强生成) 领域实现了多项创新突破,通过全面重构 Java 技术栈下的 RAG 实现方案,构建了高质量、高性能的企业级知识库解决方案:

数据清洗与预处理创新

PIG AI 开发了专用的数据清洗管道,解决了传统 RAG 系统在处理企业非结构化数据时的痛点:

这套数据清洗流程可将原始文档的有效信息密度显著提升,显著减少了"垃圾进、垃圾出"的问题,为高质量检索奠定基础。

混合检索与排序算法

PIG AI 突破了单一向量检索的局限性,构建了多路召回、多因素排序的混合检索引擎:

混合检索技术将传统单一向量检索的有了很大准确率提升,特别是在处理复杂查询和专业领域知识时表现突出。

Java 领域的技术重建

PIG AI 基于 Java 技术栈重构 RAG 技术体系,填补 Java 生态在 AI 应用领域的架构空白:

技术特性

核心优势

PIG AI 的 RAG 体系实现了技术突破与商业价值的有机统一,通过工程实践闭环将算法创新转化为可落地的智能服务,为企业构建自主可控的认知智能基座。

业务联动

打造超级员工

PIG AI 的业务联动能力将 AI 从简单的对话助手升级为具备实际业务执行能力的"超级员工",通过深度集成企业 IT 资产,实现从智能对话到业务执行的闭环。

Function Calling:智能与系统的深度集成

将自然语言转化为 API 调用或数据库查询,实现 AI 与企业现有 IT 资产的深度集成。系统能够:

业务流程自动化:AI 成为企业超级员工

AI 不再局限于回答问题,而是可以直接读写业务数据、触发业务流程,成为企业中的"超级员工",提升业务自动化水平。例如:

① 业务联动

将大模型回调业务系统的功能融入现有业务流程中 是一项关键任务。在这个过程中,首先需要经过现有业务的权限判断、参数校验等业务逻辑判断,以确保调用的合法性和准确性。一旦通过了这些判断,大模型回调功能就会被触发,开始执行相应的智能逻辑。

这种打通大模型和业务系统的壁垒,实际上是在传统应用中引入了更智能的处理方式。通过大模型的回调,业务系统可以获得更精准、更智能的决策支持,从而提升业务处理的效率和准确性。这种智能化的应用场景不仅可以优化现有业务流程,还可以为企业带来更多的竞争优势和创新可能性。

② 场景演示

将自然语言转换为 API 调用参数或查询数据库的条件;提取文本中的结构化数据。提供基于通用大型模型的实时回调业务函数能力,Function Calling 使得 Chat Completion 模型可以调用外部函数获取信息再针对输出进行格式化。能够方便地扩展任何业务逻辑,使模型更了解业务,更敏捷地构建您的私域大模型。使用函数调用能力,可以满足当前大模型无法解决的部分问题,包括:

AI 智能表单

PIG AI 的智能表单功能彻底改变了传统的数据录入方式,用户只需用自然语言描述需求,AI 即可自动理解并转化为结构化的表单数据:

自然语言理解:用户可以用口语化的方式描述信息,如"帮我创建一个新用户,名字叫张三,手机号是138xxxx,部门是技术部",AI 会自动识别出姓名、手机号、部门等字段。

自动表单填充:AI 将识别的信息自动映射到对应的表单字段,无需用户手动逐个填写。

业务流程联动:表单提交后可自动触发相关业务流程,如用户创建、权限分配、流程审批等操作。

错误检测与提示:AI 会智能检测数据的合法性和完整性,对缺失或错误的信息进行提示和确认。

这种交互方式特别适合需要频繁录入数据的场景,可以大幅提升工作效率,降低操作门槛。

Jw5Ozn

 

③ 扩展能力

PIG AI 提供了强大的功能调用支持,允许用户自行开发和实现 function calling,从而实现业务联动能力。这意味着用户可以根据自身业务需求,开发定制的功能模块,并通过 PIG AI 提供的方便 API 接口将这些功能集成到应用中。

④ 实际案例

【智能 CRM 系统增强】PIG AI 重构企业客户关系管理范式,通过多模态理解引擎实现非结构化数据的智能解析与业务联动。系统架构包含三大核心价值维度:

技术架构突破
采用多模态理解框架(文本+图像联合建模)与函数调用编排引擎,实现从原始数据到业务系统的全链路自动化。通过动态参数绑定技术,确保提取的客户信息直接对接企业现有 CRM 数据库字段,消除系统对接的二次开发成本。

系统通过声明式接口配置实现与企业现有 OA/ERP 系统的无缝对接,将 AI 能力注入现有IT基础设施,降低智能化改造成本。

智能体编排

PIG AI智能体设计界面

智能体(Agent)是具备自主决策和执行能力的 AI 实体,通过感知环境、分析决策、执行动作的闭环机制完成特定任务。PIG AI 的智能体编排系统提供可视化流程设计器,支持多智能体协同工作流的构建与优化。

① 核心特征

② 适用场景

场景类型典型应用
内容生产多语言文档翻译、营销文案批量生成
数据分析报表自动生成、数据洞察提取
流程自动化邮件自动分类回复、工单智能派发
资源处理图像批量标注、视频关键帧提取

③ 交互范式

单向任务流指令输入 → 智能体执行 → 结果输出 的标准化流程

AI 问数

Chat2BI 能够实现自然语言与 SQL 的转换,从而极大地提升了工作效率。在 AI 时代,数据库研发人员可以将 Chat2BI 视为必备的利器,它为他们提供了便捷而高效的工作方式。即使是不懂 SQL 的运营或业务人员,也可以轻松地使用 Chat2BI 进行快速的数据查询和报表生成。

Chat2BI 还具有智能化的功能,能够根据上下文自动选中相关的数据表,并生成与业务需求相匹配的 SQL 查询语句。这种智能关联功能使得用户无需深入了解数据库结构,就能够轻松地执行复杂的数据查询操作,极大地降低了使用门槛,提高了工作效率。

智能图表生成

PIG AI 的"问数"功能不止于将自然语言翻译成 SQL,其核心亮点在于 AI 的深度语义理解能力,能够根据用户问题的内在逻辑,自动生成最合适的可视化图表。

自动识别数据特征

系统通过分析查询结果的数据特征和用户问题的语义,智能判断最适合的图表类型:

识别数据对比 → 自动生成柱状图:当用户询问"各部门的销售额对比"或"不同产品的销量排名"时,系统识别出这是数据对比场景,自动生成柱状图进行直观展示。

识别时间趋势 → 自动生成折线图:当问题涉及"过去半年的用户增长趋势"或"每月收入变化"时,系统识别出时间序列特征,自动生成折线图展示趋势变化。

识别分类占比 → 自动生成饼图:当询问"各渠道的流量占比"或"产品类别的销售构成"时,系统识别出占比关系,自动生成饼图展示比例分布。

识别关联关系 → 自动生成散点图:当分析"广告投入与销售额的关系"或"用户活跃度与转化率的相关性"时,系统识别出变量关联,自动生成散点图进行相关性分析。

智能化优势

传统 BI 工具需要用户手动选择图表类型、配置坐标轴、设置图例等,而 PIG AI 通过语义理解自动完成这一切。用户只需要自然地提问,系统就能:

这种智能化能力让数据分析变得像日常对话一样简单,真正实现了"人人都是数据分析师"的目标。

MCP 能力

MCP(模型控制协议)是专为 AI 系统设计的标准化通信协议,实现不同 AI 组件间的无缝协作。研究表明,MCP 很可能是构建需要与现实世界交互的代理 AI 系统的关键,其标准化特性被业界喻为 AI 领域的"USB-C 端口",通过统一接口规范显著降低系统集成复杂度。随着快速增长的生态系统和主要科技公司的支持,MCP 正成为企业级 AI 应用落地的重要推手。

MCP 颠覆传统架构

传统架构的局限性

传统 B/S(浏览器/服务器)和 C/S(客户端/服务器)架构下,系统间的交互受限于固定的请求-响应模式和清晰的功能边界。这种架构在 AI 时代面临诸多挑战:

MCP 带来的架构革新

MCP 则创建了一个更灵活的通信层,允许 AI 智能体(Agent)直接、重复地调用操作系统级别的能力(如文件读写、程序执行),绕开了传统架构的技术壁垒:

实际应用场景

传统 C/S 系统集成:通过 MCP,AI 可以直接操作桌面应用程序(如日历软件、邮件客户端),实现"帮我在日历中添加明天下午3点的会议"这样的自然语言指令。

传统 B/S 第三方系统对接:AI 可以通过 MCP 协议直接调用第三方 Web 服务的能力,无需为每个服务单独开发适配层,大幅降低集成成本。

企业内部系统打通:将企业内部各个孤岛系统(ERP、CRM、OA 等)的能力通过 MCP 标准化暴露,AI 可以智能编排跨系统的业务流程。

MCP 客户端能力

PIG AI 作为 MCP 客户端标准实现者,提供符合 MCP 规范的客户端 SDK,支持快速接入各类 MCP 兼容服务。

多样化接入方式

支持标准 MCP 服务端的多种部署形态无缝接入:

核心能力特性

通过 MCP 客户端可实现:

MCP 服务端能力

PIG AI 作为 MCP 服务端能力提供者,支持将现有业务系统快速转换为符合 MCP 标准的 AI 能力服务,实现业务逻辑与 AI 系统的无缝集成。

1. rest2mcp 自动化转换工具

一键式接口转换:通过 rest2mcp 工具可以将原有 REST 接口自动化翻译为 MCP 能力接口,实现零代码改造的快速迁移。

Wf8KE3

核心特性

使用限制:原有接口的注释需完整满足 JavaDoc 标准,包含完整的方法描述、参数说明和返回值定义。

2. common-mcp 注解式集成

轻量级集成方案:通过引入 common-mcp 工具依赖,在原有业务代码上添加专用注解,即可自动被 PIG AI 接管实现 MCP 能力暴露。

核心特性

AI 视觉

多模态

PIG AI 提供全面的多模态支持,通过先进的大模型技术实现高质量的内容生成与转换能力。系统支持文本、图像、语音等多种模态的智能转换与协同处理,显著提升内容创作效率。

AI 视频

AI 音频

AI 智绘

AI 海报

1746941619

AI 多模态搜索

AI 多模态搜索(AI Multimodal Search)是基于大模型与向量语义理解技术的智能搜索系统,支持"以文搜图"与"以图搜图"等多模态交互方式。

核心能力

应用场景

5YQUBv

AI 公文

AI 公文功能将繁琐的格式调整与内容填充工作完全自动化,专注于公文和正式文档的智能生成。

核心特性

通过统一的 API 接口,开发者可以便捷集成这些多模态能力到现有业务系统中,构建智能化的内容生产流水线。系统采用模块化设计,支持根据业务需求灵活组合不同模态的处理能力。


AI OCR

PIG AI 提供了强大的 OCR(光学字符识别)能力,依托先进的大语言模型技术,支持多种复杂的识别场景,帮助企业和开发者高效处理图像中的文字和表格信息。其核心功能包括:

  1. 结构化 JSON 输出

  1. 灵活的内容提取

  1. 多语言支持与扩展性

  1. 业务集成与调用

AI 安全监测

PIG AI 的 AI 安全监测能力结合了 OCR、图像识别和大模型分析技术,实现对各类场景的智能安全监管,从"文字识别"升级为"知识提取",直接提供业务所需的风险判断和决策数据。

核心特性

应用场景

工地施工安全:自动检测是否佩戴安全帽、防护绳索使用情况、危险区域闯入等行为,实时预警安全隐患。

工业生产监控:发现火源、化学品泄漏、操作不规范行为、设备异常状态等风险因素,保障生产安全。

企业园区安防:识别人员闯入禁区、设备未关闭、可疑行为等风险,提升园区安全管理水平。

公共安全监管:用于交通枢纽、商场等公共区域,识别潜在危险事件(如遗留物品、人群聚集、异常行为等),辅助公共安全管理。

矿山智能监管:车辆合规检测、超载超速识别、作业区域管控等,实现矿山作业的全方位智能监管。

技术优势

通过整合多模态 OCR 能力与传统机器学习数据分析手段,PIG AI 将非结构化的监控数据转化为可分析的结构化信息,再通过业务联动机制联动预警和处置流程,实现从监测到处置的闭环管理。

实际案例

PIG AI 在矿山治理领域的应用展现了其强大的行业适应性。通过整合多模态 OCR 能力与传统机器学习数据分析手段,系统实现了矿山作业的全方位智能监管:

该系统将大幅降低矿山安全事故发生率,提高矿区运营效率。相比传统人工巡检,自动化监管可减少 75% 的人力投入,同时提高违规行为发现率 60%。系统利用 PIG AI 的 OCR 技术将非结构化的监控数据转化为可分析的结构化信息,再通过业务联动机制联动预警和处置流程,实现了从监测到处置的闭环管理。

智能提示词

提示词的重要性

提示词工程(Prompt Engineering)是构建高质量 AI 应用的核心要素。精心设计的提示词能够显著提升大模型输出的准确性、相关性和创造性,有效解决模型幻觉问题,同时降低 30%-50% 的无效交互成本。研究表明,优化后的提示词可使任务完成度提升 65%,在复杂业务场景中尤为关键。

实现路径与技术架构

PIG AI 引入了智能提示词优化引擎,该引擎通过多维度分析(包括语义理解、历史交互反馈及业务规则学习)进行实时提示词调优。我们推荐以下五步迭代法来打造高质量的提示词:

  1. 明确目标与模型选择:使用 Qwen 或 DeepSeek 应用创建新会话,选用推荐模型(如 DeepSeek)

  2. 初步构建提示词:基于引导模板(例如:"帮我写个 prompt。我希望实现[具体目标]。要求是[明确约束条件]")构建初始提示词。

  3. 测试与评估:将生成的 prompt 投入实际执行会话进行测试,仔细评估输出结果的质量和相关性。

  4. 反馈与迭代:返回原提示词构建会话,提供明确的反馈,例如:"这是处理结果,存在[具体问题,如:答案不够全面/风格不匹配/偏离主题等],应如何优化?"

  5. 持续优化:根据 AI 生成的优化建议,对提示词进行迭代修改。通常经过 3-5 轮的调整,即可获得满足需求的理想 prompt。

智能提示词优化

AI 编辑器

PIG AI 编辑器是一款专为内容创作者设计的智能写作工具,它集成了多种 AI 辅助功能,帮助用户高效创作高质量内容。以下是其核心功能特点:

核心功能

  1. 智能写作辅助

    • 提供多种写作模式:创作、润色、扩写、缩写等

    • 支持一键生成大纲、摘要和关键点提取

    • 智能补全功能可根据上下文预测并提供下一句建议

  2. 多场景模板

    • 内置丰富的专业写作模板:商业报告、学术论文、营销文案等

    • 支持自定义模板创建与分享

    • 针对不同行业提供专业术语库和写作规范

交互体验

如上图所示,PIG AI 编辑器采用直观的分栏式设计,左侧为功能导航区,中央为主编辑区域,右侧为AI辅助面板。用户可以通过简单的下拉菜单选择不同的写作场景和辅助功能,实现"所见即所得"的编辑体验。

编辑器支持多种交互方式:

通过这种设计,PIG AI 编辑器不仅提供了强大的AI辅助功能,还保持了简洁易用的操作界面,让内容创作变得更加高效和愉悦。

AI 报告

提供强大的智能报告生成功能,能够自动联动 Microsoft Office Word,让您只需一键操作即可生成专业规范的文档报告。系统会根据您的需求和输入内容,智能构建报告结构,填充专业内容,并自动应用标准格式,大幅提升文档创建效率。

规则引擎增强

生成式 AI 因其特性而在各地区受到不同程度的管控,针对这一挑战,我们基于规则引擎平台实现了业务决策与代码解耦的创新方案。PIG AI 的规则引擎为强大的 AI 模型套上了"缰绳",使其变得可控、可靠、可信,能够安全地融入企业核心业务流程。

两大核心价值

01 安全控制

内置强大的防御风控机制,确保 AI 应用在企业环境中的安全可控:

敏感内容防护

访问控制与边界管理

合规性保障

02 方便扩展

将 AI 能力的应用和创新权交还给最懂业务的专家,让 AI 能快速响应瞬息万变的市场需求:

低门槛、高灵活性

业务决策与代码解耦

规则复用与组合

通过 PIG AI 的规则引擎,企业可以在保障安全合规的前提下,灵活快速地构建和调整 AI 应用,实现"既要安全可控,又要敏捷创新"的目标。

Java 技术栈

基于 Java 语言 进行系统开发,提供了丰富的模型支持,包括公有模型和私有模型,并且具有方便的扩展性和二次开发性。让我详细解释一下:

  1. 丰富的模型支持: PIG AI 提供了多种大模型支持,涵盖了文本、图片视觉、语音识别等模型。这些模型既包括了公有模型,也支持用户上传和使用私有模型,因此可以满足各种不同场景和需求下的系统开发。

  2. 方便的扩展性: PIG AI 提供了友好的接口和工具,方便开发人员轻松地扩展系统功能。无论是集成新的预训练模型,还是开发定制的模型和算法,都可以通过 PIG AI 提供的扩展机制来实现。

  3. 二次开发支持: PIG AI 提供了灵活的二次开发支持,可以根据具体需求进行定制化开发。开发人员可以基于 PIG AI 提供的模型和工具,快速构建出符合业务需求的系统,并且可以根据实际情况进行调整和优化。

  4. 与 Java 的紧密集成: PIG AI 提供了与 Java 紧密集成的功能,这使得 Java 开发者可以更轻松地使用 PIG AI 的功能。通过 PIG AI 提供的 Java SDK 和 API,开发人员可以在 Java 项目中直接调用 PIG AI 的功能,实现各种智能化应用场景。

综上所述,基于 PIG AI 进行系统开发可以让大模型距离 Java 开发者更近一步,为他们提供了丰富的模型支持、方便的扩展性和二次开发支持。这将有助于开发人员快速构建出功能强大、智能化的系统应用。

① 服务端技术栈

② 前端技术栈

配置要求

① 配置说明

② 私有模型

附录:详细功能清单

功能清单总览

功能分类功能点描述AI 大模型开发平台
演示环境https://home.pig4cloud.com:38443
产品定位PIG AI 是一款完全基于Java 的大语言模型(LLM)应用开发平台,使Java开发者能够快速搭建生产级的生成式 AI 应用
通用功能除AI部分外,其他所有功能均一致✅ 商业版全部功能
模型在线配置OpenAI :聊天、推理、向量
 阿里百炼:Qwen 聊天、推理、向量、图文、音频
 DeepSeek:聊天、推理
 Ollama、vllam 本地私有模型
 智谱清言:聊天、推理、向量、音频
 硅基流动:聊天、推理、向量、图文、音频
 月之暗面、文心一言:聊天
 字节豆包、月之暗面:聊天
 讯飞星火、零一万物:聊天
 联网搜索
向量在线配置milvus
 qdrant
 chroma
 redis-slack
 pgvector
 neo4j
 ...
知识库RAG发布形式:外链、iframe、悬浮增强
 发布DIY
 文档预总结
 AI OCR
 会话压缩
 标注增强
 安全管理
 敏感词过滤
 多轮会话
文档管理文件上传 jpeg/png/jpg/gif/md/doc/xls/ppt/txt/pdf/docx/xlsx/pptx
 网页爬取
 在线录入
 API 同步
 知识图谱增强
切片管理命中查询
 切片编辑
 重新训练
深度推理思维链展示
 思考时间计算
 联网搜索增强
业务联动系统管理:创建用户
 流程管理:审批发起
 IOT 联动: 米家联动
AI问数自定义业务接入
 数据源管理
 动态数据表
 自然语言SQL
 结果图表展示
 结果 MD展示
多模态高质量文生图
 AI 存储搜索
 文生脑图
 文生视频
 文转语音
 语音转文
 AI 编辑器
 AI 公文
 AI 海报
 AI 报告
通用OCR底图标注
 结果结构化
 通用维护
AI业务编排动态表单
 代码节点
 模型节点
 HTTP节点
 通知节点
 选择节点
 判断节点
 函数编排
 结束节点
 分支节点
 循环节点
 知识库节点
 结构化输出节点
 文本节点
 问题分类节点
 执行代码节点
 数据库节点
 RAG知识库节点
 MCP服务节点
其他数据标注
 提示词维护