时代Java，与您同行！关注微信公众号，关注前沿技术，微信搜索：nowjava或时代Java，也可点击这里扫码关注

时代Java

京东自营 + 国补 iPhone 历史最低价国家补贴享8折

从零开始的 MCP 开发

欢马劈雪

工程师 (已认证)

原创分享签约作者

发表于教程文章

327

前言：我们迎来万能插头？

在 AI 提效上，我们小组的每个人都有自己的独特方式，作为一个沉醉在业务开发+业务样式改版的终端开发，再加上我的 CSS 功底基本上样式就是靠试，每次在 UI 还原部分都是很是痛苦。这样，在团队内部同学完成了 Done 插件转React 代码并完成 OneDay Web 端落地后，我就在想，是否可以在插件端实现一样的能力，就这样 MCP 的能力自然就进入我的视野了。

这个小玩具是通过 MCP 协议进行开发的，并且集成在了 OneDay插件中。这篇文章，主要记录了自己在开发 MCP 插件的过程中的学习路径，以及是如何从零用 AI 开发一个小插件的。最后，也是趁着业务大改版的机会，将这个插件结合在我的开发流程中。

MCP 协议简介：AI 的"万能插头"

2024 年 11 月，Anthropic推出了 Model Context Protocol (MCP)，这一开放协议旨在解决 LLM与外部工具集成的标准化问题。MCP 提供了一种统一的方式，使 AI 模型能够与各种数据源和工具进行交互，被官方形象地称为 AI 应用的"USB-C 端口"。

MCP 的本质与价值

MCP的核心价值在于提供一种标准化的方式，让 AI 模型与外部世界进行交互。在 MCP 出现之前，开发者需要为每个 AI 集成创建定制化的解决方案，这导致了严重的碎片化问题。

MCP 解决了这些问题，它提供了以下关键价值：

统一集成标准：一个协议对接所有集成，降低开发难度
实时数据更新：支持动态数据交互而非静态连接
自动工具发现：支持动态工具发现和上下文处理
隐私保护：数据和工具不需上传远端，保护数据隐私
开发效率：显著减少开发时间，提高系统可靠性

核心能力

根据 MCP 协议规范，服务器可以提供三种核心对象：

支持程度

目前 MCP 这一概念的火热也让众多 IDE 和框架积极投身在这一领域，其中Claude桌面应用和Continue提供了最全面的MCP支持，包括资源、提示模板和工具集成，使其能够深度整合本地工具和数据源。众多代码编辑器和IDE（如Cursor、Zed、Windsurf Editor和Theia IDE）通过MCP增强了开发工作流程，提供如智能代码生成、AI辅助编码等功能。

在官网的示例中（https://modelcontextprotocol.io/examples），可以发现，越来越多的公司、组织开始积极拥抱 MCP，目前通过 MCP 可以进行本地文件、云端文件的修改，Git 相关仓库的阅读与更改，基于Puppeteer 进行浏览器自动化和网页抓取，甚至通过EverArt的相关服务可以进行图像生成。

一些更抽象的 MCP 服务可以在这里看一看（https://github.com/punkpeye/awesome-mcp-servers）

真的是大一统么？

文档上说的很好，MCP 是AI 届的USB-C，使用了 MCP 就意味着你的协议可以在所有的 AI 应用上使用了。

但是，强如 USB-C 现在也没有办法做到真正的大一统，不同厂商之间还是存在着不同。

所以，“MCP 可能统一，但是 MCP统一不太可能”。

现在针对不同的 AI 终端每个 MCP 支持的能力也是不尽相同的，本文说的只是在 OneDay VSC 插件上的开发体验；

前置学习一下

看完前面的 MCP 具体协议相关的文档之后，理解能力比较强的老师可能已经知道 MCP 是在干啥了，像我这种 AI 知识早就还给 CV、ML 老师了的同学来说，还是不是很清楚 MCP 具体是咋被调用的。

为了搞清楚MCP 的运作方式，我准备学习一下开源的工具以及 SDK 是如何运作的，作为一个练习时长2 坤年的终端开发，我选择的开源仓库是 Roo 和 MCP Typescript 的 SDK。

如何使用MCP TS进行开发

在 MCP 官网上，赫然写着Building MCP with LLMs（https://modelcontextprotocol.io/tutorials/building-mcp-with-llms），但是本着尊重 AI 的劳动成果的原则还是要学习一下里面具体的内容的。

这部分不太详细展开，具体的 MCP 开发还是参考官网的文档好了。

Client

负责与 MCP 服务器建立连接并发送请求，主要的方法有：

connect(transport)：连接到服务器
request(request, schema, options)：发送请求并等待响应
close()：关闭连接

import { Client } from "@modelcontextprotocol/sdk/client/index.js";

McpServer

提供一个高级 API 来创建 MCP 服务器，主要的方法有：

tool(name, schema, handler)：注册一个工具
resource(name, template, handler)：注册一个资源
connect(transport)：连接到传输层

import { McpServer } from "@modelcontextprotocol/sdk/server/mcp.js";
const server = new McpServer({
  name: "我的MCP服务",
  version: "1.0.0"
});

Server

一个低级类，也是本文采用的一个类，低级开发用低级类（bushi

setRequestHandler(schema, handler)：为特定请求类型设置处理程序
connect(transport)：连接到传输层

import { Server } from "@modelcontextprotocol/sdk/server/index.js";

传输接口（Transport）

MCP 支持多种传输方式，用于与客户端通信，主要是通过：stdio 传输（命令行应用）和SSE 传输（Web服务器）。

import { StdioServerTransport } from "@modelcontextprotocol/sdk/server/stdio.js";


const transport = new StdioServerTransport();
await server.connect(transport);
import { SSEServerTransport } from "@modelcontextprotocol/sdk/server/sse.js";
import express from "express";


const app = express();


app.get("/sse", async (req, res) => {
  const transport = new SSEServerTransport("/messages", res);
  await server.connect(transport);
});


app.post("/messages", async (req, res) => {
  await transport.handlePostMessage(req, res);
});


app.listen(3000);

具体的开发流程如下

Roo 如何调用MCP

Roo 是谁，Cline 优化版罢了

大体上了解了 MCP SDK中的使用方式，那么问题又来了： MCP 集成在客户端上，客户端是如何判断是否需要调用 MCP 以及使用哪个 MCP 的？

打开 Roo 的源码，AI 总结启动...

可以看出来主要流程有意图识别、工具识别、工具调用这三个主要的步骤。

意图识别

Roo Code使用大型语言模型（LLM）来理解用户的自然语言输入并识别用户的意图。当用户提出一个请求时，LLM会分析请求并决定使用哪些工具来完成任务。

系统提示构建：通过 generatePrompt 函数构建完整的系统提示，包括 MCP 服务器和工具信息。

这使 LLM 能够了解可用的 MCP 服务器及其功能。

这使 LLM 能够了解可用的 MCP 服务器及其功能// src/core/prompts/system.ts
// 通过 generatePrompt 函数构建完整的系统提示，包括 MCP 服务器和工具信息。
// 这使 LLM 能够了解可用的 MCP 服务器及其功能
async function generatePrompt(
    context: vscode.ExtensionContext,
    cwd: string,
    supportsComputerUse: boolean,
    mode: Mode,
    mcpHub?: McpHub,  // MCP 集线器实例，负责管理所有 MCP 服务器连接
    diffStrategy?: DiffStrategy,
    browserViewportSize?: string,
    // ... 其他参数
): Promise<string> {
    // ... 前面的代码
    
    // 异步获取两个部分：模式部分和 MCP 服务器部分
    const [modesSection, mcpServersSection] = await Promise.all([
        getModesSection(context),
        // 仅当当前模式包含 mcp 组时才加载 MCP 服务器部分
        modeConfig.groups.some((groupEntry) => getGroupName(groupEntry) === "mcp")
            ? getMcpServersSection(mcpHub, effectiveDiffStrategy, enableMcpServerCreation)
            : Promise.resolve(""),
    ])


    // 构建完整的系统提示，包括多个部分
    const basePrompt = `${roleDefinition}


${getSharedToolUseSection()}


${getToolDescriptionsForMode(  // 这里会包含 MCP 相关工具的描述
    mode,
    cwd,
    supportsComputerUse,
    effectiveDiffStrategy,
    browserViewportSize,
    mcpHub,
    customModeConfigs,
    experiments,
)}


${getToolUseGuidelinesSection()}


${mcpServersSection}  // 这部分包含所有可用的 MCP 服务器及其工具信息


// ... 其他部分
    `


    return basePrompt
}

MCP 服务器信息生成：getMcpServersSection 方法收集并格式化已连接的 MCP 服务器信息：提供服务器名称、可用工具及其参数架构，让 LLM 知道如何使用它们。

// src/core/prompts/sections/mcp-servers.ts
export async function getMcpServersSection(
    mcpHub?: McpHub,
    diffStrategy?: DiffStrategy,
    enableMcpServerCreation?: boolean,
): Promise<string> {
    if (!mcpHub) {
        return ""
    }


    // 构建已连接服务器的信息字符串
    const connectedServers =
        mcpHub.getServers().length > 0
            ? `${mcpHub
                    .getServers()
                    .filter((server) => server.status === "connected")  // 只显示已连接的服务器
                    .map((server) => {
                        // 为每个服务器生成其工具列表信息
                        const tools = server.tools
                            ?.map((tool) => {
                                // 为每个工具包含输入模式（如果有）
                                const schemaStr = tool.inputSchema
                                    ? `    Input Schema:
    ${JSON.stringify(tool.inputSchema, null, 2).split("\n").join("\n    ")}`
                                    : ""


                                return `- ${tool.name}: ${tool.description}\n${schemaStr}`
                            })
                            .join("\n\n")


                        // ... 生成资源模板和直接资源信息 ...
                        
                        // 解析服务器配置以显示命令信息
                        const config = JSON.parse(server.config)


                        // 返回完整的服务器描述，包括工具、资源模板和直接资源
                        return (
                            `## ${server.name} (\`${config.command}${config.args ? ` ${config.args.join(" ")}` : ""}\`)` +
                            (tools ? `\n\n### Available Tools\n${tools}` : "") +
                            (templates ? `\n\n### Resource Templates\n${templates}` : "") +
                            (resources ? `\n\n### Direct Resources\n${resources}` : "")
                        )
                    })
                    .join("\n\n")}`
            : "(No MCP servers currently connected)"  // 如果没有连接服务器，显示此消息


    // ... 返回完整部分，包括 MCP 服务器介绍和创建指南 ...
}

工具描述提供：getUseMcpToolDescription 函数定义了 MCP 工具的使用方法和参数格式。包含使用示例，帮助 LLM 生成正确格式的工具调用。

// src/core/prompts/tools/use-mcp-tool.ts
export function getUseMcpToolDescription(args: ToolArgs): string | undefined {
    // 如果没有 MCP 集线器，不需要此工具描述
    if (!args.mcpHub) {
        return undefined
    }
    
    // 返回标准化的工具描述，包括参数说明和使用示例
    return `## use_mcp_tool
Description: Request to use a tool provided by a connected MCP server. Each MCP server can provide multiple tools with different capabilities. Tools have defined input schemas that specify required and optional parameters.
Parameters:
- server_name: (required) The name of the MCP server providing the tool
- tool_name: (required) The name of the tool to execute
- arguments: (required) A JSON object containing the tool's input parameters, following the tool's input schema
Usage:
<use_mcp_tool>
<server_name>server name here</server_name>
<tool_name>tool name here</tool_name>
<arguments>
{
  "param1": "value1",
  "param2": "value2"
}
</arguments>
</use_mcp_tool>


Example: Requesting to use an MCP tool


<use_mcp_tool>
<server_name>weather-server</server_name>
<tool_name>get_forecast</tool_name>
<arguments>
{
  "city": "San Francisco",
  "days": 5
}
</arguments>
</use_mcp_tool>`
}

工具识别&调用

首先通过 use_mcp_tool 工具来解析 LLM 返回的工具调用并验证参数。

// src/core/Cline.ts
async presentAssistantMessage() {
    // ... 前面的代码
    
    case "use_mcp_tool": {
        const server_name: string | undefined = block.params.server_name
        const tool_name: string | undefined = block.params.tool_name
        const mcp_arguments: string | undefined = block.params.arguments
        try {
            // 处理部分工具调用 - 这是处理未完成的工具调用的机制
            if (block.partial) {
                const partialMessage = JSON.stringify({
                    type: "use_mcp_tool",
                    serverName: removeClosingTag("server_name", server_name),
                    toolName: removeClosingTag("tool_name", tool_name),
                    arguments: removeClosingTag("arguments", mcp_arguments),
                } satisfies ClineAskUseMcpServer)
                await this.ask("use_mcp_server", partialMessage, block.partial).catch(() => {})
                break
            } else {
                // 验证必要参数是否存在
                if (!server_name) {
                    this.consecutiveMistakeCount++
                    pushToolResult(
                        await this.sayAndCreateMissingParamError("use_mcp_tool", "server_name"),
                    )
                    break
                }
                if (!tool_name) {
                    this.consecutiveMistakeCount++
                    pushToolResult(
                        await this.sayAndCreateMissingParamError("use_mcp_tool", "tool_name"),
                    )
                    break
                }
                
                // 解析 JSON 参数（如果提供）
                let parsedArguments: Record<string, unknown> | undefined
                if (mcp_arguments) {
                    try {
                        parsedArguments = JSON.parse(mcp_arguments)
                    } catch (error) {
                        // 处理 JSON 解析错误
                        this.consecutiveMistakeCount++
                        await this.say(
                            "error",
                            `Roo tried to use ${tool_name} with an invalid JSON argument. Retrying...`,
                        )
                        pushToolResult(
                            formatResponse.toolError(
                                formatResponse.invalidMcpToolArgumentError(server_name, tool_name),
                            ),
                        )
                        break
                    }
                }

然后通过McpHub.callTool方法来实现 MCP 工具的调用。

// src/core/Cline.ts - 继续上面的代码
await this.say("mcp_server_request_started")
const toolResult = await this.providerRef
    .deref()
    ?.getMcpHub()
    ?.callTool(server_name, tool_name, parsedArguments)
// src/services/mcp/McpHub.ts
async callTool(
    serverName: string,
    toolName: string,
    toolArguments?: Record<string, unknown>,
): Promise<McpToolCallResponse> {
    // 查找对应的服务器连接
    const connection = this.connections.find((conn) => conn.server.name === serverName)
    if (!connection) {
        throw new Error(
            `No connection found for server: ${serverName}. Please make sure to use MCP servers available under 'Connected MCP Servers'.`,
        )
    }
    // 检查服务器是否被禁用
    if (connection.server.disabled) {
        throw new Error(`Server "${serverName}" is disabled and cannot be used`)
    }


    // 从服务器配置中获取超时设置
    let timeout: number
    try {
        const parsedConfig = ServerConfigSchema.parse(JSON.parse(connection.server.config))
        timeout = (parsedConfig.timeout ?? 60) * 1000  // 默认 60 秒
    } catch (error) {
        console.error("Failed to parse server config for timeout:", error)
        // 解析失败时使用默认值
        timeout = 60 * 1000
    }


    // 使用 MCP SDK 的 Client 接口发送请求
    return await connection.client.request(
        {
            method: "tools/call",
            params: {
                name: toolName,
                arguments: toolArguments,
            },
        },
        CallToolResultSchema,  // 用于验证响应的模式
        {
            timeout,  // 应用从配置获取的超时值
        },
    )
}

callTool 里面最后的调用还是落在我们创建 Server 时使用的 connection。

connection.client.request(
        {
            method: "tools/call",
            params: {
                name: toolName,
                arguments: toolArguments,
            },
        },
        CallToolResultSchema,
        {
            timeout,
        },
    )

问题的答案

讲到这里我们终于可以给之前疑问画上一个句号了，具体的 MCP被调用的链路如下：

1.初始化连接:

McpHub 实例化各种 McpConnection
每个连接包含 Client 和 StdioClientTransport/SSEClientTransport

2.工具调用:

McpHub.callTool 找到合适的 McpConnection
使用 connection.client.request 发送请求
请求通过 transport 发送到 MCP 服务器

3.服务端处理:

McpServer 接收请求
找到对应的工具处理函数
验证参数并执行处理函数
返回结果

4.结果处理:

结果通过 transport 返回
Client 解析响应并将其返回给 McpHub
McpHub 处理结果并返回给调用者

接下来又到了 AI 画图时间，具体的关系如下：

MCP-Pixelator 设计

场景分析

回到当前的 MCP 场景，目前图生码的链路已经打通，现在需要解决的问题就很是清晰了，如何把图生码的结果应用在本地 IDE 上。

流程如下：

1.用户通过 OneDay VSC 等支持 MCP 的 AI 客户端上传 ZIP 文件

2.MCP 服务器解析 ZIP 文件，提取 AST 数据

3.服务器调用 AST 转码 API，将 AST 转换为 React 代码

4.根据用户选择，生成新项目或将组件添加到现有项目

5.返回生成的代码给用户

这一流程可以通过以下图表直观展示：

架构设计

基于 MCP 协议，我们的系统架构如下：

系统模块设计

McpPixelator 系统包含以下核心模块：

1.MCP 服务器模块：负责与 AI 客户端通信，处理请求和响应

2.工具注册模块：注册和管理 MCP 工具

3.文件处理模块：解析 ZIP 文件，提取 AST 数据

4.API 通信模块：与 AST 转码 API 进行交互

5.错误处理模块：处理各种异常情况

这些模块之间的关系如下图所示：

通过这样的系统设计，我们构建了一个基于 MCP 协议的、能够将设计稿 AST 转换为 React 代码的服务。接下来，SHOW ME THE CODE！

核心代码实现

代码核心实现大部分基于 AI 实现，MCP 插件通过合理的 Prompt 调试+拆分任务维度，很容易就可以实现了。

基本结构与初始化

McpPixelatorServer 类是Ï整个系统的核心，负责初始化 MCP 服务器、设置工具处理器、处理请求等。以下是其基本结构和初始化逻辑：

class McpPixelatorServer {  
  private server: Server;  
  private zipHandler: ZipHandler;  
  private apiToken: string = "";  
  private apiEndpoint: string = "fake";  
  private userId: string = "MCP_PIXELATOR" + "_" + process.env.USER_ID;  
  private from: string = process.env.FROM || "unknown";  


  constructor() {  
    // 初始化token  
    this.fetchToken()  
      .then((token) => {  
        this.apiToken = token;  
        console.log("Token已更新");  
      })  
      .catch((error) => {  
        console.error("初始化token失败:", error);  
      });  


    // 初始化MCP服务器  
    this.server = new Server(  
      {  
        name: "mcp-pixelator",  
        version: "0.1.0",  
      },  
      {  
        capabilities: {  
          tools: {},  
        },  
      },  
    );  


    this.zipHandler = new ZipHandler();  
    this.setupToolHandlers();  


    // 错误处理  
    this.server.onerror = (error: Error) => console.error("[MCP Error]", error);  
    process.on("SIGINT", async () => {  
      await this.server.close();  
      process.exit(0);  
    });  
  }  
  
  // 其他方法...  
}

在构造函数中，我们首先初始化 API Token，然后创建 MCP 服务器实例，设置基本配置和能力。接着初始化 ZIP 文件处理器，并设置工具处理器。最后，我们配置错误处理逻辑和进程退出处理。

工具注册与处理

MCP 协议的核心是工具（Tools）的注册和处理。以下是我们注册工具的代码：

private setupToolHandlers() {  
  // 注册工具列表  
  this.server.setRequestHandler(ListToolsRequestSchema, async () => ({  
    tools: [  
      {  
        name: "process_done_zip_and_generate",  
        description: "读取 Done Zip文件并直接生成 React 代码",  
        inputSchema: {  
          type: "object",  
          properties: {  
            options: {  
              type: "object",  
              properties: {  
                type: {  
                  type: "string",  
                  enum: ["create", "add"],  
                  description: "生成代码的类型：create - 创建新项目，add - 添加到现有项目",  
                  default: "create",  
                },  
                projectPath: {  
                  type: "string",  
                  description: "当 type 为 add 时，需要提供项目路径",  
                },  
              },  
              required: ["type"],  
            },  
          },  
          required: ["options"],  
        },  
      },  
    ],  
  }));  
  
  // 处理工具调用请求  
  this.server.setRequestHandler(CallToolRequestSchema, async (request) => {  
    try {  
      console.log("收到工具调用请求:", {  
        工具名称: request.params.name,  
        参数: request.params.arguments,  
      });  


      if (request.params.name === "process_done_zip_and_generate") {  
        // 处理逻辑...  
      } else {  
        throw new McpError(  
          ErrorCode.MethodNotFound,  
          `未知工具: ${request.params.name}`,  
        );  
      }  
    } catch (error) {  
      // 错误处理...  
    }  
  });

这段代码首先注册了一个名为 process_done_zip_and_generate 的工具，用于读取 ZIP 文件并生成 React 代码。该工具接受一个 options 参数，包含 type（创建新项目或添加到现有项目）和可选的 projectPath（当 type 为 add 时的项目路径）。

然后，我们设置了处理工具调用的逻辑，根据工具名称执行相应的操作。如果请求的是未知工具，则抛出 MethodNotFound 错误。

ZIP 文件处理与 AST 提取

当接收到工具调用请求后，我们需要处理 ZIP 文件并提取 AST 数据：

// 在 CallToolRequestSchema 处理函数中  
if (request.params.name === "process_done_zip_and_generate") {  
  // 获取参数  
  const { options } = request.params.arguments as {  
    options: CodeGenerationOptions;  
  };  


  // 打开文件选择器  
  const zipFilePath = await this.zipHandler.selectFile();  


  console.log(`处理ZIP文件: ${zipFilePath}`);  


  // 读取ZIP文件内容  
  const contents = await this.zipHandler.readZipFile(zipFilePath);  


  // 提取AST数据  
  const astData = this.extractAstData(contents);  


  console.log("已提取AST数据，开始生成代码");  


  // 直接调用API生成代码  
  const result = await this.generateReactCode(astData, options);  


  // 处理结果...  
}

AST 数据提取的具体实现如下：

private extractAstData(contents: ZipContents): AstData {  
  // 首先尝试找到 AST 文件  
  const astFile = contents.files.find(  
    (f: { name: string; type: string }) =>  
      (f.name === "ast.json" ||  
        f.name === "ast.txt" ||  
        f.name.endsWith(".ast")) &&  
      (f.type === "json" || f.type === "text"),  
  );  


  if (!astFile || typeof astFile.content !== "string") {  
    throw new Error("未找到有效的 AST 文件");  
  }  


  try {  
    // 尝试解析 JSON  
    const astContent = JSON.parse(astFile.content);  
    return { ast: astContent };  
  } catch (e) {  
    // 如果解析失败，直接使用原始字符串  
    console.log("AST 文件解析为 JSON 失败，使用原始字符串");  
    return { ast: astFile.content };  
  }  
}

这段代码首先在 ZIP 内容中查找 AST 文件（名为 "ast.json"、"ast.txt" 或以 ".ast" 结尾），然后尝试将其解析为 JSON 对象。如果解析失败，则使用原始字符串。

调用 AST 转码 API

提取 AST 数据后，我们调用外部 API 将其转换为 React 代码：

展开阅读全文

本文系作者在时代Java发表，未经许可，不得转载。

如有侵权，请联系nowjava@qq.com删除。

编辑于 2025-04-16 11:52:232025-04-16 11:52:23

教程文章

文章订阅