MCP: Protocolo estándar para conectar sistemas de intelixencia artificial ao mundo

Para poder facer cousas máis avanzadas que ser meros chatbots, os sistemas de IA necesitan conectarse ao mundo para buscar información ou actuar doutras maneiras. Dependendo da función que teña o sistema, este deberá conectarse a sistemas externos moi diversos. Implementar conexións e chamadas a cada un destes sistemas e orquestralos complica moito o seu desenvolvemento. Pois ben, para iso creouse o Model Context Protocol ou protocolo MCP, co fin de que os modelos de IA poidan utilizar calquera sistema externo de forma única estándar.


No número anterior explicamos que son os sistemas RAG. Para mellorar a precisión dos chatbots baseados en LLM ou grandes modelos lingüísticos (especialmente en temas moi especializados ou de actualidade), antes de facer a pregunta ao LLM, realízase unha procura (en Internet, nos documentos da nosa empresa...) Mediante unha chamada a unha API pásanse á LLM as páxinas ou documentos que son o primeiro resultado dicindo: “Responde a esta pregunta do usuario baseándoche nos contidos destes documentos”. Como se ve, nun sistema RAG hai unha capa por encima do LLM que ten o poder de chamar a unha API.

Si o sistema RAG só necesita realizar unha procura nunha colección, deberá implementar unha chamada API. Pero se vai consultar máis dunha colección, entón haberá que implementar chamadas a varias API, e o traballo engadirase e complicarase. Ademais, é posible que debas decidir por pregunta que fonte consultar ou ver por resultado si é necesario realizar máis procuras, na mesma fonte ou noutra... Pode ser realmente complexo programar esta capa sobre un sistema RAG; si a lóxica non é moi superficial, a miúdo non é fácil facer isto como un programa de computador.

MCP: o estándar para que os chatbots teñan acceso ao mundo

Pois ben, o protocolo MCP creouse para facilitar este tipo de situacións. As siglas significan Model Context Protocol, indicando que é un protocolo para dar contexto aos modelos. Os sistemas de IA baseados en LLM ofrecen unha interfaz universal única para a consulta de API. Foi creado pola empresa Anthropic (Claude LLM e fundador do chatbot) en novembro de 2024, pero en decembro de 2025 deixou en mans da Agentic AI Foundation, entidade a cargo da Fundación Linux, a propiedade e o desenvolvemento futuro do protocolo. Co tempo todos os provedores de chatbots (OpenAI, Google, Microsoft...) pasaron a utilizalo e impulsalo, e pódese dicir que é o estándar que todos utilizan hoxe en día.

Así, as API que están destinadas a ser utilizadas polos sistemas AA superponen actualmente unha capa dun servidor MCP. O protocolo MCP permite preguntar a este servidor que funcións pon accesibles, con que parámetros e de que tipo, e que tipo de resultados devolve. E logo pódeselle dicir que execute unha desas funcións cos parámetros desexados e recibirase o resultado.

Simplificando a orquestación de sistemas RAG complexos

O funcionamento dun sistema RAG como o mencionado anteriormente, utilizando o protocolo MCP, sería o seguinte: pregúntase a cada servidor MCP dispoñible e que se desexa utilizar sobre as funcións, parámetros e resultados que ten, e logo dise ao LLM: “Responde a esta pregunta do usuario e para iso podes realizar procuras nas seguintes fontes con diferentes funcións en cada unha de elas”. Entón o LLM decide en que fontes poden estar os documentos válidos para a pregunta, dille ao sistema a que MCP debe realizar as chamadas de que funcións e con que parámetros, e cando recibe o resultado decide si realizará máis procuras ou si xa ten suficiente información para responder o usuario.

Como se ve, a única vantaxe do protocolo MCP non é que aforra o traballo de implementar diferentes API. Cando existen varias fontes para distintos tipos de procuras, a tarefa a realizar pode ser complexa. A súa lóxica pode ser difícil ou custosa ou imposible de implementar nun programa informático.

No seu lugar, as seleccións de fontes e outras decisións deixaranse en mans do LLM, e o propio sistema RAG convértese en algo moi simple e bastante xeral: Debe saber realizar chamadas ao protocolo MCP, e ao principio preguntará aos servidores MCP cales son as súas funcións, parámetros, etc., logo por cada pregunta do usuario só terá que pasar unha instrución xenérica sempre igual á que vimos ao LLM, a continuación realizar as chamadas solicitadas polo LLM aos servidores MCP ata que este diga que xa ten a resposta e, para finalizar, pasar a resposta ao usuario. Non teremos que programar esta complicada lóxica que sería difícil ou imposible de programar, e é precisamente o LLM que está por facer este tipo de cousas o que fará a orquestación dos servidores MCP.

Máis aló da procura

Nos exemplos utilizados neste artigo para explicar que é MCP, todos os servidores MCP foron para buscar información. De feito, os sistemas RAG complexos son un dos casos nos que MCP é útil. Viramos antes o que son os sistemas RAG e os servizos MCP que se utilizan nestes casos son unicamente de procura.

Pero o certo é que os servidores que se poden pór a disposición a través do protocolo MCP non son só de procura e consulta. Pola contra, pódense e realízanse servidores MCP que poden executar todo tipo de accións: consultar e escribir correo electrónico, reservar voos e hoteis, realizar compras nunha tenda online, mover os carros do noso almacén robotizado, interactuar cos almacéns de código... Na actualidade existen MCPs de todo tipo dispoñibles. E podemos facelos nosos, para acceder á nosa documentación, para interactuar co noso computador...

Os sistemas que utilizan servidores MCP que ofrecen cousas máis aló da procura son axentes AA. Este é un termo que probablemente escoites ultimamente, verdade? É un tema que está de moda, sen dúbida. No próximo número falaremos de que son, como funcionan e cales son as súas vantaxes e problemas.

Buletina

Bidali zure helbide elektronikoa eta jaso asteroko buletina zure sarrera-ontzian

Bidali

Bizitza