AI एजंट्सचा वापर वाढत असताना, मानकीकरण, सुरक्षा आणि खुल्या नवकल्पनांना प्रोत्साहन देणाऱ्या प्रोटोकॉल्सची गरजही वाढत आहे. या धड्यात, आपण तीन प्रोटोकॉल्सबद्दल जाणून घेणार आहोत - मॉडेल कॉन्टेक्स्ट प्रोटोकॉल (MCP), एजंट टू एजंट (A2A) आणि नॅचरल लँग्वेज वेब (NLWeb).
या धड्यात आपण शिकणार आहोत:
• MCP कसे AI एजंट्सना बाह्य साधने आणि डेटा वापरून वापरकर्त्यांचे कार्य पूर्ण करण्यास मदत करते.
• A2A कसे वेगवेगळ्या AI एजंट्समधील संवाद आणि सहकार्य सक्षम करते.
• NLWeb कसे कोणत्याही वेबसाइटवर नैसर्गिक भाषेचे इंटरफेस आणते, ज्यामुळे AI एजंट्सना सामग्री शोधणे आणि संवाद साधणे शक्य होते.
• ओळखणे: MCP, A2A, आणि NLWeb यांचे मुख्य उद्देश आणि फायदे AI एजंट्सच्या संदर्भात.
• समजावून सांगणे: प्रत्येक प्रोटोकॉल LLMs, साधने, आणि इतर एजंट्समधील संवाद आणि परस्परसंवाद कसा सुलभ करतो.
• ओळखणे: जटिल एजेंटिक प्रणाली तयार करताना प्रत्येक प्रोटोकॉलची विशिष्ट भूमिका.
मॉडेल कॉन्टेक्स्ट प्रोटोकॉल (MCP) हा एक ओपन स्टँडर्ड आहे जो LLMs साठी कॉन्टेक्स्ट आणि साधने पुरवण्यासाठी मानकीकृत पद्धत प्रदान करतो. यामुळे AI एजंट्सना वेगवेगळ्या डेटा स्रोतांशी आणि साधनांशी सुसंगत पद्धतीने जोडण्यासाठी "युनिव्हर्सल अडॅप्टर" मिळतो.
आता MCP चे घटक, थेट API वापराच्या तुलनेत फायदे, आणि AI एजंट्स MCP सर्व्हरचा कसा वापर करू शकतात याचे उदाहरण पाहू.
MCP क्लायंट-सर्व्हर आर्किटेक्चरवर कार्य करते आणि त्याचे मुख्य घटक आहेत:
• होस्ट्स: LLM अॅप्लिकेशन्स (उदा. VSCode सारखा कोड एडिटर) जे MCP सर्व्हरशी कनेक्शन सुरू करतात.
• क्लायंट्स: होस्ट अॅप्लिकेशनमधील घटक जे सर्व्हर्सशी एक-ते-एक कनेक्शन राखतात.
• सर्व्हर्स: हलकी प्रोग्राम्स जी विशिष्ट क्षमता उघड करतात.
MCP सर्व्हरच्या क्षमतांमध्ये तीन मुख्य प्रिमिटिव्ह समाविष्ट आहेत:
• साधने (Tools): AI एजंट्स विशिष्ट कृती करण्यासाठी कॉल करू शकतात अशा स्वतंत्र क्रिया किंवा फंक्शन्स. उदाहरणार्थ, हवामान सेवा "हवामान मिळवा" साधन उघड करू शकते, किंवा ई-कॉमर्स सर्व्हर "उत्पादन खरेदी करा" साधन उघड करू शकतो. MCP सर्व्हर्स त्यांच्या क्षमतांच्या यादीत प्रत्येक साधनाचे नाव, वर्णन, आणि इनपुट/आउटपुट स्कीमा जाहिर करतात.
• संसाधने (Resources): MCP सर्व्हर पुरवू शकणाऱ्या वाचण्यायोग्य डेटा आयटम्स किंवा दस्तऐवज, जे क्लायंट्स मागणीनुसार मिळवू शकतात. उदाहरणे: फाइल सामग्री, डेटाबेस रेकॉर्ड्स, किंवा लॉग फाइल्स. संसाधने मजकूर (जसे कोड किंवा JSON) किंवा बायनरी (जसे प्रतिमा किंवा PDFs) स्वरूपात असू शकतात.
• प्रॉम्प्ट्स (Prompts): पूर्वनिर्धारित टेम्प्लेट्स जे सुचवलेले प्रॉम्प्ट्स प्रदान करतात, अधिक जटिल वर्कफ्लोजसाठी परवानगी देतात.
MCP AI एजंट्ससाठी महत्त्वाचे फायदे देते:
• डायनॅमिक टूल डिस्कव्हरी: एजंट्सना सर्व्हरकडून उपलब्ध साधनांची यादी आणि त्यांचे कार्य काय आहे याचे वर्णन डायनॅमिकरीत्या मिळते. पारंपरिक APIs च्या तुलनेत, ज्यासाठी स्थिर कोडिंग आवश्यक असते, MCP "एकदाच एकत्रीकरण" दृष्टिकोन देते, ज्यामुळे अधिक अनुकूलता मिळते.
• LLMs दरम्यान परस्परसंवाद: MCP वेगवेगळ्या LLMs वर कार्य करते, मुख्य मॉडेल्स स्विच करण्यासाठी लवचिकता प्रदान करते.
• मानकीकृत सुरक्षा: MCP मध्ये मानक प्रमाणीकरण पद्धत समाविष्ट आहे, ज्यामुळे अतिरिक्त MCP सर्व्हर्स जोडताना स्केलेबिलिटी सुधारते.

कल्पना करा की वापरकर्ता AI सहाय्यकाचा वापर करून फ्लाइट बुक करू इच्छित आहे, जो MCP वर आधारित आहे.
कनेक्शन: AI सहाय्यक (MCP क्लायंट) एअरलाइनद्वारे प्रदान केलेल्या MCP सर्व्हरशी कनेक्ट होतो.
साधन शोध: क्लायंट एअरलाइनच्या MCP सर्व्हरला विचारतो, "तुमच्याकडे कोणती साधने उपलब्ध आहेत?" सर्व्हर "फ्लाइट शोधा" आणि "फ्लाइट बुक करा" यासारखी साधने परत पाठवतो.
साधन वापर: तुम्ही AI सहाय्यकाला विचारता, "पोर्टलँडहून होनोलुलूपर्यंत फ्लाइट शोधा." AI सहाय्यक, त्याच्या LLM चा वापर करून, "फ्लाइट शोधा" साधन वापरण्याची गरज ओळखतो आणि संबंधित पॅरामीटर्स (उगम, गंतव्य) MCP सर्व्हरला पाठवतो.
अंमलबजावणी आणि प्रतिसाद: MCP सर्व्हर, रॅपर म्हणून कार्य करत, एअरलाइनच्या अंतर्गत बुकिंग API ला कॉल करतो. नंतर फ्लाइट माहिती (उदा. JSON डेटा) प्राप्त करतो आणि ती AI सहाय्यकाला परत पाठवतो.
पुढील संवाद: AI सहाय्यक फ्लाइट पर्याय सादर करतो. तुम्ही फ्लाइट निवडल्यानंतर, सहाय्यक त्याच MCP सर्व्हरवरील "फ्लाइट बुक करा" साधन वापरतो आणि बुकिंग पूर्ण करतो.
MCP LLMs आणि साधनांना जोडण्यावर लक्ष केंद्रित करते, तर एजंट-टू-एजंट (A2A) प्रोटोकॉल वेगवेगळ्या AI एजंट्समधील संवाद आणि सहकार्य सक्षम करून पुढील पायरी गाठतो. A2A वेगवेगळ्या संस्थांमधील, वातावरणांमधील, आणि तंत्रज्ञान स्टॅक्समधील AI एजंट्सना जोडतो, जेणेकरून ते एकत्रितपणे वापरकर्त्याचे कार्य पूर्ण करू शकतील.
आता A2A चे घटक, फायदे, आणि आमच्या प्रवास अॅप्लिकेशनमध्ये त्याचा कसा उपयोग होऊ शकतो याचे उदाहरण पाहू.
A2A एजंट्समधील संवाद सक्षम करण्यावर लक्ष केंद्रित करते आणि त्यांना वापरकर्त्याच्या उपकार्य पूर्ण करण्यासाठी एकत्र काम करण्यास मदत करते. प्रोटोकॉलचे प्रत्येक घटक यासाठी योगदान देतो:
MCP सर्व्हर साधनांची यादी कशी शेअर करतो, त्याचप्रमाणे एजंट कार्डमध्ये असते:
◦ एजंटचे नाव
◦ सामान्य कार्यांचे वर्णन
◦ विशिष्ट कौशल्यांची यादी आणि त्यांचे वर्णन, जेणेकरून इतर एजंट्स (किंवा मानवी वापरकर्ते) समजू शकतील की एजंट कधी आणि का कॉल करायचा.
◦ एजंटचा सध्याचा एंडपॉइंट URL
◦ एजंटची आवृत्ती आणि क्षमता जसे की स्ट्रीमिंग प्रतिसाद आणि पुश नोटिफिकेशन्स.
एजंट एक्झिक्युटर वापरकर्त्याच्या चॅटचा संदर्भ रिमोट एजंटला पास करण्यासाठी जबाबदार असतो, जेणेकरून रिमोट एजंटला पूर्ण करायचे कार्य समजू शकेल. A2A सर्व्हरमध्ये, एजंट त्याच्या स्वतःच्या LLM चा वापर करून येणाऱ्या विनंत्या पार्स करतो आणि त्याच्या अंतर्गत साधनांचा वापर करून कार्य पूर्ण करतो.
रिमोट एजंटने विनंती केलेले कार्य पूर्ण केल्यानंतर, त्याचे काम आर्टिफॅक्ट म्हणून तयार होते. आर्टिफॅक्टमध्ये एजंटच्या कामाचा परिणाम, पूर्ण केलेल्या कार्याचे वर्णन, आणि प्रोटोकॉलद्वारे पाठवलेला मजकूर संदर्भ असतो. आर्टिफॅक्ट पाठवल्यानंतर, रिमोट एजंटशी कनेक्शन पुन्हा गरज पडल्याशिवाय बंद होते.
हा घटक अपडेट्स हाताळण्यासाठी आणि संदेश पास करण्यासाठी वापरला जातो. उत्पादनासाठी एजंटिक प्रणालींमध्ये हे विशेषतः महत्त्वाचे आहे, जेणेकरून कार्य पूर्ण होण्याआधी एजंट्समधील कनेक्शन बंद होऊ नये, विशेषतः जेव्हा कार्य पूर्ण होण्यास जास्त वेळ लागू शकतो.
• सहकार्य सुधारणा: वेगवेगळ्या विक्रेत्यांच्या आणि प्लॅटफॉर्म्सच्या एजंट्सना संवाद साधण्यास, संदर्भ शेअर करण्यास, आणि एकत्र काम करण्यास सक्षम करते, पारंपरिकपणे वेगळ्या असलेल्या प्रणालींमध्ये अखंड ऑटोमेशन सुलभ करते.
• मॉडेल निवडीची लवचिकता: प्रत्येक A2A एजंट त्याच्या विनंत्यांसाठी कोणते LLM वापरायचे ते ठरवू शकतो, ज्यामुळे एजंट्ससाठी अनुकूलित किंवा फाइन-ट्यून केलेले मॉडेल्स वापरण्याची परवानगी मिळते.
• अंतर्गत प्रमाणीकरण: प्रमाणीकरण A2A प्रोटोकॉलमध्ये थेट समाविष्ट आहे, ज्यामुळे एजंट संवादांसाठी मजबूत सुरक्षा फ्रेमवर्क प्रदान होते.

आता आपल्या प्रवास बुकिंग परिदृश्याचा विस्तार करू, पण यावेळी A2A वापरून.
वापरकर्त्याची विनंती मल्टी-एजंटला: वापरकर्ता "ट्रॅव्हल एजंट" A2A क्लायंट/एजंटशी संवाद साधतो, कदाचित असे म्हणतो, "कृपया पुढील आठवड्यासाठी होनोलुलूला संपूर्ण ट्रिप बुक करा, ज्यामध्ये फ्लाइट्स, हॉटेल, आणि भाड्याने कार समाविष्ट आहे."
ट्रॅव्हल एजंटद्वारे समन्वय: ट्रॅव्हल एजंट ही जटिल विनंती प्राप्त करतो. तो त्याच्या LLM चा वापर करून कार्याचे तर्कशास्त्र समजतो आणि त्याला इतर विशेष एजंट्सशी संवाद साधण्याची गरज आहे हे ठरवतो.
एजंट्समधील संवाद: ट्रॅव्हल एजंट A2A प्रोटोकॉल वापरून डाउनस्ट्रीम एजंट्सशी कनेक्ट होतो, जसे की "एअरलाइन एजंट," "हॉटेल एजंट," आणि "कार रेंटल एजंट," जे वेगवेगळ्या कंपन्यांनी तयार केले आहेत.
कार्यांचे प्रतिनिधित्व: ट्रॅव्हल एजंट या विशेष एजंट्सना विशिष्ट कार्ये पाठवतो (उदा. "होनोलुलूसाठी फ्लाइट शोधा," "हॉटेल बुक करा," "कार भाड्याने घ्या"). हे प्रत्येक विशेष एजंट, त्यांचे स्वतःचे LLMs चालवत आणि त्यांच्या स्वतःच्या साधनांचा वापर करत (जे स्वतः MCP सर्व्हर्स असू शकतात), त्यांच्या विशिष्ट भागाचे बुकिंग पूर्ण करतात.
एकत्रित प्रतिसाद: एकदा सर्व डाउनस्ट्रीम एजंट्स त्यांची कार्ये पूर्ण करतात, ट्रॅव्हल एजंट परिणाम एकत्र करतो (फ्लाइट तपशील, हॉटेल पुष्टीकरण, कार रेंटल बुकिंग) आणि वापरकर्त्याला एक व्यापक, चॅट-शैलीतील प्रतिसाद पाठवतो.
वेबसाइट्स दीर्घकाळापासून इंटरनेटवर माहिती आणि डेटा प्रवेश करण्याचा प्राथमिक मार्ग राहिले आहेत.
आता NLWeb चे वेगवेगळे घटक, फायदे, आणि आमच्या प्रवास अॅप्लिकेशनद्वारे NLWeb कसे कार्य करते याचे उदाहरण पाहू.
NLWeb अॅप्लिकेशन (कोर सर्व्हिस कोड): नैसर्गिक भाषेतील प्रश्न प्रक्रिया करणारी प्रणाली. ही प्लॅटफॉर्मच्या वेगवेगळ्या भागांना जोडून प्रतिसाद तयार करते. तुम्ही याला वेबसाइटच्या नैसर्गिक भाषा वैशिष्ट्यांचे इंजिन समजू शकता.
NLWeb प्रोटोकॉल: वेबसाइटशी नैसर्गिक भाषेत संवाद साधण्यासाठीचा मूलभूत नियमांचा संच. तो JSON स्वरूपात प्रतिसाद पाठवतो (बहुतेक वेळा Schema.org वापरून). याचा उद्देश "AI वेब" साठी एक साधी पायाभूत रचना तयार करणे आहे, जसे HTML ने ऑनलाइन दस्तऐवज शेअर करणे शक्य केले.
MCP सर्व्हर (मॉडेल कॉन्टेक्स्ट प्रोटोकॉल एंडपॉइंट): प्रत्येक NLWeb सेटअप MCP सर्व्हर म्हणूनही कार्य करते. याचा अर्थ तो साधने (जसे "विचारा" पद्धत) आणि डेटा इतर AI प्रणालींना शेअर करू शकतो. प्रत्यक्षात, यामुळे वेबसाइटची सामग्री आणि क्षमता AI एजंट्सद्वारे वापरण्यास योग्य बनते, ज्यामुळे साइट व्यापक "एजंट इकोसिस्टम" चा भाग बनते.
एम्बेडिंग मॉडेल्स: ही मॉडेल्स वेबसाइट सामग्रीचे सांख्यिकीय प्रतिनिधित्व (एम्बेडिंग्स) मध्ये रूपांतर करण्यासाठी वापरली जातात. ही एम्बेडिंग्स संगणकांना तुलना आणि शोधण्यासाठी अर्थपूर्ण स्वरूपात कॅप्चर करतात. ती एका विशेष डेटाबेसमध्ये साठवली जातात, आणि वापरकर्ते कोणते एम्बेडिंग मॉडेल वापरायचे ते निवडू शकतात.
व्हेक्टर डेटाबेस (रिट्रिव्हल मेकॅनिझम): हा डेटाबेस वेबसाइट सामग्रीच्या एम्बेडिंग्स साठवतो. जेव्हा कोणी प्रश्न विचारतो, तेव्हा NLWeb व्हेक्टर डेटाबेस तपासतो आणि सर्वात संबंधित माहिती पटकन शोधतो. तो संभाव्य उत्तरांची जलद यादी देतो, साम्यतेनुसार क्रमवारी लावून. NLWeb Qdrant, Snowflake, Milvus, Azure AI Search, आणि Elasticsearch सारख्या वेगवेगळ्या व्हेक्टर स्टोरेज सिस्टम्ससह कार्य करतो.

आमच्या प्रवास बुकिंग वेबसाइटचा विचार करा, पण यावेळी ती NLWeb द्वारे समर्थित आहे.
डेटा इनजेशन: प्रवास वेबसाइटच्या विद्यमान उत्पादन कॅटलॉग्स (उदा. फ्लाइट लिस्टिंग्स, हॉटेल वर्णने, टूर पॅकेजेस) Schema.org वापरून स्वरूपित केल्या जातात किंवा RSS फीड्सद्वारे लोड केल्या जातात. NLWeb चे साधने ही संरचित डेटा ingest करतात, एम्बेडिंग्स तयार करतात, आणि ती स्थानिक किंवा रिमोट व्हेक्टर डेटाबेसमध्ये साठवतात.
नैसर्गिक भाषा क्वेरी (मानवी): वापरकर्ता वेबसाइटला भेट देतो आणि मेनू नेव्हिगेट करण्याऐवजी चॅट इंटरफेसमध्ये टाइप करतो: "मला होनोलुलूमध्ये पूल असलेले कौटुंबिक अनुकूल हॉटेल शोधा."
NLWeb प्रक्रिया: NLWeb अॅप्लिकेशन ही क्वेरी प्राप्त करते. ती क्वेरी समजण्यासाठी LLM ला पाठवते आणि एकाच वेळी व्हेक्टर डेटाबेसमध्ये संबंधित हॉटेल लिस्टिंग्स शोधते.
अचूक परिणाम: LLM डेटाबेसमधून शोधलेल्या परिणामांचे अर्थ लावण्यास मदत करते, "कौटुंबिक अनुकूल," "पूल," आणि "होनोलुलू" निकषांवर आधारित सर्वोत्तम जुळणारे ओळखते, आणि नंतर नैसर्गिक भाषेत प्रतिसाद स्वरूपित करते. महत्त्वाचे म्हणजे, प्रतिसाद वेबसाइटच्या कॅटलॉगमधील वास्तविक
अस्वीकरण:
हा दस्तऐवज AI भाषांतर सेवा Co-op Translator चा वापर करून भाषांतरित करण्यात आला आहे. आम्ही अचूकतेसाठी प्रयत्नशील असलो तरी कृपया लक्षात ठेवा की स्वयंचलित भाषांतरांमध्ये त्रुटी किंवा अचूकतेचा अभाव असू शकतो. मूळ भाषेतील दस्तऐवज हा अधिकृत स्रोत मानला जावा. महत्त्वाच्या माहितीसाठी व्यावसायिक मानवी भाषांतराची शिफारस केली जाते. या भाषांतराचा वापर करून निर्माण होणाऱ्या कोणत्याही गैरसमज किंवा चुकीच्या अर्थासाठी आम्ही जबाबदार राहणार नाही.