جیسے جیسے AI ایجنٹس کا استعمال بڑھ رہا ہے، ویسے ویسے ایسے پروٹوکولز کی ضرورت بھی بڑھ رہی ہے جو معیاری، محفوظ اور کھلی جدت کو فروغ دیں۔ اس سبق میں، ہم تین پروٹوکولز کا جائزہ لیں گے جو اس ضرورت کو پورا کرنے کے لیے بنائے گئے ہیں - ماڈل کانٹیکسٹ پروٹوکول (MCP)، ایجنٹ ٹو ایجنٹ (A2A) اور نیچرل لینگویج ویب (NLWeb)۔
اس سبق میں ہم درج ذیل موضوعات کا احاطہ کریں گے:
• MCP کس طرح AI ایجنٹس کو بیرونی ٹولز اور ڈیٹا تک رسائی فراہم کرتا ہے تاکہ وہ صارف کے کام مکمل کر سکیں۔
• A2A کس طرح مختلف AI ایجنٹس کے درمیان رابطے اور تعاون کو ممکن بناتا ہے۔
• NLWeb کس طرح کسی بھی ویب سائٹ پر نیچرل لینگویج انٹرفیس فراہم کرتا ہے، جس سے AI ایجنٹس مواد کو دریافت اور اس کے ساتھ تعامل کر سکتے ہیں۔
• شناخت کریں کہ MCP، A2A، اور NLWeb کا بنیادی مقصد اور فوائد AI ایجنٹس کے تناظر میں کیا ہیں۔
• وضاحت کریں کہ ہر پروٹوکول کس طرح LLMs، ٹولز، اور دیگر ایجنٹس کے درمیان رابطے اور تعامل کو ممکن بناتا ہے۔
• پہچانیں کہ ہر پروٹوکول پیچیدہ ایجنٹک سسٹمز کی تعمیر میں کیا کردار ادا کرتا ہے۔
ماڈل کانٹیکسٹ پروٹوکول (MCP) ایک اوپن اسٹینڈرڈ ہے جو ایپلیکیشنز کو LLMs کے لیے کانٹیکسٹ اور ٹولز فراہم کرنے کا معیاری طریقہ فراہم کرتا ہے۔ یہ مختلف ڈیٹا سورسز اور ٹولز کے لیے "یونیورسل اڈاپٹر" کے طور پر کام کرتا ہے، جس سے AI ایجنٹس ایک مستقل طریقے سے جڑ سکتے ہیں۔
آئیے MCP کے اجزاء، ڈائریکٹ API کے استعمال کے مقابلے میں اس کے فوائد، اور ایک مثال دیکھتے ہیں کہ AI ایجنٹس MCP سرور کو کس طرح استعمال کر سکتے ہیں۔
MCP کلائنٹ-سرور آرکیٹیکچر پر کام کرتا ہے اور اس کے بنیادی اجزاء یہ ہیں:
• ہوسٹس: یہ LLM ایپلیکیشنز ہیں (مثال کے طور پر، ایک کوڈ ایڈیٹر جیسے VSCode) جو MCP سرور سے کنکشن شروع کرتی ہیں۔
• کلائنٹس: یہ ہوسٹ ایپلیکیشن کے اندر موجود اجزاء ہیں جو سرورز کے ساتھ ایک سے ایک کنکشن برقرار رکھتے ہیں۔
• سرورز: یہ ہلکے پروگرامز ہیں جو مخصوص صلاحیتیں فراہم کرتے ہیں۔
پروٹوکول میں تین بنیادی پرائمٹوز شامل ہیں، جو MCP سرور کی صلاحیتوں کی نمائندگی کرتے ہیں:
• ٹولز: یہ مخصوص اعمال یا فنکشنز ہیں جنہیں AI ایجنٹ کسی عمل کو انجام دینے کے لیے کال کر سکتا ہے۔ مثال کے طور پر، ایک موسم کی سروس "موسم معلوم کریں" ٹول فراہم کر سکتی ہے، یا ایک ای کامرس سرور "پروڈکٹ خریدیں" ٹول فراہم کر سکتا ہے۔ MCP سرورز ہر ٹول کے نام، وضاحت، اور ان پٹ/آؤٹ پٹ اسکیمہ کو اپنی صلاحیتوں کی فہرست میں ظاہر کرتے ہیں۔
• وسائل: یہ صرف پڑھنے کے قابل ڈیٹا آئٹمز یا دستاویزات ہیں جو MCP سرور فراہم کر سکتا ہے، اور کلائنٹس انہیں ضرورت کے وقت حاصل کر سکتے ہیں۔ مثالوں میں فائل کے مواد، ڈیٹا بیس ریکارڈز، یا لاگ فائلز شامل ہیں۔ وسائل متن (جیسے کوڈ یا JSON) یا بائنری (جیسے تصاویر یا PDFs) ہو سکتے ہیں۔
• پرومپٹس: یہ پہلے سے طے شدہ ٹیمپلیٹس ہیں جو مشورہ شدہ پرومپٹس فراہم کرتے ہیں، جس سے زیادہ پیچیدہ ورک فلو ممکن ہوتا ہے۔
MCP AI ایجنٹس کے لیے اہم فوائد فراہم کرتا ہے:
• ڈائنامک ٹول ڈسکوری: ایجنٹس سرور سے دستیاب ٹولز کی فہرست اور ان کے کاموں کی وضاحت کو ڈائنامک طور پر حاصل کر سکتے ہیں۔ یہ روایتی APIs کے برعکس ہے، جن کے لیے اکثر انضمام کے لیے جامد کوڈنگ کی ضرورت ہوتی ہے، اور کسی بھی API تبدیلی کے لیے کوڈ اپڈیٹس کی ضرورت ہوتی ہے۔ MCP "ایک بار انضمام کریں" کا طریقہ فراہم کرتا ہے، جو زیادہ موافقت پذیر ہے۔
• LLMs کے درمیان انٹرآپریبلٹی: MCP مختلف LLMs کے ساتھ کام کرتا ہے، جس سے بنیادی ماڈلز کو بہتر کارکردگی کے لیے تبدیل کرنے کی لچک فراہم ہوتی ہے۔
• معیاری سیکیورٹی: MCP ایک معیاری تصدیقی طریقہ شامل کرتا ہے، جو اضافی MCP سرورز تک رسائی شامل کرنے پر اسکیل ایبلٹی کو بہتر بناتا ہے۔ یہ مختلف روایتی APIs کے لیے مختلف کیز اور تصدیقی اقسام کو منظم کرنے سے زیادہ آسان ہے۔

فرض کریں کہ ایک صارف MCP کے ذریعے چلنے والے AI اسسٹنٹ کا استعمال کرتے ہوئے ایک فلائٹ بک کرنا چاہتا ہے۔
کنکشن: AI اسسٹنٹ (MCP کلائنٹ) ایک ایئرلائن کے فراہم کردہ MCP سرور سے جڑتا ہے۔
ٹول ڈسکوری: کلائنٹ ایئرلائن کے MCP سرور سے پوچھتا ہے، "آپ کے پاس کون سے ٹولز دستیاب ہیں؟" سرور "فلائٹس تلاش کریں" اور "فلائٹس بک کریں" جیسے ٹولز کے ساتھ جواب دیتا ہے۔
ٹول انووکیشن: آپ AI اسسٹنٹ سے کہتے ہیں، "براہ کرم پورٹ لینڈ سے ہونولولو کے لیے فلائٹ تلاش کریں۔" AI اسسٹنٹ، اپنے LLM کا استعمال کرتے ہوئے، پہچانتا ہے کہ اسے "فلائٹس تلاش کریں" ٹول کو کال کرنے کی ضرورت ہے اور متعلقہ پیرامیٹرز (آغاز، منزل) MCP سرور کو بھیجتا ہے۔
عمل درآمد اور جواب: MCP سرور، ایک ریپر کے طور پر کام کرتے ہوئے، ایئرلائن کے اندرونی بکنگ API کو اصل کال کرتا ہے۔ پھر یہ فلائٹ کی معلومات (مثلاً JSON ڈیٹا) حاصل کرتا ہے اور اسے AI اسسٹنٹ کو واپس بھیجتا ہے۔
مزید تعامل: AI اسسٹنٹ فلائٹ کے اختیارات پیش کرتا ہے۔ ایک فلائٹ منتخب کرنے کے بعد، اسسٹنٹ ممکنہ طور پر اسی MCP سرور پر "فلائٹ بک کریں" ٹول کو کال کرتا ہے، اور بکنگ مکمل کرتا ہے۔
جہاں MCP LLMs کو ٹولز سے جوڑنے پر توجہ مرکوز کرتا ہے، وہیں ایجنٹ ٹو ایجنٹ (A2A) پروٹوکول ایک قدم آگے بڑھتا ہے اور مختلف AI ایجنٹس کے درمیان رابطے اور تعاون کو ممکن بناتا ہے۔ A2A مختلف تنظیموں، ماحولیات، اور ٹیکنالوجی اسٹیکس کے AI ایجنٹس کو ایک مشترکہ کام مکمل کرنے کے لیے جوڑتا ہے۔
ہم A2A کے اجزاء اور فوائد کا جائزہ لیں گے، اور یہ دیکھیں گے کہ اسے ہمارے ٹریول ایپلیکیشن میں کیسے لاگو کیا جا سکتا ہے۔
A2A ایجنٹس کے درمیان رابطے کو ممکن بناتا ہے اور انہیں صارف کے کسی ذیلی کام کو مکمل کرنے کے لیے اکٹھا کام کرنے دیتا ہے۔ پروٹوکول کے ہر جزو کا اس میں کردار ہے:
جیسے MCP سرور ٹولز کی فہرست شیئر کرتا ہے، ویسے ہی ایک ایجنٹ کارڈ میں شامل ہوتا ہے:
◦ ایجنٹ کا نام
◦ عام کاموں کی وضاحت جو یہ مکمل کرتا ہے
◦ مخصوص مہارتوں کی فہرست جن کی وضاحت دوسرے ایجنٹس (یا حتیٰ کہ انسانی صارفین) کو یہ سمجھنے میں مدد دیتی ہے کہ کب اور کیوں اس ایجنٹ کو کال کرنا چاہیے
◦ ایجنٹ کا موجودہ اینڈ پوائنٹ URL
◦ ایجنٹ کا ورژن اور صلاحیتیں جیسے اسٹریمنگ جوابات اور پش نوٹیفکیشنز
ایجنٹ ایگزیکیوٹر کا کام صارف کی چیٹ کا کانٹیکسٹ ریموٹ ایجنٹ کو منتقل کرنا ہے، تاکہ ریموٹ ایجنٹ یہ سمجھ سکے کہ کون سا کام مکمل کرنا ہے۔ A2A سرور میں، ایک ایجنٹ اپنے LLM کا استعمال کرتے ہوئے آنے والی درخواستوں کو پارس کرتا ہے اور اپنے اندرونی ٹولز کا استعمال کرتے ہوئے کام انجام دیتا ہے۔
جب ایک ریموٹ ایجنٹ درخواست کردہ کام مکمل کر لیتا ہے، تو اس کا نتیجہ ایک آرٹیفیکٹ کے طور پر تیار ہوتا ہے۔ آرٹیفیکٹ میں شامل ہوتا ہے:
◦ ایجنٹ کے کام کا نتیجہ
◦ کیا مکمل کیا گیا اس کی وضاحت
◦ متن کا کانٹیکسٹ جو پروٹوکول کے ذریعے بھیجا گیا تھا
آرٹیفیکٹ بھیجنے کے بعد، ریموٹ ایجنٹ کے ساتھ کنکشن اس وقت تک بند رہتا ہے جب تک کہ دوبارہ ضرورت نہ ہو۔
یہ جزو اپ ڈیٹس کو ہینڈل کرنے اور پیغامات منتقل کرنے کے لیے استعمال ہوتا ہے۔ یہ خاص طور پر پروڈکشن میں ایجنٹک سسٹمز کے لیے اہم ہے تاکہ ایجنٹس کے درمیان کنکشن اس وقت تک بند نہ ہو جب تک کہ کام مکمل نہ ہو جائے، خاص طور پر جب کام مکمل ہونے میں زیادہ وقت لگ سکتا ہو۔
• بہتر تعاون: یہ مختلف وینڈرز اور پلیٹ فارمز کے ایجنٹس کو ایک دوسرے کے ساتھ تعامل کرنے، کانٹیکسٹ شیئر کرنے، اور اکٹھے کام کرنے کے قابل بناتا ہے، جس سے روایتی طور پر غیر مربوط سسٹمز کے درمیان ہموار آٹومیشن ممکن ہوتی ہے۔
• ماڈل کے انتخاب کی لچک: ہر A2A ایجنٹ یہ فیصلہ کر سکتا ہے کہ وہ اپنی درخواستوں کو پورا کرنے کے لیے کون سا LLM استعمال کرے، جس سے ہر ایجنٹ کے لیے بہتر یا فائن ٹونڈ ماڈلز کا استعمال ممکن ہوتا ہے، جیسا کہ کچھ MCP منظرناموں میں ایک ہی LLM کنکشن کے برعکس۔
• بلٹ ان تصدیق: تصدیق A2A پروٹوکول میں براہ راست شامل ہے، جو ایجنٹ کے تعاملات کے لیے ایک مضبوط سیکیورٹی فریم ورک فراہم کرتی ہے۔

آئیے ہمارے ٹریول بکنگ منظرنامے کو وسعت دیتے ہیں، لیکن اس بار A2A کا استعمال کرتے ہوئے۔
صارف کی درخواست ملٹی ایجنٹ کو: ایک صارف "ٹریول ایجنٹ" A2A کلائنٹ/ایجنٹ کے ساتھ بات چیت کرتا ہے، مثلاً یہ کہہ کر: "براہ کرم اگلے ہفتے ہونولولو کے لیے پورے سفر کی بکنگ کریں، جس میں فلائٹس، ہوٹل، اور کرائے کی کار شامل ہو۔"
ٹریول ایجنٹ کی آرکیسٹریشن: ٹریول ایجنٹ اس پیچیدہ درخواست کو وصول کرتا ہے۔ یہ اپنے LLM کا استعمال کرتے ہوئے کام کے بارے میں استدلال کرتا ہے اور طے کرتا ہے کہ اسے دوسرے ماہر ایجنٹس کے ساتھ تعامل کرنے کی ضرورت ہے۔
ایجنٹس کے درمیان رابطہ: ٹریول ایجنٹ پھر A2A پروٹوکول کا استعمال کرتے ہوئے نیچے والے ایجنٹس سے جڑتا ہے، جیسے "ایئرلائن ایجنٹ"، "ہوٹل ایجنٹ"، اور "کار رینٹل ایجنٹ" جو مختلف کمپنیوں کے بنائے ہوئے ہیں۔
تفویض شدہ کام کی انجام دہی: ٹریول ایجنٹ ان ماہر ایجنٹس کو مخصوص کام بھیجتا ہے (مثلاً "ہونولولو کے لیے فلائٹس تلاش کریں"، "ہوٹل بک کریں"، "کار کرائے پر لیں")۔ ان میں سے ہر ماہر ایجنٹ، اپنے LLMs اور اپنے ٹولز کا استعمال کرتے ہوئے (جو خود MCP سرورز ہو سکتے ہیں)، بکنگ کے اپنے مخصوص حصے کو انجام دیتا ہے۔
جامع جواب: جب تمام نیچے والے ایجنٹس اپنے کام مکمل کر لیتے ہیں، تو ٹریول ایجنٹ نتائج (فلائٹ کی تفصیلات، ہوٹل کی تصدیق، کار رینٹل بکنگ) کو مرتب کرتا ہے اور صارف کو ایک جامع، چیٹ اسٹائل جواب بھیجتا ہے۔
ویب سائٹس طویل عرصے سے انٹرنیٹ پر معلومات اور ڈیٹا تک رسائی کا بنیادی ذریعہ رہی ہیں۔
آئیے NLWeb کے مختلف اجزاء، اس کے فوائد، اور یہ دیکھتے ہیں کہ ہمارے ٹریول ایپلیکیشن کے ذریعے NLWeb کیسے کام کرتا ہے۔
NLWeb ایپلیکیشن (کور سروس کوڈ): وہ نظام جو نیچرل لینگویج سوالات کو پروسیس کرتا ہے۔ یہ پلیٹ فارم کے مختلف حصوں کو جوڑ کر جوابات تیار کرتا ہے۔ آپ اسے ویب سائٹ کی نیچرل لینگویج خصوصیات کو چلانے والے انجن کے طور پر سمجھ سکتے ہیں۔
NLWeb پروٹوکول: یہ ویب سائٹ کے ساتھ نیچرل لینگویج تعامل کے لیے بنیادی اصولوں کا ایک سیٹ ہے۔ یہ JSON فارمیٹ میں جوابات واپس بھیجتا ہے (اکثر Schema.org کا استعمال کرتے ہوئے)۔ اس کا مقصد "AI ویب" کے لیے ایک سادہ بنیاد بنانا ہے، جیسے HTML نے آن لائن دستاویزات شیئر کرنا ممکن بنایا۔
MCP سرور (ماڈل کانٹیکسٹ پروٹوکول اینڈ پوائنٹ): ہر NLWeb سیٹ اپ ایک MCP سرور کے طور پر بھی کام کرتا ہے۔ اس کا مطلب ہے کہ یہ ٹولز (جیسے "پوچھیں" کا طریقہ) اور ڈیٹا دوسرے AI سسٹمز کے ساتھ شیئر کر سکتا ہے۔ عملی طور پر، یہ ویب سائٹ کے مواد اور صلاحیتوں کو AI ایجنٹس کے لیے قابل استعمال بناتا ہے، جس سے ویب سائٹ وسیع "ایجنٹ ایکو سسٹم" کا حصہ بن جاتی ہے۔
ایمبیڈنگ ماڈلز: یہ ماڈلز ویب سائٹ کے مواد کو عددی نمائندگیوں (ایمبیڈنگز) میں تبدیل کرنے کے لیے استعمال ہوتے ہیں۔ یہ ایمبیڈنگز معنی کو اس طرح قید کرتی ہیں کہ کمپیوٹر ان کا موازنہ اور تلاش کر سکیں۔ انہیں ایک خاص ڈیٹا بیس میں محفوظ کیا جاتا ہے، اور صارفین یہ منتخب کر سکتے ہیں کہ وہ کون سا ایمبیڈنگ ماڈل استعمال کرنا چاہتے ہیں۔
ویٹر ڈیٹا بیس (ریٹریول میکنزم): یہ ڈیٹا بیس ویب سائٹ کے مواد کے ایمبیڈنگز کو محفوظ کرتا ہے۔ جب کوئی سوال پوچھتا ہے، تو NLWeb ویٹر ڈیٹا بیس کو چیک کرتا ہے تاکہ جلدی سے سب سے متعلقہ معلومات تلاش کی جا سکیں۔ یہ ممکنہ جوابات کی ایک تیز فہرست دیتا ہے، جو مشابہت کے لحاظ سے درجہ بندی کی جاتی ہے۔ NLWeb مختلف ویٹر اسٹوریج سسٹمز جیسے Qdrant، Snowflake، Milvus، Azure AI Search، اور Elasticsearch کے ساتھ کام کرتا ہے۔

ہمارے ٹریول بکنگ ویب سائٹ کو دوبارہ دیکھیں، لیکن اس بار یہ NLWeb کے ذریعے چل رہی ہے۔
ڈیٹا انٹیک: ٹریول ویب سائٹ کے موجودہ پروڈکٹ کیٹلاگز (مثلاً فلائٹ لسٹنگز، ہوٹل کی تفصیلات، ٹور پیکجز) کو Schema.org کا استعمال کرتے ہوئے فارمیٹ کیا جاتا ہے یا RSS فیڈز کے ذریعے لوڈ کیا جاتا ہے۔ NLWeb کے ٹولز اس ساختی ڈیٹا کو انٹیک کرتے ہیں، ایمبیڈنگز بناتے ہیں، اور انہیں مقامی یا ریموٹ ویٹر ڈیٹا بیس میں محفوظ کرتے ہیں۔
نیچرل لینگویج سوال (انسان): ایک صارف ویب سائٹ پر جاتا ہے اور مینو کے ذریعے نیویگیٹ کرنے کے بجائے چیٹ انٹرفیس میں ٹائپ کرتا ہے: "مجھے ہونولولو میں اگلے ہفتے کے لیے ایک فیملی فرینڈلی ہوٹل تلاش کریں جس میں پول ہو۔"
NLWeb پروسیسنگ: NLWeb ایپلیکیشن اس سوال کو وصول کرتی ہے۔ یہ سوال کو سمجھنے کے لیے LLM کو بھیجتی ہے اور ساتھ ہی اپنے ویٹر ڈیٹا بیس میں متعلقہ ہوٹل لسٹنگز تلاش کرتی ہے۔
درست نتائج: LLM تلاش کے نتائج کی تشریح کرنے میں مدد کرتا ہے، "فیملی فرینڈلی"، "پول"، اور "ہونولولو" کے معیار کی بنیاد پر بہترین میچز
ڈسکلیمر:
یہ دستاویز AI ترجمہ سروس Co-op Translator کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگی ہو سکتی ہیں۔ اصل دستاویز، جو اس کی اصل زبان میں ہے، کو مستند ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے لیے ہم ذمہ دار نہیں ہیں۔