(برای مشاهده ویدیوی این درس بر روی تصویر بالا کلیک کنید)
این درس یک مرور جامع بر روی Agentic Retrieval-Augmented Generation (Agentic RAG) ارائه میدهد، یک پارادایم نوظهور در هوش مصنوعی که در آن مدلهای زبانی بزرگ (LLM) بهصورت خودکار برنامهریزی برای گامهای بعدی خود را انجام میدهند و همزمان اطلاعات را از منابع خارجی استخراج میکنند. بر خلاف الگوهای ایستا که ابتدا بازیابی میکنند و سپس میخوانند، Agentic RAG شامل فراخوانهای تکراری به LLM است که با فراخوانی ابزار یا تابع و خروجیهای ساختار یافته ترکیب میشود. سیستم نتایج را ارزیابی میکند، پرسشها را پالایش میکند، ابزارهای بیشتری را در صورت نیاز فرا میخواند و این چرخه را ادامه میدهد تا زمانی که راهحلی قابل قبول به دست آید.
این درس موارد زیر را پوشش میدهد
پس از اتمام این درس، شما خواهید دانست چگونه/درک خواهید کرد:
Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در هوش مصنوعی است که در آن مدلهای زبانی بزرگ (LLM) بهصورت خودکار گامهای بعدی خود را برنامهریزی میکنند در حالی که اطلاعات را از منابع خارجی استخراج میکنند. بر خلاف الگوهای ایستا که ابتدا بازیابی میکنند و سپس میخوانند، Agentic RAG شامل فراخوانهای تکراری به LLM است که با فراخوانی ابزار یا توابع و خروجیهای ساختار یافته ترکیب میشود. سیستم نتایج را ارزیابی میکند، پرسشها را پالایش میکند، ابزارهای بیشتری را در صورت نیاز فرا میخواند و این چرخه را ادامه میدهد تا زمانی که راهحلی قابل قبول به دست آید. این سبک “سازنده-بازرس” تکراری دقت را بهبود میبخشد، پرسشهای ناقص را مدیریت میکند و نتایج با کیفیت بالا را تضمین میکند.
سیستم فرآیند استدلال خود را بهصورت فعال در اختیار دارد، پرسشهای ناموفق را بازنویسی میکند، روشهای بازیابی متفاوتی را انتخاب میکند و ابزارهای متعددی را مانند جستجوی برداری در Azure AI Search، پایگاه دادههای SQL یا APIهای سفارشی پیش از نهایی کردن پاسخ خود ادغام میکند. کیفیت تمایز دهنده یک سیستم عاملی، توانایی آن در مالکیت فرآیند استدلال خود است. پیادهسازیهای سنتی RAG به مسیرهای از پیش تعیین شده تکیه دارند، اما یک سیستم عاملی بهصورت خودکار توالی گامها را بر اساس کیفیت اطلاعاتی که مییابد تعیین میکند.
Agentic Retrieval-Augmented Generation (Agentic RAG) یک پارادایم نوظهور در توسعه هوش مصنوعی است که در آن مدلهای زبانی بزرگ نه تنها اطلاعات را از منابع داده خارجی استخراج میکنند، بلکه بهطور خودکار گامهای بعدی خود را برنامهریزی میکنند. بر خلاف الگوهای ایستا که ابتدا بازیابی میکنند و سپس میخوانند یا توالیهای کاملاً اسکریپت شده درخواستها، Agentic RAG شامل یک حلقه از فراخوانهای تکراری به LLM است که با فراخوانی ابزار یا توابع و خروجیهای ساختار یافته ترکیب میشود. در هر مرحله، سیستم نتایجی را که به دست آورده ارزیابی میکند، تصمیم میگیرد پرسشهای خود را پالایش کند یا خیر، ابزارهای اضافی را در صورت نیاز فرا میخواند و این چرخه را تا زمانی که راهحل رضایتبخشی به دست آورد، ادامه میدهد.
این سبک عملکرد “سازنده-بازرس” تکراری برای بهبود دقت، رسیدگی به پرسشهای ناقص به پایگاههای داده ساختارشده (مثلاً NL2SQL) و تضمین نتایج متعادل و با کیفیت طراحی شده است. به جای تکیه صرف بر زنجیرههای درخواستهای مهندسی شده، سیستم بهطور فعال فرآیند استدلال خود را در اختیار دارد. میتواند پرسشهایی که شکست میخورند را بازنویسی کند، روشهای بازیابی مختلفی را انتخاب نماید و چندین ابزار را مانند جستجوی برداری در Azure AI Search، پایگاه دادههای SQL یا APIهای سفارشی قبل از نهایی کردن پاسخ خود ادغام کند. این نیاز به چارچوبهای سازماندهی پیچیده را از بین میبرد. در عوض، یک حلقه نسبتاً ساده از «فراخوان LLM → استفاده از ابزار → فراخوان LLM → …» میتواند خروجیهای پیشرفته و مبتنی بر استدلال تولید کند.

ویژگی تمایز دهندهای که یک سیستم را «عاملی» میکند، توانایی مالکیت فرآیند استدلالش است. پیادهسازیهای سنتی RAG اغلب به مسیر تعیین شده توسط انسان برای مدل تکیه دارند: یک زنجیره اندیشه که مشخص میکند چه چیزی و چه زمانی بازیابی شود. اما زمانی که یک سیستم واقعاً عاملی است، بهصورت داخلی تصمیم میگیرد چگونه به مسئله نزدیک شود. این فقط اجرای یک اسکریپت نیست؛ بلکه بهصورت خودکار توالی گامها را بر اساس کیفیت اطلاعاتی که مییابد تعیین میکند. برای مثال، اگر از آن خواسته شود استراتژی راهاندازی محصولی را ایجاد کند، تنها به یک درخواست که کل جریان تحقیق و تصمیمگیری را مشخص میکند تکیه نمیکند. بلکه مدل عاملی بهطور مستقل تصمیم میگیرد:

یک سیستم عاملی به یک الگوی تعامل حلقوی تکیه دارد:
با گذشت زمان، این حس فهم پیوسته ایجاد میشود که به مدل اجازه میدهد وظایف پیچیده چندمرحلهای را بدون نیاز به مداخله مستمر انسان یا تغییر مکرر درخواست هدایت کند.
خودمختاری Agentic RAG همچنین شامل مکانیزمهای قوی خوداصلاحی است. زمانی که سیستم به بنبست میرسد — مانند بازیابی اسناد نامرتبط یا مواجهه با پرسشهای ناقص — میتواند:
این رویکرد تکراری و پویا به مدل اجازه میدهد بهطور مستمر بهبود یابد و اطمینان حاصل کند که سیستم تنها یکبار شلیک نیست بلکه از اشتباهات خود در طول یک جلسه یاد میگیرد.

با وجود خودمختاریاش در یک وظیفه، Agentic RAG معادل هوش مصنوعی عمومی نیست. قابلیتهای «عاملی» آن محدود به ابزارها، منابع داده و سیاستهایی است که توسط توسعهدهندگان انسانی ارائه شدهاند. نمیتواند ابزارهای خود را اختراع کند یا از مرزهای حوزههای تعیین شده فراتر رود. بلکه در سازماندهی پویا منابع موجود عالی است. تفاوتهای کلیدی با اشکال پیشرفتهتر هوش مصنوعی عبارتند از:
Agentic RAG در سناریوهایی که نیاز به پالایش تکراری و دقت دارد میدرخشد:
با خودمختارتر شدن این سیستمها در استدلال، حکمرانی و شفافیت حیاتی میشود:
داشتن ابزارهایی که سوابق واضحی از اقدامات فراهم میکنند ضروری است. بدون آنها عیبیابی یک فرآیند چند مرحلهای میتواند بسیار دشوار باشد. مثال زیر از Literal AI (شرکتی پشت Chainlit) برای یک اجرای Agent را ببینید:

Agentic RAG نمایانگر یک تحول طبیعی در نحوه مدیریت سیستمهای هوش مصنوعی برای وظایف پیچیده و دادهمحور است. با اتخاذ الگوی تعامل حلقوی، انتخاب خودکار ابزارها و پالایش پرسشها تا رسیدن به نتیجهای با کیفیت بالا، سیستم فراتر از تبعیت ایستا از درخواستها حرکت کرده و به تصمیمگیری تطبیقی، آگاه به زمینه تبدیل میشود. در حالی که هنوز محدود به زیرساختها و دستورالعملهای اخلاقی تعریف شده توسط انسان است، این قابلیتهای عاملی تعاملات هوش مصنوعی غنیتر، پویاتر و در نهایت مفیدتری را برای سازمانها و کاربران نهایی فراهم میکنند.
به Microsoft Foundry Discord بپیوندید تا با دیگر یادگیرندگان ملاقات کنید، در ساعات اداری شرکت کنید و سوالات خود درباره AI Agents را مطرح نمایید.
ساخت عوامل هوش مصنوعی قابل اعتماد
سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما تلاش میکنیم دقت را حفظ کنیم، لطفاً آگاه باشید که ترجمههای خودکار ممکن است حاوی خطا یا نادرستی باشند. سند اصلی به زبان بومی خود باید منبع معتبر تلقی شود. برای اطلاعات حیاتی، ترجمه حرفهای انسانی توصیه میشود. ما مسئول هیچ گونه سوء تفاهم یا تفسیر نادرستی که از استفاده این ترجمه ناشی شود، نیستیم.