(এই পাঠের ভিডিও দেখতে উপরের ছবি ক্লিক করুন)
এই পাঠটি Agentic Retrieval-Augmented Generation (Agentic RAG) সম্পর্কে একটি ব্যাপক ওভারভিউ প্রদান করে, যা একটি উদীয়মান AI প্যারাডাইম যেখানে বড় ভাষার মডেলগুলি (LLMs) স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপগুলি পরিকল্পনা করে যখন তারা বাহ্যিক উৎস থেকে তথ্য সংগ্রহ করে। স্থির retrieval-then-read প্যাটার্নের বিপরীতে, Agentic RAG iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনগত আউটপুট সহ। সিস্টেম ফলাফল মূল্যায়ন করে, প্রশ্নগুলি পরিমার্জন করে, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে এবং এই চক্রটি চালিয়ে যায় যতক্ষণ না সন্তুষ্টিজনক সমাধান পাওয়া যায়।
এই পাঠে আলোচনা করা হবে
এই পাঠ সম্পন্ন করার পর, আপনি জানতে পারবেন/বোঝাপড়া পাবেন:
Agentic Retrieval-Augmented Generation (Agentic RAG) একটি উদীয়মান AI প্যারাডাইম যেখানে বড় ভাষার মডেলগুলি (LLMs) স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপ পরিকল্পনা করে যখন তারা বাহ্যিক উৎস থেকে তথ্য সংগ্রহ করে। স্থির retrieval-then-read প্যাটার্নের পরিবর্তে, Agentic RAG iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনগত আউটপুট সহ। সিস্টেম ফলাফল মূল্যায়ন করে, প্রশ্ন পরিমার্জন করে, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে এবং এই চক্রটি চালিয়ে যায় যতক্ষণ না সন্তোষজনক সমাধান পাওয়া যায়। এই পুনরাবৃত্তিমূলক “maker-checker” স্টাইল সঠিকতা উন্নত করে, ভুলভাবে গঠিত প্রশ্নগুলি পরিচালনা করে এবং উচ্চ গুণমানের ফলাফল নিশ্চিত করে।
সিস্টেম সক্রিয়ভাবে নিজের যুক্তি প্রক্রিয়া পরিচালনা করে, ব্যর্থ প্রশ্ন পুনঃলিখন করে, ভিন্ন রিট্রিভাল পদ্ধতি নির্বাচন করে এবং একাধিক টুল ইন্টিগ্রেট করে—যেমন Azure AI Search এ ভেক্টর সার্চ, SQL ডেটাবেস, অথবা কাস্টম API—এটি চূড়ান্ত উত্তর দেওয়ার আগে। একটি agentic সিস্টেমের প্রধান বৈশিষ্ট্য হলো এটি নিজের যুক্তি প্রক্রিয়া পরিচালনার ক্ষমতা। প্রচলিত RAG বাস্তবায়নগুলি পূর্বনির্ধারিত পাথের উপর নির্ভর করে, কিন্তু একটি agentic সিস্টেম স্বয়ংক্রিয়ভাবে তথ্যের গুণগত মানের উপর ভিত্তি করে ধাপগুলির ক্রম নির্ধারণ করে।
Agentic Retrieval-Augmented Generation (Agentic RAG) AI উন্নয়নের একটি উদীয়মান প্যারাডাইম যেখানে LLM গুলি কেবল বাহ্যিক ডেটা উৎস থেকে তথ্য সংগ্রহ করে না, বরং স্বয়ংক্রিয়ভাবে তাদের পরবর্তী ধাপ পরিকল্পনা করে। স্থির retrieval-then-read প্যাটার্ন বা সাবধানে স্ক্রিপ্ট করা প্রম্পট সিকোয়েন্সের পরিবর্তে, Agentic RAG একটি লুপের মতো iterative কল করে LLM-কে, টুল বা ফাংশন কল এবং গঠনমূলক আউটপুট সহ। প্রতিটি ধাপে সিস্টেম পেয়েছে ফলাফল মূল্যায়ন করে, প্রশ্ন পরিমার্জিত করা দরকার কিনা তা সিদ্ধান্ত নেয়, প্রয়োজনে অতিরিক্ত টুল আহ্বান করে, এবং এই চক্র চালিয়ে যায় যতক্ষণ না সন্তোষজনক সমাধান পাওয়া যায়।
এই পুনরাবৃত্তিমূলক “maker-checker” অপারেশন স্টাইল সঠিকতা উন্নত করতে, গঠিত ডেটাবেসের ত্রুটিপূর্ণ প্রশ্ন (যেমন NL2SQL) পরিচালনা করতে, এবং সুষম, উচ্চ-মানের ফলাফল নিশ্চিত করতে ডিজাইন করা হয়েছে। শুধুমাত্র সাবধানে পরিকল্পিত প্রম্পট চেইনের উপর নির্ভর না করে, সিস্টেম সক্রিয়ভাবে নিজের যুক্তি প্রক্রিয়া পরিচালনা করে। এটি ব্যর্থ প্রশ্নগুলি পুনঃলিখন করতে পারে, বিভিন্ন রিট্রিভাল পদ্ধতি বেছে নিতে পারে, এবং একাধিক টুল ইন্টিগ্রেট করতে পারে — যেমন Azure AI Search এ ভেক্টর সার্চ, SQL ডাটাবেস, বা কাস্টম API — এর উত্তর চূড়ান্ত করার আগে। এটি অতিরিক্ত জটিল অর্কেস্ট্রেশন ফ্রেমওয়ার্কের প্রয়োজনীয়তা দূর করে। বরং, একটি তুলনামূলক সহজ লুপ “LLM কল → টুল ব্যবহারে → LLM কল → …” উন্নত এবং ভাল ভিত্তিক আউটপুট প্রদান করতে পারে।

একটি সিস্টেমকে “agentic” বানায় এমন বৈশিষ্ট্য হল এটি নিজের যুক্তির প্রক্রিয়া নিয়ন্ত্রণ করার ক্ষমতা। প্রচলিত RAG বাস্তবায়নগুলি সাধারণত মানুষের দ্বারা মডেলের জন্য একটি পথ পূর্বনির্ধারণের ওপর নির্ভর করে: একটি chain-of-thought যা উল্লেখ করে কখন কি রিট্রিভ করতে হবে।
কিন্তু যখন একটি সিস্টেম সত্যিকার অর্থে agentic হয়, তখন এটি অভ্যন্তরীণভাবে সিদ্ধান্ত নেয় কীভাবে সমস্যা সমাধান করা হবে। এটি শুধুমাত্র একটি স্ক্রিপ্ট চালাচ্ছে না; এটি তথ্যের গুণমানের উপর ভিত্তি করে ধাপগুলির ক্রম স্বয়ংক্রিয়ভাবে নির্ধারণ করছে।
উদাহরণস্বরূপ, যদি এটি একটি প্রোডাক্ট লঞ্চ কৌশল তৈরি করতে বললে, এটি শুধু একটি প্রম্পটের উপর নির্ভর করবে না যা পুরো গবেষণা এবং সিদ্ধান্ত গ্রহণের কাজকে বর্ণনা করে। বরং, agentic মডেল স্বতন্ত্রভাবে সিদ্ধান্ত নেয়:
এই সমস্ত ধাপগুলো — প্রশ্ন পরিমার্জন, উৎস নির্বাচন, উত্তর নিয়ে “খুশি” না হওয়া পর্যন্ত পুনঃপ্রক্রিয়া — মডেল নিজেই সিদ্ধান্ত নেয়, কোন মানব পূর্বনির্ধারিত স্ক্রিপ্ট নেই।

একটি agentic সিস্টেম একটি লুপযুক্ত ইন্টারঅ্যাকশন প্যাটার্নের উপর নির্ভর করে:
সময়ের সাথে সাথে, এটি যা বোঝা বাড়াচ্ছে তাতে একটি বিকাশমান বোধ তৈরি করে, যার ফলে মডেল জটিল, বহু-ধাপ কাজ দক্ষতার সাথে সম্পন্ন করতে পারে, মানব হস্তক্ষেপ বা প্রম্পট পুনর্গঠন ছাড়াই।
Agentic RAG এর স্বায়ত্তশাসনে শক্তিশালী স্ব-সংশোধন প্রক্রিয়াও অন্তর্ভুক্ত। যখন সিস্টেম অযোগ্য শেষবিন্দুতে পৌঁছায় — যেমন অপ্রাসঙ্গিক ডকুমেন্ট সংগ্রহ বা ভুল প্রশ্নের সম্মুখীন হয় — তখন এটি করতে পারে:
এই পুনরাবৃত্তিমূলক এবং গতিশীল পদ্ধতি মডেলকে ক্রমাগত উন্নতির সুযোগ দেয়, নিশ্চয়তা দিয়ে যে এটি শুধুমাত্র একবারের সিস্টেম নয় বরং নির্দিষ্ট সেশনে তার ভুল থেকে শিখতে সক্ষম।

একটি কাজের মধ্যে স্বয়ংক্রিয়তার সত্বেও, Agentic RAG কৃত্রিম সাধারণ বুদ্ধিমত্তার (Artificial General Intelligence) সমতুল্য নয়। এর “agentic” সক্ষমতাগুলি মানুষের ডেভেলপারদের দ্বারা প্রদত্ত টুল, ডেটা উৎস এবং নীতিমালা সীমাবদ্ধ। এটি নিজস্ব টুল উদ্ভাবন করতে বা নির্ধারিত ডোমেন সীমানার বাইরে যেতে পারে না। বরং, এটি হাতের রিসোর্সগুলো গতিশীলভাবে পরিচালনায় সক্ষম।
উন্নত AI রূপ থেকে প্রধান পার্থক্য হলো:
Agentic RAG নিম্নলিখিত পরিস্থিতিতে বিশেষভাবে কার্যকর যখন পুনরাবৃত্তিমূলক পরিমার্জন এবং সঠিকতা প্রয়োজন:
এই সিস্টেমগুলো যত বেশি স্বায়ত্তশাসিত হবে তত বেশি শাসন এবং স্বচ্ছতা গুরুত্বপূর্ণ হবে:
অ্যাকশনগুলোর একটি পরিষ্কার রেকর্ড প্রদানকারী টুল থাকা গুরুত্বপূর্ণ। এগুলো ছাড়া, বহু-ধাপ প্রক্রিয়া ডিবাগ করা অনেক কঠিন। Literal AI (Chainlit এর পিছনের কোম্পানি) থেকে Agent রান এর উদাহরণ দেখুন:

Agentic RAG AI সিস্টেমগুলি কিভাবে জটিল, ডেটা-নির্ভর কাজ পরিচালনা করে তার একটি প্রাকৃতিক বিকাশ প্রতিনিধিত্ব করে। একটি লুপযুক্ত ইন্টারঅ্যাকশন প্যাটার্ন গ্রহণ করে, স্বতন্ত্রভাবে টুল নির্বাচন করে এবং পুনরাবৃত্তভাবে প্রশ্ন পরিমার্জন করে উচ্চ-মানের ফলাফল নিশ্চিত করে, সিস্টেম স্থির প্রম্পট অনুসরণ থেকে বেরিয়ে আসে, একটি আরও অভিযোজ্য, প্রসঙ্গ-সচেতন সিদ্ধান্ত গ্রহণকারী হয়ে ওঠে। যদিও এটি এখনও মানব-নির্ধারিত অবকাঠামো এবং নৈতিক নির্দেশিকার দ্বারা সীমাবদ্ধ, তবে এই agentic সক্ষমতাগুলো আরও সমৃদ্ধ, গতিশীল এবং সর্বশেষে অধিক কার্যকর AI ইন্টারঅ্যাকশন সক্ষম করে ব্যবস্থাগুলোর জন্য এবং শেষ ব্যবহারকারীদের জন্য।
অন্য শিক্ষার্থীদের সাথে দেখা করতে, অফিস আওয়ার অংশগ্রহণ করতে এবং আপনার AI এজেন্ট সম্পর্কিত প্রশ্নগুলোর উত্তর পেতে Microsoft Foundry Discord এ যোগ দিন।
বাদ দেওয়া ঘোষণা: এই নথিটি AI অনুবাদ সেবা Co-op Translator ব্যবহার করে অনূদিত হয়েছে। আমরা যথাসাধ্য সঠিকতার চেষ্টা করি, তবে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা ভুল থাকতে পারে। মূল নথি তার স্বাভাবিক ভাষায় সর্বোচ্চ কর্তৃপক্ষ হিসেবে গণ্য হবে। গুরুত্বপূর্ণ তথ্যের জন্য পেশাদার মানব অনুবাদের পরামর্শ দেওয়া হয়। এই অনুবাদের ব্যবহারে যে কোনও ভুল বোঝাবুঝি বা ভ্রান্ত ব্যাখ্যার জন্য আমরা দায়ী নই।