কথোপকথনমূলক প্রশ্ন উত্তর সিস্টেমের প্রাথমিক অন্তর্দৃষ্টি (CQA)

গবেষক বুদ্ধিমান কথোপকথন সিস্টেমের একটি অ্যারে তৈরি করার জন্য কাজ করছেন যা শুধুমাত্র একটি ইন্টারেক্টিভ কথোপকথন চালানোর ক্ষেত্রে মানুষের স্তরের সাথে মেলে বা অতিক্রম করে না বরং বিভিন্ন বিষয়ে প্রশ্নের উত্তর দেয়। LaMDA – খুব ছোট “সংলাপ অ্যাপ্লিকেশনের জন্য ভাষার মডেল”google-এর সাম্প্রতিক গবেষণার অগ্রগতি, সেই ধাঁধার সবচেয়ে উত্তেজনাপূর্ণ বিভাগগুলির মধ্যে একটি অংশ যোগ করে: কথোপকথন৷ LaMDA একটি উন্মুক্ত প্রকৃতির সাথে বিকশিত হয় মানে তারা একটি নির্দিষ্ট বিষয় দিয়ে শুরু করতে পারে এবং কোথাও সম্পূর্ণভাবে বিভিন্ন বিষয়ে শেষ করতে পারে। বেশ কিছু সফল ডায়ালগ এজেন্ট যেমন অ্যামাজন অ্যালেক্সা, অ্যাপল সিরি, মাইক্রোসফ্ট কর্টানা, ইত্যাদি। এই ব্লগে, আমি একটি কথোপকথনমূলক প্রশ্নের উত্তর দেওয়ার সিস্টেমের প্রধান বিল্ডিং ব্লকগুলি কভার করতে চাই

“আমরা আর লোকেদের শেখাচ্ছি না কিভাবে সিস্টেমের সাথে যোগাযোগ করতে হয়, আমরা মানুষদের সাথে যোগাযোগ করতে সিস্টেমগুলি শেখাচ্ছি।”

কথোপকথন AI এর ক্ষেত্রটিকে তিনটি ভিন্ন ডায়ালগ সিস্টেমে ভাগ করা যেতে পারে:

  1. টাস্ক-ওরিয়েন্টেড ডায়ালগ সিস্টেম: এই কথোপকথন সিস্টেমটি ব্যবহারকারীর পক্ষে কাজগুলি যেমন একটি রেস্তোরাঁয় একটি রিজার্ভেশন করা বা একটি ইভেন্টের সময় নির্ধারণের জন্য প্রয়োজনীয়।
  2. চ্যাট-ওরিয়েন্টেড ডায়ালগ সিস্টেম: এই সিস্টেমটি ব্যবহারকারীদের সাথে একটি স্বাভাবিক এবং ইন্টারেক্টিভ কথোপকথন চালাতে হবে।
  3. QA ডায়ালগ সিস্টেম: এই কথোপকথন সিস্টেমটি পাঠ্য নথি বা জ্ঞানের ভিত্তির মতো বিভিন্ন ডেটা উত্স থেকে প্রাপ্ত তথ্যের ভিত্তিতে ব্যবহারকারীদের প্রশ্নের স্পষ্ট এবং সংক্ষিপ্ত উত্তর দেওয়ার জন্য দায়ী।

আগামীতে নিম্নলিখিত ব্লকগুলিতে, আমি ব্যাখ্যা করব QA ডায়ালগ সিস্টেম।

কথোপকথন AI এর শ্রেণীকরণ।
কথোপকথনমূলক এআই এর প্রকারগুলি

সাধারণভাবে প্রশ্নের উত্তর দেওয়ার মধ্যে একটি জিজ্ঞাসিত প্রশ্নের সঠিক উত্তর খুঁজে পেতে বিভিন্ন ডেটা উত্স অ্যাক্সেস করা জড়িত। যেহেতু CQA কে QA-এর একটি উপ-শ্রেণি হিসাবে শ্রেণীবদ্ধ করা হয়েছে, তাই CQA মডেলের শ্রেণীকরণ ডেটা ডোমেন, প্রশ্নের ধরন, ডেটা উত্সের ধরন এবং সিস্টেমের প্রকারের ভিত্তিতে উপলব্ধি করা যেতে পারে।

CQA-এর শ্রেণীকরণের ভিত্তিতে: i) ডেটা ডোমেন, ii) প্রশ্নের ধরন, iii) ডেটা উত্সের ধরন এবং iv) সিস্টেমের প্রকার
i) ডেটা ডোমেন, ii) প্রশ্নের ধরন, iii) ডেটা উত্সের প্রকার এবং iv) সিস্টেমের প্রকারের ভিত্তিতে CQA এর শ্রেণীকরণ

উপরের চিত্রটি একটি CQA সিস্টেমের প্রতিটি বিভাগের বিশদ বিবরণ প্রকাশ করে। আমরা কথোপকথনমূলক মেশিন রিডিং কম্প্রিহেনশন সিস্টেম এবং CoQA ডেটাসেটের উপর আরও জোর দেওয়ার চেষ্টা করব। আমার আসন্ন ব্লগগুলিতে, আমি ওপেন-ডোমেন CQA কে আরও বিস্তারিতভাবে ব্যাখ্যা করার চেষ্টা করব যা বর্তমানে NLP-এর QA-তে গবেষণার একটি অত্যন্ত বিখ্যাত বিষয়।

কথোপকথনমূলক মেশিন রিডিং কম্প্রিহেনশন (CMRC)

বেশিরভাগই, সমস্ত মেশিন রিডিং বোধগম্য একক-টার্ন QA-এর উপর ভিত্তি করে যা বাস্তব-বিশ্বের অ্যাপ্লিকেশন থেকে অসম্ভাব্য যেখানে ব্যবহারকারীরা পালাক্রমে একাধিক প্রশ্ন জিজ্ঞাসা করে। উদাহরণস্বরূপ, একজন ব্যবহারকারী জিজ্ঞাসা করতে পারেন, “ইলন মাস্ক কে? এবং প্রাপ্ত উত্তরের উপর ভিত্তি করে, তিনি আরও তদন্ত করতে পারেন, “সে কোথায় পড়াশোনা করেছে?” এবং “তিনি কি জন্য বিখ্যাত ছিলেন? ” একজন মানুষের পক্ষে বোঝা সহজ যে এখানে ফলো-আপ প্রশ্নে “তিনি” প্রথম প্রশ্ন থেকে “এলন মাস্ক” উল্লেখ করেছেন। কিন্তু যখন প্রেক্ষাপট বোঝার মেশিনের কথা আসে, তখন এটি চ্যালেঞ্জের একটি সেট তৈরি করে যেমন কথোপকথনের ইতিহাসকে কীভাবে সহ-রেফারেন্স করবেন যার অর্থ মডেলটি পূর্ববর্তী প্রশ্নগুলি থেকে বোঝে এমন তথ্যের ভিত্তিতে বর্তমান প্রশ্নের উত্তর দেওয়া।

টেক্সট-ভিত্তিক QA এজেন্টদের ব্যবহারিক ব্যবহার CMRC এজেন্ট হিসাবেও উল্লেখ করা হয়, মোবাইল ফোন এবং সার্চ ইঞ্জিনে (যেমন Google, Bing, ইত্যাদি) বেশি সাধারণ, যেখানে ব্যবহারকারীদের সংক্ষিপ্ত এবং সরাসরি উত্তর দেওয়া হয়।

CQA এর ক্ষেত্রে দ্রুত বৃদ্ধির একটি কারণ হল মেশিন বোঝার জন্য বড় আকারের কথোপকথন ডেটাসেটের আবির্ভাব। আরও একটি বিভাগে, আমরা CMRC ডেটাসেট নিয়ে আলোচনা করব।

কথোপকথনমূলক মেশিন রিডিং বোঝার জন্য ডেটাসেট

সাধারণত, তারা যে ধরনের উত্তর দেয় তার উপর ভিত্তি করে তিন ধরনের CMRC ডেটাসেট রয়েছে:

  • একাধিক পছন্দের বিকল্প ডেটাসেট পাঠ্য-ভিত্তিক বহু-পছন্দের প্রশ্ন প্রদান করুন এবং মডেলটি উপলব্ধ বিকল্পগুলির মধ্যে সঠিক উত্তরটি সনাক্ত করবে বলে আশা করুন। উদাহরণ: MCTest, MCSript, ইত্যাদি।
  • বর্ণনামূলক উত্তর ডেটাসেট উত্তরগুলি যেকোন ফ্রি-ফর্ম টেক্সটে হতে দিন। উদাহরণ: MS Marco এবং Narrative QA।
  • স্প্যান পূর্বাভাস ডেটাসেটের জন্য প্রদত্ত উৎস প্যাসেজ থেকে সঠিক উত্তরের স্প্যান বের করার জন্য মডেলের প্রয়োজন হয়। উদাহরণ: CoQA, SQuAD, TriviaQA, ইত্যাদি।

এর উপর আমাদের হাত পেতে CoQA ডেটাসেট

CoQA (কোকথাসাহিত্যিক প্রuestion উত্তর দিচ্ছে)

CoQA (কোকথাসাহিত্যিক প্রuestion উত্তর দিচ্ছে) তিনটি উদ্দেশ্য মাথায় রেখে শিবা রেড্ডি চালু করেছিলেন।

  • প্রথমটি হল মানুষের কথোপকথনে প্রশ্নের প্রকৃতি। এই ডেটাসেটে, প্রথমটি ছাড়া প্রতিটি প্রশ্ন পূর্ববর্তী কথোপকথনের ইতিহাসের উপর নির্ভরশীল।
  • CoQA উত্তরের যৌক্তিকতা হিসাবে প্রদত্ত প্যাসেজ থেকে একটি পাঠ্য স্প্যান প্রদান করার সময় ফ্রি-ফর্ম উত্তরের অনুমতি দেয়।
  • CoQA একাধিক ডোমেন জুড়ে CQA সিস্টেমের বিকাশের অনুমতি দেয়।

CoQA ডেটাসেটে উত্তর সহ 127k প্রশ্ন রয়েছে, সাতটি বিভিন্ন ডোমেন থেকে পাঠ্য প্যাসেজ সম্পর্কে 8k কথোপকথন থেকে প্রাপ্ত। প্রশ্নগুলি কথোপকথনমূলক, এবং উত্তরগুলি প্যাসেজে হাইলাইট করা সংশ্লিষ্ট প্রমাণ সহ বিনামূল্যের পাঠ্য।

CoQA ডেটাসেট থেকে একটি কথোপকথন।
CoQA ডেটাসেট থেকে একটি কথোপকথন।

আগ্রহী! CMRC মডেলটি কী ইনপুট প্যারামিটারগুলি বিবেচনা করে এবং প্রাসঙ্গিক উত্তরের সাথে উত্তর দেওয়ার জন্য মডেলটি কীভাবে সেই প্যারামিটারগুলি বুঝবে?

CoQA কে কথোপকথনমূলক প্রতিক্রিয়া তৈরির সমস্যা বা পড়ার বোঝার সমস্যা হিসাবে মডেল করা যেতে পারে। একটি প্যাসেজ দেওয়া হলে আমরা প্রতিটি মডেলিং ধরনের জন্য বেসলাইন মূল্যায়ন করি পিকথোপকথনের ইতিহাস {q1, a1, . . . qi−1, ai−1}এবং একটি প্রশ্ন qiটাস্ক উত্তর ভবিষ্যদ্বাণী করা হয় ai. এখানে মডেল সোনার উত্তর থেকে তথ্য ব্যবহার করবে a1, a2, . . . , ai−1 অনুমান করা ai.

প্রদত্ত প্রসঙ্গ উৎস থেকে দস্তাবেজ/স্প্যান পুনরুদ্ধার শেখার জন্য সংক্ষিপ্তভাবে DrQA নিয়ে আলোচনা করা যাক।

বড় আকারের ওপেন-ডোমেন QA এবং পাঠ্যের মেশিন বোধগম্য উভয়ের চ্যালেঞ্জ একত্রিত করতে। যেকোনো প্রশ্নের উত্তর দেওয়ার জন্য, প্রথমে উইকিপিডিয়া নিবন্ধগুলি ব্যবহার করে 5 মিলিয়নেরও বেশি আইটেমের মধ্যে কয়েকটি প্রাসঙ্গিক নিবন্ধ পুনরুদ্ধার করতে হবে এবং তারপর উত্তরটি সনাক্ত করতে সাবধানতার সাথে স্ক্যান করতে হবে। এর লেখক DrQA কাগজ এই সেটিং আখ্যা দিয়েছে, স্কেল এ মেশিন রিডিং (MRS).

DrQA একাধিক বিদ্যমান QA ডেটাসেটের জন্য একটি ওপেন-ডোমেন সিস্টেম ব্যবহার করে MRS মূল্যায়ন করার জন্য তৈরি করা হয়েছিল। DrQAউইকিপিডিয়া থেকে প্রশ্নের উত্তর দেওয়ার জন্য একটি সিস্টেম যা গঠিত:

  • নথি পুনরুদ্ধারকারী: বিগগ্রাম হ্যাশিং এবং TF-IDF ম্যাচিং ব্যবহার করে একটি মডিউল ডিজাইন করা হয়েছে, একটি প্রশ্ন দেওয়া হয়েছে, দক্ষতার সাথে প্রাসঙ্গিক নিবন্ধগুলির একটি উপসেট ফেরত দিতে।
  • ডকুমেন্ট রিডার: এটা হয় একটি মাল্টি-লেয়ার রিকারেন্ট নিউরাল নেটওয়ার্ক মেশিন কম্প্রিহেনশন মডেল যা সেই কয়েকটি ফেরত নথিতে উত্তর স্প্যান সনাক্ত করতে প্রশিক্ষিত।

DrQA প্রশ্ন উত্তর সিস্টেমের একটি ওভারভিউ নীচে দেখানো হয়েছে এবং DrQA এর মূল কাগজ থেকে একটি ছবি নেওয়া হয়েছে 🙂

আমাদের প্রশ্ন উত্তর সিস্টেম DrQA এর একটি ওভারভিউ।

আমরা আমার আসন্ন ব্লগগুলিতে ওপেন-ডোমেন কথোপকথনমূলক QA নিয়ে আরও বিস্তারিত আলোচনা করব। এখানে, DrQA এর একটি প্রাথমিক ওভারভিউ দেওয়া হয়েছে এবং আরও তথ্যের জন্য এখানে পরিদর্শন করুন.

CQA-তে ভবিষ্যত কাজ ও চ্যালেঞ্জ

বর্তমান CQA বেঞ্চমার্ক প্রধানত ইংরেজির মতো সম্পদ-সমৃদ্ধ ভাষাগুলিতে ফোকাস করে। কথোপকথনমূলক প্রশ্নের উত্তরে স্বল্প-সম্পদ ভাষার উন্নতির জন্য প্রচুর জায়গা রয়েছে। বহুভাষিক এবং কয়েক-শট ক্রস-লিঙ্গুয়াল ট্রান্সফার লার্নিং এখনও CQA-তে গবেষণার একটি প্রয়োজনীয় ক্ষেত্র।

এছাড়াও, বর্তমান সিস্টেমটি বিভিন্ন নিবন্ধে বিষয় পরিবর্তনের সাথে প্রশ্ন-উত্তর চালিয়ে যাওয়ার জন্য স্বয়ংসম্পূর্ণ নয়।

এই নিবন্ধটি পড়ার জন্য ধন্যবাদ! আমার সাথে আপনার পর্যালোচনা/ধারনা শেয়ার করুন. আপনার যদি কোনো সন্দেহ থাকে বা কোনো ত্রুটির সম্মুখীন হন, তাহলে মন্তব্যে আমাকে জানান। আমাকে একটা হাততালি দিতে ভুলবেন না👏 🙂

তথ্যসূত্র

[1] https://aclanthology.org/Q19-1016.pdf

[2] https://github.com/facebookresearch/DrQA

[3] ডানকি চেন, অ্যাডাম ফিশ, জেসন ওয়েস্টন এবং অ্যান্টোইন বোর্ডেস। 2017। ওপেন-ডোমেন প্রশ্নের উত্তর দিতে উইকিপিডিয়া পড়া. ভিতরে অ্যাসোসিয়েশন ফর কম্পিউটেশনাল লিঙ্গুইস্টিকসের 55 তম বার্ষিক সভার কার্যপ্রণালী (ভলিউম 1: লং পেপারস), পৃষ্ঠা 1870-1879, ভ্যাঙ্কুভার, কানাডা। কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতি।

[4] শিভা রেড্ডি, ডানকি চেন এবং ক্রিস্টোফার ডি. ম্যানিং। 2019 CoQA: একটি কথোপকথনমূলক প্রশ্ন উত্তর চ্যালেঞ্জ. কম্পিউটেশনাল ভাষাবিজ্ঞানের জন্য সমিতির লেনদেন7:249-266।

[5] https://stanfordnlp.github.io/coqa/

[6] https://arxiv.org/abs/2112.09866

Leave a Reply

Your email address will not be published.