Google-এর জীবন-পরিবর্তনকারী AR স্মার্ট চশমার ডেমো আমাকে শিহরিত করেছে

যখন Viva এবং Yoshiko, একজন ইংরেজি স্পিকার এবং অন্যজন একজন ম্যান্ডারিন চাইনিজ স্পিকার, Google I/O 2022-এ এক ঝলক দেখার সময় Google-এর প্রোটোটাইপ স্মার্ট চশমা ব্যবহার করার চেষ্টা করেছিলেন, তখন আমার মেরুদণ্ডে কাঁপতে থাকে। তাদের মুখের অভিব্যক্তি, অর্থপূর্ণভাবে এমন ব্যক্তির সাথে যোগাযোগ করার আকস্মিক ক্ষমতা যিনি আগে পুরোপুরি বুঝতে পারেননি যা বলা হচ্ছে তা আমাকে দারুণভাবে অনুপ্রাণিত করেছিল। এটি এমন প্রযুক্তির একটি উদাহরণ যা আমি সত্যিই পছন্দ করি: একটি যা জীবন পরিবর্তন করতে পারে।

‘বিশ্বের জন্য সাবটাইটেল’

আপনি যদি Google I/O চলাকালীন এই বিশেষ মুহূর্তটি মিস করেন তবে আপনাকে ক্ষমা করা হবে, কারণ এটি ম্যারাথন ইভেন্টের ঠিক শেষের দিকে এসেছিল এবং মাত্র কয়েক মিনিটের জন্য স্থায়ী হয়েছিল৷ প্রকৃত স্মার্ট চশমাগুলির নামকরণ করা হয়নি, শুধুমাত্র একটি প্রদর্শন ভিডিওতে দেখানো হয়েছে এবং সত্যিই শুধুমাত্র একটি ধারণা হিসাবে প্রকাশ করা হয়েছে৷ গুগল এমনকি আমাদেরকে ইন্টারফেসটিও দেখায়নি বা ইঙ্গিত দেয়নি যে স্মার্ট চশমাগুলি প্রকৃত পণ্য হিসাবে প্রকাশ করা হবে।

এটা করতে হবে না. গুগল স্বপ্ন বিক্রি করেছে. একটি সাধারণ জোড়া চশমার মতো পরা, লেন্সটি একটি ছোট স্ক্রীনকে অন্তর্ভুক্ত করে যা অগমেন্টেড রিয়েলিটি (AR) তে অন্য ভাষার রিয়েল-টাইম অনুবাদ দেখায়, তাই এটি আপনি সাধারণত যা দেখেন তা ওভারলে করে। গুগল প্রোডাক্ট ম্যানেজার ম্যাক্স স্পিয়ার কার্যকারিতাটি নিখুঁতভাবে তুলে ধরেছেন, বলেছেন যে এটি “বিশ্বের জন্য সাবটাইটেল” এর মতো। আপনার মতো একই ভাষায় কথা বলতে পারে না এমন একজনের বিপরীতে বসে থাকা, চশমাটি কথোপকথনের একটি পাঠ্য-ভিত্তিক অনুবাদ প্রদান করবে যেমনটি ঘটে।

আপনি হয়ত ভাবছেন যে এটি অন্যান্য অনুবাদ প্রযুক্তির মতো – গুগলের পিক্সেল বাড আছে একটি অনুবাদ বৈশিষ্ট্য, উদাহরণস্বরূপ — তবে এখানে কিছু স্বতন্ত্র সুবিধা রয়েছে। শুরুতে, একজোড়া চশমার ভিতরে একটি স্ক্রিনে পাঠ্য দেখার অর্থ হল আপনি চোখের যোগাযোগ বজায় রাখতে পারেন, আপনি বোতাম না টিপে বা দীর্ঘ, বিশ্রী নীরবতা অনুসরণ করতে পারেন কারণ একটি মেশিন যা বলা হচ্ছে তা অনুবাদ করে। টেক্সট অন্য ভয়েস শোনার চেয়ে কম অনুপ্রবেশকারী, এবং যেহেতু কেউ অনুবাদ শোনে না, এটি অপ্রাকৃতিক মনে হয় না।

সম্ভাব্য ব্যবহার

যে কেউ বিদেশ ভ্রমণ করেছেন, বা এমন সম্প্রদায়ে সময় কাটিয়েছেন যেখানে ভাষা আলাদা, তারা তাৎক্ষণিকভাবে বুঝতে পারবেন যে এই ধরনের প্রযুক্তি কীভাবে উপকারী হবে। যারা চশমা পরীক্ষা করছেন তাদের মুখের আনন্দের কারণেই আমি কাঁপতে কাঁপতে কাঁপতে ছিলাম না, কারণ আমি অবিলম্বে ভেবেছিলাম যে একই প্রযুক্তিতে অ্যাক্সেস থাকলে আমার নিজের জীবন কতবার বদলে যেত।

আমার মনে আছে জাপানে এক বন্ধুর সাথে রাতের খাবার খেয়েছি, এবং যদিও আমাদের দুজনেরই একে অপরের ভাষার মৌলিক কমান্ড ছিল, কথোপকথনটি প্রবাহিত হতে পারেনি। আমরা একটি ফোনে Google অনুবাদ ব্যবহার করে শেষ করেছি এবং অ্যাপের মাধ্যমে ভয়েস ব্যবহার করার পরিবর্তে টাইপ করেছি কারণ পরিবেশটি বেশ কোলাহলপূর্ণ ছিল। এটি কাজ করেছিল এবং বেশ মজার ছিল, কিন্তু এটি নিখুঁত ছিল না এবং মাঝে মাঝে বেশ বিশ্রী ছিল। স্মার্ট চশমা সেই অবস্থাকে পুরোপুরি বদলে দিত।

আমি অনেক বছর ধরে গ্রীসে বাস করেছি, এবং যদিও আমি গ্রীক ভাষার ন্যায্য পরিমাণ বুঝতে পারি, আমি এটি মোটেও ভাল বলতে পারি না। আমি ভাবছি কিভাবে গুগলের স্মার্ট চশমা এবং অনুবাদ ব্যবস্থা সেখানে আমার সময় পরিবর্তন করবে? কিন্তু, যেহেতু আমি এই উভয় পরিস্থিতি এবং অন্য অনেকগুলি সম্পর্কে আশ্চর্য হয়েছি যেখানে আমি ব্যক্তিগতভাবে এসেছি যেখানে স্মার্ট চশমা সত্যিই সহায়ক হতে পারে, আমি দ্রুত সেই বড় বাধায় পৌঁছে যাই যা শুধুমাত্র গুগলের প্রোটোটাইপ চশমা নয়, যে কোনও পরিধানযোগ্য অনুবাদ প্রযুক্তি।

যেকোনও পরিধানযোগ্য ডিভাইসের সাথে সমস্যা হল যে দু’জন লোকের জন্য ভিজ্যুয়াল অনুবাদ প্রদান করে যারা বিভিন্ন ভাষায় কথা বলে যে সমস্ত পক্ষের তাদের একটির মালিক হওয়া এবং পরতে হবে। কথোপকথনগুলি দ্বিমুখী জিনিস, এবং যদি আপনার মধ্যে কেবল একজনই বুঝতে পারে যে কী বলা হচ্ছে, তবে এটি কেবলমাত্র সেই পরিস্থিতিতে কার্যকর হয় যেখানে প্রতিক্রিয়ার প্রয়োজন হয় না। সুতরাং, আমার পরিস্থিতির জন্য এটিকে কার্যকর করতে, জাপান এবং গ্রীসে আমার পরিচিত প্রত্যেককে গুগলের অনুবাদ প্রযুক্তি সহ স্মার্ট চশমা পরতে হবে। মনে হচ্ছে যে … অসম্ভাব্য.

যেখানে তারা সব পক্ষ ছাড়াই কাজ করবে তা অনুবাদের জন্য নয়, প্রতিলিপির জন্য। এই ধরনের ভিজ্যুয়াল ট্রান্সক্রিপশন এবং বর্ধিতকরণ বধির বা শ্রবণশক্তি কম লোকদের জন্য স্পষ্টভাবে জীবন-পরিবর্তনকারী হতে পারে। আমার বাবা শ্রবণযন্ত্র ব্যবহার করেন, কিন্তু আমি জানি তিনি শব্দগুলি “দেখতে” উপকৃত হবেন, এবং কিছু পরিস্থিতিতে শ্রবণযন্ত্রের সাথে আসা বিরক্তিকর অডিও প্রতিক্রিয়া মিস করবেন না। এটি আমাকে মনে করিয়ে দেয় যে eSight স্মার্ট চশমার মতো রূপান্তরকারী পণ্যগুলি অন্ধ এবং আংশিকভাবে দৃষ্টিশক্তিসম্পন্ন ব্যক্তিদের জন্য কতটা।

সম্ভবত Google Glass 2 নয়

যতটা আমি ভাবতে চাই যে আমরা Google Glass 2 এর একটি প্রাথমিক সংস্করণ দেখছি, আমি মনে করি না আমরা তা। পরিবর্তে, আমরা এর অনুবাদ এবং ট্রান্সক্রিপশন প্রযুক্তির গতি এবং নির্ভুলতায় Google এর দ্রুত অগ্রগতির একটি আশ্চর্যজনক প্রদর্শন দেখেছি।

গুগলের এআর স্মার্টগ্লাস অনুবাদ বৈশিষ্ট্য প্রদর্শিত হয়েছে।

Google I/O 2022-এর সময় Google-এর ভাষা দক্ষতার উন্নতির আরও কয়েকটি উদাহরণ ছিল। এটি ঘোষণা করা হয়েছিল যে আরও 24টি ভাষা সারা বিশ্বের 300 মিলিয়ন নতুন লোকেদের পরিষেবা দেওয়ার জন্য Google অনুবাদে যুক্ত করা হয়েছে৷ এটি মোট 133টি সমর্থিত ভাষায় নিয়ে যায় এবং জিরো-শট মেশিন ট্রান্সলেশন নামে একটি নতুন এআই সিস্টেম দ্বারা সম্ভব হয়েছে, যা সেই তথ্যের উৎস সীমিত হলেও বিদ্যমান জ্ঞান এবং নতুন তথ্যের সংমিশ্রণের মাধ্যমে নতুন ভাষা শেখে।

Google-এর AI প্রাকৃতিক ভাষা বোঝার ক্ষেত্রে এবং সাধারণভাবে এটি যেভাবে ব্যবহার করা হয়, যেমন Nest Hub Max-এর লুক অ্যান্ড টক ফিচার বোঝার ক্ষেত্রে আরও ভাল হয়ে উঠছে, যা I/O 2022-এর সময়েও ঘোষণা করা হয়েছিল। Google Pixel 6-এর সাথে যে কেউ Google ব্যবহার করে দেখেন। বার্তার উত্তরে আপনার ভয়েস প্রতিলিপি করার বা লাইভ অনুবাদ সহ ভিডিও দেখার সহকারীর ক্ষমতা। উভয়ই দ্রুত, এবং বিশেষ করে বার্তার উত্তরের ক্ষেত্রে, চমকপ্রদভাবে সঠিক।

আমি প্রতিদিন বিভিন্ন ডিভাইসে Google অনুবাদ ব্যবহার করি, সাধারণত জাপানি, কোরিয়ান এবং চীনা থেকে ইংরেজিতে অনুবাদ করি। এগুলি করা খুব চ্যালেঞ্জিং, এবং কথোপকথনে এগুলি কার্যকরভাবে ব্যবহার করার জন্য ভাষা কীভাবে কাজ করে সে সম্পর্কে জ্ঞানের প্রয়োজন, অন্যথায় বিব্রতকর ভুল করা হবে। শুনছি এবং এখন দেখছি যে Google কীভাবে তার অনুবাদ প্রযুক্তি উদ্ভাবন করছে এবং উন্নত করছে তার মানে আমার বিশ্ব আরও বেশি উন্মুক্ত হচ্ছে, এবং আমি মনে করি এটি ধীরে ধীরে সেই ভাষাগুলি শেখাকে আরও সহজ করে তুলবে।

একজোড়া স্মার্ট চশমার মাধ্যমে Google-এর উন্নত ভাষা এবং অনুবাদ প্রযুক্তিকে একীভূত করা অত্যন্ত শক্তিশালী। যদি আমি অবিলম্বে বুঝতে পারি যে সুবিধাগুলি আমার এবং আমার কাছের লোকদের জন্য নিয়ে আসবে, আমি কেবলমাত্র সেই উত্তেজনা বুঝতে শুরু করতে পারি যে কেউ শুনতে পায় না। আপনি পিক্সেল 7 এবং পিক্সেল ওয়াচ রাখতে পারেন — এই ধরনের অবিশ্বাস্য ভবিষ্যত প্রযুক্তির প্রদর্শনের কারণেই আমি দুই ঘণ্টারও বেশি Google I/O মূল প্রেজেন্টেশনের মধ্য দিয়ে বসে থাকি, এবং আমি বুঝতে শুরু করি যে এটি কতটা সম্ভাব্য রূপান্তর হতে পারে আমার পুরস্কার

সম্পাদকদের সুপারিশ




Leave a Reply

Your email address will not be published.