گوگل به تازگی از انتشار مدل هوش مصنوعی Gemini 3.5 Live Translate پرده برداشته است؛ ابزار قدرتمندی که به زودی با اضافه شدن به سرویسهای گوگل میت و گوگل ترنسلیت، تجربه ترجمه همزمان و زنده مکالمات صوتی را به سطحی کاملاً جدید ارتقا میدهد.
به گفته گوگل، Gemini 3.5 Live Translate میتواند بهطور خودکار بیش از ۷۰ زبان را شناسایی کند. این مدل همچنین میتواند ترجمههایی با صدای طبیعی تولید کند که لحن، سرعت و گام صدای گوینده در آنها حفظ شده است. علاوهبراین، برعکس سیستمهای نوبتی که منتظر میمانند تا صحبتهای گوینده تمام شود، این مدل میتواند بهطور همزمان گفتار گوینده را ترجمه کند.
گوگل این مدل را در دو دمو به نمایش گذاشته است. دموی اول تجربه دوبله زنده را نشان میدهد که در آن یک ویدیو بهصورت همزمان به زبان دیگری ترجمه میشود. درهمینحال، دموی دوم بر ترجمه سخنرانیها و ارائهها به چندین زبان تمرکز دارد که نتایج هر دو بسیار چشمگیر است.
قابلیتهای جدید Gemini 3.5 Live Translate در گوگل میت و ترنسلیت
گوگل اعلام کرده که Gemini 3.5 Live Translate به گوگل میت اضافه خواهد شد. این قابلیت پس از عرضه، پشتیبانی از بیش از ۷۰ زبان را به همراه خواهد داشت که پیشرفتی بزرگ نسبت به محدودیت فعلیِ تنها ۵ زبان محسوب میشود. یکی دیگر از نکات برجسته این است که امکان ترکیب بیش از ۲۰۰۰ زبان را در یک جلسه فراهم میکند؛ درحالیکه پیش از این، ترجمه گفتار در گوگل میت تنها به زبان انگلیسی یا از زبان انگلیسی انجام میشد. گوگل همچنین قصد دارد رابط کاربری گوگل میت را بهروزرسانی کند تا بتوانید سریعتر به ترجمه گفتار دسترسی داشته باشید.
نسخه بهبودیافته ترجمه گفتار در گوگل میت در ابتدا بهصورت پیشنمایش خصوصی برای مشتریان تجاری منتخب Google Workspace عرضه خواهد شد. غول فناوری سپس آن را در اواخر سال جاری میلادی برای کاربران بیشتری توسعه میدهد.
مدل Gemini 3.5 Live Translate همچنین به صورت جهانی برای برنامه ترنسلیت در اندروید و iOS عرضه میشود. همراه با این انتشار، گوگل یک «حالت شنیداری» جدید را نیز برای اندروید معرفی کرده است. این حالت جدید نرمافزار علاوهبر امکان گوش دادن به ترجمههای زنده از طریق هدفون، قابلیت شنیدن مستقیم ترجمهها از طریق بلندگوی گوشی را هم فراهم میکند.
مانند تمام محتواهای تولیدشده توسط هوش مصنوعی، صدای ایجادشده توسط Gemini 3.5 Live Translate با SynthID علامتگذاری خواهد شد. فناوری SynthID یک واترمارک نامرئی است که برای جلوگیری از انتشار اطلاعات نادرست استفاده میشود. گوگل میگوید این واترمارک بهطور مستقیم در خروجی صوتی تعبیه خواهد شد.
نظرات کاربران