Không cần biết ngoại ngữ, bạn vẫn có thể trò chuyện với người nước ngoài nhờ tính năng này
Trong nhiều năm qua, các ứng dụng dịch thuật đã giúp việc giao tiếp với người nước ngoài trở nên dễ dàng hơn. Tuy nhiên, phần lớn vẫn tồn tại một hạn chế quen thuộc: người này phải nói xong, hệ thống mới bắt đầu dịch cho người kia nghe. Với Gemini 3.5 Live Translate, Google đang tìm cách thay đổi điều đó.
Tôi vẫn nhớ những lần sử dụng Google Dịch khi đi du lịch hoặc trao đổi với đối tác nước ngoài. Dù khá hữu ích, nhưng cuộc hội thoại thường diễn ra theo kiểu ngắt quãng. Một người nói, chờ dịch, rồi đến lượt người còn lại phản hồi. Cảm giác giống như đang nói chuyện thông qua một chiếc máy hơn là một cuộc trò chuyện bình thường.
Gemini 3.5 Live Translate được phát triển để giải quyết chính vấn đề này. Theo Google, mô hình có thể dịch giọng nói theo thời gian thực trên hơn 70 ngôn ngữ, trong đó có tiếng Việt. Thay vì đợi người nói kết thúc hoàn toàn, hệ thống bắt đầu xử lý và tạo bản dịch gần như ngay lập tức, giúp cuộc hội thoại diễn ra tự nhiên hơn.
Điều khiến tôi chú ý không nằm ở số lượng ngôn ngữ được hỗ trợ, mà ở cách Google cố gắng giữ lại ngữ điệu, nhịp điệu và cảm xúc của người nói. Đây là chi tiết tưởng nhỏ nhưng lại quyết định trải nghiệm thực tế. Một bản dịch chính xác chưa chắc đã tạo cảm giác tự nhiên nếu giọng đọc quá máy móc hoặc mất đi cảm xúc ban đầu.
Google đang đưa Gemini 3.5 Live Translate lên ứng dụng Google Translate dành cho Android và iPhone. Chỉ cần mở tính năng dịch trực tiếp, người dùng có thể bắt đầu cuộc trò chuyện với người nói ngôn ngữ khác mà không cần chuyển đổi qua lại giữa nhiều màn hình hay ứng dụng.
Nếu sử dụng cùng tai nghe Bluetooth, trải nghiệm còn gần với một cuộc trò chuyện thông thường hơn. Bản dịch được đọc lại ngay trong tai nghe, trong khi người đối diện vẫn nghe ngôn ngữ của họ. Trên Android, Google còn bổ sung chế độ Listening Mode, cho phép người dùng nghe bản dịch qua loa thoại bằng cách đưa điện thoại lên tai như đang thực hiện một cuộc gọi.
Tôi cho rằng giá trị lớn nhất của công nghệ này nằm ở những tình huống rất đời thường. Một du khách hỏi đường tại Tokyo, một tài xế công nghệ đón khách nước ngoài, hay một cuộc họp trực tuyến giữa các thành viên đến từ nhiều quốc gia khác nhau. Những rào cản ngôn ngữ vốn tồn tại từ lâu đang dần được AI xử lý theo cách ít gây chú ý hơn trước.
Google cho biết Gemini 3.5 Live Translate cũng sẽ xuất hiện trên Google Meet và hỗ trợ hơn 2.000 cặp ngôn ngữ khác nhau trong các cuộc họp trực tuyến. Trong khi đó, Grab đang thử nghiệm công nghệ này để hỗ trợ giao tiếp giữa tài xế và hành khách sử dụng ngôn ngữ khác nhau.
Dĩ nhiên, sẽ còn cần thời gian để đánh giá độ chính xác trong những tình huống phức tạp, đặc biệt với tiếng lóng, phương ngữ hoặc môi trường nhiều tiếng ồn. Nhưng nếu những gì Google trình diễn phản ánh đúng trải nghiệm thực tế, Gemini 3.5 Live Translate có thể là một trong những ứng dụng AI hữu ích nhất đối với người dùng phổ thông trong năm nay.
Bởi suy cho cùng, điều nhiều người mong đợi ở AI không phải những màn trình diễn ấn tượng, mà là khả năng giúp chúng ta giao tiếp với nhau dễ dàng hơn. Và đây có lẽ là một trong những bước tiến gần nhất đến mục tiêu đó.




