Bản cập nhật ChatGPT Voice: Tín hiệu rõ ràng về tương lai của Siri mới

Bản cập nhật giọng nói mới của ChatGPT tưởng như nhỏ, nhưng thực tế lại mang đến sự thay đổi lớn trong cách chúng ta tương tác với chatbot. Đây cũng là ví dụ rất rõ cho kiểu trải nghiệm mà Siri mới – khi Apple tung ra hoàn chỉnh – cần phải có.

ChatGPT chuyển từ văn bản sang giọng nói – và tác động của nó

Khi mới ra mắt, ChatGPT chỉ hỗ trợ văn bản. Sau đó, tính năng giọng nói xuất hiện và tạo ra hai thay đổi đáng chú ý:

1. Trải nghiệm trở nên “giống người” hơn

Dù điều này gây tranh cãi, ít nhất OpenAI đã điều chỉnh lại để chatbot không còn ưu tiên “thân thiện quá mức” mà đánh đổi độ chính xác.

2. Tăng tính tiện dụng

Nhiều tình huống dùng giọng nói nhanh và thuận tiện hơn gõ tay. Tuy nhiên, có những lúc người dùng vẫn phải quay lại chế độ văn bản – ví dụ như tạo ảnh, xem bản đồ, xem lại thông tin.

Điều bất tiện nhất là cảm giác như đang dùng hai ChatGPT khác nhau: một dành cho giọng nói và một dành cho văn bản.

Tích hợp mới: Không còn ranh giới giữa giọng nói và văn bản

Bản cập nhật mới nhất đã hợp nhất hoàn toàn hai chế độ này. Giờ đây bạn có thể:

  • Nói chuyện bằng giọng nói ngay trong một cuộc trò chuyện văn bản
  • Vừa nói vừa xem câu trả lời hiện trực tiếp
  • Xem lại toàn bộ lịch sử trò chuyện
  • Nhận phản hồi gồm cả hình ảnh, bản đồ, biểu đồ… theo thời gian thực

Đây chính xác là loại trải nghiệm “liền mạch đa phương thức” mà Siri mới cần có.

Tất nhiên, ChatGPT vẫn có lúc lỗi — ví dụ như nói rằng đã hiển thị bản đồ nhưng thực tế chưa hiển thị. Nhưng hướng đi thì đã rõ.

Siri mới muốn “lột xác”? Cần làm được những điều này

Nếu muốn thực sự cạnh tranh, Siri phải:

  • Nhận lệnh bằng giọng nói
  • Hiển thị trả lời bằng cả giọng nói, văn bản và hình ảnh
  • Cho phép người dùng thao tác qua lại giữa các chế độ
  • Hoạt động như một tác nhân thông minh điều khiển các ứng dụng trong máy

Ví dụ lý tưởng:
Chỉ cần nói “Đặt chuyến bay đầu tiên sáng mai từ Heathrow đến Las Vegas, Siri sẽ tự mở ứng dụng đặt vé bạn hay dùng và hoàn tất toàn bộ thao tác.

Đây là điều ChatGPT đang tiến rất gần, còn Siri thì vẫn… trên đường.

Liệu Apple có làm kịp?

Đây mới là câu hỏi lớn.

Apple không chỉ phải bắt kịp ChatGPT hiện tại, mà còn phải bắt kịp phiên bản tương lai của ChatGPT khi Siri mới ra mắt. Vì vậy, khả năng rất cao là Apple sẽ phải tích hợp trí tuệ nhân tạo của bên thứ ba.

Điều quan trọng là hai điểm:

1. Quyền riêng tư

Apple phải đảm bảo dữ liệu người dùng không bị sử dụng để huấn luyện mô hình AI — như cách họ đã làm khi tích hợp ChatGPT tùy chọn trong iOS.

2. Thời gian

Năm sau là hạn cuối mà người dùng có thể chờ đợi. Nếu Siri mới dựa trên công nghệ của ChatGPT, Gemini hay bất cứ ai, điều đó không quá quan trọng — miễn là nó hoạt động đủ tốt.

Bình luận

0 Nhận xét