Công ty XAI vừa giới thiệu Grok Vision, tính năng cho phép người dùng tương tác trực tiếp với thế giới xung quanh chỉ bằng máy ảnh trên điện thoại. Chính thức ra mắt vào khoảng ngày 23 tháng 4, Grok Vision hiện có sẵn miễn phí trên ứng dụng iOS và với người dùng Android, nó sẽ phải nâng cấp lên phiên bản Supergrok để trải nghiệm.
Tính năng mới Grok Vision
Grok Vision cung cấp khả năng phân tích hình ảnh trong thời gian thực, giúp người dùng chỉ cần hướng camera điện thoại vào một vật thể, văn bản hoặc phong cảnh và đặt câu hỏi như “Đây là gì?” Để có được một câu trả lời ngay lập tức. Được hỗ trợ bởi công nghệ hình ảnh máy tính tiên tiến, Grok Vision tự mình cạnh tranh trực tiếp với các đối thủ lớn như Openai và Google Gemini.
Khả năng của Grok Vision không giới hạn ở nhận dạng đối tượng, mà còn phân tích các tài liệu, biểu đồ và thậm chí cho thấy các công thức nấu ăn từ các bức ảnh thô. Ví dụ, khi chụp ảnh một món ăn, Grok Vision sẽ cung cấp thông tin dinh dưỡng hoặc chế biến. Điều này mở ra tiềm năng lớn trong nhiều lĩnh vực như giáo dục, sức khỏe và thương mại điện tử.
Gần đây, XAI cũng đã tích hợp một số cải tiến nổi bật vào Grok:
- Deepersearch: Tính năng này giúp người dùng cải thiện hơn nữa khả năng tìm thông tin và dữ liệu với chi tiết cực kỳ cao
- Bộ nhớ hội thoại: Tính năng này giúp Grok ghi nhớ chi tiết từ các cuộc hội thoại trước đó, mang lại trải nghiệm cá nhân hóa và thông minh hơn.
Những cải tiến này cho thấy rõ mục tiêu của XAI trong việc biến Grok thành một trợ lý AI đa năng và gần gũi với người dùng.
Với Grok Vision, XAI đang tham gia vào cuộc thi khốc liệt với “lớn” của công nghệ AI. Phân tích hình ảnh thực sự thông qua máy ảnh không chỉ thuận tiện mà còn mở rộng khả năng ứng dụng thực tế, từ giáo dục hình ảnh đến phân tích hình ảnh y tế hỗ trợ.
https://www.youtube.com/watch?v=gsDaigy85V4
>
Ý kiến bạn đọc (0)