Google ra mắt phiên bản Gemini 1.5: Cải tiến đáng chú ý và cửa sổ ngữ cảnh lớn hơn

Google vừa công bố phiên bản kế tiếp của mô hình ngôn ngữ lớn Gemini với nhiều cải tiến đáng chú ý. Phiên bản Gemini 1.5 có cửa sổ ngữ cảnh lớn hơn, cho phép xử lý truy vấn lớn hơn và xem xét nhiều thông tin hơn cùng một lúc. Đây được coi là một bước đột phá lớn và hữu ích cho doanh nghiệp.

Google giới thiệu Gemini 1.5: Cải tiến đáng chú ý và cửa sổ ngữ cảnh lớn hơn

Google ra mắt phiên bản Gemini 1.5: Cải tiến đáng chú ý và cửa sổ ngữ cảnh lớn hơn - 1872361841

( Ảnh: Theverge )

Google vừa công bố phiên bản kế tiếp của mô hình ngôn ngữ lớn Gemini chỉ sau hai tháng ra mắt. Phiên bản Gemini 1.5 sẽ được ra mắt trước cho các nhà phát triển và doanh nghiệp trước khi được tung ra cho người dùng cuối. Google đã rõ ràng thể hiện quyết tâm sử dụng Gemini như một công cụ kinh doanh, một trợ lý cá nhân và nhiều hơn thế nữa.

Google ra mắt phiên bản Gemini 1.5: Cải tiến đáng chú ý và cửa sổ ngữ cảnh lớn hơn - -1671411046

( Ảnh: Theverge )

Gemini 1.5 có nhiều cải tiến đáng chú ý. Phiên bản Gemini 1.5 Pro, một mô hình phổ dụng trong hệ thống của Google, được cho là tương đương với phiên bản cao cấp Gemini Ultra mà công ty chỉ mới ra mắt gần đây, và nó đã vượt trội hơn phiên bản Gemini 1.0 Pro trên 87% các bài kiểm tra chuẩn.

Mô hình này được tạo ra bằng phương pháp phổ biến ngày càng nhiều được biết đến là "Mixture of Experts" (MoE), có nghĩa là nó chỉ chạy một phần của mô hình tổng thể khi bạn gửi một truy vấn, thay vì xử lý toàn bộ mô hình mọi lúc. Phương pháp này sẽ làm cho việc sử dụng mô hình nhanh hơn đối với người dùng và hiệu quả hơn cho Google trong việc vận hành.

Tuy nhiên, có một điểm mới trong Gemini 1.5 khiến cả công ty, bắt đầu từ CEO Sundar Pichai, đều rất hào hứng: Gemini 1.5 có một cửa sổ ngữ cảnh rất lớn, có nghĩa là nó có thể xử lý các truy vấn lớn hơn và xem xét nhiều thông tin hơn cùng một lúc. Cửa sổ này có đến 1 triệu "tokens", so với 128.000 "tokens" của GPT-4 của OpenAI và 32.000 "tokens" của Gemini Pro hiện tại.

Trong quá trình giải thích cho tôi, Pichai nói thêm rằng bạn có thể đưa cả bộ ba "Chúa tể của những chiếc nhẫn" vào cửa sổ ngữ cảnh đó. Điều này nghe có vẻ quá cụ thể, vì vậy tôi hỏi ông: điều này đã xảy ra rồi, phải không? Có ai đó trong Google chỉ đang kiểm tra xem Gemini có phát hiện ra lỗi liên tục, cố gắng hiểu về dòng họ phức tạp của Trung Địa và xem xem có thể AI cuối cùng có thể hiểu được Tom Bombadil hay không. "Tôi chắc chắn đã xảy ra," Pichai nói với một tiếng cười, "hoặc sẽ xảy ra - một trong hai."

Pichai cũng cho rằng cửa sổ ngữ cảnh lớn hơn sẽ rất hữu ích cho doanh nghiệp. "Điều này cho phép các trường hợp sử dụng mà bạn có thể thêm nhiều ngữ cảnh cá nhân và thông tin trong thời điểm của truy vấn," ông nói. "Hãy nghĩ về việc chúng tôi đã mở rộng cửa sổ truy vấn một cách đáng kể."

Ông tưởng tượng các nhà làm phim có thể tải lên toàn bộ phim của họ và hỏi Gemini những gì các nhà phê bình có thể nói; ông thấy các công ty sử dụng Gemini để xem xét hàng loạt hồ sơ tài chính. "Tôi xem đây là một trong những bước đột phá lớn nhất chúng tôi đã thực hiện," ông nói.

Hiện tại, Gemini 1.5 chỉ sẽ có sẵn cho người dùng doanh nghiệp và nhà phát triển thông qua Vertex AI và AI Studio của Google. Cuối cùng, nó sẽ thay thế Gemini 1.0, và phiên bản tiêu chuẩn của Gemini Pro - phiên bản có sẵn cho tất cả mọi người tại gemini.google.com và trong các ứng dụng của công ty - sẽ là Gemini 1.5 Pro với cửa sổ ngữ cảnh 128.000 "tokens". Bạn sẽ phải trả thêm để có được 1 triệu "tokens". Google cũng đang kiểm tra tính an toàn và đạo đức của mô hình, đặc biệt là với cửa sổ ngữ cảnh lớn hơn mới.

Google đang trong cuộc đua với thời gian để xây dựng công cụ trí tuệ nhân tạo tốt nhất hiện nay, khi các doanh nghiệp trên toàn thế giới đang cố gắng tìm hiểu chiến lược trí tuệ nhân tạo riêng của họ - và xem liệu họ nên ký hợp đồng với OpenAI, Google hay ai khác. Ngay trong tuần này, OpenAI đã công bố tính năng "bộ nhớ" cho ChatGPT và có vẻ như họ đang chuẩn bị cho một đợt tấn công vào tìm kiếm web.

Cho đến nay, Gemini có vẻ ấn tượng, đặc biệt là đối với những người đã sử dụng hệ sinh thái của Google, nhưng còn rất nhiều công việc phải làm trên cả hai bên.

Cuối cùng, Pichai nói với tôi rằng tất cả những phiên bản 1.0 và 1.5 và Pro và Ultra và những cuộc chiến doanh nghiệp này sẽ không thực sự quan trọng đối với người dùng. "Mọi người chỉ đang tiêu thụ các trải nghiệm," ông nói. "Đó giống như sử dụng một chiếc điện thoại thông minh mà không luôn quan tâm đến bộ xử lý bên dưới." Nhưng vào lúc này, ông nói, chúng ta vẫn đang ở giai đoạn mà mọi người đều biết chip bên trong điện thoại của mình, vì nó quan trọng. "Công nghệ cơ bản đang thay đổi nhanh chóng," ông nói. "Mọi người quan tâm."

Đăng nhận xét

Mới hơn Cũ hơn