Điều chưa biết về cuộc đua AI tại Đông Nam Á


Cuộc đua phát triển trí tuệ nhân tạo (AI) tại Đông Nam Á đang là một trong những cuộc chạy đua đáng chú ý.

Giám đốc điều hành Microsoft Satya Nadella công bố việc mở trung tâm dữ liệu mới tại Thái Lan. Ảnh: Reuters
Giám đốc điều hành Microsoft Satya Nadella công bố việc mở trung tâm dữ liệu mới tại Thái Lan. Ảnh: Reuters

Bản báo cáo mới của Liên hợp quốc vừa được công bố cho thấy sự quan tâm của thế giới đối với AI đang ngày một gia tăng. Theo đó, hầu hết sự chú ý tập trung vào Mỹ và Trung Quốc, nơi có nhiều nhà phát triển mô hình AI hàng đầu thế giới. Các khu vực khác cũng nhận được sự chú ý đáng kể, từ châu Âu đến các nước khu vực Trung Đông như Saudi Arabia và Các Tiểu vương quốc Ả Rập Thống nhất nhằm thu hút các công ty khởi nghiệp mới đến Vùng Vịnh. ​​

Tuy nhiên, có một khu vực chưa nhận được nhiều sự quan tâm trên toàn cầu là Đông Nam Á. Hiệp hội các quốc gia Đông Nam Á (ASEAN) đang âm thầm trở thành điểm nóng mới nổi về AI.

Thông qua các công ty trong nước, cùng với yếu tố địa chính trị và sự tham gia của các công ty nước ngoài, cuộc đua AI ở Đông Nam Á mang đến những bài học độc đáo mà các nhà hoạch định chính sách, nhà đầu tư và chuyên gia công nghệ toàn cầu nên theo dõi chặt chẽ.

Đông Nam Á hiện là một trong những khu vực quan trọng nhất về mặt kinh tế trên thế giới. Nếu cộng lại, GDP của ASEAN sẽ là nền kinh tế lớn thứ năm thế giới. Tầng lớp trung lưu của khu vực này bao gồm khoảng 200 triệu người, gần bằng 2/3 tổng dân số Hoa Kỳ.

Đến năm 2050, Indonesia được dự đoán sẽ là nền kinh tế lớn thứ tư thế giới, trong khi GDP tính riêng của Philippines, Thái Lan và Malaysia có thể vượt quá 1 nghìn tỷ USD.

Với sức nặng kinh tế, khu vực này đang trở thành thị trường hấp dẫn đối với các công ty công nghệ toàn cầu. Tuy nhiên, Đông Nam Á có đặc điểm khu vực độc đáo khiến việc sử dụng AI trở nên khó khăn hơn. Khu vực này có 9 ngôn ngữ chính thức, nghĩa là các mô hình AI dành cho khu vực này phải có khả năng đa ngôn ngữ mạnh mẽ.

Mặc dù có nhu cầu lớn, nhưng theo Sarosh Nagar, nhà nghiên cứu tại University College London, kiến thức nền và ngôn ngữ Đông Nam Á bị thiếu hụt trong các tập dữ liệu mà nhiều mô hình AI của phương Tây được đào tạo.

Chuyên gia này chỉ ra, chỉ có 0,5% tập dữ liệu đào tạo cho mô hình ngôn ngữ lớn Llama 2 (LLM) của Meta bao gồm các ngôn ngữ Đông Nam Á, mặc dù khu vực này chiếm 8,45% dân số toàn cầu.

Do những hạn chế này, người dùng Đông Nam Á nhận thấy rằng khi họ nhập văn bản tiếng Thái hoặc tiếng Bahasa Indonesia vào các mô hình ngôn ngữ lớn, nhiều LLM trả về những phản hồi không hữu ích, thường là bằng tiếng Anh.

Điều này mở ra cơ hội cho những công ty xây dựng LLM riêng cho khu vực. Dẫn đầu là Singapore, mô hình đầu tiên của quốc gia này, SEA-LION LLM, có 13% tập dữ liệu được đào tạo bằng các ngôn ngữ Đông Nam Á. Jasmine Group của Thái Lan, một công ty công nghệ truyền thông lớn, cũng được cho là đang nỗ lực xây dựng một LLM tiếng Thái.

Trong khi đó, công ty khởi nghiệp Yellow.ai của Indonesia đã xây dựng Komodo-7B, một LLM được đào tạo bằng tiếng Bahasa Indonesia và 11 ngôn ngữ khác trong khu vực, dựa trên mô hình Llama-2 nguồn mở của Meta.

Theo Sergio Imparato, giảng viên của Đại học Harvard, không giống như hầu hết các công ty ở Mỹ và Trung Quốc, một số công ty AI hàng đầu Đông Nam Á không phải là công ty tư nhân thuần túy. Ví dụ, AI Singapore là liên minh công-tư giữa các công ty khởi nghiệp AI và các tổ chức nghiên cứu công.

"Nếu các bên thành công trong việc xây dựng các LLM khu vực hiện đại đạt được sức hút đáng kể, điều này sẽ mang đến kinh nghiệm về thúc đẩy mối quan hệ hợp tác công-tư mang lại lợi ích trong việc xây dựng các hệ thống AI tiên tiến", chuyên gia này phân tích.

Hơn nữa, nếu các LLM trong khu vực thu hút được nhiều sự chú ý hơn so với các LLM của Mỹ hoặc Trung Quốc, điều này có thể khuyến khích sự phát triển của các mô hình LLM mang văn hóa riêng ở các khu vực khác trên thế giới.

Tuy nhiên, Đông Nam Á đang chứng kiến ​​sự cạnh tranh đáng kể giữa các công ty Hoa Kỳ và Trung Quốc để đáp ứng nhu cầu của khu vực. Ví dụ, Học viện DAMO của Alibaba gần đây đã ra mắt SeaLLM, một mô hình mới tập trung vào các ngôn ngữ Đông Nam Á. Trong khi đó, Amazon Web Services có kế hoạch thêm Malaysia vào một trong những thị trường mới của mình trong năm nay.

Ngoài Mỹ và Trung Quốc, một quốc gia khác, như Nhật Bản... cũng đang thâm nhập vào Đông Nam Á. Vào tháng 7, Thủ tướng Nhật Bản Kishida Fumio đã khởi động quan hệ đối tác công - tư để hỗ trợ các công ty Nhật Bản phát triển LLM cho Đông Nam Á.

Sự cạnh tranh này rất quan trọng. AI là một lĩnh vực đòi hỏi vốn đầu tư lớn, vì vậy các công ty tạo ra được doanh thu lớn trong khu vực sẽ được trang bị tốt hơn để trang trải chi phí đắt đỏ cho việc phát triển mô hình ngôn ngữ lớn và thúc đẩy những tiến bộ mạnh mẽ trong lĩnh vực này.

Theo Cẩm Anh/Diendandoanhnghiep.vn