Sự bùng nổ của trí tuệ nhân tạo đang đẩy các trung tâm dữ liệu đến giới hạn về băng thông và điện năng, buộc hạ tầng mạng phải chuyển dịch từ kết nối điện sang quang học ở cấp độ sâu hơn.

Trong hành trình đó, một thành phần quan trọng từng bị thiếu chính là laser tích hợp trực tiếp vào hệ thống. Giờ đây, bước ngoặt đã xuất hiện khi Scintil Photonics hợp tác cùng Tower Semiconductor để sản xuất bộ phát quang DWDM đơn chip đầu tiên phục vụ riêng cho hạ tầng AI.
Cốt lõi của công nghệ này là DWDM, một phương pháp cho phép nhiều tín hiệu quang, mỗi tín hiệu mang một bước sóng khác nhau, cùng truyền trên một sợi cáp. Điều này không chỉ giúp tăng đáng kể dung lượng truyền dữ liệu mà còn giảm độ trễ và mức tiêu thụ năng lượng, hai yếu tố then chốt trong các hệ thống AI quy mô lớn. Dù khái niệm ghép kênh quang đã tồn tại từ lâu trong ngành viễn thông, việc đưa nó vào môi trường trung tâm dữ liệu AI lại đặt ra những yêu cầu hoàn toàn khác.
Thách thức nằm ở việc các hệ thống AI hiện đại hoạt động giống như những siêu máy tính khổng lồ, nơi hàng chục hoặc hàng trăm GPU phải phối hợp chặt chẽ như một thực thể duy nhất. Điều này đặc biệt đúng với mạng scale-up, nơi các bộ xử lý cần giao tiếp trực tiếp với nhau với độ trễ cực thấp. Trong khi kết nối quang đã được áp dụng thành công ở mạng scale-out để liên kết các cụm lớn, việc đưa quang học tiến gần đến từng chip xử lý vẫn là một bài toán khó, chủ yếu do chưa thể tích hợp laser một cách hiệu quả vào quy trình sản xuất silicon.
Giải pháp của Scintil nằm ở công nghệ tích hợp quang học dị thể, cho phép kết hợp các vật liệu bán dẫn khác nhau lên cùng một nền silicon. Bằng cách gắn các mảnh vật liệu phát quang lên wafer silicon tại những vị trí chính xác, họ tạo ra các laser trực tiếp trên chip mà không cần thay đổi toàn bộ quy trình sản xuất. Nhờ đó, hệ thống có thể tạo ra nhiều bước sóng ổn định với độ chính xác cao, đáp ứng yêu cầu khắt khe của truyền dữ liệu tốc độ cao.
Thành quả là một mạch tích hợp quang có khả năng phát đồng thời nhiều kênh tín hiệu trên mỗi sợi quang. Thay vì dồn toàn bộ dữ liệu vào một kênh tốc độ cực cao, công nghệ này phân bổ dữ liệu thành nhiều luồng nhỏ hơn chạy song song. Cách tiếp cận này không chỉ tăng tổng dung lượng mà còn cải thiện hiệu suất năng lượng, đồng thời giảm áp lực lên từng kênh riêng lẻ.
Một lợi ích quan trọng khác là giảm độ trễ trong hệ thống. Khi mạng không theo kịp tốc độ xử lý của GPU, hiệu suất toàn hệ thống sẽ bị kéo xuống do các bộ xử lý phải chờ dữ liệu. Việc sử dụng nhiều kênh song song giúp duy trì luồng dữ liệu ổn định hơn, từ đó nâng cao hiệu suất sử dụng GPU, một yếu tố cực kỳ quan trọng trong các tác vụ AI quy mô lớn.
Trong vài năm tới, công nghệ này được kỳ vọng sẽ nhanh chóng bước vào giai đoạn thương mại hóa. Các kế hoạch sản xuất đã được đặt ra với quy mô hàng chục nghìn đơn vị, trước khi mở rộng mạnh hơn nữa để đáp ứng nhu cầu triển khai thực tế vào khoảng năm 2028. Khi đó, mạng quang đa bước sóng có thể trở thành nền tảng cốt lõi cho thế hệ trung tâm dữ liệu AI tiếp theo, nơi hiệu suất, độ trễ và năng lượng đều được tối ưu ở mức chưa từng có.