Nhu cầu về tốc độ cao hơn, phát triển mạng AI và hiệu quả năng năng đang thúc đẩy những tiến bộ trong công nghệ mạng quang.
Khi các mạng doanh nghiệp lớn và quy mô xử lý lượng công việc AI ngày càng lớn và các ứng dụng khác yêu cầu hiệu suất băng thông cao, nhu cầu về công nghệ kết nối quang học cũng đang tăng lên.
Ông Bill Gartner, phó chủ tịch cấp cao kiêm tổng giám đốc nhóm Fiber của Cisco cho biết: “Về cơ bản, quang học là loại công nghệ kết nối duy nhất có thể cung cấp dung lượng mà các tổ chức yêu cầu, trên khoảng cách cần thiết, để kết nối trung tâm dữ liệu, máy chủ, bộ định tuyến, bộ chuyển mạch và tất cả các thành phần phân tán tạo nên kiến trúc mạng ngày nay”.
Nhưng việc sử dụng nhiều cáp quang trong mạng cũng có những thách thức riêng.
Các nhà cung cấp đang lên kế hoạch chuyển sang tốc độ cao hơn một cách hiệu quả và bền vững như Ethernet 400G, Ethernet 800G, v.v…, đồng thời họ cũng đang nỗ lực phát triển các công nghệ tiên tiến để hỗ trợ mạng AI. Các nỗ lực phát triển các công nghệ tiết kiệm năng lượng hơn cho mạng quang và giao diện cũng đang được tiến hành.
Bộ chuyển mạch mạch quang hiện đang được cung cấp hoặc phát triển bởi các nhà cung cấp bao gồm Cisco, Calient Networks, Broadcom, Nvidia và Telescent. Google cũng đang phát triển nền tảng chuyển mạch mạch quang của riêng mình có tên là Apollo. Mặc dù nhu cầu hỗ trợ băng thông và tốc độ cao là rất quan trọng, nhưng các công ty này cũng tập trung vào việc cải thiện mức sử dụng năng lượng.
Google nâng cấp chuyển mạch mạch quang Apollo
Trong một bài đăng trên blog gần đây về Apollo, Google đã tuyên bố rằng các mạng truyền thống sử dụng cấu trúc liên kết “Clos”, còn được gọi là cấu hình cột sống và lá, để kết nối tất cả máy chủ và giá rack trong trung tâm dữ liệu, trong khi nền tảng Apollo của họ sử dụng chuyển mạch mạch quang (OCS) cho kết nối mạng trung tâm dữ liệu:
“Trong kiến trúc cột sống và lá, tài nguyên tính toán – các giá rack máy chủ được trang bị CPU, GPU, FPGA, bộ lưu trữ và/hoặc ASIC – được kết nối với các bộ chuyển mạch lá hoặc trên cùng rack, sau đó kết nối thông qua các lớp tổng hợp khác nhau với trục fabric” Google đã viết. “Theo truyền thống, xương sống của mạng này sử dụng Bộ chuyển mạch gói điện tử (EPS), là các bộ chuyển mạch mạng tiêu chuẩn do các công ty như Broadcom, Cisco, Marvell và Nvidia cung cấp. Tuy nhiên, những EPS này tiêu thụ một lượng điện năng đáng kể.”
“Apollo được cho là triển khai quy mô lớn đầu tiên về chuyển mạch mạch quang (OCS) cho kết nối mạng trung tâm dữ liệu. Nền tảng Apollo OCS bao gồm OCS tự phát triển, tự phát triển trong nội bộ, bộ lưu hành và công nghệ thu phát quang phân chia bước sóng (WDM) tùy chỉnh hỗ trợ các liên kết hai chiều thông qua OCS và bộ lưu hành. Apollo đã đóng vai trò là xương sống của tất cả các mạng trung tâm dữ liệu của Google, đã được đưa vào sản xuất trong gần một thập kỷ, hỗ trợ tất cả các trường hợp sử dụng trung tâm dữ liệu.
“Việc kết hợp lớp Apollo OCS thay thế các khối cột sống, dẫn đến tiết kiệm đáng kể chi phí và năng lượng bằng cách loại bỏ các bộ chuyển mạch điện và giao diện quang học được sử dụng trong lớp cột sống. Google sử dụng các bộ chuyển mạch quang học này trong kiến trúc kết nối trực tiếp để liên kết các lá thông qua bảng vá. Phương pháp này không phải là chuyển mạch gói; nó hoạt động như một kết nối chéo quang học,” Google tuyên bố.
“Bộ chuyển mạch OCS cung cấp băng thông cao và độ trễ mạng thấp, cùng với việc giảm đáng kể chi phí vốn. Điều này là do khả năng giảm số lượng bộ chuyển mạch điện cần thiết, do đó loại bỏ được việc chuyển đổi quang-điện-quang tốn kém,” Sameh Boujelbene, phó chủ tịch của Dell’Oro Group cho biết. “Hơn nữa, không giống như bộ chuyển mạch điện, bộ chuyển mạch OCS không cần nâng cấp thường xuyên khi máy chủ áp dụng bộ thu phát quang thế hệ tiếp theo.”
Tuy nhiên, OCS vẫn là một công nghệ mới nổi. “Cho đến nay, chỉ có Google quản lý để triển khai chúng ở quy mô lớn trong mạng trung tâm dữ liệu của mình sau nhiều năm phát triển. Ngoài ra, bộ chuyển mạch OCS có thể yêu cầu thay đổi cơ sở hạ tầng cáp quang hiện có, tùy thuộc vào nhà cung cấp dịch vụ đám mây,” Boujelbene nói.
“Bộ chuyển mạch OCS đã được triển khai tại Google trong Fabric nhưng với sự xuất hiện của các ứng dụng AI, chúng tôi thấy chúng được triển khai nhiều hơn bên trong các cụm AI do những lợi ích mà chúng mang lại,” Boujelbene nói.
Chuẩn hóa công nghệ truyền tải quang
Các yêu cầu đối với thiết bị mạng Ethernet tốc độ cao hơn đang phát triển khi mạng AI mở rộng. Ví dụ, nhu cầu ngày tăng đối với Ethernet 800G sử dụng công nghệ truyền dẫn quang tốc độ cao 800ZR và OpenZR+, sáng kiến của ngành để phát triển các tiêu chuẩn có thể tương tác cho bộ thu phát quang học kết hợp.
Ở cấp độ Ethernet 400G, 400ZR đã “là một thành công lớn đối với ngành công nghiệp có thể cắm kết hợp với nhiều nhà cung cấp và khối lượng lớn các mô-đun 400ZR QSFP-DD và OSFP được triển khai trong các ứng dụng DCI (kết nối trung tâm dữ liệu) đô thị,” theo trang web Acacia của Cisco. (Cisco đã mua lại nhà sản xuất quang học Acacia Communications với thỏa thuận trị giá 4,5 tỷ USD vào năm 2021.)
“Quang học có thể cắm cấp mạng như 400ZR và các loại khác sẽ chứng kiến sự gia tăng đáng kể trong việc triển khai vào năm 2024 trong mạng nhà cung cấp dịch vụ truyền thông,” IDC gần đây đã báo cáo.
Ông Gartner cho biết, việc liên kết hiệu quả các trung tâm dữ liệu phân tán thông qua DCI sẽ là động lực chính cho mạng AI và cáp quang khi khoảng cách giữa các trung tâm dữ liệu AI trở thành một vấn đề.
Gartner của Cisco cho biết dung lượng của các liên kết này sẽ cần phải tăng lên với các ứng dụng AI. “Ngay bây giờ, chúng tôi có 400 gig trên một bước sóng, nhưng ngành muốn hiệu suất tốt hơn nhiều, chi phí thấp hơn, mật độ thấp hơn, mật độ tốt hơn và điều đó cũng sẽ xảy ra,” Gartner nói. “Vì vậy, những gì xuất hiện ban đầu có thể được tối ưu hóa cho năm nanomet. Chúng ta cần phải làm tốt hơn và đây sẽ là bước tiến của công nghệ này.”