星融元的“一鍵RoCE”RoCEv2技術(shù)支持在以太網(wǎng)上承載RDMA協(xié)議,實現(xiàn)RDMA over Ethernet,但需要網(wǎng)絡(luò)側(cè)支持無損以太網(wǎng)。目前,星融元網(wǎng)絡(luò)操作系統(tǒng)AsterNOS使用標(biāo)準(zhǔn)的PFC+ECN來實現(xiàn)無損以太網(wǎng)。在以太網(wǎng)交換機(jī)上配置PFC、ECN功能,需要用戶熟悉QoS機(jī)制、配置邏輯和相關(guān)命令行。 對此,星融元針對RoCEv2場景的配置需求進(jìn)行設(shè)計規(guī)劃,推出一鍵RoCE,實現(xiàn)了業(yè)務(wù)級的命令行封裝,以達(dá)到RoCEv2場景下最佳的可維護(hù)性和可用性。 繼提供高性價比低時延交換機(jī)產(chǎn)品替代方案后,在產(chǎn)品的使用和運維上,星融元進(jìn)行了網(wǎng)絡(luò)部署的升級,降低工程師們的運維復(fù)雜度,讓用戶聚焦于業(yè)務(wù)。 1. 一鍵啟用PFC和ECN,完成無損網(wǎng)絡(luò)配置 沒有一鍵RoCE配置命令行時,一線實施和運維工程師配置無損網(wǎng)絡(luò)或者取消配置,需要分別修改PFC和ECN的配置。通常情況下,要配置PFC和ECN,需要工程師理解QoS的配置邏輯和步驟,這對工程師有著一定的網(wǎng)絡(luò)知識要求。 有了一鍵RoCE配置命令行后,工程師可以通過一條命令行完成無損網(wǎng)絡(luò)配置,不需要再使用原子級的命令行,對PFC和ECN進(jìn)行配置。 2. 無損網(wǎng)絡(luò)的配置和運行狀態(tài),集中展示 在以前運維無損網(wǎng)絡(luò)時,如果想要進(jìn)行網(wǎng)絡(luò)異常定位或者運行狀態(tài)檢查,通常需要到不同命令行視圖下進(jìn)行執(zhí)行多次show命令,以確定當(dāng)前的隊列映射關(guān)系、Buffer使用情況、PFC和ECN在哪個隊列中被啟用、各種門限的數(shù)值、PFC和ECN所在隊列的吞吐量、Pasue和CNP報文的觸發(fā)次數(shù)等信息。 現(xiàn)在工程師可以通過show roce命令打印全局的RoCE信息、端口的RoCE信息和計數(shù),以及對RoCE相關(guān)計數(shù)進(jìn)行統(tǒng)一清零。 3. 不同業(yè)務(wù)場景下的參數(shù)調(diào)優(yōu) 通過一鍵RoCE命令行,可以快速配置無損網(wǎng)絡(luò),當(dāng)業(yè)務(wù)場景不滿足于設(shè)備提供的默認(rèn)模板配置時,工程師仍然可以通過qos命令行精細(xì)化地調(diào)試PFC和ECN的各項參數(shù),讓當(dāng)前業(yè)務(wù)場景的性能達(dá)到最優(yōu)。 一鍵RoCE的可應(yīng)用場景1、簡化高性能計算和存儲網(wǎng)絡(luò)的部署 一鍵RoCE的使用對于需要高性能網(wǎng)絡(luò)傳輸?shù)膽?yīng)用程序非常有幫助,如高性能計算、存儲、大數(shù)據(jù)分析和人工智能、云計算等領(lǐng)域。它可以提供比傳統(tǒng)以太網(wǎng)更高的吞吐量和更低的延遲,從而為這些領(lǐng)域的應(yīng)用程序提供更高的性能和效率。 高性能計算和存儲業(yè)務(wù)場景中,工程師通常對業(yè)務(wù)非常熟悉,集中精力在服務(wù)器側(cè)的配置調(diào)優(yōu),對于網(wǎng)絡(luò),通常提出的要求是“需要一張高可用、高性能的無損網(wǎng)絡(luò)”。針對這種情況,高性能計算和存儲工程師可以通過一鍵RoCE命令行,快速完成無損網(wǎng)絡(luò)配置部署。 這種業(yè)務(wù)級命令行的封裝,將多個原子級命令行進(jìn)行組合,簡化配置流程,節(jié)省工程師的時間和精力去完成更有價值的業(yè)務(wù)側(cè)優(yōu)化。 2、定位無損網(wǎng)絡(luò)的瓶頸和故障 show roce業(yè)務(wù)級命令行將多個原子級命令行組合成一個語義完整的業(yè)務(wù)命令,將多個命令的輸出信息整合在一起。 在排查網(wǎng)絡(luò)故障時,可以使用show roce一次性查詢和無損網(wǎng)絡(luò)相關(guān)的所有配置信息、運行狀態(tài),而不需要逐個查詢原子級命令行。從而簡化故障排除流程,提高故障排除效率。 未來,隨著云計算、大數(shù)據(jù)和AIGC行業(yè)的不斷發(fā)展,對高性能網(wǎng)絡(luò)傳輸技術(shù)的需求將會越來越大。一鍵RoCE作為一種快速部署RDMA網(wǎng)絡(luò)的解決方案,將會在未來得到更廣泛的應(yīng)用。 |
|