AI四巨頭Google、DeepMind、Microsoft、Uber深度學(xué)習(xí)框架大比拼4
微軟的DeepSpeed是一個(gè)新的開源框架,專注于優(yōu)化大型深度學(xué)習(xí)模型的訓(xùn)練。當(dāng)前版本包含了ZeRO的第一個(gè)實(shí)現(xiàn)以及其他優(yōu)化方法。從編程的角度來看,DeepSpeed是在PyTorch之上構(gòu)建的,它提供了一個(gè)簡單的API,允許工程師只需幾行代碼就可以利用并行化技術(shù)來進(jìn)行訓(xùn)練。DeepSpeed抽象了大規(guī)模訓(xùn)練的所有困難方面,例如并行化、混合精度、梯度累積和檢查點(diǎn),使得開發(fā)人員可以專注于模型的構(gòu)建。