2月24日消息,DeepSeek宣布开源首款用于Hopper GPU的高效型MLA解码核——FlashMLA。此前,DeepSeekk宣布本周将是开源周(OpenSourceWeek),并且已连续开源五个软件库。
据DeepSeek介绍,FlashMLA是Hopper GPUs的有效MLA解码内核,可针对可变长度序列进行优化,当前主要发布包括:BF16以及块大小为64的分页kvcache。
截至目前,该项目已经在GitHub上收获了超过2700Star,并且拥有104个Fork。(李姝)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
