当前速看:LLM推理提速2.8倍,CMU清华姚班校友提出投机式推理引擎SpecInfer

2023-05-30 16:39:38   来源:搜狐数码