部署文心4.5開源模型給Android設備調用

在上一篇文章《文心4.5開源大模型的使用和部署》已經介紹瞭如何使用fastdeploy部署文心4.5開源大模型的,並且簡單調用了接口,本篇文章來介紹Android如何調用這個部署的接口,並實現對話。

閱讀全文
文心4.5開源大模型的使用和部署

文心4.5系列開源模型共10款,涵蓋了激活參數規模分別爲47B 和3B 的混合專家(MoE)模型(最大的模型總參數量爲424B),以及0.3B 的稠密參數模型。下面我們就介紹如何快速使用文心4.5模型推理,以及部署接口給Android、微信小程序等客戶端調用,注意這裏只接受文本類型的模型,實際文心4.5也有多模態的模型。

閱讀全文