智谱发布新一代大模型GLM-4.6,寒武纪、摩尔线程已适配

32度域获悉,9月30日,国内大模型头部厂商智谱正式发布并开源新一代大模型GLM-4.6,在Agentic Coding等关键能力上实现大幅提升。智谱官方宣布,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案。同时,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)

猜你喜欢

发表回复

登录后才能评论