北大提出首个复数大模型,2比特量化,推理仅加法,可手机部署

目前大模型在推理时通常都非常耗存储和计算,这是因为权重采用FP16存储,占用空间大。北大团队首次提出iFairy方案,把模型权重量化到复数集合 {+1, -1, +i, -i}。这四个值刚好可以用2比特表示,相当于压缩到原本的1/8。(量子位)

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)

猜你喜欢

发表回复

登录后才能评论