
不依赖token,字节级模型来了!直接处理二进制数据
不依赖token,字节级模型来了!直接处理二进制数据
最新GPT,不预测token了。
微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。
通过直接处理原生二进制数据,bGPT将所有输入内容都视为字节序列,从而可以不受限于任何特定的格式或任务。
14
0
2025-09-01
