那个DeepSeek的什么光学分词，光学token，我看了，就是分词的时候，尽可

梁斌聊商业 2025-10-28 18:48:19

那个DeepSeek的什么光学分词，光学token，我看了，就是分词的时候，尽可能选择长词。。。老概念了。动机也很简单，就是注意力机制需要全部token进行计算KQV，复杂度是token长度的平方复杂度，极其消耗，如果压缩token的数量，可以大大节约计算开销，然后就把分词从短词，延生到长词，就压缩了。。

不是网络上有人说的，一段话当初一个token，如果一段话当成一个光学token，那么这种token基本上接近随机出现，当信息是随机出现，就没有信息了。。

分词选择长词，一定是一个趋势，切词不要切太碎了，信息反而不聚焦，当然也不能太长，要实事求是，符合语义的自然切分。国内现在搞大模型，各种省显存，省算力，这方面创新投入是极大的，一旦我们解决了算力，喷涌而来的power是非常可怕的。

0 阅读：3

梁斌聊商业

感谢大家的关注

作者最新文章

1

有网友让我研究baba，说最近kimi多牛逼，baba掉队了。。我不这么看。b

2

这个双11大家都买了什么啊？有什么推荐，评论区讨论一下，是不是便宜后前面都出完了

3

另外还有几篇小作文，分别是《谷歌哪些地方被投资人看好》和《Physical AI

4

陆续把一些拖欠的小作文补上，最近好多网友问我为什么内存股，闪存厂商大涨，背后的技

5

昨晚凌晨2点就醒了，做了个梦，梦到马云约我去钓鱼，然后聊得不错让我在他家住下来，

6

老黄这次在台北讲话被泄露，意义深远，邀请都是台湾IT界举足轻重的人物，其中包括台

7

现在全世界AI大厂都玩命猛干，于此同时我也把“票”儿投给了我最看好的AI大厂，看

8

一觉醒来，回血3万美金，毫无波澜。

9

我这一生犯的最大的错误，其实就是相信自己太晚了。。。以前总觉得自己不行，然后就

10

你看我刚毕业上班是2000年，那会工资也不高，多有干劲啊，欲望也强，现在这个低欲

热门分类

财经TOP

1

今晚苹果市值突破4万亿美元，这是历史上第三家。全部在美股，分别是英伟达、微软、苹

2

外媒称中国向美国进口了大豆，没想到听到这一消息，紧盯中国市场的黄仁勋

3

10月新势力销量：大家涨的都很疯狂啊

4

一觉醒来，黄金市场彻底失控了！不是因为涨到了1308一克，而是现在大家根本

5

今年双十一落下帷幕，手机销量/销售额排名出炉，这个双十一大家都买什么手机了？

6

马年概念大妖应该是飞鹿股份！有个成语叫指鹿为马！！！

7

我老婆把囤的200克金条卖了！这200克金条是老婆十几年前在工商银行买的，当时2

8

中方这一波又稳了！安世中国已正式向欧洲客户发出通知，宣布恢复芯片供应，不过此次供

9

一夜之间，金价还是又失控了！10月30号，一只99克镯子，随随便便依然还是

10

这就是现在日系品牌在国内最大的雷，没有之一尤其是在新能源转型必须且只能在中国实现

财经最新文章

1

中国🇨🇳科技企业要雄起[赞]

2

11.16低价启动欲望榜：谁将复刻平潭热度，成为下一个热门标的？1. 盈新发展：

3

一个省的经济强不强，主要看上市公司就可以知道，像广东887家上市公司，市值快20

4

（孚日股份）；俘获日本，概念继续！（拓日新能）；调整完毕，继续上攻！（日出东方）

5

从7万抄到430万，反复牢记这几句话！如果你未来想把炒股当做第二职业，养家糊口，

6

📢记住了，我国车企的三大央企➕三大国企：1，一汽——央企，品牌：红旗、天工；

7

掐指一算，我的新主力机要来了

8

【热点前瞻】多技术融合创新第一阶段6G技术试验完成相关概念股有共进股份(6031

9

我老婆把囤的200克金条卖了！这200克金条是老婆十几年前在工商银行买的，当时2

10

2012年，推广比特币的寒酸小展台上，注册就送100枚。那时候一枚比特币才12美