三藏中文网

手机浏览器扫描二维码访问

第一百四十二章 更多问题(第1页)

向山大概听明白了。

或者说,唯一让向山懵逼了一瞬间的,也就是英格丽德举出的那个例子。

他没想到会在这种场合听到这种……奇怪的例子。

但是,除此之外,好像并没有什么更有价值的东西。

只能说,任何专业人士,在超出自己专业领域之后,就不比一般人更加智慧吧。

虽然在英格丽德眼中,这些外星人的书写方式有趣极了,但归根结底,这就是一种压缩算法。

而这无法解释向山现在在琢磨的问题。

“所有外星机械的设计图纸、装配工艺、材料制造的参数,再加上它们自身运行的AI,加在一块,是如何压缩到两三百MB这个水平的”。

外星人使用了两种压缩算法。

一种大致可以称作“字典算法”,即“将高频出现的排列组合用,做成对应字典,然后用字典内编号代码来替代该组合”。这种手段人类也在使用。当然,如果“字典”做得很大,那么数据本体就可以压缩得很小。但有些时候,又会形成“字典比数据本体还要大”的情况。

外星人大概是选择了一个恰好的数值,保证“本体+字典”的大小最小。

另外就是英格丽德所说的这种二维的符号矩阵。

但不管怎么样,信息的无损压缩一定是有极限的。

而这种二维矩阵的算法,不管外星人将读取规则设计得怎样花里胡哨,它都存在一个“上限”的。

就如英嘉所说,如果多增加一个“下一个终止方向符号无效”的符号,固然可以增加读取路线的数量,但是却会导致符号之中混入大量除了表示“下一个终止方向符号无效”之外没有其他任何意义的符号,“字典”的集合之中也要增加项目。

“读取路线”的增加,会导致“掺杂过多只与读取规则有关的符号”以及“字典”的膨胀。

同字典算法一样,到最后,同样也会出现“读取规则”大小大于数据本体大小的问题。

这里面同样存在一个平衡点。

按照向山估计,关于读取规则的符号可能也就那么几个,不会太多。

而二维的符号矩阵也存在另一个问题。就好像“填字游戏”一样,一个空间坐标上的符号,要受到来自四个方向内容的制约。这反而使得信息的表达不像一维的文字那样自由。

“就用你举的例子来说吧……”向山是如此说的:“虽然那个古代诗人在八百四十字里面压缩了七千九百五十八首诗,但是我敢肯定,这七千九百、将尽八千首的诗,单独拆出来的话,没有一首可以流传千古吧,说不定还存在那个什么……格律啊韵脚不那么工整的情况。”

英格丽德有些好奇:“你看上去好像是刚刚才知道这玩意的……”

“如果那个文字游戏里面拆出来的诗足够优秀的话,肯定会上课本。那我肯定会有印象。”向山在这一点上倒是非常确信:“仔细一想,古代多半没有标点符号,断句也得后人来猜……”

英格丽德捂脸:“我猜你想说‘句读’。”

向山无视了英格丽德的提示:“你看,从这一点来看,这种文字游戏,对信息的压缩,损失很大,效率也就那样。它甚至不是‘压缩任意八千首诗’,以压缩算法的标注来看……嘶……”

向山好像意识到了什么……

——不是“压缩了任意八千首”……不一定是压缩……

——什么……

热门小说推荐
我有一个熟练度面板

我有一个熟练度面板

三年又三年,三年的时间别人家的穿越者早已经称皇称帝,成为大佬中的大佬。  然而,  穿越三年,带着个能看不能加的破烂熟练度面板的张清元,还只是云水宗数万外...

史上第一混乱

史上第一混乱

我真倒霉,真的  人家穿越,我只能被穿越  人家泡妞,我只能被妞  在我的第好几号当铺里,我接待了名叫荆轲李白关羽秦侩等等一系列客户,发生了...

超凡神眼

超凡神眼

透视神医是一本其他小说。更多好看的其他小说,请关注啃书小说网其他小说专栏或其他小说排...

周天子

周天子

彼时,西边秦惠王初露锋芒,东边齐威王垂垂老矣,北边赵武灵王横刀跃马,南边楚怀王合纵天下。彼时,天下之言非杨即墨等等,这是哪个文盲说的?亚...

最后一个葬魂师

最后一个葬魂师

古语有云八字轻者,身虚,神弱,易近鬼!我的八字就非常的轻!不仅如此,据说我在出生的那天正巧紫薇星降世!这要是换成在古代,我必定会是帝王之相!可惜,却毁在了我的八字轻上面!这让我只有了帝王之相,却没有帝王之命!等待我的只能是百鬼缠身,死于非命!(新书更新慢可以养肥了再看!这段时间了大家不妨看一下阴阳墓师。了解一下乔胖子祖父辈们的故事!另外重生之无赖至尊欢迎大家收看!)...

长夜余火

长夜余火

灰土上所有人都相信,埋葬在危险和饥荒中的某个遗迹深处,有通往新世界的道路,只要能找到一把独特的钥匙,打开那扇门,就能进入新世界。在那里,大地是丰饶的,就像...