第一百五十四章 幻大数据压缩研究
这些重合表达为最短表达式,当然,一个原始数据不可能只采用一个数据卡尺。
发展下去,大数据就需要有专用的数据卡尺服务器,也就是小的数据卡尺服务器,可以常备1000多个数据卡尺,而大的数据卡尺服务器,可以常备千万亿级别的数据卡尺。
数据卡尺越多,越容易生成最短表达式。
数据卡尺的用法:
一元数据卡尺:把原始数据和数据卡尺进行比对,找出其中重合部分,把重合部分记录为数据卡尺引用段落表达式。
二元数据卡尺:把原始数据和两个数据卡尺进行比对,找出其中重合部分,把重合部分记录为数据卡尺引用段落表达式,当不重合出现时,就对数据卡尺进行偏移运算,准备从两个数据卡尺的偏移不进位加法或不进位减法中生成能和原始数据重合的段落,从而只需要记录偏移运算(两个数据卡尺的偏移数据,开始引用段落起点和结束引用段落终点)和所采用的是不进位加法还是不进位减法。
三元数
第一百五十四章 幻大数据压缩研究(2/3).继续阅读