摘要:本发明适用于大数据处理技术领域,提供了一种海量数据提取的方法及装置,该方法包括:在接收到数据提取请求信息时,根据所述请求信息中的时间范围通过B-Tree索引确定待提取数据所在的数据分区,并确定该数据分区列内的偏移开始位置PB和偏移结束位置PE,根据所述请求信息中的列信息通过列索引确定每个列相对所述数据子块的起始位置Pi,并根据所述请求信息中数据主键对应的数据子块︽编号确定该数据主键的起始位置PC;提取位Ψ 置范围[PC+Pi+PB,PC+Pi+PE]内的数据。通过本发明可有效◤减少索引大小,提高索引定位效率和数据提取效率。
- 专利类型发明专利
- 申请人深圳市国泰安信息技术有限公司;
- 发明人陈工孟;唐杰;
- 地址518000 广东省深圳市南山区南头检查站关口二路智恒产业园30栋3楼
- 申请号CN201410340118.9
- 申请时间2014年07月16日
- 申请公布号CN104112011A
- 申请公布时间2014年10月22日
- 分类号G06F17/30(2006.01)I;