大发平台

  • <tr id='cGg4xP'><strong id='cGg4xP'></strong><small id='cGg4xP'></small><button id='cGg4xP'></button><li id='cGg4xP'><noscript id='cGg4xP'><big id='cGg4xP'></big><dt id='cGg4xP'></dt></noscript></li></tr><ol id='cGg4xP'><option id='cGg4xP'><table id='cGg4xP'><blockquote id='cGg4xP'><tbody id='cGg4xP'></tbody></blockquote></table></option></ol><u id='cGg4xP'></u><kbd id='cGg4xP'><kbd id='cGg4xP'></kbd></kbd>

    <code id='cGg4xP'><strong id='cGg4xP'></strong></code>

    <fieldset id='cGg4xP'></fieldset>
          <span id='cGg4xP'></span>

              <ins id='cGg4xP'></ins>
              <acronym id='cGg4xP'><em id='cGg4xP'></em><td id='cGg4xP'><div id='cGg4xP'></div></td></acronym><address id='cGg4xP'><big id='cGg4xP'><big id='cGg4xP'></big><legend id='cGg4xP'></legend></big></address>

              <i id='cGg4xP'><div id='cGg4xP'><ins id='cGg4xP'></ins></div></i>
              <i id='cGg4xP'></i>
            1. <dl id='cGg4xP'></dl>
              1. <blockquote id='cGg4xP'><q id='cGg4xP'><noscript id='cGg4xP'></noscript><dt id='cGg4xP'></dt></q></blockquote><noframes id='cGg4xP'><i id='cGg4xP'></i>
              2. 首页
              3. 装备资讯
              4. 热点专题
              5. 人物访谈
              6. 政府采购
              7. 产品库
              8. 求购库
              9. 企业库
              10. 品牌排行
              11. 院校库
              12. 案例·技术
              13. 会展信息
              14. 教育装备采购网首页 > 知识产权 > 专利 > CN101286156A

                基于元数据去除重复对象的方法

                  摘要:本发明公开了一种基于元数据去除重复对象的方法,涉及元数⌒ 据清理领域,解决了现有去除重复数据工作量大的问题,本发明先对待录入的元数据进行规范化处理。在比较时通过▽缩小比较范围,减少工作量,提高工作效率。在数据集合记录中,选取与待录入元数据的出版社字段相同的记录;在选定的记录中,选取isbn、书名、作者、出版社、出版时间、价格字段,作为比较▂范围。利用带权重值的相似度比较函数,计算待录入元数据与数据集合中对应字段的属性值之间的相似度值;将各个字段相似度值乘以权重值,相加得到复合相似▓度值;将复合相似度值与预设阈值进行比较;如果复合相似度值不小于阈值,则数据集合中的当↘前记录与待录入元数据为重复数据。
                • 专利类型发明专利
                • 申请人北大方正集团有限公司;北京方正阿帕比技术有限公司;
                • 发明人高飞;
                • 地址100871北京市海淀区成府路298号←方正大厦5层
                • 申请号CN200710106024.5
                • 申请时间2007年05月29日
                • 申请公布号CN101286156A
                • 申请公布时间2008年10月15日
                • 分类号G06F17/30(2006.01);G06F19/00(2006.01);