当前位置: 首页 > news >正文

工会网站建设管理工作总结seo排名点击软件运营

工会网站建设管理工作总结,seo排名点击软件运营,做一个网页设计多少钱,网站制作成品文章目录 前言为什么叫倒排索引数据结构如何生成如何查询TF、IDF参考文档 前言 上一章,简单介绍了 ES 的节点类型。 本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。 ES 的全文索引就是基于倒排索引实现的。 本章内容建议重点学习&…

文章目录

      • 前言
      • 为什么叫倒排索引
      • 数据结构
      • 如何生成
      • 如何查询
      • TF、IDF
      • 参考文档

前言

上一章,简单介绍了 ES 的节点类型。
本章,我们要介绍 ES 中非常重要的一个概念:倒排索引。
ES 的全文索引就是基于倒排索引实现的。
本章内容建议重点学习,因为面试也常问。

为什么叫倒排索引

倒排索引指的是将每一个关键字映射到它出现的文档中。如下图所示
在这里插入图片描述

因为结构是倒着的,因此被称为倒排索引。

数据结构

倒排索引分为 2 部分:一部分叫 term directory(term 词典),一部分叫 posting list(倒排列表)。如下图所示
在这里插入图片描述

  • term directory
    term 字典,存放着每个单词到对应倒排列表的映射关系

  • posting list
    Docs 是一个数组。其中 1:2:[2,6] 意思如下

    • 1:文档ID
    • 2:词频(term frequency)
    • [2,6]:出现在文档中的第 2,6 个 term。

如何生成

这里涉及到我们之前讲过的分词器。工作流程如下图所示
在这里插入图片描述

大体就包含2部分,根据分词器将文本分词,然后根据分词生成倒排索引。

如何查询

例如我们查询:To do right
则该文本会先被分词为:to, do, right
对应的结果如下图所示:
在这里插入图片描述

TF、IDF

默认情况下,ES 会根据文档与搜索词的相关性得分对结果降序返回。相关性得分与以下 2 个概念有关(稍做了解,后续会出文章做更深入的介绍)

  • Term Frequency(TF):term 在文档中出现的频率,得分正相关。出现频率越高,得分越高
  • Inverted Document Frequency(IDF):term 在 所有文档 中出现的频率,得分负相关。出现频率越高,得分越低。

参考文档

Indexing: Inverted Index

http://www.mmbaike.com/news/103890.html

相关文章:

  • 重庆市城乡建设施工安全管理总站网站百度seo排名点击器app
  • 制作ppt用什么软件好seo的中文名是什么
  • 连连跨境电商网站怎么做什么是百度竞价
  • 用织梦做网站有后台吗百度网页版入口链接
  • 企业网站设计与实现太原网站快速排名提升
  • 重庆优化网站搜索引擎成功案例分析
  • 建公司网站步骤百度指数资讯指数是指什么
  • 网站流量推广跨境电商怎么开店铺
  • 苏州建设有限公司武汉seo价格
  • 做报纸版式的网站广州seo软件
  • 网站界面设计如何实现功能美与形式美的统一?搜索技巧
  • 手机触屏版网站管理系统网络推广培训班哪家好
  • 深圳网站建设开发公司南京seo优化推广
  • 微博内网站怎么做的有创意的营销案例
  • 网页搜题网页优化包括什么
  • 简单详细搭建网站教程视频教程域名查询seo
  • 如何建设国际网站首页信息流广告优化师培训
  • 有专门做宝宝用品的网站吗互联网项目推广平台有哪些
  • 不用php做网站今日头条新闻头条
  • 做设计必知网站网页制作免费模板
  • 漫画门户网站怎么做的长春百度seo公司
  • 三河网站建设营销网站建设专家
  • 自己做的网站涉黄seo1新地址在哪里
  • 哪些网站可以做设计方案品牌推广策略怎么写
  • 网站建设的费用优化营商环境指什么
  • 网站建设社区内容企业推广
  • 学习网站建设的心得体会百度推广的几种方式
  • 郑州网站建设代运营肇庆seo排名外包
  • 义乌网站建设公司优化网站的软件下载
  • 上海 建网站郑州众志seo