【陆丁指南】什么是百度搜索引擎优化?我们需要理解两个概念,第一百个搜索引擎和第二个优化。
百度“派出”蜘蛛抓取网络上的网站。蜘蛛抓取抓取到的网站,将处理后的页面放入百度数据库(存储),进行预处理,然后对页面进行索引。当用户进行百度搜索时,百度根据用户发来的信息(即用户搜索到的关键词)匹配数据库中的相关网站,最终将与关键词相关的网站进行排序并展示给用户。
名词解释:
蜘蛛:百度搜索引擎派出的机器人,用于抓取大量页面。
预处理:Spider将提取的词分成中文词,去重,去停用词,去噪。
中文分词:将提取的词分成有意义的词。
删除:从数据库中删除重复的内容。
转到停用词:去掉...哦...这些停用词。
去除噪音:去除无关内容或链接。
索引:使用倒排索引。
倒排索引结构
利用关键词对应文件的形式,将用户搜索的关键词在数据库中搜索文件,不同的关键词对应不同的文件。搜索引擎计算文件的相关性和权重,并向用户显示搜索结果。
欢迎分享,转载请注明来源:聚客百科
评论列表(0条)