设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

SEO去除 中文分词 还有 文本分析

发布时间:2022-05-25 14:39 所属栏目:21 来源:互联网
导读:对于刚入职的SEO人员,日常工作中,我们很少谈论中文分词与文本分析,但在实际的SEO项目操作中,一个成熟的SEO运营,有必要的进一步对二者进行加以了解。 理由很简单,它是搜索引擎的工作原理中最基础,而又十分重要的因素之一,在此之前,我们更多的是对中
         对于刚入职的SEO人员,日常工作中,我们很少谈论“中文分词”与“文本分析”,但在实际的SEO项目操作中,一个成熟的SEO运营,有必要的进一步对二者进行加以了解。
 
         理由很简单,它是搜索引擎的工作原理中最基础,而又十分重要的因素之一,在此之前,我们更多的是对“中文分词”的了解,而本文,我们也会进一步讨论:文本分析在SEO中的重要性。
 
         那么,SEO如何理解:中文分词与文本分析?
         根据以往SEO关键词优化的经验,Two Or Ten,将通过如下内容,进一步阐述二者的重要性:
 
1、中文分词
 
简单理解:在SEO优化的过程中,我们偶尔会遇到这样一种情况,那就是当你检索某一个特定词组的时候,你会发现网页title中,并没有包含特定的完整关键词,而该页面却在SERP中,排名第一。
 
这就要提到我们:中文分词对页面相关性的理解,实际上,对于任何一个内容页面,搜索引擎都会常识抓取与识别页面词组,利用一个个词组的频率,通过复杂的算法,进行页面相关性的识别,从而参与到索引排序中。
 
通常而言,中文分词算法主要包括如下四个策略:正向最大匹配法、逆向最大匹配法、最少切分、双向最大匹配法。
 
当然,中文分词是一个动态更新的过程,每天都会产生大量的新词汇,对于搜索引擎而言,它需要利用一定周期学习,一般而言它基于词典(类似于海量关键词库)以及相关统计方法,进行筛选与相关性计算。
 
一般而言,一个内容页面,在分词后,被搜索引擎会按照简单的四个要素,进行基础性分类,比如:
 
① 关键词
 
② 词性(关键词的属性,名词、动词、形容词等)
 
③ 频率
 
④ 权重(它类似于关键词密度)
 
从而经过一些列的数据分析与评估,进入倒排索引的序列,用于用户检索时,给出相应的搜索结果。
 
2、文档分析
 
相对于中文分词而言,如果说它是从词的角度理解页面内容,而经过Two Or Ten多年的实战经验,则认为文档分析,则更加强调页面结构的属性,它主要包括:
 
① 字数统计:内容页面,可识别文字的数量,侧面反应页面的长度。
 
② 项目符号:段落中使用的逻辑符号,以及文本内容中,特有表情字符的利用。
 
③ 逻辑结构:它主要包括段落行文结构,内在的逻辑关系,以及相关性词语的使用。
 
④ 文本标签:常见页面标签的使用,比如:H标签与<strong>标签等。
 
⑤ 文本比率:在早期一篇关于SEO代码优化的文章中,我们进行了详细的阐述。
 
其中,文档分析中所涉及的相关元素,使得每个页面,具有一定的独立性,在成千上万页面中,具备一定的稀缺性,特别是针对相关影响因子,统计分析,它与网站排名之间的关系。
 
因此,文档分析在SEO的工作中,显得格外重要。

(编辑:ASP站长网)

    网友评论
    推荐文章
      热点阅读