有些朋友询问如何对收集的内容进行分类以及如何对捕获的单词进行分类。实际上,它非常简单。我把它理解为一个小网站。这种炉渣属于这种科学。
清理内容后,需要将其放入仓库。如果存储中存在逻辑,则有必要在集合开始时考虑这一点并设计收集和上线的过程。
每个站点的情况都不同,但最基本的模式类似于以下内容:
20181021_5bcc176c8081f.png确定要完成的主题,从该主题中选择一些根,根或几个根来表示内容类别
使用单词扩展并挖掘要完成的流程词
挖出单词,然后抓取相应的内容
如上所示,例如,我设置了一个根,并从该根挖掘了10个扩展单词。每个扩展单词都会抓取20个内容,因此在此根目录(内容主题)下,我有100个可以在线的内容。上线的页面通常分为两个:
详细页面
聚合页面
然后,详细信息页面是捕获的100个内容;聚合页面是由根挖出的10个扩展词,每个扩展词生成一个列表页面或其他形式的聚合页面,页面内容为20个对应于单词集合的内容。内容。
数据表格式
因此,线上必须至少有3个表。以mysql为例。如果你使用mongodb啥的非关系数据库,你可以自己转换它。
每个扩展词都标记了它所属频道的ID,因此您可以在上线时互相推荐相同的频道扩展词。
此外,对于每个扩展单词,单词的优先级可以通过竞争程度,搜索量,单词频道质量,包含,排名等来设置,优先级较高的单词可以提供更多的链接支持。站。
该字段可以是动态的。例如,在检查线后,每周检查一次排名。第二页和第三页上的所有关键字优先级都调整到最高,并提供了更多链接以支持第一页。
相关词是这类词的同义词,或者只是抓住相关词搜索,在页面中嵌入这些词,如果用户搜索点击可以转到主页.
根据具体需要调整扩展词汇量的其他领域依赖于创新,没有固定的例程
每篇文章都会映射自己的扩展ID和自己的频道
举个例子
以上是最简单的模式。您可以使用此模式根据网站本身的情况设置网站。例如,我有一个销售音乐设备的电台。该网站的主要内容是围绕产品或品牌的产品信息。
音乐设备行业没有太多固定的搜索词,但如果你深入挖掘,你可以找到很多个性化的搜索词,比如“XX鼓简单歌曲”“xxx和什么是好”.这种搜索行为只能基于某个产品或某个品牌会产生这样的搜索。它不能应用于所有产品和品牌,如“XX价格”和“XX评估”,并可以在页面上批量生产。
但是,如果我想获得这些个性化搜索字词的流量呢?没有办法覆盖现有的页面标题,只能生成一个新的页面来覆盖每个单词,而网站的主要内容是产品信息,不能涵盖这些个性化的搜索词,那么它只能被收集。
然后根据上图的例程,然后根是每个产品和品牌,用这些词找到各种渠道中的流量词,找到交通词再到大平台去掌握相应的内容。
在在线阶段,理想情况下,为每个扩展词收集20个内容,使得生成的聚合页面具有20条信息(零神测试,列表页面信息的数量是20,主页的概率比)得到了。其他数字很高),但理想非常好,现实非常残酷,所有延伸词都不可能捕获20个项目,那我该怎么办?
每个扩展词都有自己的根,每个根在站中都有自己的产品信息内容。因此,除了数据库中收集的内容之外,根下的扩展词还具有原始产品信息。内容,这两种类型的内容,虽然不是一个词,但在同一主题下,属于某个品牌或产品。扩展词仅收集3个内容,并且生成新页面作为短页面,不包括在内。然后,可以调用扩展词的根的产品信息来完成,从而提高页面质量。