标签:python分词

    站长原创

    python筛选seo相似词_叠词_分词重复

    python筛选seo相似词叠词分词重复,众所周知,在建设词库的时候,会采集到很多,叠词,和分词重复的词,这类的词,聚合页,往往搜索的结果是一致的,造成重复页面,怎么去掉这类的词,成了比较困难的问题,所以小编写了下面的一个小小的脚本解决这个问题。 import jieba for line in open('cibiao','urllist+',encodi……继续阅读 »

    wuya 3个月前 (04-15) 219浏览 0评论 0个赞