解读淘宝搜索发展史之一(原创)

老夏分析师 2022-04-17 15:10:07

淘宝搜索,属于阿里巴巴旗下的搜索引擎。淘宝搜索,主要针对旗下的淘宝网进行站内搜索,为用户提供C2C的购物搜索结果。

淘宝搜索功能

1.@+旺旺名,可以直达淘宝店铺首页

2.淘宝搜索将新增选购知识

3.排除关键词:在关键词前加“-”号

4.找促销宝贝:在搜索词后边加上“促销”

5.只搜索淘宝商品:输入 关键词 -tmall . 如:连衣裙 -tmall

6.明星开店:直接把明星名字输入到搜索框中,会有提示。

7.新增任意门功能:在搜索里输入阿里旺旺就可以直接跳出下载窗口。


淘宝搜索发展史


⑴2009年:上下架时间-轮流排名(时间模型)

淘宝网上所有宝贝从上架时刻开始,经过7天/14天的周期后,自动下架,然后自动上架,离自动下架时间(剩余时间)越少的宝贝,就优先排名靠前。

 

当卖家了解到这个排名规则后,就大量发布重复的宝贝,同一个商品发布几十个宝贝链接(重复铺货),上架时间错开。这就就可以确保无论何时,无论何地,自己店铺都有快要下架的宝贝,确保搜索结果首页都有自己店铺的宝贝。重复的宝贝,严重影响买家的购物体验,也极大浪费了淘宝服务器资源。搜索量流量的80%长期被20%卖家独占,公平性也无从谈起.

⑵2009年底:店铺信用评价页面调整,中差评的影响(服务模型)

所以“以剩余时间作为排名主要因素”的规则,就需要改革!   

2009年年底:店铺导航信用评价页面,发生了变化:   

a.动态评分的显示方式更加醒目; 

b.信用积分显示方式由列表变成了下拉菜单。

那时候大家都非常重视动态评分和好评率提高

⑶2010年6月:搜索页每页每个店铺只出现2个宝贝(卖家模型)。

这对于中小店铺的排名是一个新的亮点,让每一个店铺,不论宝贝数量的多少,都有机会在淘宝搜索结果页面展示。对于宝贝比较多的大店铺,可能会减少宝贝的展示机会,不过也不用怕,可以调整别的关键词,搜索别的关键词让宝贝得到展示的机会

⑷2010年7月:阿基米德上线,搜索降权屏蔽规则(服务模型+反作弊模型)

a.根据买家搜索关键词,依次为:与该关键词搜索意图最符合的类目、第二符合类目、第三符合类目....分别从高到低赋予权重值(类目相关性)。这样不同类目下宝贝的大致排序就确定了:比如,第三类目下的宝贝排到首页是不太现实的。   

b.然后再把这些类目下宝贝标题包含该关键词的宝贝筛选出来(文本相关性),并检查是否有降权违规等,有违规降权的直接排到后面去。   

C.没有违规的按照剩余时间从多到少排序,同时对橱窗推荐、好评率高、动态评分DSR高、退款少(3项)的店铺和宝贝分别加分,从而实现对剩余时间排序结果的微调。

阿基米德算法模型中最重要的5个因素


①服务指数

增加卖家服务质量这一因素的权重,是为了能给诚信经营、做好服务的卖家更多展现机会。淘宝是希望卖家将更多的精力放在提高服务质量方面,为买家创造良好的购物体验,达成买卖双方的双赢。

服务指数包括:DSR(店铺动态评分)、退款率、旺旺响应速度、支付宝使用率、投诉率及发货速度等。

 注意:对于新卖家来说,一些服务指数是没有数据的,比如退款率,投诉情况,评分等,但系统会给他一个略高于均值的数值,来参与计算,所以基本不会影响新商家的排序。此外,退款率是一个动态计算的过程,只会计算最近一段时间内的退款率,只要卖家提升服务水平,这个数字会很快提升上来的

②成交指数

      成交指数包括:收藏量、点击量、支付宝成交情况等。

      从点击量角度而言,丰富店内导航和关联营销就非常重要。

③相关性

      相关性:简单理解就是你的宝贝和搜索的关键词是否相关。相关和不相关也不是绝对的。例如:搜索”篮球”, 最相关的应该就是”篮球”的商品,其次才会是篮球鞋、篮球服等商品。所以大家一定要重视标题和类目的准确性。标题如何描述一方面会影响相关性,另一方面也会影响用户体验。标题乱使用关键词是会被降权的。而若产品放错类目,则可能导致宝贝无法被搜索到。

④下架时间

      下架时间一直是排序中比较重要的因素,用来保证每个商品都有机会展现。因此你的商品上架时间也很重要,如何让你的商品在一天不同时间段都有展现,这个有很多技巧。最好在宝贝展现的时候,卖家能在线服务,否则买家想买也联系不到卖家。淘宝的交易高峰时间,或者是说购买人群最多的时段在一天之内有三个:早上10:00-12:00, 下午3:00-5:00, 晚上8:00-10:00. 正常情况下,周一到周五的人群比周末要多。所以如何安排你的宝贝下架时间,也成了一个有用的工具。

⑤滞销商品

      90天前首次发布,且最近3个月内没有卖出过任何一件的商品,被定义为滞销商品。滞销商品会被屏蔽,但编辑商品并重新上架后,该滞销商品会被重新搜索到。

      阿基米德模型中的考量因素总计有100多项,以上5个方面的因素是阿基米德模型中决定搜索排名最重要的也是起决定性的因素,大家在店铺宝贝的优化过程中应该给予这些因素以重点的关注!

⑸2010年10月:滞销商品(动销率),不进入搜索库

①什么是滞销商品? 

滞销商品是指90天前首次发布的,且最近3个月内没有卖出过任何一件的商品。这一类商品是不会进入搜索库的,也就是说你用所有的标题去搜索,肯定找不到你的宝贝。

②如何修改滞销商品? 如果希望让其进入淘宝搜索索引,目前的方式是建议重新手动修改一下标题、价格等后重新发布(请注意:一定要在宝贝为上架的时候编辑重新发布)。

⑹2011年6月:关键词搜索采用分词技术

淘宝搜索的分词是从2011年的6月1日开始的,有了分词的技术以后呢,从原来的单词索引到今天的以相关性为前提的索引方式.


1)query最小滑动窗口模型。简单来说就是紧密结合原则。

举个例子来说下吧

比如说我们的产品是一款男装衬衫,我们以“长袖衬衫”这个词来说,淘宝会把这个词进行拆分,变成“长袖”&“衬衫”两个词

那么系统又是如何组合的呢

我们知道淘宝有一个庞大的数据词库

【词库的词的来源简单说下:就是用户搜索的一些短词和类目词等等】好,我们模拟下系统的匹配方式,

那么在“长袖”这个词下对应了一个词库,是包含长袖的所有的词,我们先把他命名为【长袖.txt】,.txt是说这个包含这些词的一个文档

当然在“衬衫”这个词底下也是对应一个词库,我们把它命名为【衬衫.txt】也是包含衬衫的所有的关键词

然后每一个词底下都是对应一个最优最佳类目的,然后在这些词中去找他们的交集点,这样一来交集出来的词都是比较相关的了,这就是简单的拆词和相关匹配

但是最小滑动窗口是什么呢?

也就是说“长袖”这个词和“衬衫”这个词之间的距离,如果标题写成“长袖衬衫”比“韩版春装长袖衬衫”这个词相关性好,这是系统拆词的一个原则。

2)query不要有异议

什么意思呢?

这是个是相当严重的问题,因为在淘宝系统去识别我们的标题的时候,如果识别错误的话,那就不好了,所以我们不能让淘宝系统进行误识别,因为系统是根据算法来的,不可避免的会错一些,但是针对这个问题,我们必须需要谨慎和注意,也就是你在组合标题一定要正确,不能出现假词.

3)属性query进索引

我们知道,淘宝的搜索叫做路径搜索和百度不一样,百度是目标搜索。而淘宝搜索会先去匹配用户搜索的关键词的类目分布,然后去匹配我们的标题宝贝。

这是我们之前理解的相关性,其实淘宝远远不是这么简单的审核我们的相关性

所以我们知道,产品不能放错类目。但是呢?仅仅是这样远远满足不了用户的需求度和客户体验,所以进出来了这个属性进索引。

其一:当我们的宝贝的标题如果没有写上属性词的时候,但是我们的属性当中存在这个属性或者勾选了这个属性,那么用户在搜索这个词的时候,淘宝也会展示我们的商品,这是因为属性进了索引。

其二:我们需要去做的是不是说属性词就可以不写在标题当中了呢?显然这样去做会损失很多流量,不是因为淘宝不去展示我们的宝贝,而是因为影响排名因素的权重或者因子,不单单是属性这一项,所以我们的人气分很低的时候而是很难把握的,因为前面说到了紧密组合是吧,所以我们需要的是把一重要属性或者热搜属性进行书写并紧密结合。所以我们需要填好属性,而且要全面的把属性填的完整。

【有一点需要注意的是,属性和标题是不能冲突的,如果属性勾选的是“圆领短袖”但是标题中却出现了“方领长袖”显然这样是不会展示的,而且还是违规。所以在写标题的时候千万不可以用这样的字眼和犯这样的错误。

4)宝贝标签进索引

这个原则,不是所有类目都有的,会被淘宝索引进索引库的

 就是在我们点击宝贝发布的时候会有这个宝贝标签

5)词性

词性,直接决定了你的排名非常重要

名词和形容词,属性词

这是什么意思呢?我们知道淘宝是系统识别标题的,但是系统如何知道我们的产品是什么,或者叫什么呢?

有人会说不是区分最优类目了么,可是类目底下还是包含很多的词的,然而淘宝是如何准确的识别我们产品的名称的呢?

这就牵涉到我们的词性的问题。

我们知道语句中会有主语、谓语、宾语,也有谓宾短语。

淘宝也是这样识别的,先是拆词,然后进行词性的处理,分辨出你的产品中的名词,也就是名称词。

我们需要把握的就是让淘宝系统准确的识别出我们的名词也就是中心词。那怎样做到呢?

空格的有效利用

感谢大家收藏和关注,我是老夏,专注原创【淘宝天猫电商运营系列文章】,

很高兴和大家分享,祝您2018年旺旺旺!!


友情链接