百度搜索天气关键词识别策略优化

一、背景和目的

1. 背景

我们在使用百度地图的过程中,如果要搜索从某一地点到另一地点如何坐公交才能到达时,百度地图往往会给我们展现出多个路线推荐。那么到底为什么会有多个路线推荐呢?这其中的路线推荐策略是什么呢?

2. 目的

通过对百度地图公交推荐路线的策略四要素进行分析,从而熟悉策略的分析过程,并且对百度地图的公交推荐路线的策略有更清晰的认识。

二、百度地图推荐路线策略四要素分析

1. 待解决问题

找到使用公交出行方式,从地点A到地点B的最优路线。

2. 输入

影响用户公交出行的因素主要分为用户主观因素以及客观因素。其中主观因素是用户的出行位置信息及出行偏好,被动因素指天气、时间等外界因素。

3. 计算逻辑

1. 出发地与目的地不在同一座城市

首先需要考虑长途出行的公共交通方案,如高铁、火车、飞机、大巴等。然后再考虑如何将出行方式进行排序。下图是使用百度地图的公交查询搜索的出发地和目的地位于不同城市的搜索推荐:

从北京出发到其它省份(不完全)的出行方案汇总:

从上表的数据中,我们似乎可以得出一个结论,两地距离1800公里甚至1900公里以上的会优先推荐飞机方案,低于这个阈值的会优先推荐高铁方案。

但是这里还有个问题,我们只收集了从北京出发的各种情况,还有起点终点均为其它城市的情况,我们没有考虑到。如下图:

从保定到韶关距离1789公里,优先推荐的飞机方案;从韶关到保定1768公里,优先推荐的也是飞机方案。并且我们发现,从a到b与从b到a的推荐方案并不是采用的同一种方案,如:从保定到石家庄正定机场与从石家庄正定机场到保定所推荐的路线竟然不一样,相差了1个小时的时间。

这个例子其实已经证明,我们如果单纯按照两地相距的距离来作为方案推荐的依据是非常不合理的。我们还需要考虑其他的因素如城市内的通行方式是如何推荐的(参考下面出发地与目的地在一座城市);城市间的通行方式都可能受到哪些因素的影响,如:距离、时长、甚至根据用户历史使用习惯来判定用户是否对价格不够敏感等因素。

2. 出发地与目的地在同一座城市

为了研究出发地与目的地在同一座城市的公交路线推荐策略,我们还需要通过几次搜索来进行判断。下面是几次搜索结果的统计:

通过上面的搜索结果我们发现,有时候最佳路线可能不是最快的、步行距离最短的、换成次数最少的,但是该路线为什么会成为推荐路线呢?

我们猜测这可能是不同的影响因素,都有各自的权重系数,然后将所有的影响因素与其权重系数的积加起来,就会得到一条路线的得分。最佳出行方案应该就是那条得分最低的方案。

首先我们需要将方案的各个影响因素的单位统一起来,将时间、步行距离、换成次数折算成分值,方案分值越低越好。折算方式如下表:

如方案A花费的时间为50分钟,步行距离1000米,换乘次数2次;方案B花费的时间55分钟,步行距离500米,换乘次数1次。

方案A的得分为:时间得分 = 50 / 5 = 10分;步行距离得分 = 1000 / 300 = 3.3分;换乘得分 = 2 / 1 = 2分;

方案B的得分为:时间得分 = 55 / 5 = 11分;步行距离得分 = 500 / 300 = 1.67分;换乘得分 = 1 / 1 = 1分;

计算逻辑为:方案得分 = 方案时间 * 时间系数 + 方案步行距离 * 步行距离系数 + 换乘次数 *换乘系数 + 出行方式 * 出行方式系数。最后还需要增加一个判断,即:在选定时间节点下,方案是否可用,如果不可用则直接放到页面底部中的不在运营时间的方案中。

假定时间、步行距离等因素的系数如下表:

因此方案A与方案B的最终得分为:

方案A得分 = 10 * 3 + 3.3 * 2 + 2 * 1 = 38.6分

方案B得分 = 11 * 3 + 1.67 * 2 + 1 * 1 = 37.34

方案B因为得分低于方案A,因此方案B为推荐方案。

当然在基础的计算逻辑之外,还有其它因素会影响计算逻辑:

如:

– 公交车停运时,该方案直接放到页面最下方的“以下方案不在运营时间内”模块中;

– 天气状况不好时,调低步行距离系数;

– 是否是早晚高峰期,有无班车(快速直达专线)。如果在早晚高峰期且有快速直达公交,如果没有其他更优路线,优先推荐次方案;

– 路线中是否有堵车风险,如果没有则排序前调;

– 少步行:用户选择少步行时,直接将步行距离最短的路线方案作为方案排名的第一位;

– 时间短:用户选择时间短时,直接将用时最少的方案作为方案排名的第一位;

– 地铁优先:用户选择地铁优先时,将方案中使用地铁的方案作为方案排名的第一位,如果有多个乘坐地铁的方案,则再按照上面的基础计算规则进行排序;

– 不坐地铁:用户选择不坐地铁时,将发难中不使用地铁的方案作为方案排名的第一位,如果有多个不乘坐地铁的方案,则再按照上面的基础计算规则进行排序;

4. 输出

1. 正常时间与夜间的路线对比,不在运营时间的放到列表下部。

2. 正常时间与上下班时间的路线对比,早晚高峰时期,如果有快速直达专线且整体得分靠前,优先推荐。并且快速直达专线还展示了最近班次的发车时间。

发表评论

邮箱地址不会被公开。 必填项已用*标注