如何避免客户流失(4)

客户1和客户2 均与不止一家公司进行交易,但是他们的购买份额并没有平均分配给与其有交易的各家公司。在这种情况下,我们不会知道他们具体的流失时间,许多消费品的采购都属于这种类型。在这种方式中,被用来建模的并不是客户流失的时间,而是与每家公司或每种品牌相关的客户转移概率。迁移模型和马尔科夫(Markov)模型通常都是用来估算客户转移概率的模型。

广泛应用的流失模型

在上述不轻易转变型的方式中,模型预测了客户流失的概率。在众多能够预测客户流失概率的模型当中,有两个统计模型被广泛应用于不轻易转变情形下的流失预测,这两个模型分别是逻辑回归模型和风险模型。即使在多方尝试型的情形下,公司也可以有效地使用逻辑回归模型预测客户迁移的上升或下降趋势,关于这一点,我们将会在本章的后面作出阐述。

逻辑回归模型

逻辑回归模型是回归预测分析模型之一,其中的因变量是一个二元值,并假定只有两个离散值(0或1)。在客户流失模型中,因变量指的是客户在某个特定时期是否会流失。也就是说,如果客户流失,因变量就是1,否则就是0。模型中的自变量通常分为四类:基于成交的特征(或交换特征)、客户特征、产品特征以及公司的营销工作。应用在流失模型中一些关键的交换特征分别是第一次购买后的时间(持续时间)、最后一次购买后的时间(最后一次购物)、所购产品的种类(购买的全部)、每类产品所购数量(购物焦点)、平均的购买时间间隔或购买频率,以及平均收入。客户特征通常由人口统计学中的变量组成,如收入、年龄和受教育程度。重要的产品特征包括产品种类,以及某些产品的当前所有权。市场营销工作在预测客户流失问题方面起着非常重要的作用,它包括营销沟通的数量以及与客户沟通的渠道(如电子邮件、电话和面对面的交流)。

公司使用一段时期内(例如三年)的交易数据和营销沟通数据来建立模型,而这些抽样数据就是所谓的校准试样。公司还会预留短期(例如一年)的类似数据,以测试这个使用校准试样得出的模型估测数据是否对其他样本也适用。这个样本被称为有效样本。无论是校准数据还是有效数据,都包含客户是否已在观察期内流失的信息,而通过这些信息可以得出因变量的值。同时,这些数据也含有与交换特征、客户特征、产品特征、营销沟通(所有自变量)相关的一些信息,这些信息与每一个因变量的值是相对应的。此时便可通过校准试样建立逻辑回归模型,然后就可以估算出参数值。简单来说,逻辑回归模型确定了一套自变量,而这些自变量有可能影响因变量的值和与每一个自变量相关的值(指自变量对因变量影响程度的参数)。在使用校准数据确定有关的变量及系数后,公司便可以为有效数据中的所有观测预测出因变量的值,然后与实际数据进行比较。如果模型与有效数据相符,公司就可以预测今后一段时期内的因变量的值。逻辑回归模型中估算的所有因变量数值均在0~1之间,这些估算得出的值被视为客户流失的概率或流失倾向。

风险模型

风险模型是建立在生存和风险函数基础之上的,通常被用来分析失效的时间(或某一事件发生的时间)。虽然风险模型最初是在生物化学领域发明的,用来研究一些治疗方法对个别生命期的影响,但现今它已广泛应用于不同领域,用来研究某些事件发生的时间(这些事件有可能是机器发生故障,或客户购物,总之因情形而异)。生存函数表示个体生存(不包括该事件的发生)至某个特定时刻(t)的概率。对购买产品这一事件来说,生存函数就是客户不购买产品的概率(在这种情况下,事件是指购买产品)。风险函数是指假设该个体存活至t,在时刻t瞬时流失的概率。在客户流失的情况下,如果假设客户在一段时期后才会流失,那么他最近时期从公司流失的概率就是风险概率或风险函数。风险模型的一个优点是:把没有发生的事件作为截尾观测数据。例如,在用于设计模型的样本中,观测期间有20位客户没有流失,而其余80人流失了。因为目前这20人尚未流失,所以风险模型视这20人的观测数据为截尾,并且在模型中只包含他们的生存函数。对于其余的80人,风险模型中既包含了生存函数,也包含了风险函数,当应用类似逻辑回归这样的模型时,样本中的20人作为未流失的客户,而另外80人作为流失的客户。该种研究方法往往忽略了这样一个事实:若将时间跨度加长,那些所谓的未流失的客户也可能流失。

读书导航