Online Learning笔记系列

1. Offline Learning

传统的机器学习是offline的。大致的步骤为：给定训练数据，训练模型，再将模型应用在测试数据上。这样做的前提是假设了训练数据与测试数据源于统一分布。但是在实际问题中，往往是不成立的，现实生活中的数据是实时到来，数据分布也会有所变化。比如一般来说，用户一年四季的购物喜好是不同的。对于这种数据流数据，传统机器学习会有很多问题，具体来说有：

Evolving / Concept drift 数据的分布往往是随着时间实时变化或演化的。比如一年中顾客购买衣物的习惯是随着季节而变化的，这种变化被称为概念漂移。一般来说，概念漂移现象很普遍，表现为数据的分布变化$P(X)$，或者后验分布变化$P(Y\mid X)$。从变化的快慢又可以分为渐变的概念漂移和突变的概念漂移。从字面上可以理解，前者变化缓慢，后者变化快速，这类概念漂移往往难以捕获，难以和噪声数据所带来的影响加以区别。
Constraints in terms of memory and running time 由于数据吞吐量与计算机硬件的限制，离线模型通常难以处理大规模的数据。当然，计算能力的问题可以通过分布式机器学习算法得到解决。对于变化的数据，采取离线更新模型的方式（这里的更新是指以离线的方式，在新训练集上重新训练模型，再放回线上应用场景之中），但是，新训练数据随着时间不断增大，模型训练将变得更加费时。
Trade-off between Accuracy and Efficiency
如果要离线重新训练模型，那么为了保持效率，则必须牺牲模型精度。比如采用一定时间内的数据来做模型的重新训练等等

2. Online Learning

在线学习则是以当前数据驱动的方式，实时更新模型（这里的更新不是指重新训练模型，而是根据当前数据，对模型对必要的实时改修）。所以在线学习的优势体现在了他的Real-time update and prediction和Data Scalability之上。如下面的流程图所示。对于新到来的数据，模型首先对他进行预测，根据预测结果，模型suffer loss。然后，模型收到feedback信息，最后更新模型。这里模型的更新一般来说会用到feedback的信息，比如ground truth 。当然feedback也不一定都是存在的，如半监督在线学习用无标签数据来更新模型。

Online Learning (1)

Introducation

1. Offline Learning

2. Online Learning

CATALOG

FEATURED TAGS

FRIENDS