现实世界中的主动学习
编者注:更多内容可以参考Strata北京2017的相关议题

线上世界中充满了丰富多彩的计算机应用创造的财宝。我们不再写信, 而是发电子邮件;我们不会在导游手册上寻找好的餐厅,而是去看 OpenTable。甚至当使这一切成为可能的计算机出错的时候,我们也还是去网络中寻找解决办法。我们的生活已经依赖这些数量庞大的 “信号”了。

但是有信号的地方就一定会有噪声(不准确的、不合适的或者仅仅是没有帮助的信息)。例如,使用电子邮件,我们就会碰到想要阻挡的垃圾邮件;在查找新的工作机会的时候,我们就会收到很多自动产生的工作推荐,但绝大多数都是不合适的匹配;过滤器试图去发现色情图片,但同时也会被医学图片所误导。

我们(自己)是可以过滤掉这些噪声,但在某种程度上会得不偿失。我的意思是,当计算机和算法可以让事情变的更简单(例如为了过滤垃圾邮件),我们可以给计算机和算法一些已知的垃圾邮件和非垃圾邮件的例子,帮助算法来更好的过滤邮件。

封面