Skip to main content

Command Palette

Search for a command to run...

#dmls

Articles tagged with #dmls

  1. 精读《设计机器学习系统》-ch04: 训练数据

    不同于 Chapter03 从系统的角度来处理数据,这一章从数据科学的视角来处理数据。这章的标题是“training Data”,而非“training dataset”,因为 数据集(dataset) 意味着有限(finite)和固定(stationary), 而现实生产环境中的 数据(data) 通常是 无限 并且 不固定 的。 抽样 抽样方法在 ML 项目的生命周期中无处不在,在这一节中,我们使用生成训练数据作为例子。 那为什么需要抽样?直接使用全部数据不可以吗? 首先,在现实世界中,并不...

    Dec 10, 20222 min read49
    精读《设计机器学习系统》-ch04: 训练数据
  2. 精读《设计机器学习系统》-ch02: 机器学习系统设计导论

    业务和机器学习目标 对于大多数的算法/开发工程师,大部分关注机器学习模型的指标: 准确率, F1 score, 推理时耗等等,并且热衷于使用大量的资源(数据,计算量,开发时间)来获得微小的提升。 然而对于大部分的公司,并不关心以上的机器学习指标,诺贝尔奖获得者 Milton Friedman 指出,大部分公司的关心的是“能否提升股东们的收益”。 任何业务的终极目标都是这个,提升用户满意度,增加用户市场,提升点击率等等目标,都直接或者间接和它相关。 对于一个在商业组织成功的机器学习模型,如果想要...

    Nov 24, 20221 min read19
    精读《设计机器学习系统》-ch02: 机器学习系统设计导论