机器学习公式详解--51Testing独家连载

发表于:2023-6-12 09:11

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:克里斯蒂安·迈尔    来源:51Testing软件测试网原创

  前 言
  在撰写“南瓜书”第1 版期间,笔者和秦州有幸结识同样在为“西瓜书”写注解的贾彬彬老师,由于当时第1 版已定稿,未能合作,遂相约一起撰写“南瓜书”第2 版。我们利用工作之余,历时两年,在第1 版的基础上,延续之前的思路,以本科数学视角对“西瓜书”中的内容做了更进一步的解读。除了大幅扩充解读的公式数量以外,我们在部分章节开篇处加注了学习建议和些许见解,供读者参考。此外,为了照顾数学基础薄弱的读者,我们又增添了许多数学知识的解读,同时将其前置在所用到的章节处,不再以附录的形式给出,以便于查阅。
  第2 版的使用方法保持不变,仍然是“西瓜书”的教辅,读者在阅读“西瓜书”过程中如遇到难以理解的知识点或者公式,可查阅本书相应章节的解读,辅以理解,效果最佳。为了与“西瓜书”中的图表进行区分,本书中的图表序号格式为“章节号-图表序号”(例如“图2-1”),而“西瓜书”中的图表序号格式为“章节号. 图表序号”(例如“图2.1”)。
  对于本书中的内容,需要掌握到何种程度?这是自本书第1 版出版以来,笔者收到的最多的反馈。其实学习目的不同,需要掌握的程度也不同。学习机器学习的人群按照其学习目的可简单分为三类:期望从事机器学习理论研究的人,期望从事机器学习系统实现的人,以及期望将机器学习应用到具体场景的人。对于期望从事机器学习理论研究的读者,本书中的内容理应全部掌握,同时对本书所涉及数学知识的归属学科也理应系统性学习,诸如最优化、矩阵论和信息论。对于期望从事机器学习系统实现的读者,本书中的内容用于了解算法细节,以便进行工程化实现和性能优化,因此涉及算法原理的公式推导理应读懂。对于期望将机器学习应用到具体场景的读者,本书可以帮助其深入理解各个算法所适用的数据类型,因此其中的公式推导可以不深究。本书的编写初衷是希望分享过来人的经验,以期望帮助“西瓜书”的读者们在有限的时间成本下,踩更少的“坑”,学更多的知识。
  本书由开源组织Datawhale 的成员采用开源协作的方式完成,参与者包括3 位主要作者(谢文睿、秦州和贾彬彬)、5 位编委会成员(居凤霞、马晶敏、胡风范、周天烁和叶梁)、12 位特别贡献成员(awyd234、feijuan、Ggmatch、Heitao5200、xhqing、LongJH、LilRachel、LeoLRH、Nono17、spareribs、sunchaothu和StevenLzq)。本书的开源版本托管于GitHub,仓库名为“pumpkin-book”。
  由于编者水平有限,书中难免有所纰漏和表述不当之处,还望各位读者批评指正。关注微信公众号“Datawhale”,回复“南瓜书”即可与我们取得联系,我们将尽力提供答疑和勘误。
  谢文睿
  2023 年3 月1 日于后厂村
32/3<123>
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号