讨论Spark上分布式机器学习库的实现。
Spark的机器学习库主要分为ml和mllib,其中ml较新,本文主要围绕ml来讲。
ml和mllib底层会用到Breeze库(类似于numpy的线性代数库)和BLAS(Basic Linear Algebra Subroutines,更基础的线性代数库),在这里也进行介绍。
福州游记
发表于
由于疫情因素,原本的深圳之行最终改为了福州之行。我们分别从深圳和无锡出发,在福州站汇合。
用Python处理Excel和Word
发表于
微软的 Office 系列具有非常厉害的技术,但产品具有极高的学习成本,例如在查找替换这一项,它不支持标准的正则表达式(毕竟是 wysiwyg 嘛,也要考虑样式),但不是基于正则表达式定制,而是自己另辟蹊径,这就有点让人难受了。而内置的 Word VBA 的相关文档和 Demo 又很少,基本要靠录制宏来现学现卖,而录制宏生成的代码过于 adhoc,难以泛化,所以这时候借助于 Python 来处理相关文档就显得比较有意义。
OAuth2.0标准简析
发表于
以第三方接入的视角,讲解OAuth2.0协议。
Python HTTP Server实现详解
发表于
本文讲解Python 2.7版本上的HTTP Server的实现。
Innodb学习笔记
发表于
本文是有关InnoDB实现原理的读书笔记,主要包含:
- 《MySQL技术内幕(InnoDB存储引擎)第2版》
- 《MySQL内核:INNODB存储引擎 卷一》
在本文中,主要介绍下面内容:
- MySQL/InnoDB的配置和搭建
- MySQL/InnoDB的宏观架构
- MySQL/InnoDB的日志,以及事务中涉及到日志相关的部分
在本文中,不会详细介绍:
- 刷脏页机制
- MVCC机制
- 索引机制和索引页的维护
- MySQL服务器
线性代数复习——以MIT18.06为指导
发表于
Go语言学习笔记————Codewar做题实录
发表于
Go 语言之前在写 6.824 的时候用过,现在单独拿出来学习一下,主要学习方式以在 codewar 做题为主
异星工厂常用命令介绍
发表于
本文主要介绍异星工厂常用的Lua命令,以及异星工厂服务器的搭建
multiprocessing模块实现
发表于