Spark 性能调优

collect 大数据集可以分区获取。collect类操作时,各分区的数据会复制回主节点 count() isEmpty() 看看 RDD.scala isEmpty()方法的源码就可以发现…

More

Spark RDD 和 DataSet

看DataSet完整类名:org.apache.spark.sql.DataSet, 会认为它只是处理DB数据才用到,大概类似java.sql.ResultSet, 只是它支持分布式并行计算。其实不然。…

More

Mac上Kubernetes快速上手

Mac上使用minikube 安装ghost blog service…

More

Privoxy HTTP 代理配置

GFW内的同学,都懂的…

More

RancherOS zsh配置

RancherOS 的 alpine console 上使用zsh…

More