Spark 性能调优

collect

大数据集可以分区获取。collect类操作时,各分区的数据会复制回主节点

count() isEmpty()

看看 RDD.scala isEmpty()方法的源码就可以发现

Back to top

comments powered by Disqus