国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python常见问题 > 怎么用python写spark

怎么用python写spark

头像

silencement

2019-11-21 09:41:222304浏览 · 0收藏 · 0评论

为什么要使用Python来写Spark

Python写spark我认为唯一的理由就是:你要做数据挖掘,AI相关的工作。因为很多做数挖的他们的基础语言都是python,他们如果重新学scala比较耗时,而且,python他的强大类库是他的优势,很多算法库只有python有。

Win本地编写代码调试

编辑器:PyCharm

Spark:1.6

Python:2.7

Win环境准备

Python的安装

解压python包,在环境变量里面配上bin的路径

Spark的安装

下载spark的bin文件,解压即可,在环境变量配置SPARK_HOME

要可以通过编辑器来安装,如pycharm,查找pyspark库安装即可

Hadoop安装

安装hadoop环境 。在win下面需要winutils.exe;在环境里面配置HADOOP_HOME 即可。

代码示例

# -*- coding: utf-8 -*-
from __future__ import print_function
from pyspark import *
import os
print(os.environ['SPARK_HOME'])
print(os.environ['HADOOP_HOME'])
if __name__ == '__main__':
    sc = SparkContext("local[8]")
    rdd = sc.parallelize("hello Pyspark world".split(" "))
    counts = rdd \
        .flatMap(lambda line: line) \
        .map(lambda word: (word, 1)) \
        .reduceByKey(lambda a, b: a + b) \
        .foreach(print)
    sc.stop

python学习网,大量的免费python学习视频,欢迎在线学习!

问题:

from pyspark import *

找不到pyspark。那你需要把spark的bin包下面的python的所有都拷贝到(可能需要解压py4j)

%PYTHON%\Lib\site-packages下面去。这样,你的编辑器才能找到。

或者:

配置你的编辑器的环境变量:

PYTHONPATH=F:\home\spark-1.6.0-bin-hadoop2.6\python;F:\python2.7\Lib\site-packages

使用spark-submit提交时用到其他类库 –py-files xxxx/xxxx.zip,xxxx.py。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

打扑克的全程视频| 一边啃奶头一边躁狂会怎么样| 打开网站免费进入| 白天像教授晚上像野兽 | 亚洲六区| 丈夫不在的日子中字头| 巨乳美女| 老师掀起裙子让我挺进| 暴躁老阿姨与老年人的爱情与财运| 欧美黑粗大硬巴XXOO| 一母四女共一婿的全诗解读| 无码亚洲一区二区三区| 陈宝莲作品| 男女做受A片AAAA| 臭小子快拔出来危险期会怀孕| 妈妈がだけの爱いたい歌词| 儿子日娘章节小说| 公憩止痒小说原著叫什么名字| 戴着小玩具练瑜伽| 《大尺度吃奶做爰》电影| 美女热舞| 美女两个球球抖动抓球球视频| 小丹让我尝尝你的味道是什么歌啊| 双人床上剧烈运动会怎么消除| 大姨妈来了同房内射吃避孕药| 老汉噗嗤一声整根全进视频| 明明说好的只蹭蹭苦苦恳求歌词 | 男女打扑克| 向日葵在线观看免费高清电视剧| 吴彦祖| 黑料不打烊吃瓜爆料黑料| 快一点慢一点上一点下一点歌曲| 母与子免费观看大全电视剧| 坤坤寒入桃子里电视剧免费看 | 《诱人的女房东3》| 女人做爰高潮全黄| 速度与激情9| 小雪被房东CAO得合不拢腿| 韩漫免费浸画在线阅读| 停电后我和公做了爱| 下面的小嘴又饿了