by Steve Watt, Chief Architect, Big Data, Red Hat
Red Hat and Continuum Analytics are pleased to announce a new solution that allows customers to deploy PySpark on top of Red Hat Storage GlusterFS. If you're attending Strata, you are encouraged to swing by the Red Hat Booth to grab a solution brief that describes how the solution is put together and how you can set it up. However, for those of you that are not at Strata, here's the overview -- and be sure to check out the technology brief, here.
Continuum Analytics are the makers of Anaconda, a leading Python distribution. At Strata, Continuum Analytics are announcing a new product, Anaconda Cluster, which is a highly-scalable cluster resource management tool. Red Hat Storage GlusterFS is a cost effective, easily scalable, POSIX compliant, distributed filesystem that runs on industry standard servers. Given that accessing data in HDFS from Python can be cumbersome, Red Hat and Continuum Analytics have built a solution that enables Anaconda Cluster to deploy PySpark on GlusterFS. This collocated solution keeps life simple for Python developers by providing a Python interface to Apache Spark that is able to read and write data on a distributed filesystem that looks and works like the local filesystems that they are used to. Furthermore, given that both Python and GlusterFS are written in C, this allows easy access to data from Python applications whether they are running on-premise or in the cloud.
If you'd like to try it out, please check out the demo posted in the video below and its accompanying tutorial: https://github.com/wattsteve/pyspark-tutorial
Sobre o autor
Navegue por canal
Automação
Saiba o que há de mais recente nas plataformas de automação incluindo tecnologia, equipes e ambientes
Inteligência artificial
Descubra as atualizações nas plataformas que proporcionam aos clientes executar suas cargas de trabalho de IA em qualquer ambiente
Serviços de nuvem
Aprenda mais sobre nosso portfólio de serviços gerenciados em nuvem
Segurança
Veja as últimas novidades sobre como reduzimos riscos em ambientes e tecnologias
Edge computing
Saiba quais são as atualizações nas plataformas que simplificam as operações na borda
Infraestrutura
Saiba o que há de mais recente na plataforma Linux empresarial líder mundial
Aplicações
Conheça nossas soluções desenvolvidas para ajudar você a superar os desafios mais complexos de aplicações
Programas originais
Veja as histórias divertidas de criadores e líderes em tecnologia empresarial
Produtos
- Red Hat Enterprise Linux
- Red Hat OpenShift
- Red Hat Ansible Automation Platform
- Red Hat Cloud Services
- Veja todos os produtos
Ferramentas
- Treinamento e certificação
- Minha conta
- Recursos para desenvolvedores
- Suporte ao cliente
- Calculadora de valor Red Hat
- Red Hat Ecosystem Catalog
- Encontre um parceiro
Experimente, compre, venda
Comunicação
- Contate o setor de vendas
- Fale com o Atendimento ao Cliente
- Contate o setor de treinamento
- Redes sociais
Sobre a Red Hat
A Red Hat é a líder mundial em soluções empresariais open source como Linux, nuvem, containers e Kubernetes. Fornecemos soluções robustas que facilitam o trabalho em diversas plataformas e ambientes, do datacenter principal até a borda da rede.
Selecione um idioma
Red Hat legal and privacy links
- Sobre a Red Hat
- Oportunidades de emprego
- Eventos
- Escritórios
- Fale com a Red Hat
- Blog da Red Hat
- Diversidade, equidade e inclusão
- Cool Stuff Store
- Red Hat Summit