开源大数据平台 E-MapReduce

弹性稳定、存算分离,帮您快速构建AI时代开源大数据平台底座

  • 100% 兼容开源

    100% 采用社区开源组件,随开源版本升级迭代
  • 安全可靠

    分钟级搭建大数据计算环境,智能诊断分析,Kerberos身份认证,数据加密等
  • 节约成本

    计算资源按需使用,自动数据冷热分层存储, 支持阿里云抢占式实例等
  • 弹性资源

    支持按负载/时间配置规则,分钟级弹性伸缩, 支持多种弹性资源类型
  • 1/0

    产品动态

    产品简介

    阿里云开源大数据平台(E-MapReduce,简称EMR)是基于开源框架的一站式大数据处理服务,提供智能数据湖方案。支持大数据处理的各类场景,无缝对接阿里云多种服务,支持分钟级快速部署、弹性扩容,拥有高可用架构,服务可用性高达99.9%,数据可靠性达99.9999999%。广泛应用于日志分析、客户画像、物联网数据分析、金融数据分析等领域。助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。在大数据处理领域处于领先地位。
    开源大数据平台 E-MapReduce

    产品优势

    开源大数据平台 E-MapReduce(简称“EMR”)为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto等开源大数据计算和存储引擎,支持on ECS、on ACK以及Serverless多种部署形态,选择EMR,您可以轻松构建具备以下优势的云上服务。
    img

    100%兼容开源社区组件,性能较开源版本提升3-5倍

    100%采用社区开源组件,随开源版本升级迭代。适配开源组件,避免开源组件之间的版本兼容性问题。基于开源组件优化和增强阿里云部署环境,性能远高于开源版本。

    img

    分钟级搭建大数据计算环境,支持智能诊断分析

    分钟级搭建大数据计算环境,支持一键调整计算资源规模,无需人工部署和启动服务。完善的监控和告警体系,支持智能诊断分析,大幅缩减排障路径,提升运维效率。

    img

    计算资源按需使用,自动数据冷热分层存储,支持抢占式实例等多种优化手段

    计算资源按需使用,降低闲置算力成本;自动数据冷热分层存储,降低单位存储成本。丰富的运维辅助工具,智能诊断分析,便捷管理大数据平台,降低运维成本;支持阿里云抢占式实例、预留实例券(RI)、混合计费等多种成本优化手段,进一步压缩成本支出。

    img

    支持按负载/时间,灵活配置规则;分钟级弹性伸缩,支持多种弹性资源类型

    支持按负载/时间,可灵活的根据业务场景配置规则。分钟级弹性伸缩,极高效率,响应快速变化的业务诉求。支持多种弹性资源类型。

    图片

    Gartner®

    国际权威咨询机构 IDC (国际数据有限公司) 中国首次发布了《IDC MarketScape: 中国实时湖仓市场 2024 年厂商评估》,凭借领先的产品技术服务及市场策略,​阿里云在首次报告发布即入选领导者类别。​其中,阿里云在​能力维度获中国第一​。​
    国际权威咨询机构 IDC (国际数据有限公司) 中国首次发布了《IDC MarketScape: 中国实时湖仓市场 2024 年厂商评估》,凭借领先的产品技术服务及市场策略,​阿里云在首次报告发布即入选领导者类别。​其中,阿里云在​能力维度获中国第一​。​

    安全合规

    阿里云 EMR 提供全面的安全防护与合规支持,涵盖网络隔离、认证授权、加密、审计等多维度安全机制,保障数据机密性、完整性和可用性。具备多项国内外权威合规资质,如等保二级、三级、ISO 27001、ISO 27701、GDPR 等,满足金融、政务、医疗等多行业严格合规要求。

    卡片头部图

    网络和基础设施安全

    访问隔离通过安全组管理,对集群内的ECS实例进行出方向和入方向的网络控制,满足业务网络保护要求。
    存储传输加密通过数据盘加密,对动态数据传输及静态数据加密,保护数据的隐私性和自主性,为业务数据提供安全边界。
    卡片头部图

    系统安全

    权限管控通过阿里云通用RAM访问控制鉴权,控制对EMR集群资源的操作权限。
    操作审计通过阿里云Action Trail操作审计查询用户操作EMR产生的管控事件,满足业务实时审计、问题回溯分析需求。
    卡片头部图

    容灾安全

    数据容灾数据支持多副本存储,任一数据出现问题时,副本数据自动切换恢复,保证数据的可靠性。
    服务容灾通过核心组件高可用部署,保障任一服务节点故障时,能够自动切换,保证服务不受影响。

    客户案例

    开源大数据平台EMR为您提供安全可靠、弹性伸缩的云原生大数据平台,在不同行业内都沉淀了不少客户案例,为广大客户解决了诸多业务挑战。

    bannerbannerbanner
    1
    喜马拉雅
    “阿里云的开源大数据平台可以兼容业界开源大数据协议,在合作的过程中,我们也能感受到阿里云开源开放的态度,这点非常符合喜马拉雅坚持走开源大数据的发展理念。”喜马拉雅大数据工程负责人陈叶超强调。
    了解更多
    2
    猿辅导
    “为了应对不同的业务场景,我们希望能够有一个引擎,可以完成在 AP 场景下的统一,这时就发现了 StarRocks, StarRocks 借助于它本身优秀的向量化引擎的能力,能够在大部分场景下性能提升显著,因此我们决定将更多的场景基于 StarRocks 来做。”猿辅导大数据平台团队负责人申阳强调。
    了解更多
    3
    微财
    微财科技选择基于 EMR Serverless Spark 建立数据平台,有了单独的资源池进行模型训练,避免了资源冲突,同时还解决了存算分离架构下需要处理 Shuffle 稳定性和性能问题的困扰。
    了解更多
    免费试用

    想体验更多产品功能?

    立即购买 开源大数据平台 E-MapReduce产品

    了解更多阿里云产品介绍?

    探索 阿里云产品 了解更多产品介绍

    遇到了困难需要帮助?

    联系我们 咨询阿里云服务团队