1. 负责公司数据底座需求技术实现全生命周期管理,从技术方案调研、设计开发到上线,确保技术方案满足业务对数据快速响应需求。
2、制定大数据离线/实时计算开发标准,落地大数据技术管理制度、技术标准、技术规范,监督大数据开发交付实施的技术标准落地,编写高质量代码与技术文档,主导数据交付过程的设计评审与代码Review和计算任务调度上线。
3、设计和开发高可靠、实时和离线的数据采集与处理任务框架,负责核心参数调优与二次开发,参与核心技术实现流程的开发,持续优化数据开发流程和技术方案。
4、主导数据产品交付相关的数据模型设计,建立高效、规范的数据分层模型,设计数据建模、分析与应用方案,从多源数据中提炼业务价值,支撑业务决策与产品创新。
5、与业务、技术、产品团队深度协作,落地数据拉通和数据产品解决方案,提供数据开发技术支持与优化建议,推动数据能力在各业务场景的规模化应用,推动数据应用如BI报告开发、CDP应用的持续迭代优化。
1、7年及以上数据仓库、大数据开发或数据中台系统开发相关工作经验,,3年以上数据架构师工作经验,精通数仓模型设计方法论(如维度建模)与 Hadoop 生态组件(Hive/Kafka/Spark/Flink/HBase)实操。
2、具备 Doris 实时数仓开发经验,精通 Java/Scala/Python 至少一门编程语言,有丰富的 ETL 工具应用与代码优化经验。
3、有公司经营指标建设项目、CDP及营销自动化工具落地项目、数据分析系统落地至少两个领域的完整落地经验,熟悉零售、家电、制造及2C市场营销的相关业务知识及数仓建模方法。
4、 责任结果导向:以任务交付效率、模型复用率提升为核心目标,拆解工作节点,制定明确计划,确保按时高质量完成开发任务。
5、执行力 - 系统思维:能清晰梳理数仓分层逻辑与实时任务链路,设计兼顾复用性、扩展性与性能的开发方案,减少重复改造。
