简介

6年+ 一线互联网大厂(腾讯、网易)基础架构与混合云平台开发经验。精通 Python/Golang,深入理解云原生生态(K8s Operator/CI/CD)。

在腾讯期间参与核心 PaaS 平台建设,支撑内部 1600+ SaaS 应用的全生命周期管理;

在网易主导 Gamecloud 混合云架构演进及 AIOps 落地,支撑网易互娱在海内外多云环境共 10,000+ 台虚拟机的集中纳管与智能运维。

具备极强的底层技术钻研能力与极客精神(拥有 C++ 客户端逆向、底层虚拟机分析与 600+ Star 复杂开源项目的主导经验)。

工作经历

资深平台开发工程师

2024 - 至今
网易, 广州

高级工程师

2019 - 2024
腾讯, 深圳

技能 & 熟练度

后端开发

Python (Django/DRF/Celery)GolangC++

精通 Python 与后端架构设计;熟练使用 Golang 进行高并发与云原生组件开发

云原生与基础设施

Docker / K8sK8s Operator (Golang)容器镜像 / 离线交付公有云 OpenAPI 纳管

深入理解 Docker/K8s 体系,具备 K8s Operator 开发经验,熟悉容器镜像底层原理

DevOps & AIOps

CI/CD (GitOps)Cloud Native BuildpacksLLM / Prompt EngineeringAI Agent

精通 CI/CD 自动化流水线;熟练应用大语言模型解决运维排障痛点

工作项目

名称:
Gamecloud 混合云管理服务平台 2024-至今
描述:
面向网易互娱打造的国内外统一混合云资源管理平台。通过深度整合多云环境,提供全生命周期的云原生基础设施纳管(涵盖 VM、负载均衡、证书、对象存储及 VPC/专线等网络资源),同时构建了计费分账、云上事件总线、全链路监控告警及全局 IAM 权限管控等核心云原生管控能力。
职责:
  • 多云纳管落地:负责对接主流公有云 OpenAPI,封装底层管理原语;主导完成百度云资源体系的整体接入,成功完成主要业务线 1000 余台虚拟机的纳管与平滑迁移,保障业务高可用。
  • 架构重构与性能调优:主导云资源生命周期(申请、交付、回收)链路的底层技术债清理与重构。将 NATGW 关联的 EIP 申请流程由串行优化为并发执行,使创建接口提速 40%。
  • 容错机制与降本增效:设计并实现了高可靠的异常回滚流程,确保虚拟机等资源申请失败时能被自动且彻底地清理。有效避免了残留资源导致的无效云费用,每月平均为团队节省约 20+ 小时的人工排障与兜底处理时间。
  • 核心指标构建:负责全局网络质量大盘的数据支撑,研发海量数据聚合分析接口,输出互娱玩家分布热力图、服务端链路延迟、竞品对比等核心指标体系。
  • AIOps 智能化运维:深入挖掘云厂商基础能力,结合 Prompt Engineering 将大模型引入运维场景。成功将 SRE 故障定位与处理时间从平均 1~2 小时缩短至 30 分钟内。
  • 交互式智能查询平台:基于 LLM,采用 SDD (Spec Driven Development) 与大模型 Skills(技能调用)相结合的架构设计,完成支持自然语言交互的公有云资源查询工具开发。
  • 业务赋能:深度挖掘数据价值,构建"多维度延迟横向比对"与"客户端来源地域 vs 接入节点映射"等分析模型。成功协助业务精准定位多起隐蔽的网络异常。
  • 名称:
    Blueking PaaS2019-2024
    描述:
    蓝鲸智云 PaaS 平台是一个开放式的开发平台,在腾讯内部托管运行着 1600+ SaaS 应用。该项目的 Web API 使用 Django(DRF) 和 Celery 开发, 应用构建依托于 Cloud Native Buildpacks 和 Kaniko, 应用运行生命周期使用 K8S Operator(Golang) 管理。接入层使用 Nginx Ingress 作流量转发, 支持常规 ELK 方案和蓝鲸自研日志采集器采集日志。
    职责:
  • 设计从源码到构建的执行流程和数据存储结构, 实现从二进制制品到云原生容器镜像的构建系统的无缝升级。
  • 设计应用(SaaS)离线交付方案和构建工具, 支持以镜像层为粒度交付应用(SaaS)的镜像。通过自研的镜像层(Image Layer)合并算法,将容器镜像交付体积缩减了 60%(或从 1GB+ 降低至 200~400 MB),极大提升了 SaaS 应用在私有化环境的部署效率。
  • 主导研发低代码后台管理渲染框架,融合 Vue 与 Django SSR,将后台管理接口的开发复杂度与工时降低 80% 以上。
  • 运用设计原则和对模板、组合、策略等设计模式的综合使用, 搭建了同时支持 ELK 和蓝鲸日志平台的日志采集、查询链路;搭建了支持 git/svn/容器镜像的应用源码(或镜像)的源码拉取模块。
  • 个人项目

    描述:
    作为核心主导者,填补了该游戏国内社区的技术空白。项目在 Nexusmods 累计获得 20,000+ 下载量,自建国内代理源 CDN 月均处理请求流量达 30+ GB,在玩家社区具有极高知名度。
    职责:
  • 无源码动态注入 (C++/Windows Hook):在无游戏源码的环境下,通过 C++ 与 Windows API Hooking 技术对客户端进行深度逆向分析与内存注入,实现核心逻辑劫持。
  • 底层渲染管线重构:破解并重写游戏原生的字体渲染引擎,成功实现对动态 TTF 字体的支持与大规模文本的高效渲染。
  • 自动化工具链与协同平台建设 (工作流引擎):针对几十万字的海量游戏文本,独立研发资源解包与文本自动化提取/回注工具。同时搭建了支持多人在线协同的翻译模式,极大降低了社区志愿者的参与门槛,实现了翻译内容的持续集成与高效发布。
  • 名称:
    描述:
    moby-distribution 是一个纯 Python 库,提供了对 Docker 镜像 Manifest 和 Blob(包括 Layers、Config 等)的完整操作能力,可在不依赖 Docker Daemon 的情况下实现镜像的组装与推送。
    职责:
    从底层协议出发,独立研发基于 Python 的 Docker Registry 交互库,打破了常规镜像操作对 Docker Daemon 的强依赖。该库已作为核心组件反哺应用于腾讯蓝鲸 PaaS 生产环境的离线镜像合成业务中。