% !TEX TS-program = xelatex
% !TEX encoding = UTF-8 Unicode
% !Mode:: "TeX:UTF-8"

\documentclass{resume}
\usepackage{zh_CN-Adobefonts_external}
\usepackage{linespacing_fix}

\begin{document}
\pagenumbering{gobble}

\name{HE Haotan}

% {phone}{email}{job title}{homepage}
\contactInfo{何昊潭}{(+86) 188-0637-7955}{2080208310@qq.com}

% -------------------- 教育背景 --------------------
\section{教育背景}
\datedsubsection{\textbf{武汉大学}, 计算机科学与技术, \textit{本科}}{2022.09 - 2026.06(预计)}
\textbf{相关课程}: 高级语言程序设计、数据结构、计算机组成原理、操作系统、计算机网络、数据库原理、算法设计与分析、人工智能引论、计算机视觉

% -------------------- 技术能力 --------------------
\section{技术能力}
\begin{itemize}[parsep=0.2ex]
  \item \textbf{编程语言}: C/C++，Python，Objective-C，Golang
  \item \textbf{深度学习与模型系统}: PyTorch，CUDA，OpenAI Triton，Transformer
  \item \textbf{系统与工具}: Linux/Unix，GDB，Valgrind，CMake，Git
\end{itemize}

% -------------------- 实习经历 --------------------
\section{实习经历}
\datedsubsection{\textbf{阿里巴巴智能信息事业群 | 用户平台组}, C/C++ 开发实习生}{2025.06 - 2025.09}
\begin{itemize}
  \item 负责夸克 iOS 端小说业务，使用 Objective-C 开发，打通排版引擎链路，实现阅读器字体切换功能。
  \item 优化书架云同步系统，构建完整 trace 链路，提升故障定位与排查效率。
  \item 参与跨端调用链路调试与性能优化，熟悉大型互联网业务开发流程。
\end{itemize}

% -------------------- 项目经历 --------------------
\section{项目经历}

\datedsubsection{\textbf{xv6-RISC-V 操作系统开发}}{2024}
\begin{itemize}
  \item 基于 MIT xv6 教学操作系统，在 RISC-V 架构上进行开发与扩展。
  \item 实现基于伙伴系统的动态内存分配机制，优化内存管理效率。
  \item 添加系统调用（如 getprocnum），完成用户态与内核态调用链路实现。
  \item \textbf{技术栈}: RISC-V，Unix，QEMU，Make
\end{itemize}

\datedsubsection{\textbf{轻量级 LSM-Tree 存储引擎设计与实现}}{2025}
\begin{itemize}
  \item 设计并实现类 LSM-Tree 结构的轻量级存储引擎，包含基于跳表的 MemTable、SSTable 持久化结构与 WAL 机制。
  \item 实现预写日志与分层存储结构，理解写放大与读放大的权衡。
  \item 设计基于 LRU 的 Buffer 管理机制，分析缓存命中率与访问延迟之间的关系。
  \item 使用读写锁支持高并发访问，构建模块化系统结构并完成单元测试与性能测试。
  \item \textbf{技术栈}: C++，并发编程，LSM-Tree，LRU 缓存，持久化存储，CMake
\end{itemize}

\datedsubsection{\textbf{分布式 LLM 训练与推理系统优化实践}}{2026}
\begin{itemize}
  \item 基于 PyTorch 从零实现 LLaMA 风格 Transformer 架构，完整复现 BPE 分词、RoPE 位置编码、SwiGLU 激活函数与数值稳定交叉熵损失，系统性理解大模型结构设计与数值稳定性问题。
  \item 实现 AdamW 优化器与余弦退火学习率调度器，构建支持梯度裁剪与断点续训的训练流水线，分析训练动态与收敛行为。
  \item 使用 OpenAI Triton 编写基于 Tiling 与 Online Softmax 的 FlashAttention 前向内核，通过减少显存访问与优化内存带宽利用率，加速长序列推理阶段的 Attention 计算。
  \item 实现分布式数据并行（DDP）与类似 ZeRO-1 的优化器状态分片机制，系统分析参数、梯度与优化器状态的内存占用结构，降低显存峰值并提升多卡扩展效率。
  \item \textbf{技术栈}: PyTorch，CUDA，OpenAI Triton，DDP，ZeRO
\end{itemize}

% -------------------- 竞赛获奖 --------------------
\section{竞赛与奖项}
\begin{itemize}[parsep=0.2ex]
  \item 全国大学生数学竞赛省级一等奖，2023
  \item 全国大学生物联网设计竞赛（华为杯）全国三等奖，2024
  \item 团体程序设计天梯赛个人三等奖，2025
\end{itemize}

% -------------------- 个人总结 --------------------
\section{个人总结}
具备扎实的系统基础与工程实现能力，能够从底层机制出发分析复杂软件与模型系统的结构设计与性能瓶颈，形成了从抽象设计、机制实现到性能评估的完整思考路径。关注计算与存储资源约束下的大规模系统效率问题，具备独立实现与优化复杂系统的能力

\end{document}